Python?查看數(shù)據(jù)類(lèi)型與格式
Python查看數(shù)據(jù)類(lèi)型與格式
一般我們拿到一個(gè)數(shù)據(jù),會(huì)先看一下這個(gè)數(shù)據(jù)有多少行多少列,各個(gè)字段是什么,數(shù)據(jù)格式類(lèi)型是什么。在開(kāi)始講數(shù)據(jù)格式前,需要先梳理一下各個(gè)數(shù)據(jù)類(lèi)型。
我們常使用的庫(kù)一般是numpy和pandas,Numpy下的核心是數(shù)組(array,ndarray),Pandas下的核心是數(shù)據(jù)框(Series,DataFrame)
先隨機(jī)創(chuàng)一點(diǎn)數(shù)據(jù)用來(lái)測(cè)試
import pandas as pd import numpy as np df=pd.DataFrame(np.random.randint(5,10,size=(10,2)),columns=['a','b']) Array=np.random.randint(5,10,size=(10,2)) #假設(shè)我們不知道df和Array是什么數(shù)據(jù)類(lèi)型
查看現(xiàn)有的數(shù)據(jù)是數(shù)據(jù)框類(lèi)型還是數(shù)組矩陣類(lèi)型
語(yǔ)法:type(XXX),適用于tuple/list/array/ndarray/Series/Dataframe
print(type(df)) #輸出 class 'pandas.core.frame.DataFrame'這是DataFrame類(lèi)型的數(shù)據(jù) print(type(Array)) #輸出class 'numpy.ndarray'這是多維數(shù)組 print(type(tuple(Array))) #輸出'tuple'這是元組 print(type(list(df['a']))) #輸出'class list'這是一個(gè)list類(lèi)型
查看數(shù)據(jù)格式是字符串還是數(shù)字格式
這里需要區(qū)分一下Numpy和Pandas的查看方式略有不同,一個(gè)是dtype,一個(gè)是dtypes
print(Array.dtype) #輸出int64 print(df.dtypes) #輸出Df下所有列的數(shù)據(jù)格式 a:int64,b:int64
Python數(shù)據(jù)類(lèi)型bytes
1 bytes類(lèi)型的特性
Python 3.x之后,Python自帶字符默認(rèn)使用utf-8格式編碼和顯示
- Python默認(rèn)字符串string數(shù)據(jù)類(lèi)型是utf-8顯示形式的序列
- bytes數(shù)據(jù)類(lèi)型是utf-8格式的二進(jìn)制形式的不可變序列
- bytearray數(shù)據(jù)類(lèi)型是utf-8格式的二進(jìn)制形式的可變序列
1.1 ASCII表
2 bytes類(lèi)型創(chuàng)建與轉(zhuǎn)化
2.1 bytes類(lèi)型與數(shù)字
數(shù)字類(lèi)型并不是字符串,無(wú)法直接生成對(duì)應(yīng)的bytes類(lèi)
Python對(duì)數(shù)字類(lèi)型定義了特殊意義
① 當(dāng)入?yún)閿?shù)字時(shí),表示創(chuàng)建nul(\x00)的向量
byte_str = bytes(10) print(byte_str) >>> b'\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00'
② 當(dāng)入?yún)閿?shù)字的序列時(shí),直接轉(zhuǎn)為bytes的序列,且對(duì)應(yīng)值相同,將數(shù)字序列直接寫(xiě)入底層應(yīng)該使用這種方法
byte_str = bytes([1, 10, 0xF]) print(byte_str) >>> b'\x00\x10\x0f'
③ 當(dāng)二進(jìn)制數(shù)據(jù)在[33, 126]區(qū)間時(shí),屬于ASCII表上可顯示字符范圍,會(huì)直接顯示對(duì)應(yīng)的字符
數(shù)字直接使用bytes創(chuàng)建
byte_str = bytes([33, 48, 126]) print(byte_str) >>> b'!0~'
2.2 bytes類(lèi)型與ASCII字符
2.2.1 創(chuàng)建bytes數(shù)據(jù)
① 使用b''創(chuàng)建
byte_str = b'Python' print(byte_str) >>> b'Python'
② 使用bytes()創(chuàng)建不可變序列
byte_str = bytes('Python', encoding='utf-8') print(byte_str) >>> b'Python'
③ 使用bytearray()創(chuàng)建可變序列
byte_str = bytearray('Python', encoding='utf-8') print(byte_str) >>> bytearray(b'Python')
2.2.2 還原bytes數(shù)據(jù)
① 使用bytes.decode()還原不可變序列
byte_str = bytes('Python', encoding='utf-8') utf_str = bytes.decode(byte_str) print(utf_str) >>> 'Python'
② 使用bytearray.decode()還原可變序列
byte_str = bytearray('Python', encoding='utf-8') utf_str = bytearray.decode(byte_str) print(utf_str) >>> 'Python'
2.3 bytes類(lèi)型與漢字
在UTF-8中,每個(gè)漢字用3個(gè)Byte表示
byte_str = bytes('我是', encoding='utf-8') print(byte_str) >>> b'\xe6\x88\x91\xe6\x98\xaf'
還原:
byte_str = b'\xe6\x88\x91\xe6\x98\xaf' utf_str = bytes.decode(byte_str) print(utf_str) >>> '我是'
3 bytes類(lèi)型切片迭代
① 通過(guò)bytes[index]方式返回的是底層int類(lèi)型
byte_str = b'a' print(type(byte_str[0])) print(byte_str[0]) >>> <class 'int'> >>> 97
byte_str = b'abc' print(type(byte_str[2])) print(byte_str[2]) >>> <class 'int'> >>> 99
② 通過(guò)for ... in bytes方式返回的是底層int類(lèi)型
byte_str = b'abc' for byte in byte_str: ? ? print(type(byte)) ? ? print(byte) ? ?? >>> <class 'int'> >>> 97 >>> <class 'int'> >>> 98 >>> <class 'int'> >>> 99
③ 通過(guò)bytes[start:end]方式返回的是底層bytes類(lèi)型
byte_str = b'a' print(type(byte_str[:])) print(byte_str[:]) >>> <class 'bytes'> >>> b'a'
以上為個(gè)人經(jīng)驗(yàn),希望能給大家一個(gè)參考,也希望大家多多支持腳本之家。
相關(guān)文章
OpenCV(python)版實(shí)現(xiàn)文本分割之水平投影法
本文主要介紹了OpenCV(python)版實(shí)現(xiàn)文本分割之水平投影法,文中通過(guò)示例代碼介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友們下面隨著小編來(lái)一起學(xué)習(xí)學(xué)習(xí)吧2022-08-08Python密碼學(xué)Caesar?Cipher凱撒密碼算法教程
這篇文章主要為大家介紹了Python密碼學(xué)Caesar?Cipher凱撒密碼算法教程,有需要的朋友可以借鑒參考下,希望能夠有所幫助,祝大家多多進(jìn)步,早日升職加薪2022-05-05Python入門(mén)教程之變量與數(shù)據(jù)類(lèi)型
這篇文章主要介紹了Python入門(mén)教程之變量與數(shù)據(jù)類(lèi)型的相關(guān)知識(shí),文中給大家提到了變量的基本概念和數(shù)據(jù)類(lèi)型的相關(guān)實(shí)例代碼,需要的朋友可以參考下2022-02-02Python深度學(xué)習(xí)之使用Albumentations對(duì)圖像做增強(qiáng)
諸如RandomCrop和CenterCrop之類(lèi)的某些增強(qiáng)功能可能會(huì)變換圖像,使其不包含所有原始邊界框. 本示例說(shuō)明如何使用名為RandomSizedBBoxSafeCrop的變換來(lái)裁剪圖像的一部分,但保留原始圖像的所有邊界框,需要的朋友可以參考下2021-05-05python3實(shí)現(xiàn)UDP協(xié)議的服務(wù)器和客戶端
這篇文章主要為大家詳細(xì)介紹了python3實(shí)現(xiàn)UDP協(xié)議的服務(wù)器和客戶端,具有一定的參考價(jià)值,感興趣的小伙伴們可以參考一下2017-06-06Centos7下源碼安裝Python3 及shell 腳本自動(dòng)安裝Python3的教程
這篇文章主要介紹了Centos7下源碼安裝Python3 shell 腳本自動(dòng)安裝Python3的相關(guān)知識(shí),本文給大家介紹的非常詳細(xì),具有一定的參考借鑒價(jià)值,需要的朋友可以參考下2020-03-03基于Python寫(xiě)個(gè)"點(diǎn)球大戰(zhàn)"小游戲
這篇文章主要為大家詳細(xì)介紹了如何利用Python寫(xiě)個(gè)簡(jiǎn)單的"點(diǎn)球大戰(zhàn)"小游戲,文中的示例代碼講解詳細(xì),感興趣的小伙伴可以跟隨小編一起學(xué)習(xí)一下2022-12-12