欧美bbbwbbbw肥妇,免费乱码人妻系列日韩,一级黄片

python讀取mnist數(shù)據(jù)集方法案例詳解

 更新時(shí)間:2021年09月03日 14:45:30   作者:Luna2137  
這篇文章主要介紹了python讀取mnist數(shù)據(jù)集方法案例詳解,本篇文章通過簡(jiǎn)要的案例,講解了該項(xiàng)技術(shù)的了解與使用,以下就是詳細(xì)內(nèi)容,需要的朋友可以參考下

mnist手寫數(shù)字?jǐn)?shù)據(jù)集在機(jī)器學(xué)習(xí)中非常常見,這里記錄一下用python從本地讀取mnist數(shù)據(jù)集的方法。

數(shù)據(jù)集格式介紹

這部分內(nèi)容網(wǎng)絡(luò)上很常見,這里還是簡(jiǎn)明介紹一下。網(wǎng)絡(luò)上下載的mnist數(shù)據(jù)集包含4個(gè)文件:

在這里插入圖片描述

前兩個(gè)分別是測(cè)試集的image和label,包含10000個(gè)樣本。后兩個(gè)是訓(xùn)練集的,包含60000個(gè)樣本。.gz表示這個(gè)一個(gè)壓縮包,如果進(jìn)行解壓的話,會(huì)得到.ubyte格式的二進(jìn)制文件。

在這里插入圖片描述

上圖是訓(xùn)練集的label和image數(shù)據(jù)的存儲(chǔ)格式。兩個(gè)文件最開始都有magic number和number of images/items兩個(gè)數(shù)據(jù),有用的是第二個(gè),表示文件中存儲(chǔ)的樣本個(gè)數(shù)。另外要注意的是數(shù)據(jù)的位數(shù),有32位整型和8位整型兩種。

讀取方法

.gz格式的文件讀取

需要import gzip
讀取訓(xùn)練集的代碼如下:

def load_mnist_train(path, kind='train'): 
'‘'
path:數(shù)據(jù)集的路徑
kind:值為train,代表讀取訓(xùn)練集
‘'‘   
    labels_path = os.path.join(path,'%s-labels-idx1-ubyte.gz'% kind)
    images_path = os.path.join(path,'%s-images-idx3-ubyte.gz'% kind)
    #使用gzip打開文件
    with gzip.open(labels_path, 'rb') as lbpath:
	    #使用struct.unpack方法讀取前兩個(gè)數(shù)據(jù),>代表高位在前,I代表32位整型。lbpath.read(8)表示一次從文件中讀取8個(gè)字節(jié)
	    #這樣讀到的前兩個(gè)數(shù)據(jù)分別是magic number和樣本個(gè)數(shù)
        magic, n = struct.unpack('>II',lbpath.read(8))
        #使用np.fromstring讀取剩下的數(shù)據(jù),lbpath.read()表示讀取所有的數(shù)據(jù)
        labels = np.fromstring(lbpath.read(),dtype=np.uint8)
    with gzip.open(images_path, 'rb') as imgpath:
        magic, num, rows, cols = struct.unpack('>IIII',imgpath.read(16))
        images = np.fromstring(imgpath.read(),dtype=np.uint8).reshape(len(labels), 784)
    return images, labels

讀取測(cè)試集的代碼類似。

非壓縮文件的讀取

如果在本地對(duì)四個(gè)文件解壓縮之后,得到的就是.ubyte格式的文件,這時(shí)讀取的代碼有所變化。

def load_mnist_train(path, kind='train'): 
'‘'
path:數(shù)據(jù)集的路徑
kind:值為train,代表讀取訓(xùn)練集
‘'‘   
    labels_path = os.path.join(path,'%s-labels-idx1-ubyte'% kind)
    images_path = os.path.join(path,'%s-images-idx3-ubyte'% kind)
    #不再用gzip打開文件
    with open(labels_path, 'rb') as lbpath:
	    #使用struct.unpack方法讀取前兩個(gè)數(shù)據(jù),>代表高位在前,I代表32位整型。lbpath.read(8)表示一次從文件中讀取8個(gè)字節(jié)
	    #這樣讀到的前兩個(gè)數(shù)據(jù)分別是magic number和樣本個(gè)數(shù)
        magic, n = struct.unpack('>II',lbpath.read(8))
        #使用np.fromfile讀取剩下的數(shù)據(jù)
        labels = np.fromfile(lbpath,dtype=np.uint8)
    with gzip.open(images_path, 'rb') as imgpath:
        magic, num, rows, cols = struct.unpack('>IIII',imgpath.read(16))
        images = np.fromfile(imgpath,dtype=np.uint8).reshape(len(labels), 784)
    return images, labels

讀取之后可以查看images和labels的長(zhǎng)度,確認(rèn)讀取是否正確。

到此這篇關(guān)于python讀取mnist數(shù)據(jù)集方法案例詳解的文章就介紹到這了,更多相關(guān)python讀取mnist數(shù)據(jù)集方法內(nèi)容請(qǐng)搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!

相關(guān)文章

  • python實(shí)現(xiàn)二分查找算法

    python實(shí)現(xiàn)二分查找算法

    這篇文章主要為大家詳細(xì)介紹了python實(shí)現(xiàn)二分查找算法,具有一定的參考價(jià)值,感興趣的小伙伴們可以參考一下
    2017-09-09
  • Python如何創(chuàng)建裝飾器時(shí)保留函數(shù)元信息

    Python如何創(chuàng)建裝飾器時(shí)保留函數(shù)元信息

    這篇文章主要介紹了Python如何創(chuàng)建裝飾器時(shí)保留函數(shù)元信息,文中講解非常細(xì)致,幫助大家更好的理解和學(xué)習(xí),感興趣的朋友可以了解下
    2020-08-08
  • python BeautifulSoup庫(kù)的常用操作

    python BeautifulSoup庫(kù)的常用操作

    Beautiful Soup 是一個(gè)可以從HTML或XML文件中提取數(shù)據(jù)的Python庫(kù),它能夠通過你喜歡的轉(zhuǎn)換器實(shí)現(xiàn)慣用的文檔導(dǎo)航,查詢,修改文檔的方式,本文就來給大家簡(jiǎn)單介紹一下BeautifulSoup庫(kù)的常用操作,需要的朋友可以參考下
    2023-08-08
  • python中的np.round()函數(shù)示例詳解

    python中的np.round()函數(shù)示例詳解

    np.round()是NumPy庫(kù)中的一個(gè)函數(shù),用于對(duì)數(shù)組或單個(gè)數(shù)值進(jìn)行四舍五入,該函數(shù)返回一個(gè)與輸入類型相同的數(shù)組或數(shù)值,并可以通過可選的參數(shù)來指定保留的小數(shù)位數(shù),這篇文章主要介紹了python中的np.round()函數(shù),需要的朋友可以參考下
    2024-06-06
  • Python腳本開發(fā)中的命令行參數(shù)及傳參示例詳解

    Python腳本開發(fā)中的命令行參數(shù)及傳參示例詳解

    這篇文章主要為大家介紹了Python腳本開發(fā)中的命令行參數(shù)及傳參示例詳解,有需要的朋友可以借鑒參考下,希望能夠有所幫助,祝大家多多進(jìn)步,早日升職加薪
    2022-07-07
  • python subprocess 殺掉全部派生的子進(jìn)程方法

    python subprocess 殺掉全部派生的子進(jìn)程方法

    下面小編就為大家?guī)硪黄猵ython subprocess 殺掉全部派生的子進(jìn)程方法。小編覺得挺不錯(cuò)的,現(xiàn)在就分享給大家,也給大家做個(gè)參考。一起跟隨小編過來看看吧
    2017-01-01
  • Python+Turtle制作海龜迷宮小游戲

    Python+Turtle制作海龜迷宮小游戲

    這篇文章主要是帶大家寫一個(gè)利用Turtle庫(kù)制作的一款海龜闖關(guān)的三大迷宮,文中的示例代碼講解詳細(xì),對(duì)我們學(xué)習(xí)Python有一定幫助,感興趣的可以了解一下
    2022-04-04
  • Python實(shí)現(xiàn)的簡(jiǎn)單計(jì)算器功能詳解

    Python實(shí)現(xiàn)的簡(jiǎn)單計(jì)算器功能詳解

    這篇文章主要介紹了Python實(shí)現(xiàn)的簡(jiǎn)單計(jì)算器功能,結(jié)合實(shí)例形式詳細(xì)分析了Python實(shí)現(xiàn)計(jì)算器功能的具體步驟、相關(guān)操作技巧與注意事項(xiàng),需要的朋友可以參考下
    2018-08-08
  • Python自動(dòng)化辦公技巧分享

    Python自動(dòng)化辦公技巧分享

    Python自動(dòng)化辦公是指用Python程序來完成某些需要重復(fù)性操作的工作,例如大批量的文件處理等,本篇文章將介紹Python自動(dòng)化辦公的基本概念和常用技術(shù),希望能對(duì)Python初學(xué)者提供一些幫助
    2023-06-06
  • 利用Python繪制多種風(fēng)玫瑰圖

    利用Python繪制多種風(fēng)玫瑰圖

    這篇文章主要介紹了利用Python繪制多種風(fēng)玫瑰圖,風(fēng)玫瑰是由氣象學(xué)家用于給出如何風(fēng)速和風(fēng)向在特定位置通常分布的簡(jiǎn)明視圖的圖形工具,下文繪制實(shí)現(xiàn)詳情,需要的小伙伴可以參考一下
    2022-05-05

最新評(píng)論