Python處理mat文件的三種方式小結
處理mat文件的三種方式
讀書的時候,處理數(shù)據(jù)都是采用matlab,但畢業(yè)后當了程序員,matlab從此在自己的電腦上消失了(安裝包太大,還要license,啟動也好慢,不符合程序員的需求)。
但是最近公司仿真的數(shù)據(jù)是以matlab的.mat格式存儲的,需要讀取出來處理,那就找找python相關的庫吧,沒有python干不了的活?。?!
mat文件存儲了matlab中變量數(shù)據(jù),因此,python讀出的mat數(shù)據(jù)是以k-v形式存儲在字典里,key是變量名,value是數(shù)據(jù)內(nèi)容:
scipy
最先想到的的是scipy工具
import scipy.io as scio data = scio.loadmat(‘example.mat') data[‘loss']
但是讀取有的.mat文件的時,會拋出異常(v7.3版本):
raise NotImplementedError('Please use HDF reader for matlab v7.3 files')NotImplementedError: Please use HDF reader for matlab v7.3 files
h5py
遇到上面的問題,就需要采用h5py庫了:
import h5py data=h5py.loadmat('example.mat') ?? data['loss'][:]
但是這樣讀出來的是file格式,調(diào)試的時候都很難知道key是什么,取數(shù)據(jù)可以按照key來取,但是前提是需要知道key值,不方便獨立調(diào)試。
mat73
今天的主角登場,個人覺得mat73兼容性最好,幾乎所有的mat文件都能成功讀取,而且讀取的結果是k-v的字典,很便于后續(xù)處理:
import mat73 data=mat73.loadmat(path) ?? data['loss']
mat4py
不推薦,兼容性較差,可能是沒有后續(xù)更新。
總結:總的來說,個人比較推薦使用mat73,兼容各種版本的mat文件,其次可以比較清晰的看到mat文件中保存數(shù)據(jù)的key值,便于后續(xù)的提取。
python操作.mat文件
在win10中,打開
ITC_VD 數(shù)據(jù)集格式,
結果在訓練集ITC_VD_Training_Testing_set中,看到標簽文件全是快捷方式,
選中一個文件,右鍵 屬性,看到:
Microsoft Access Table Shortcut (.mat)
查了半天,發(fā)現(xiàn)是.mat 的 matlab格式,
python讀取.mat格式
from scipy.io import loadmat?? m = loadmat(r"E:\data\yolov5_dbb\ITC_VD_Training_Testing_set\Training\GT/00064.mat") ? daaa=m.keys() print(daaa) ? print(m['x00064'])
.mat 文件里的數(shù)據(jù)結構是 dict ,所以取值要按照 key:value 的形式:
上面讀出來的數(shù)據(jù)是 ndarray 類型,為了方便數(shù)據(jù)的展示,我們可以將其轉換為,pandas的DataFrame:
import pandas as pd ? df = pd.DataFrame(m['H_BETA']) ? df.head()
mat轉圖片
import glob? import cv2 import numpy as np ? r_path=r'C:\File\2021-11' ? files=glob.glob(r_path+"/*.mat") from scipy.io import loadmat? ? # 數(shù)據(jù)矩陣轉圖片的函數(shù) def MatrixToImage(data): ? ? # data = data * 255 ? ? new_im = data.astype(np.uint8) ? ? return new_im? ? for file in files: ? ? ? if "2018" in file: ? ? ? ? continue ? ? print(file) ? ? m = loadmat(file) ? ? ? daaa = m.keys() ? ? ? data=m['groundTruth'] ? ? ? print(data) ? ? ? new_im = MatrixToImage(data) ? ? cv2.imshow("asdf",new_im) ? ? cv2.waitKey() ? ? ? # print(data)
以上為個人經(jīng)驗,希望能給大家一個參考,也希望大家多多支持腳本之家。
相關文章
python使用循環(huán)打印所有三位數(shù)水仙花數(shù)的實例
今天小編就為大家分享一篇python使用循環(huán)打印所有三位數(shù)水仙花數(shù)的實例,具有很好的參考價值,希望對大家有所幫助。一起跟隨小編過來看看吧2018-11-11Pycharm 如何連接遠程服務器并debug調(diào)試
本文主要介紹了Pycharm 如何連接遠程服務器并debug調(diào)試,文中通過示例代碼介紹的非常詳細,對大家的學習或者工作具有一定的參考學習價值,需要的朋友們下面隨著小編來一起學習學習吧2022-06-06解決Jupyter Notebook開始菜單欄Anaconda下消失的問題
這篇文章主要介紹了解決Jupyter Notebook開始菜單欄Anaconda下消失的問題,具有很好的參考價值,希望對大家有所幫助。一起跟隨小編過來看看吧2020-04-04Mac上Python使用ffmpeg完美解決方案(避坑必看!)
ffmpeg是一個強大的開源命令行多媒體處理工具,下面這篇文章主要給大家介紹了關于Mac上Python使用ffmpeg完美解決方案的相關資料,文中通過實例代碼介紹的非常詳細,需要的朋友可以參考下2023-02-02