python如何讀取.mtx文件
mtx文件是按照稀疏矩陣格式存儲(chǔ)的矩陣數(shù)據(jù),可以按照以下步驟讀?。?/p>
1、安裝scanpy包
pip install scanpy
2、文件讀取
import scanpy as sc adata = sc.read(filename) data = adata.X
第一行read之后返回的是annData,第二行通過(guò).X操作得到的是矩陣數(shù)據(jù)
3、轉(zhuǎn)換為稠密矩陣
data = data.todense()
直接得到的矩陣是稀疏形式的,通過(guò)todense函數(shù)可轉(zhuǎn)換為稠密矩陣
補(bǔ)充:python讀取各種文件方式
Json:
use_time=[] with open(address,'r') as f: #ubuntu mobile = json.load(f) calls = mobile["transactions"][0]["calls"] for call in calls: use_time.append(str(call['use_time']))
Excel:
rawdata1=open_workbook(address) rawdata=rawdata1.sheet_by_index(0) for i in range(1,rawdata.nrows): if rawdata.cell(i,date_index).value=="": #跳過(guò)空行 continue else: if ctype==3: #若為3,則用datetime模塊處理日期 date1=rawdata.cell(i,date_index).value date2 = xldate_as_tuple(date1,0) date3=datetime(*date2) if "." in str(rawdata.cell(i,phone_index).value): phone1=str(rawdata.cell(i,phone_index).value)[:-2] else: phone1=str(rawdata.cell(i,phone_index).value)
寫(xiě)EXCEL:
Excel_file = xlwt.Workbook() sheet = Excel_file.add_sheet('sheet0') header=[u'號(hào)碼','日期top1','日期top2','日期top3'] #寫(xiě)入標(biāo)題行: for i in range(len(header)): sheet.write(0,i,header[i]) #開(kāi)始按行寫(xiě)入數(shù)據(jù): for i in range(len(phonelist)): sheet.write(i+1,0,phonelist[i]) sheet.write(i+1,1,dic[str(phonelist[i])]) #保存EXCEL: Excel_file.save("C:/Users/Desktop/100個(gè)文件輸出xls/"+str(fileName)+".xls")
CSV:
rawdata=pd.read_csv(address,skip_blank_lines=True) #參數(shù)為去除空行 if 'start_time' or 'begin_time' in rawdata.columns: if 'start_time' in rawdata.columns: start_time=rawdata['start_time'] elif 'begin_time' in rawdata.columns: start_time=rawdata['begin_time']
txt:
rawdata=open(address,'r') i=0 a=[] #c存放第一行的列名 for line in rawdata: if i==1: #默認(rèn)第二行開(kāi)始存儲(chǔ)通話(huà)數(shù)據(jù) a=line.split(',') #逗號(hào)作為分隔符 for j in range(len(a)): #查找指定列名所在的列下標(biāo) if (('-' in str(a[j]))or('/' in str(a[j]))): #判斷日期所在列數(shù) date_index=j #保存日期的列下標(biāo) elif str(a[j]).isdigit() and len(str(a[j]))>5: #默認(rèn)全為數(shù)字組成的字符串為電話(huà)號(hào)碼 phone_index=j else: pass break else: i+=1 i=0 for line in rawdata:#開(kāi)始轉(zhuǎn)存數(shù)據(jù): if len(line)<10: #跳過(guò)空行 continue data_line=line.split(',') #txt默認(rèn)以','分隔數(shù)據(jù) if i==0: pass #第一行為列名,跳過(guò) i+=1 else: #從第二行開(kāi)始保存數(shù)據(jù) start_time.append(data_line[date_index])
以上為個(gè)人經(jīng)驗(yàn),希望能給大家一個(gè)參考,也希望大家多多支持腳本之家。如有錯(cuò)誤或未考慮完全的地方,望不吝賜教。
相關(guān)文章
Python3下錯(cuò)誤AttributeError: ‘dict’ object has no attribute’ite
這篇文章主要跟大家介紹了關(guān)于在Python3下錯(cuò)誤AttributeError: 'dict' object has no attribute 'iteritems'的分析與解決方法,文中介紹的非常詳細(xì),對(duì)大家具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友們下面來(lái)一起看看吧。2017-07-07python使用pywinauto驅(qū)動(dòng)微信客戶(hù)端實(shí)現(xiàn)公眾號(hào)爬蟲(chóng)
這個(gè)項(xiàng)目是通過(guò)pywinauto控制windows(win10)上的微信PC客戶(hù)端來(lái)實(shí)現(xiàn)公眾號(hào)文章的抓取。代碼分成server和client兩部分。server接收client抓取的微信公眾號(hào)文章,并且保存到數(shù)據(jù)庫(kù)。另外server支持簡(jiǎn)單的搜索和導(dǎo)出功能。client通過(guò)pywinauto實(shí)現(xiàn)微信公眾號(hào)文章的抓取。2021-05-05Python中shutil模塊的常用文件操作函數(shù)用法示例
shutil模塊提供比OS模塊更強(qiáng)大的本地文件操作功能,包括文件的壓縮和解壓縮等,下面我們就來(lái)列舉Python中shutil模塊的常用文件操作函數(shù)用法示例:2016-07-07Python海龜turtle基礎(chǔ)知識(shí)大全以及畫(huà)圖集合實(shí)例
turtle是一個(gè)簡(jiǎn)單的繪圖工具,它提供了一個(gè)海龜,你可以把它理解為一個(gè)機(jī)器人,只聽(tīng)得懂有限的指令,下面這篇文章主要給大家介紹了關(guān)于Python海龜turtle基礎(chǔ)知識(shí)大全以及畫(huà)圖集合的相關(guān)資料,需要的朋友可以參考下2023-04-04Python實(shí)現(xiàn)獲取彈幕的兩種方式分享
彈幕可以給觀(guān)眾一種“實(shí)時(shí)互動(dòng)”的錯(cuò)覺(jué),在相同時(shí)刻發(fā)送的彈幕基本上也具有相同的主題,在參與評(píng)論時(shí)就會(huì)有與其他觀(guān)眾同時(shí)評(píng)論的錯(cuò)覺(jué)。本文為大家總結(jié)了兩個(gè)Python獲取彈幕的方法,希望對(duì)大家有所幫助2023-03-03Pycharm學(xué)習(xí)教程(7)虛擬機(jī)VM的配置教程
這篇文章主要為大家詳細(xì)介紹了最全的Pycharm學(xué)習(xí)教程第七篇,Python快捷鍵相關(guān)設(shè)置,文中示例代碼介紹的非常詳細(xì),具有一定的參考價(jià)值,感興趣的小伙伴們可以參考一下2017-05-05Python內(nèi)置函數(shù)之filter map reduce介紹
Python內(nèi)置了一些非常有趣、有用的函數(shù),如:filter、map、reduce,都是對(duì)一個(gè)集合進(jìn)行處理,filter很容易理解用于過(guò)濾,map用于映射,reduce用于歸并. 是Python列表方法的三架馬車(chē)2014-11-11TensorFlow人工智能學(xué)習(xí)Keras高層接口應(yīng)用示例
這篇文章主要為大家介紹了TensorFlow人工智能學(xué)習(xí)中Keras高層接口的應(yīng)用示例,有需要的朋友可以借鑒參考下,希望能夠有所幫助,祝大家多多進(jìn)步2021-11-11