用Python讀取幾十萬行文本數(shù)據(jù)
我在使用python讀取幾十萬行的文件中的數(shù)據(jù),并構(gòu)造字典,列表等數(shù)據(jù)結(jié)構(gòu)時,再訪問字典,列表時,一般都會出現(xiàn)內(nèi)存不夠的問題,然后只能循環(huán)讀取幾百行或者一定數(shù)量的行數(shù)來循環(huán)操作。
keyword_list=[line.strip() for line in open("keywords.txt",'r')] #f1=open("part_wiki_vec.txt",'r') f1=open("wiki_vectors.txt") f2=open("result.txt",'w') i=0 content=f1.readlines() while i<1150: for line in content[300*i:300*(i+1)]: line=line.strip().split(' ') if line[0] in keyword_list: wordvec=' '.join(line) print wordvec f2.write(wordvec) #print line i+=1
我是這樣讀取的
應(yīng)該還有很多好的方法,比如多線程等等。
做此記錄只為了學習
總結(jié)
以上就是這篇文章的全部內(nèi)容了,希望本文的內(nèi)容對大家的學習或者工作具有一定的參考學習價值,謝謝大家對腳本之家的支持。如果你想了解更多相關(guān)內(nèi)容請查看下面相關(guān)鏈接
- python3 cvs將數(shù)據(jù)讀取為字典的方法
- Python從數(shù)據(jù)庫讀取大量數(shù)據(jù)批量寫入文件的方法
- python分塊讀取大數(shù)據(jù),避免內(nèi)存不足的方法
- 對Python3+gdal 讀取tiff格式數(shù)據(jù)的實例講解
- python讀取word文檔,插入mysql數(shù)據(jù)庫的示例代碼
- python3 讀取Excel表格中的數(shù)據(jù)
- python使用numpy讀取、保存txt數(shù)據(jù)的實例
- 使用python的pandas庫讀取csv文件保存至mysql數(shù)據(jù)庫
- python讀取excel指定列數(shù)據(jù)并寫入到新的excel方法
- python 讀取.csv文件數(shù)據(jù)到數(shù)組(矩陣)的實例講解
相關(guān)文章
pandas如何將datetime64[ns]轉(zhuǎn)為字符串日期
這篇文章主要介紹了pandas如何將datetime64[ns]轉(zhuǎn)為字符串日期,具有很好的參考價值,希望對大家有所幫助。如有錯誤或未考慮完全的地方,望不吝賜教2022-07-07Python利用卡方Chi特征檢驗實現(xiàn)提取關(guān)鍵文本特征
卡方檢驗最基本的思想就是通過觀察實際值與理論值的偏差來確定理論的正確與否。本文將利用卡方Chi特征檢驗實現(xiàn)提取關(guān)鍵文本特征功能,感興趣的可以了解一下2022-12-12Python實現(xiàn)奇數(shù)列與偶數(shù)列調(diào)換的方法詳解
這篇文章主要為大家詳細介紹了如何利用Python實現(xiàn)df的奇數(shù)列與偶數(shù)列調(diào)換位置,比如A列,B列,調(diào)換成B列,A列,感興趣的小伙伴可以了解一下2022-05-05keras中模型訓練class_weight,sample_weight區(qū)別說明
這篇文章主要介紹了keras中模型訓練class_weight,sample_weight區(qū)別說明,具有很好的參考價值,希望對大家有所幫助。一起跟隨小編過來看看吧2020-05-05python算法練習之兔子產(chǎn)子(斐波那切數(shù)列)
這篇文章主要給大家介紹python算法練習兔子產(chǎn)子,文章先進行問題描述及分析然后設(shè)計算法最后再得出完整程序,需要的朋友可以參考一下 文章得具體內(nèi)容2021-10-10