快捷導(dǎo)航

用Python讀取幾十萬(wàn)行文本數(shù)據(jù)

更新時(shí)間：2018年12月24日 11:21:15 作者：accumulate_zhang

今天小編就為大家分享一篇關(guān)于用Python讀取幾十萬(wàn)行文本數(shù)據(jù)，小編覺(jué)得內(nèi)容挺不錯(cuò)的，現(xiàn)在分享給大家，具有很好的參考價(jià)值，需要的朋友一起跟隨小編來(lái)看看吧

我在使用python讀取幾十萬(wàn)行的文件中的數(shù)據(jù)，并構(gòu)造字典，列表等數(shù)據(jù)結(jié)構(gòu)時(shí)，再訪問(wèn)字典，列表時(shí)，一般都會(huì)出現(xiàn)內(nèi)存不夠的問(wèn)題，然后只能循環(huán)讀取幾百行或者一定數(shù)量的行數(shù)來(lái)循環(huán)操作。

keyword_list=[line.strip() for line in open("keywords.txt",'r')]
#f1=open("part_wiki_vec.txt",'r')
f1=open("wiki_vectors.txt")
f2=open("result.txt",'w')
i=0
content=f1.readlines()
while i<1150:
 for line in content[300*i:300*(i+1)]:
  line=line.strip().split(' ')
  if line[0] in keyword_list:
   wordvec=' '.join(line)
   print wordvec
   f2.write(wordvec)
  #print line
 i+=1

我是這樣讀取的

應(yīng)該還有很多好的方法，比如多線程等等。

做此記錄只為了學(xué)習(xí)

總結(jié)

以上就是這篇文章的全部?jī)?nèi)容了，希望本文的內(nèi)容對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值，謝謝大家對(duì)腳本之家的支持。如果你想了解更多相關(guān)內(nèi)容請(qǐng)查看下面相關(guān)鏈接

您可能感興趣的文章:

相關(guān)文章

pandas如何將datetime64[ns]轉(zhuǎn)為字符串日期
這篇文章主要介紹了pandas如何將datetime64[ns]轉(zhuǎn)為字符串日期，具有很好的參考價(jià)值，希望對(duì)大家有所幫助。如有錯(cuò)誤或未考慮完全的地方，望不吝賜教
2022-07-07
python包和文件夾有的區(qū)別點(diǎn)總結(jié)
在本篇文章里小編給大家整理的是一篇關(guān)于python包和文件夾有的區(qū)別點(diǎn)總結(jié)內(nèi)容，有興趣的朋友們可以學(xué)習(xí)參考下。
2021-09-09
Python利用卡方Chi特征檢驗(yàn)實(shí)現(xiàn)提取關(guān)鍵文本特征
卡方檢驗(yàn)最基本的思想就是通過(guò)觀察實(shí)際值與理論值的偏差來(lái)確定理論的正確與否。本文將利用卡方Chi特征檢驗(yàn)實(shí)現(xiàn)提取關(guān)鍵文本特征功能，感興趣的可以了解一下
2022-12-12
Python實(shí)現(xiàn)奇數(shù)列與偶數(shù)列調(diào)換的方法詳解
這篇文章主要為大家詳細(xì)介紹了如何利用Python實(shí)現(xiàn)df的奇數(shù)列與偶數(shù)列調(diào)換位置，比如A列，B列，調(diào)換成B列，A列，感興趣的小伙伴可以了解一下
2022-05-05
Python遞歸實(shí)現(xiàn)猴子吃桃問(wèn)題及解析
這篇文章主要介紹了Python遞歸實(shí)現(xiàn)猴子吃桃問(wèn)題及解析，具有很好的參考價(jià)值，希望對(duì)大家有所幫助。如有錯(cuò)誤或未考慮完全的地方，望不吝賜教
2022-07-07
使用Python批量移除Word文檔水印的代碼示例
移除Word文檔中的水印可以減少不必要的麻煩,通過(guò)使用Python這樣的編程語(yǔ)言,我們可以輕松實(shí)現(xiàn)自動(dòng)化操作,高效地移除Word文檔中的水印,確保文檔的專業(yè)性和準(zhǔn)確性,本文將介紹如何使用Python批量移除Word文檔中的水印
2024-07-07
Windows 64位下python3安裝nltk模塊
這篇文章主要為大家詳細(xì)介紹了Windows 64位下python3安裝nltk模塊，具有一定的參考價(jià)值，感興趣的小伙伴們可以參考一下
2018-09-09
python 5個(gè)頂級(jí)異步框架推薦
這篇文章主要介紹了python5個(gè)頂級(jí)的異步框架，幫助大家更好的利用python進(jìn)行web開(kāi)發(fā)，感興趣的朋友可以了解下
2020-09-09
keras中模型訓(xùn)練class_weight,sample_weight區(qū)別說(shuō)明
這篇文章主要介紹了keras中模型訓(xùn)練class_weight,sample_weight區(qū)別說(shuō)明，具有很好的參考價(jià)值，希望對(duì)大家有所幫助。一起跟隨小編過(guò)來(lái)看看吧
2020-05-05
python算法練習(xí)之兔子產(chǎn)子（斐波那切數(shù)列）
這篇文章主要給大家介紹python算法練習(xí)兔子產(chǎn)子，文章先進(jìn)行問(wèn)題描述及分析然后設(shè)計(jì)算法最后再得出完整程序,需要的朋友可以參考一下文章得具體內(nèi)容
2021-10-10