Python詞頻統(tǒng)計(jì)的兩種方法詳解
統(tǒng)計(jì)文件里每個(gè)單詞的個(gè)數(shù)
思路:
分別統(tǒng)計(jì)文檔中的單詞,與出現(xiàn)的次數(shù)
用兩個(gè)列表將其保存起來(lái),最后再用zip()函數(shù)連接輸出**
想法成立開(kāi)始實(shí)踐
方法一:
# 導(dǎo)入文件 with open("passage.txt", 'r') as file: dates = file.readlines() # 處理 words = [] for i in dates: words += i.replace("\n", "").split(" ") # 用空字符來(lái)代替換行 words +是為了不被覆蓋無(wú)+將只有最后一條數(shù)據(jù) # print(i.replace("\n","").split(" ")) setWords = list(set(words)) # 集合自動(dòng)去重 num = [] # 統(tǒng)計(jì)一個(gè)單詞出現(xiàn)的次數(shù) for k in setWords: count = 0 for j in words: if k == j: count = count + 1 num.append(count) print(num) print(setWords) # 輸出 for x, y in zip(setWords, num): # 將兩個(gè)列表用zip結(jié)合 print(x + ":" + str(y))、
效果圖:
方法二:
此方法用來(lái)字典,較前一個(gè)相對(duì)簡(jiǎn)潔一點(diǎn)
# 導(dǎo)入 with open("passage.txt", 'r') as file: dates = file.readlines() # 處理 words = [] for i in dates: words += i.replace("\n", "").split(" ") # print(i.replace("\n","").split(" ")) # setWords=list(set(words)) #可以不用這個(gè) print(words) print("-" * 40) # print(setWords) diccount = dict() for i in words: if (i not in diccount): diccount[i] = 1 # 第一遍字典為空 賦值相當(dāng)于 i=1,i為words里的單詞 # print(diccount) else: diccount[i] = diccount[i] + 1 # 等不在里面的全部遍歷一遍賦值就都在里面了,我們?cè)賮?lái)記數(shù) print(diccount)
效果圖:
統(tǒng)計(jì)的文檔
總結(jié)
本篇文章就到這里了,希望能夠給你帶來(lái)幫助,也希望您能夠多多關(guān)注腳本之家的更多內(nèi)容!
- Python 詳解爬取并統(tǒng)計(jì)CSDN全站熱榜標(biāo)題關(guān)鍵詞詞頻流程
- 如何利用python實(shí)現(xiàn)詞頻統(tǒng)計(jì)功能
- Python統(tǒng)計(jì)詞頻并繪制圖片(附完整代碼)
- Python jieba 中文分詞與詞頻統(tǒng)計(jì)的操作
- Python英文文章詞頻統(tǒng)計(jì)(14份劍橋真題詞頻統(tǒng)計(jì))
- Python 合并多個(gè)TXT文件并統(tǒng)計(jì)詞頻的實(shí)現(xiàn)
- 詳解Python用三種方式統(tǒng)計(jì)詞頻的方法
- python寫(xiě)程序統(tǒng)計(jì)詞頻的方法
相關(guān)文章
keras實(shí)現(xiàn)圖像預(yù)處理并生成一個(gè)generator的案例
這篇文章主要介紹了keras實(shí)現(xiàn)圖像預(yù)處理并生成一個(gè)generator的案例,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。一起跟隨小編過(guò)來(lái)看看吧2020-06-06女神相冊(cè)密碼忘記了 我只用Python寫(xiě)了20行代碼
這篇文章主要介紹了怎么樣用Python寫(xiě)了20行代碼來(lái)破解找回已經(jīng)忘記的密碼,密碼的排列組合是有限的,遍歷嘗試就能夠試出正確的密碼,但這個(gè)工作要怎么用python實(shí)現(xiàn),請(qǐng)看下文2021-08-08python遞歸調(diào)用中的坑:打印有值, 返回卻None
這篇文章主要介紹了python遞歸調(diào)用中的坑:打印有值, 返回卻None,本文通過(guò)問(wèn)題分析給出解決方法,對(duì)大家的學(xué)習(xí)或工作具有一定的參考借鑒價(jià)值,需要的朋友可以參考下2020-03-03Python程序設(shè)計(jì)入門(mén)(3)數(shù)組的使用
這篇文章主要介紹了Python數(shù)組的使用方法,需要的朋友可以參考下2014-06-06python爬蟲(chóng)之bs4數(shù)據(jù)解析
這篇文章主要介紹了python爬蟲(chóng)之bs4數(shù)據(jù)解析,文中有非常詳細(xì)的代碼示例,對(duì)正在學(xué)習(xí)python爬蟲(chóng)的小伙伴們有非常好的幫助,需要的朋友可以參考下2021-04-04python實(shí)現(xiàn)遠(yuǎn)程控制電腦
這篇文章主要為大家詳細(xì)介紹了python實(shí)現(xiàn)遠(yuǎn)程控制電腦,具有一定的參考價(jià)值,感興趣的小伙伴們可以參考一下2019-05-05