Python統(tǒng)計(jì)詞頻的幾種方法小結(jié)
本文介紹python統(tǒng)計(jì)詞頻的幾種方法,供大家參考
方法一:運(yùn)用集合去重方法
def word_count1(words,n):
word_list = []
for word in set(words):
num = words.counts(word)
word_list.append([word,num])
word_list.sort(key=lambda x:x[1], reverse=True)
for i in range(n):
word, count = word_list[i]
print('{0:<15}{1:>5}'.format(word, count))
說明:運(yùn)用集合對文本字符串列表去重,這樣統(tǒng)計(jì)詞匯不會重復(fù),運(yùn)用列表的counts方法統(tǒng)計(jì)頻數(shù),將每個(gè)詞匯和其出現(xiàn)的次數(shù)打包成一個(gè)列表加入到word_list中,運(yùn)用列表的sort方法排序,大功告成。
方法二:運(yùn)用字典統(tǒng)計(jì)
def word_count2(words,n):
counts = {}
for word in words:
if len(word) == 1:
continue
else:
counts[word] = counts.get(word, 0) + 1
items = list(counts.items())
items.sort(key=lambda x:x[1], reverse=True)
for i in range(n):
word, count = items[i]
print("{0:<15}{1:>5}".format(word, count))
方法三:使用計(jì)數(shù)器
def word_count3(words,n):
from collections import Counter
counts = Counter(words)
for ch in "": # 刪除一些不需要統(tǒng)計(jì)的元素
del counts[ch]
for word, count in counts.most_common(n): # 已經(jīng)按數(shù)量大小排好了
print("{0:<15}{1:>5}".format(word, count))
到此這篇關(guān)于Python統(tǒng)計(jì)詞頻的幾種方法小結(jié)的文章就介紹到這了,更多相關(guān)Python統(tǒng)計(jì)詞頻內(nèi)容請搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!
相關(guān)文章
Python and、or以及and-or語法總結(jié)
這篇文章主要介紹了Python and、or以及and-or語法總結(jié),本文分別給出實(shí)例講解它們的使用方法,需要的朋友可以參考下2015-04-04
py3nvml實(shí)現(xiàn)GPU相關(guān)信息讀取的案例分析
這篇文章主要介紹了py3nvml實(shí)現(xiàn)GPU相關(guān)信息讀取,此時(shí)就可以考慮使用py3nvml這樣的工具,針對于GPU任務(wù)執(zhí)行的過程進(jìn)行細(xì)化的分析,有助于提升GPU的利用率和程序執(zhí)行的性能,需要的朋友可以參考下2022-01-01
python安裝/卸載模塊方法步驟詳解(附詳細(xì)圖解)
在日常工作中會需要安裝或者卸載Python模塊.于是我整理了一下,下面這篇文章主要給大家介紹了關(guān)于python安裝/卸載模塊的相關(guān)資料,文中通過圖文介紹的非常詳細(xì),需要的朋友可以參考下2023-01-01
對python中GUI,Label和Button的實(shí)例詳解
今天小編就為大家分享一篇對python中GUI,Label和Button的實(shí)例詳解,具有很好的參考價(jià)值,希望對大家有所幫助。一起跟隨小編過來看看吧2019-06-06
python通過pillow識別動態(tài)驗(yàn)證碼的示例代碼
在上網(wǎng)時(shí),經(jīng)常會遇到驗(yàn)證碼,本次試驗(yàn)將帶領(lǐng)大家認(rèn)識驗(yàn)證碼的一些特性,并利用 Python 中的 pillow 庫完成對驗(yàn)證碼的破解。感興趣的可以了解一下2021-11-11
如何使用Python程序完成描述性統(tǒng)計(jì)分析需求
這篇文章主要介紹了如何使用Python程序完成描述性統(tǒng)計(jì)分析需求,運(yùn)用制表和分類,圖形以及計(jì)算概括性數(shù)據(jù)來描述數(shù)據(jù)特征的各項(xiàng)活動,需要的朋友可以參考下2023-03-03

