快捷導(dǎo)航

python用字典統(tǒng)計(jì)單詞或漢字詞個(gè)數(shù)示例

更新時(shí)間：2014年04月22日 10:06:49 作者：

這篇文章主要介紹了python用字典統(tǒng)計(jì)單詞或漢字詞個(gè)數(shù)示例,需要的朋友可以參考下

有如下格式的文本文件

/“/請(qǐng)/！/”/“/請(qǐng)/！/”/兩名/劍士/各自/倒轉(zhuǎn)/劍尖/，/右手/握/劍柄/，
/左手/搭于/右手/手背/，/躬身行禮/。/兩/人/身子/尚未/站/直/，
/突然/間/白光閃/動(dòng)/，/跟著/錚的/一/聲響/，
/雙劍相/交/，/兩/人/各/退一步/。
/旁/觀眾/人/都/是/“/咦/”/的/一聲/輕呼/。/青衣/劍士/連/劈/三/劍/

將這段話進(jìn)行詞頻統(tǒng)計(jì)，結(jié)果是詞—詞數(shù) 的形式，比如請(qǐng) 2 ，并把結(jié)果放到txt文件中。

這樣的問(wèn)題利用詞或單詞作為字典的key,循環(huán)判斷有不有這個(gè)key，沒(méi)有新增一個(gè)，有的話，將這個(gè)key對(duì)應(yīng)的value加1

復(fù)制代碼代碼如下:

#coding:utf-8
word_lst = []
word_dict = {}

with open("中文.txt","r") as f1 ,open("詞次數(shù).txt",'w') as f2:
for line in f1:
word_lst.append(line.split('/'))

   for item in word_lst:
       for item2 in item:
           if item2.strip() not in "，！?！啊? :
               if   item2 not in word_dict:
                   word_dict[item2] = 1
               else :
                   word_dict[item2] += 1

   for key in word_dict:
       print key,word_dict[key]
       f2.write(key+' '+str(word_dict[key]))

您可能感興趣的文章:

相關(guān)文章

Python在線和離線安裝第三方庫(kù)的方法
這篇文章主要介紹了Python在線和離線安裝第三方庫(kù)的方法,本文給大家介紹的非常詳細(xì)，對(duì)大家的學(xué)習(xí)或工作具有一定的參考借鑒價(jià)值，需要的朋友可以參考下
2020-10-10
基于TensorFlow常量、序列以及隨機(jī)值生成實(shí)例
今天小編就為大家分享一篇基于TensorFlow常量、序列以及隨機(jī)值生成實(shí)例，具有很好的參考價(jià)值，希望對(duì)大家有所幫助。一起跟隨小編過(guò)來(lái)看看吧
2020-01-01
Python設(shè)置matplotlib.plot的坐標(biāo)軸刻度間隔以及刻度范圍
這篇文章主要介紹了Python設(shè)置matplotlib.plot的坐標(biāo)軸刻度間隔以及刻度范圍，具有一定的參考價(jià)值，感興趣的小伙伴們可以參考一下
2019-06-06
如何基于python操作json文件獲取內(nèi)容
這篇文章主要介紹了如何基于python操作json文件獲取內(nèi)容,文中通過(guò)示例代碼介紹的非常詳細(xì)，對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友可以參考下
2019-12-12
python 函數(shù)中的參數(shù)類型
thon中函數(shù)的參數(shù)類型比較豐富，比如我們經(jīng)常見到*args和**kwargs作為參數(shù)。今天給大家介紹python 函數(shù)中的參數(shù)類型,需要的朋友可以參考下
2020-02-02
pytorch 實(shí)現(xiàn)二分類交叉熵逆樣本頻率權(quán)重
這篇文章主要介紹了pytorch 實(shí)現(xiàn)二分類交叉熵逆樣本頻率權(quán)重的操作，具有很好的參考價(jià)值，希望對(duì)大家有所幫助。如有錯(cuò)誤或未考慮完全的地方，望不吝賜教
2021-05-05
利用Matplotlib實(shí)現(xiàn)單畫布繪制多個(gè)子圖
這篇文章主要介紹了利用Matplotlib實(shí)現(xiàn)單畫布繪制多個(gè)子圖，具有很好的參考價(jià)值，希望對(duì)大家有所幫助。如有錯(cuò)誤或未考慮完全的地方，望不吝賜教
2023-02-02
Python使用函數(shù)輔助工具簡(jiǎn)化開發(fā)提高效率
這篇文章主要為大家介紹了Python使用函數(shù)輔助工具簡(jiǎn)化開發(fā)提高效率,有需要的朋友可以借鑒參考下,希望能夠有所幫助,祝大家多多進(jìn)步,早日升職加薪
2024-01-01
Python+SimpleRNN實(shí)現(xiàn)股票預(yù)測(cè)詳解
這篇文章主要為大家詳細(xì)介紹了如何利用Python和SimpleRNN實(shí)現(xiàn)股票預(yù)測(cè)效果，文中的示例代碼講解詳細(xì)，對(duì)我們學(xué)習(xí)有一定幫助，需要的可以參考一下
2022-05-05
Python?創(chuàng)建或讀取?Excel?文件的操作代碼
Excel是一種常用的電子表格軟件，廣泛應(yīng)用于金融、商業(yè)和教育等領(lǐng)域，本文介紹Python?創(chuàng)建或讀取?Excel?文件的操作代碼，感興趣的朋友一起看看吧
2023-09-09