欧美bbbwbbbw肥妇,免费乱码人妻系列日韩,一级黄片

python用字典統(tǒng)計(jì)單詞或漢字詞個(gè)數(shù)示例

 更新時(shí)間:2014年04月22日 10:06:49   作者:  
這篇文章主要介紹了python用字典統(tǒng)計(jì)單詞或漢字詞個(gè)數(shù)示例,需要的朋友可以參考下

有如下格式的文本文件

復(fù)制代碼 代碼如下:

/“/請(qǐng)/!/”/“/請(qǐng)/!/”/兩名/劍士/各自/倒轉(zhuǎn)/劍尖/,/右手/握/劍柄/,
/左手/搭于/右手/手背/,/躬身行禮/。/兩/人/身子/尚未/站/直/,
/突然/間/白光閃/動(dòng)/,/跟著/錚的/一/聲響/,
/雙劍相/交/,/兩/人/各/退一步/。
/旁/觀眾/人/都/是/“/咦/”/的/一聲/輕呼/。/青衣/劍士/連/劈/三/劍/

將這段話進(jìn)行詞頻統(tǒng)計(jì),結(jié)果是  詞—詞數(shù)  的形式,比如  請(qǐng)  2  ,并把結(jié)果放到txt文件中。

這樣的問題利用詞或單詞作為字典的key,循環(huán)判斷有不有這個(gè)key,沒有新增一個(gè),有的話,將這個(gè)key對(duì)應(yīng)的value加1

復(fù)制代碼 代碼如下:

#coding:utf-8
word_lst = []
word_dict = {}

with open("中文.txt","r") as f1 ,open("詞次數(shù).txt",'w') as f2:
   for line in f1:
       word_lst.append(line.split('/'))

   for item in word_lst:
       for item2 in item:
           if item2.strip() not in ",!?!啊? :
               if   item2 not in word_dict:
                   word_dict[item2] = 1
               else :
                   word_dict[item2] += 1

   for key in word_dict:
       print key,word_dict[key]
       f2.write(key+' '+str(word_dict[key]))

相關(guān)文章

最新評(píng)論