Python實(shí)現(xiàn)統(tǒng)計(jì)單詞出現(xiàn)的個(gè)數(shù)
最近在看python腳本語言,腳本語言是一種解釋性的語言,不需要編譯,可以直接用,由解釋器來負(fù)責(zé)解釋。python語言很強(qiáng)大,而且寫起來很簡(jiǎn)潔。下面的一個(gè)例子就是用python統(tǒng)計(jì)單詞出現(xiàn)的個(gè)數(shù)。
import sys import string #import collections if len(sys.argv) == 1 or sys.argv[1] in {"-h", "--help"}: print("usage: uniqueword filename_1 filename_2 ... filename_n") sys.exit() else: words = {} # words = collections.defaultdict(int) strip = string.whitespace + string.punctuation + string.digits + "\"'" for filename in sys.argv[1:]: for line in open(filename): for word in line.split(): word = word.strip(strip) if len(word) >= 2: words[word] = words.get(word, 0) + 1 # words[word] += 1 for word in sorted(words): print("'{0}' occurs {1} times".format(word,words[word]))
假設(shè)文件名是 uniqueword.py,在命令行下輸入: uniqueword.py filename_1 filename_2 ... filename_n中單詞出現(xiàn)的次數(shù)可以被統(tǒng)計(jì)出來。
第四行和第五行判斷是否有輸入?yún)?shù),如果輸入?yún)?shù)為空或者為-h, -help,則輸出幫助信息。
從第七行到第14行是核心部分,逐一打開參數(shù)中指定的文件,并讀取每一行,再用字符串的split方法把讀取的行抽取出一個(gè)一個(gè)的單詞,但單詞長(zhǎng)度大于2的時(shí)候,把此單詞加入到字典words中。 其中words.get(word, 0)的意思是取出key等于word的value,如果key為空,則把value置為默認(rèn)值0. 最后打印出結(jié)果。
- Python統(tǒng)計(jì)列表中的重復(fù)項(xiàng)出現(xiàn)的次數(shù)的方法
- python實(shí)現(xiàn)簡(jiǎn)單中文詞頻統(tǒng)計(jì)示例
- Python實(shí)現(xiàn)對(duì)excel文件列表值進(jìn)行統(tǒng)計(jì)的方法
- python統(tǒng)計(jì)一個(gè)文本中重復(fù)行數(shù)的方法
- 用Python中的字典來處理索引統(tǒng)計(jì)的方法
- Python中統(tǒng)計(jì)函數(shù)運(yùn)行耗時(shí)的方法
- python統(tǒng)計(jì)cpu利用率的方法
- python數(shù)據(jù)結(jié)構(gòu)之二叉樹的統(tǒng)計(jì)與轉(zhuǎn)換實(shí)例
- python高斯分布概率密度函數(shù)的使用詳解
- python實(shí)現(xiàn)beta分布概率密度函數(shù)的方法
- Python實(shí)現(xiàn)的概率分布運(yùn)算操作示例
- Python統(tǒng)計(jì)分析模塊statistics用法示例
相關(guān)文章
python實(shí)現(xiàn)TCP服務(wù)器端與客戶端的方法詳解
這篇文章主要介紹了python實(shí)現(xiàn)TCP服務(wù)器端與客戶端的方法,以實(shí)例形式詳解分析了Python實(shí)現(xiàn)服務(wù)器端與客戶端的技巧,具有一定參考借鑒價(jià)值,需要的朋友可以參考下2015-04-04基于Python中isfile函數(shù)和isdir函數(shù)使用詳解
今天小編就為大家分享一篇基于Python中isfile函數(shù)和isdir函數(shù)使用詳解,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。一起跟隨小編過來看看吧2019-11-11教你用python實(shí)現(xiàn)一個(gè)無界面的小型圖書管理系統(tǒng)
今天帶大家學(xué)習(xí)怎么用python實(shí)現(xiàn)一個(gè)無界面的小型圖書管理系統(tǒng),文中有非常詳細(xì)的圖文解說及代碼示例,對(duì)正在學(xué)習(xí)python的小伙伴們有很好地幫助,需要的朋友可以參考下2021-05-05Python調(diào)用C/C++動(dòng)態(tài)鏈接庫的方法詳解
這篇文章主要介紹了Python調(diào)用C/C++動(dòng)態(tài)鏈接庫的方法,需要的朋友可以參考下2014-07-07Python實(shí)現(xiàn)計(jì)算信息熵的示例代碼
信息熵(information?entropy)是信息論的基本概念。描述信息源各可能事件發(fā)生的不確定性。本文將通過Python實(shí)現(xiàn)信息熵的計(jì)算,感興趣的可以了解一下2022-12-12NetWorkX使用方法及nx.draw()相關(guān)參數(shù)解讀
這篇文章主要介紹了NetWorkX使用方法及nx.draw()相關(guān)參數(shù)解讀,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。如有錯(cuò)誤或未考慮完全的地方,望不吝賜教2022-12-12