布同 統(tǒng)計(jì)英文單詞的個(gè)數(shù)的python代碼
更新時(shí)間:2011年03月13日 13:21:09 作者:
最近需要翻譯英文文章,所以需要統(tǒng)計(jì)單詞個(gè)數(shù)。索性寫了一段代碼在此,可以簡(jiǎn)單的統(tǒng)計(jì)單詞的個(gè)數(shù)
word中對(duì)于英文單詞的統(tǒng)計(jì)也很好,大家不妨試試。如果沒有安裝word,而且你也是程序員的話,那么可以使用我的這段代碼。通過測(cè)試,word的統(tǒng)計(jì)結(jié)果是18674,軟件的統(tǒng)計(jì)結(jié)果是18349,相差不到2%,可以作為一個(gè)參考。
代碼如下:
# -*- coding: utf-8 -*-
import os,sys
info = os.getcwd() #獲取當(dāng)前文件名稱
fin = open(u'谷歌C++編程代碼規(guī)范.txt')
info = fin.read()
alist = info.split(' ') # 將文章按照空格劃分開
fout = open(u'count.txt', 'w')
fout.write('\n'.join(alist)) # 可以通過文本文件的行號(hào)同樣看到效果
##fout.write('%s' % alist)
fout.close()
allen = len(alist) # 總的單詞數(shù)
nulen = alist.count('') # 空格的數(shù)量
print "words' number is",allen
print "null number is",nulen
print "poor words number is", allen-nulen # 實(shí)際的單詞數(shù)目
fin.close()
代碼如下:
復(fù)制代碼 代碼如下:
# -*- coding: utf-8 -*-
import os,sys
info = os.getcwd() #獲取當(dāng)前文件名稱
fin = open(u'谷歌C++編程代碼規(guī)范.txt')
info = fin.read()
alist = info.split(' ') # 將文章按照空格劃分開
fout = open(u'count.txt', 'w')
fout.write('\n'.join(alist)) # 可以通過文本文件的行號(hào)同樣看到效果
##fout.write('%s' % alist)
fout.close()
allen = len(alist) # 總的單詞數(shù)
nulen = alist.count('') # 空格的數(shù)量
print "words' number is",allen
print "null number is",nulen
print "poor words number is", allen-nulen # 實(shí)際的單詞數(shù)目
fin.close()
您可能感興趣的文章:
- python實(shí)現(xiàn)統(tǒng)計(jì)漢字/英文單詞數(shù)的正則表達(dá)式
- Python實(shí)現(xiàn)統(tǒng)計(jì)英文單詞個(gè)數(shù)及字符串分割代碼
- Python統(tǒng)計(jì)純文本文件中英文單詞出現(xiàn)個(gè)數(shù)的方法總結(jié)【測(cè)試可用】
- Python3實(shí)現(xiàn)統(tǒng)計(jì)單詞表中每個(gè)字母出現(xiàn)頻率的方法示例
- python 文本單詞提取和詞頻統(tǒng)計(jì)的實(shí)例
- python實(shí)現(xiàn)字符串中字符分類及個(gè)數(shù)統(tǒng)計(jì)
- python 統(tǒng)計(jì)數(shù)組中元素出現(xiàn)次數(shù)并進(jìn)行排序的實(shí)例
- python統(tǒng)計(jì)字母、空格、數(shù)字等字符個(gè)數(shù)的實(shí)例
- Python實(shí)現(xiàn)統(tǒng)計(jì)英文文章詞頻的方法分析
相關(guān)文章
Python使用MySQL8.2讀寫分離實(shí)現(xiàn)示例詳解
在這篇文章中,我們將了解如何將?MySQL?8.2?的讀寫分離功能與?MySQL-Connector/Python?一起使用的方法示例詳解,有需要的朋友可以借鑒參考下,希望能夠有所幫助,祝大家多多進(jìn)步,早日升職加薪2023-11-11關(guān)于Python中 循環(huán)器 itertools的介紹
循環(huán)器是對(duì)象的容器,包含有多個(gè)對(duì)象。通過調(diào)用循環(huán)器的next()方法 (__next__()方法,在Python 3.x中),循環(huán)器將依次返回一個(gè)對(duì)象。直到所有的對(duì)象遍歷窮盡,循環(huán)器將舉出StopIteration錯(cuò)誤。這篇文章將對(duì)此做一個(gè)詳細(xì)介紹,感興趣的小伙伴請(qǐng)參考下面文字內(nèi)容2021-09-09python opencv鼠標(biāo)事件實(shí)現(xiàn)畫框圈定目標(biāo)獲取坐標(biāo)信息
這篇文章主要為大家詳細(xì)介紹了python opencv鼠標(biāo)事件實(shí)現(xiàn)畫框圈定目標(biāo),獲取坐標(biāo)信息,文中示例代碼介紹的非常詳細(xì),具有一定的參考價(jià)值,感興趣的小伙伴們可以參考一下2019-08-08python實(shí)現(xiàn)異步回調(diào)機(jī)制代碼分享
本文介紹了python實(shí)現(xiàn)異步回調(diào)機(jī)制的功能,大家參考使用吧2014-01-01超詳細(xì)注釋之OpenCV旋轉(zhuǎn)圖像任意角度
這篇文章主要介紹了OpenCV旋轉(zhuǎn)圖像任意角度,本文給大家介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或工作具有一定的參考借鑒價(jià)值,需要的朋友可以參考下2021-09-09Python threading模塊condition原理及運(yùn)行流程詳解
這篇文章主要介紹了Python threading模塊condition原理及運(yùn)行流程詳解,文中通過示例代碼介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友可以參考下2020-10-10Cpython3.9源碼解析python中的大小整數(shù)
這篇文章主要介紹了Cpython3.9源碼解析python中的大小整數(shù),在CPython中,小整數(shù)對(duì)象池是一種優(yōu)化機(jī)制,用于減少對(duì)常用小整數(shù)的內(nèi)存分配和銷毀開銷,需要的朋友可以參考下2023-04-04