python 統(tǒng)計(jì)文件中的字符串?dāng)?shù)目示例
題目:
一個(gè)txt文件中已知數(shù)據(jù)格式為:
C4D
C4D/maya
C4D
C4D/su
C4D/max/AE
統(tǒng)計(jì)每個(gè)字段出現(xiàn)的次數(shù),比如C4D、maya
先讀取文件,將文件中的數(shù)據(jù)抽取出來(lái):
def getWords(filepath): file = open(filepath) wordOne=[] while(file): line = file.readline() word = line.split('/') wordOne.extend(word) if(not line): #若讀取結(jié)束了 break wordtwo=[] for i in wordOne: wordtwo.extend(i.split()) return wordtwo
說(shuō)明:這個(gè)有一個(gè)要注意的地方是文件是被”\n”,”/”兩種格式分割而來(lái)的,因此需要split兩次。
然后定義一個(gè)dict,遍歷數(shù)據(jù),代碼如下所示:
def getWordNum(words): dictWord={} for i in words: if(i not in dictWord): dictWord[i]=0 dictWord[i]+=1 return dictWord
主函數(shù)的調(diào)用:
filepath='data/new.txt' words = getWords(filepath) dictword = getWordNum(words) print(dictword)
結(jié)果:
{'C4D': 9, 'max': 1, 'su': 1, 'maya': 1, 'AE': 3}
說(shuō)明:
1,
print(type(word)) print(type(splitData[0]))
輸出為:
<class 'list'> <class 'str'>
就是當(dāng)splitData.extend()執(zhí)行之后就將原本是list類(lèi)型的數(shù)據(jù)轉(zhuǎn)換成str類(lèi)型的存儲(chǔ)起來(lái)。只有對(duì)str類(lèi)型的數(shù)據(jù)才能用split函數(shù)
2,
import os print(os.getcwd())
這個(gè)可以輸出當(dāng)前所在位置,對(duì)于讀取文件很有用。
在讀入文件并對(duì)文件進(jìn)行切分的時(shí)候,若是含有的切分詞太多,那么使用re.split()方法是最方便的,如下所示:
filepath='data/new.txt' file = open(filepath) #讀取文件 wordOne=[] symbol = '\n/' #定義分隔符 symbol = "["+symbol+"]" #拼接正則表達(dá)式 while(file): line = file.readline() word = re.split(symbol,line) wordOne.extend(word) if(not line): break #通過(guò)上式得到的list中會(huì)含有很多的空字符串,所以要去空 wordOne = [x for x in wordOne if x]
以上這篇python 統(tǒng)計(jì)文件中的字符串?dāng)?shù)目示例就是小編分享給大家的全部?jī)?nèi)容了,希望能給大家一個(gè)參考,也希望大家多多支持腳本之家。
相關(guān)文章
Python requests timeout的設(shè)置
這篇文章主要介紹了Python requests timeout的設(shè)置,文中通過(guò)示例代碼介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友們下面隨著小編來(lái)一起學(xué)習(xí)學(xué)習(xí)吧2021-04-04Django models.py應(yīng)用實(shí)現(xiàn)過(guò)程詳解
這篇文章主要介紹了Django models.py應(yīng)用實(shí)現(xiàn)過(guò)程詳解,文中通過(guò)示例代碼介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友可以參考下2019-07-07使用Python批量對(duì)文本文件編碼互轉(zhuǎn)的方法
這篇文章主要介紹了使用Python批量對(duì)文本文件編碼互轉(zhuǎn)的方法,本文給大家介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或工作具有一定的參考借鑒價(jià)值,需要的朋友可以參考下2023-03-03Python實(shí)現(xiàn)隨機(jī)游走的詳細(xì)解釋
這篇文章主要介紹了Python實(shí)現(xiàn)隨機(jī)游走的詳細(xì)解釋,文中通過(guò)示例代碼介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友們下面隨著小編來(lái)一起學(xué)習(xí)學(xué)習(xí)吧2021-03-03python實(shí)現(xiàn)圖片轉(zhuǎn)字符小工具
這篇文章主要為大家詳細(xì)介紹了python實(shí)現(xiàn)圖片轉(zhuǎn)字符小工具,具有一定的參考價(jià)值,感興趣的小伙伴們可以參考一下2019-04-04