使用python實現(xiàn)個性化詞云的方法
更新時間:2017年06月16日 08:58:43 作者:baddog_
最近看到可視化的詞云,看到網(wǎng)上也很多這樣的工具,但是都不怎么完美,有些不支持中文,有的中文詞頻統(tǒng)計得莫名其妙、有的不支持自定義形狀、所有的都不能自定義顏色,于是網(wǎng)上找了一下,決定用python繪制詞云
先上圖片
詞云圖
需要模板
pip install jieba pip install wordcloud
還需要安裝另外兩個東西這兩個我也不太懂借鑒百度寫上去的
pip install scipy pip install matplotlib
因為用ubuntu系統(tǒng)所有沒有windows那么麻煩,也沒有那么多報錯
看到好多人制作自己的詞云有沒有一絲絲的激動啊,有激動就要馬上去做,沖動才是第一創(chuàng)造力。
jieba是一款很恨很好用的中文分詞模板
至于wordcloud沒有中文文檔不過咱會猜啊,英文不好咱們可以猜啊,查看源代碼猜。
先把我全部代碼貢獻上來
#-*-coding:utf-8—-*- import jieba.analyse from wordcloud import WordCloud,ImageColorGenerator from scipy.misc import imread import matplotlib.pyplot as plt class wc: def __init__(self,txt_file,img_file,font_file): self.f = open(txt_file,'r') self.txt = self.f.read() self.f.close() self.tags = jieba.analyse.extract_tags(self.txt,topK=100) #topK說白了就是返回幾個關(guān)鍵詞 self.text = ' '.join(self.tags) #把分詞鏈接起來,加空格因為英文靠空格分詞 self.img = imread(img_file) self.wc = WordCloud(font_path=font_file,background_color='white',max_words=100,mask=self.img,max_font_size=80) ###直接在這里進行猜### #font_path指的是字體文件路徑,因為wordcloud自帶的字體不支持中文所以我們要指定一個字體文件,否者輸出的圖片全是框框 #background_color 默認(rèn)是黑色 我設(shè)置成白色 #max_words最大顯示的詞數(shù) #mask 背景圖片 #max_font_size 最大字體字號 self.word_cloud = self.wc.generate(self.text) def show_wc(self): #img_color = ImageColorGenerator(self.img) plt.imshow(self.word_cloud) #可以通過 plt.imshow(self.wc.recolor(color_func=img_color))使圖片顏色跟字體顏色一樣 plt.axis("off") plt.show() if __name__=='__main__': mywc = wc('sanwen.txt','out.png','font.ttc') mywc.show_wc()
使用wc.recolor(color_func=img_color)
相關(guān)文章
在tensorflow下利用plt畫論文中l(wèi)oss,acc等曲線圖實例
這篇文章主要介紹了在tensorflow下利用plt畫論文中l(wèi)oss,acc等曲線圖實例,具有很好的參考價值,希望對大家有所幫助。一起跟隨小編過來看看吧2020-06-06