欧美bbbwbbbw肥妇,免费乱码人妻系列日韩,一级黄片

使用python實(shí)現(xiàn)個(gè)性化詞云的方法

 更新時(shí)間:2017年06月16日 08:58:43   作者:baddog_  
最近看到可視化的詞云,看到網(wǎng)上也很多這樣的工具,但是都不怎么完美,有些不支持中文,有的中文詞頻統(tǒng)計(jì)得莫名其妙、有的不支持自定義形狀、所有的都不能自定義顏色,于是網(wǎng)上找了一下,決定用python繪制詞云

先上圖片


詞云圖

需要模板

pip install jieba
pip install wordcloud

還需要安裝另外兩個(gè)東西這兩個(gè)我也不太懂借鑒百度寫(xiě)上去的

pip install scipy
pip install matplotlib

因?yàn)橛胾buntu系統(tǒng)所有沒(méi)有windows那么麻煩,也沒(méi)有那么多報(bào)錯(cuò)

看到好多人制作自己的詞云有沒(méi)有一絲絲的激動(dòng)啊,有激動(dòng)就要馬上去做,沖動(dòng)才是第一創(chuàng)造力。

jieba是一款很恨很好用的中文分詞模板

jeiba中文文檔

至于wordcloud沒(méi)有中文文檔不過(guò)咱會(huì)猜啊,英文不好咱們可以猜啊,查看源代碼猜。

先把我全部代碼貢獻(xiàn)上來(lái)

#-*-coding:utf-8—-*-
import jieba.analyse
from wordcloud import WordCloud,ImageColorGenerator
from scipy.misc import imread
import matplotlib.pyplot as plt

class wc:
  def __init__(self,txt_file,img_file,font_file):
   self.f = open(txt_file,'r')
  self.txt = self.f.read()
   self.f.close()
  self.tags = jieba.analyse.extract_tags(self.txt,topK=100)
  #topK說(shuō)白了就是返回幾個(gè)關(guān)鍵詞
  self.text = ' '.join(self.tags) #把分詞鏈接起來(lái),加空格因?yàn)橛⑽目靠崭穹衷~
  self.img = imread(img_file)
  self.wc = WordCloud(font_path=font_file,background_color='white',max_words=100,mask=self.img,max_font_size=80)
###直接在這里進(jìn)行猜###
#font_path指的是字體文件路徑,因?yàn)閣ordcloud自帶的字體不支持中文所以我們要指定一個(gè)字體文件,否者輸出的圖片全是框框
#background_color 默認(rèn)是黑色 我設(shè)置成白色
#max_words最大顯示的詞數(shù)
#mask 背景圖片
#max_font_size 最大字體字號(hào)
  self.word_cloud = self.wc.generate(self.text)

  def show_wc(self):
  #img_color = ImageColorGenerator(self.img)
    plt.imshow(self.word_cloud)
#可以通過(guò) plt.imshow(self.wc.recolor(color_func=img_color))使圖片顏色跟字體顏色一樣
    plt.axis("off")
    plt.show()


if __name__=='__main__':
  mywc = wc('sanwen.txt','out.png','font.ttc')
  mywc.show_wc()


使用wc.recolor(color_func=img_color)

相關(guān)文章

最新評(píng)論