欧美bbbwbbbw肥妇,免费乱码人妻系列日韩,一级黄片

使用python實(shí)現(xiàn)個(gè)性化詞云的方法

 更新時(shí)間:2017年06月16日 08:58:43   作者:baddog_  
最近看到可視化的詞云,看到網(wǎng)上也很多這樣的工具,但是都不怎么完美,有些不支持中文,有的中文詞頻統(tǒng)計(jì)得莫名其妙、有的不支持自定義形狀、所有的都不能自定義顏色,于是網(wǎng)上找了一下,決定用python繪制詞云

先上圖片


詞云圖

需要模板

pip install jieba
pip install wordcloud

還需要安裝另外兩個(gè)東西這兩個(gè)我也不太懂借鑒百度寫上去的

pip install scipy
pip install matplotlib

因?yàn)橛胾buntu系統(tǒng)所有沒(méi)有windows那么麻煩,也沒(méi)有那么多報(bào)錯(cuò)

看到好多人制作自己的詞云有沒(méi)有一絲絲的激動(dòng)啊,有激動(dòng)就要馬上去做,沖動(dòng)才是第一創(chuàng)造力。

jieba是一款很恨很好用的中文分詞模板

jeiba中文文檔

至于wordcloud沒(méi)有中文文檔不過(guò)咱會(huì)猜啊,英文不好咱們可以猜啊,查看源代碼猜。

先把我全部代碼貢獻(xiàn)上來(lái)

#-*-coding:utf-8—-*-
import jieba.analyse
from wordcloud import WordCloud,ImageColorGenerator
from scipy.misc import imread
import matplotlib.pyplot as plt

class wc:
  def __init__(self,txt_file,img_file,font_file):
   self.f = open(txt_file,'r')
  self.txt = self.f.read()
   self.f.close()
  self.tags = jieba.analyse.extract_tags(self.txt,topK=100)
  #topK說(shuō)白了就是返回幾個(gè)關(guān)鍵詞
  self.text = ' '.join(self.tags) #把分詞鏈接起來(lái),加空格因?yàn)橛⑽目靠崭穹衷~
  self.img = imread(img_file)
  self.wc = WordCloud(font_path=font_file,background_color='white',max_words=100,mask=self.img,max_font_size=80)
###直接在這里進(jìn)行猜###
#font_path指的是字體文件路徑,因?yàn)閣ordcloud自帶的字體不支持中文所以我們要指定一個(gè)字體文件,否者輸出的圖片全是框框
#background_color 默認(rèn)是黑色 我設(shè)置成白色
#max_words最大顯示的詞數(shù)
#mask 背景圖片
#max_font_size 最大字體字號(hào)
  self.word_cloud = self.wc.generate(self.text)

  def show_wc(self):
  #img_color = ImageColorGenerator(self.img)
    plt.imshow(self.word_cloud)
#可以通過(guò) plt.imshow(self.wc.recolor(color_func=img_color))使圖片顏色跟字體顏色一樣
    plt.axis("off")
    plt.show()


if __name__=='__main__':
  mywc = wc('sanwen.txt','out.png','font.ttc')
  mywc.show_wc()


使用wc.recolor(color_func=img_color)

相關(guān)文章

  • Python常用數(shù)字處理基本操作匯總

    Python常用數(shù)字處理基本操作匯總

    這篇文章主要介紹了Python常用數(shù)字處理基本操作匯總,文中通過(guò)示例代碼介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友可以參考下
    2020-09-09
  • 在tensorflow下利用plt畫論文中l(wèi)oss,acc等曲線圖實(shí)例

    在tensorflow下利用plt畫論文中l(wèi)oss,acc等曲線圖實(shí)例

    這篇文章主要介紹了在tensorflow下利用plt畫論文中l(wèi)oss,acc等曲線圖實(shí)例,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。一起跟隨小編過(guò)來(lái)看看吧
    2020-06-06
  • Python之Trimesh庫(kù)的使用方式

    Python之Trimesh庫(kù)的使用方式

    這篇文章主要介紹了Python之Trimesh庫(kù)的使用方式,具有很好的參考價(jià)值,希望對(duì)大家有所幫助,如有錯(cuò)誤或未考慮完全的地方,望不吝賜教
    2024-06-06
  • python2和python3的輸入和輸出區(qū)別介紹

    python2和python3的輸入和輸出區(qū)別介紹

    這篇文章主要介紹了python2和python3的輸入和輸出區(qū)別介紹,本文給大家介紹的非常詳細(xì),具有一定的參考借鑒價(jià)值,需要的朋友可以參考下
    2018-11-11
  • Python變量格式化輸出實(shí)現(xiàn)原理解析

    Python變量格式化輸出實(shí)現(xiàn)原理解析

    這篇文章主要介紹了Python變量格式化輸出實(shí)現(xiàn)原理解析,文中通過(guò)示例代碼介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友可以參考下
    2020-08-08
  • python  文件的基本操作 菜中菜功能的實(shí)例代碼

    python 文件的基本操作 菜中菜功能的實(shí)例代碼

    這篇文章主要介紹了python 文件的基本操作 菜中菜功能,本文通過(guò)實(shí)例代碼給大家介紹的非常詳細(xì),具有一定的參考借鑒價(jià)值 ,需要的朋友可以參考下
    2019-07-07
  • 使用python實(shí)現(xiàn)畫AR模型時(shí)序圖

    使用python實(shí)現(xiàn)畫AR模型時(shí)序圖

    今天小編就為大家分享一篇使用python實(shí)現(xiàn)畫AR模型時(shí)序圖,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。一起跟隨小編過(guò)來(lái)看看吧
    2019-11-11
  • python抓取網(wǎng)頁(yè)中圖片并保存到本地

    python抓取網(wǎng)頁(yè)中圖片并保存到本地

    本篇文章給大家介紹python抓取網(wǎng)頁(yè)中圖片并保存到本地,對(duì)python抓取網(wǎng)頁(yè)圖片相關(guān)知識(shí)感興趣的朋友一起學(xué)習(xí)吧
    2015-12-12
  • Python paramiko使用方法代碼匯總

    Python paramiko使用方法代碼匯總

    這篇文章主要介紹了Python paramiko使用方法代碼匯總,文中通過(guò)示例代碼介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友可以參考下
    2020-11-11
  • python將人民幣轉(zhuǎn)換大寫的腳本代碼

    python將人民幣轉(zhuǎn)換大寫的腳本代碼

    python將人民幣轉(zhuǎn)換大寫的代碼,有需要的朋友可以參考下
    2013-02-02

最新評(píng)論