Python詞云展示庫(kù)wordcloud配置詳解
1.介紹
wordcloud是優(yōu)秀的詞云展示第三方庫(kù),wordcloud能夠?qū)⒁欢挝谋咀兂梢粋€(gè)詞云。
詞云就是將詞語(yǔ)通過(guò)圖形可視化的方式,直觀和藝術(shù)的展示出來(lái)。詞云在我們的生活中經(jīng)常能夠看到,無(wú)論是中文的詞云還是英文的詞云。
安裝第三方庫(kù)需要使用pip工具,在命令行下運(yùn)行安裝命令(不是IDLE)。注意:需要將Python目錄和其目錄下的Scripts目錄加到環(huán)境變量中。
使用命令pip install wordcloud安裝第三方庫(kù),安裝之后會(huì)提示successfully installed,告知是否安裝成功。
2.使用說(shuō)明
wordcloud庫(kù)把詞云當(dāng)做一個(gè)WordCloud對(duì)象,即wordcloud.WordCloud()是一個(gè)代表文本對(duì)應(yīng)詞云的對(duì)象,一個(gè)詞云就是一個(gè)WordCloud對(duì)象。wordcloud庫(kù)可以根據(jù)文本中詞語(yǔ)出現(xiàn)的頻率等一系列參數(shù)來(lái)繪制詞云,在繪制詞云時(shí),詞云的形狀、尺寸、顏色包括字體都是可以設(shè)定的。
wordcloud庫(kù)對(duì)具體詞云的繪制有一個(gè)基本的思路,思路是用wordcloud庫(kù)中的WordCloud對(duì)象來(lái)表明一個(gè)詞云,WordCloud對(duì)象是一個(gè)詞云的對(duì)象基礎(chǔ),然后向這個(gè)對(duì)象中配置參數(shù)、加載文本、輸出到文件中。這同樣也是詞云繪制的步驟:1.配置對(duì)象參數(shù);2.加載詞云文本;3.輸出詞云文件。為了完成后兩個(gè)步驟,我們需要將WordCloud對(duì)象賦給一個(gè)變量名,使得后兩個(gè)步驟可以調(diào)用,例如:w=wordcloud.WordCloud()。
配置對(duì)象參數(shù)(參數(shù)之間使用逗號(hào)隔開):
- width
指定詞云對(duì)象生成圖片的寬度,默認(rèn)400像素,例如:
w=wordcloud.WordCloud(width=600)
- height
指定詞云對(duì)象生成圖片的高度,默認(rèn)200像素,例如:
w=wordcloud.WordCloud(height=400)
- min_font_size
指定詞云中字體的最小字號(hào),默認(rèn)4號(hào),例如:
w=wordcloud.WordCloud(min_font_size=10)
- max_font_size
指定詞云中字體的最大字號(hào),根據(jù)高度自動(dòng)調(diào)節(jié),例如:
w=wordcloud.WordCloud(max_font_size=20)
- font_step
指定詞云中字體字號(hào)的步進(jìn)間隔,默認(rèn)為1
w=wordcloud.WordCloud(font_step=2)
- font_path
指定字體文件的路徑,默認(rèn)為None
w=wordcloud.WordCloud(font_path="msyh.ttc")
- max_words
指定詞云顯示的最大單詞數(shù)量,默認(rèn)200,例如:
w=wordcloud.WordCloud(max_words=20)
- stop_words
指定詞云的排除單詞列表,即不顯示的單詞列表,例如:
w=wordcloud.WordCloud(stop_words={"Python"})
- mask
指定詞云形狀(提供白色的形狀圖片),默認(rèn)為長(zhǎng)方形,在使用時(shí)需要引用imread()函數(shù),例如:
from scipy.misc import imread mk=imread("pic.png") w=wordcloud.WordCloud(mask=mk)
- background_color
指定詞云圖片的背景顏色,默認(rèn)為黑色,例如:
w=wordcloud.WordCloud(background_color="white")
加載詞云文本方法(默認(rèn)前提w=wordcolud.WordCloud()):
w.generate(txt)
向WordCloud對(duì)象w中加載文本txt,例如:
w.generate("Python and WordCloud")
輸出詞云文件方法(默認(rèn)前提w=wordcolud.WordCloud()):
w.to_file(filename)
將詞云輸出為圖像文件,采用.png或.jpg格式,例如:
w.to_file("outfile.png")
在不指定圖片寬和高時(shí),默認(rèn)圖片寬為400像素,高位200像素。
由文本變?yōu)樵~云,wordcloud庫(kù)大概做了4件事:
1.wordcloud庫(kù)以空格為分隔符,將文本分割成單詞;
2.wordcloud庫(kù)會(huì)在文本中統(tǒng)計(jì)每一個(gè)單詞出現(xiàn)的次數(shù),單詞出現(xiàn)次數(shù)越多,那么單詞顯示的詞云效果的字體越大,反之則反。并且將只有1到2個(gè)字符的單詞過(guò)濾掉;
3.wordcloud庫(kù)會(huì)根據(jù)統(tǒng)計(jì)單詞出現(xiàn)的次數(shù),為不同的單詞配置顯示的字號(hào);
4.進(jìn)行布局。
英文詞云實(shí)例:
import wordcloud txt="Guido van Rossum, Father of Python" w=wordcloud.WordCloud( \ background_color="white") w.generate(txt) w.to_file("image.png")
生成的圖片
中文詞云實(shí)例:
import jieba import wordcloud#Python小白學(xué)習(xí)交流群:725638078 txt="Python由荷蘭數(shù)學(xué)和計(jì)算機(jī)科學(xué)研究學(xué)會(huì)的吉多·范羅蘇姆于1990年代初設(shè)計(jì),作為一門叫做ABC語(yǔ)言的替代品。 \ Python提供了高效的高級(jí)數(shù)據(jù)結(jié)構(gòu),還能簡(jiǎn)單有效地面向?qū)ο缶幊?。Python語(yǔ)法和動(dòng)態(tài)類型,以及解釋型語(yǔ)言的本質(zhì),\ 使它成為多數(shù)平臺(tái)上寫腳本和快速開發(fā)應(yīng)用的編程語(yǔ)言,隨著版本的不斷更新和語(yǔ)言新功能的添加,逐漸被用于獨(dú)立的、大型項(xiàng)目的開發(fā)。" w=wordcloud.WordCloud( width=1000,font_path="msyh.ttc",height=700) #必須設(shè)置字體,否則中文會(huì)顯示成方框。這里字體文件與.py文件處于同一目錄下 w.generate(" ".join(jieba.lcut(txt))) w.to_file("image.png")
生成的圖片
到此這篇關(guān)于Python詞云展示庫(kù)wordcloud配置詳解的文章就介紹到這了,更多相關(guān)Python詞云展示庫(kù)wordcloud內(nèi)容請(qǐng)搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!
相關(guān)文章
python使用PyCharm進(jìn)行遠(yuǎn)程開發(fā)和調(diào)試
這篇文章主要介紹了python使用PyCharm進(jìn)行遠(yuǎn)程開發(fā)和調(diào)試,小編覺得挺不錯(cuò)的,現(xiàn)在分享給大家,也給大家做個(gè)參考。一起跟隨小編過(guò)來(lái)看看吧2017-11-11python 對(duì)任意數(shù)據(jù)和曲線進(jìn)行擬合并求出函數(shù)表達(dá)式的三種解決方案
這篇文章主要介紹了python 對(duì)任意數(shù)據(jù)和曲線進(jìn)行擬合并求出函數(shù)表達(dá)式的三種解決方案,本文通過(guò)實(shí)例代碼給大家介紹的非常詳細(xì),具有一定的參考借鑒價(jià)值,需要的朋友可以參考下2020-02-02python機(jī)器學(xué)習(xí)實(shí)現(xiàn)決策樹
這篇文章主要為大家詳細(xì)介紹了python機(jī)器學(xué)習(xí)實(shí)現(xiàn)決策樹,文中示例代碼介紹的非常詳細(xì),具有一定的參考價(jià)值,感興趣的小伙伴們可以參考一下2019-11-11python3 pathlib庫(kù)Path類方法總結(jié)
這篇文章主要介紹了python3 pathlib庫(kù)Path類方法總結(jié),文中通過(guò)示例代碼介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友可以參考下2019-12-12三個(gè)Python常用的數(shù)據(jù)清洗處理方式總結(jié)
這篇文章主要為大家詳細(xì)介紹了python數(shù)據(jù)處理過(guò)程中三個(gè)主要的數(shù)據(jù)清洗說(shuō)明,分別是缺失值/空格/重復(fù)值的數(shù)據(jù)清洗,感興趣的小伙伴可以了解一下2022-12-12