Python詞云展示庫wordcloud配置詳解
1.介紹
wordcloud是優(yōu)秀的詞云展示第三方庫,wordcloud能夠?qū)⒁欢挝谋咀兂梢粋€詞云。
詞云就是將詞語通過圖形可視化的方式,直觀和藝術(shù)的展示出來。詞云在我們的生活中經(jīng)常能夠看到,無論是中文的詞云還是英文的詞云。
安裝第三方庫需要使用pip工具,在命令行下運行安裝命令(不是IDLE)。注意:需要將Python目錄和其目錄下的Scripts目錄加到環(huán)境變量中。
使用命令pip install wordcloud安裝第三方庫,安裝之后會提示successfully installed,告知是否安裝成功。
2.使用說明
wordcloud庫把詞云當(dāng)做一個WordCloud對象,即wordcloud.WordCloud()是一個代表文本對應(yīng)詞云的對象,一個詞云就是一個WordCloud對象。wordcloud庫可以根據(jù)文本中詞語出現(xiàn)的頻率等一系列參數(shù)來繪制詞云,在繪制詞云時,詞云的形狀、尺寸、顏色包括字體都是可以設(shè)定的。
wordcloud庫對具體詞云的繪制有一個基本的思路,思路是用wordcloud庫中的WordCloud對象來表明一個詞云,WordCloud對象是一個詞云的對象基礎(chǔ),然后向這個對象中配置參數(shù)、加載文本、輸出到文件中。這同樣也是詞云繪制的步驟:1.配置對象參數(shù);2.加載詞云文本;3.輸出詞云文件。為了完成后兩個步驟,我們需要將WordCloud對象賦給一個變量名,使得后兩個步驟可以調(diào)用,例如:w=wordcloud.WordCloud()。
配置對象參數(shù)(參數(shù)之間使用逗號隔開):
- width
指定詞云對象生成圖片的寬度,默認400像素,例如:
w=wordcloud.WordCloud(width=600)
- height
指定詞云對象生成圖片的高度,默認200像素,例如:
w=wordcloud.WordCloud(height=400)
- min_font_size
指定詞云中字體的最小字號,默認4號,例如:
w=wordcloud.WordCloud(min_font_size=10)
- max_font_size
指定詞云中字體的最大字號,根據(jù)高度自動調(diào)節(jié),例如:
w=wordcloud.WordCloud(max_font_size=20)
- font_step
指定詞云中字體字號的步進間隔,默認為1
w=wordcloud.WordCloud(font_step=2)
- font_path
指定字體文件的路徑,默認為None
w=wordcloud.WordCloud(font_path="msyh.ttc")
- max_words
指定詞云顯示的最大單詞數(shù)量,默認200,例如:
w=wordcloud.WordCloud(max_words=20)
- stop_words
指定詞云的排除單詞列表,即不顯示的單詞列表,例如:
w=wordcloud.WordCloud(stop_words={"Python"})
- mask
指定詞云形狀(提供白色的形狀圖片),默認為長方形,在使用時需要引用imread()函數(shù),例如:
from scipy.misc import imread mk=imread("pic.png") w=wordcloud.WordCloud(mask=mk)
- background_color
指定詞云圖片的背景顏色,默認為黑色,例如:
w=wordcloud.WordCloud(background_color="white")
加載詞云文本方法(默認前提w=wordcolud.WordCloud()):
w.generate(txt)
向WordCloud對象w中加載文本txt,例如:
w.generate("Python and WordCloud")
輸出詞云文件方法(默認前提w=wordcolud.WordCloud()):
w.to_file(filename)
將詞云輸出為圖像文件,采用.png或.jpg格式,例如:
w.to_file("outfile.png")
在不指定圖片寬和高時,默認圖片寬為400像素,高位200像素。
由文本變?yōu)樵~云,wordcloud庫大概做了4件事:
1.wordcloud庫以空格為分隔符,將文本分割成單詞;
2.wordcloud庫會在文本中統(tǒng)計每一個單詞出現(xiàn)的次數(shù),單詞出現(xiàn)次數(shù)越多,那么單詞顯示的詞云效果的字體越大,反之則反。并且將只有1到2個字符的單詞過濾掉;
3.wordcloud庫會根據(jù)統(tǒng)計單詞出現(xiàn)的次數(shù),為不同的單詞配置顯示的字號;
4.進行布局。
英文詞云實例:
import wordcloud txt="Guido van Rossum, Father of Python" w=wordcloud.WordCloud( \ background_color="white") w.generate(txt) w.to_file("image.png")
生成的圖片
中文詞云實例:
import jieba import wordcloud#Python小白學(xué)習(xí)交流群:725638078 txt="Python由荷蘭數(shù)學(xué)和計算機科學(xué)研究學(xué)會的吉多·范羅蘇姆于1990年代初設(shè)計,作為一門叫做ABC語言的替代品。 \ Python提供了高效的高級數(shù)據(jù)結(jié)構(gòu),還能簡單有效地面向?qū)ο缶幊?。Python語法和動態(tài)類型,以及解釋型語言的本質(zhì),\ 使它成為多數(shù)平臺上寫腳本和快速開發(fā)應(yīng)用的編程語言,隨著版本的不斷更新和語言新功能的添加,逐漸被用于獨立的、大型項目的開發(fā)。" w=wordcloud.WordCloud( width=1000,font_path="msyh.ttc",height=700) #必須設(shè)置字體,否則中文會顯示成方框。這里字體文件與.py文件處于同一目錄下 w.generate(" ".join(jieba.lcut(txt))) w.to_file("image.png")
生成的圖片
到此這篇關(guān)于Python詞云展示庫wordcloud配置詳解的文章就介紹到這了,更多相關(guān)Python詞云展示庫wordcloud內(nèi)容請搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!
相關(guān)文章
python使用PyCharm進行遠程開發(fā)和調(diào)試
這篇文章主要介紹了python使用PyCharm進行遠程開發(fā)和調(diào)試,小編覺得挺不錯的,現(xiàn)在分享給大家,也給大家做個參考。一起跟隨小編過來看看吧2017-11-11python 對任意數(shù)據(jù)和曲線進行擬合并求出函數(shù)表達式的三種解決方案
這篇文章主要介紹了python 對任意數(shù)據(jù)和曲線進行擬合并求出函數(shù)表達式的三種解決方案,本文通過實例代碼給大家介紹的非常詳細,具有一定的參考借鑒價值,需要的朋友可以參考下2020-02-02python機器學(xué)習(xí)實現(xiàn)決策樹
這篇文章主要為大家詳細介紹了python機器學(xué)習(xí)實現(xiàn)決策樹,文中示例代碼介紹的非常詳細,具有一定的參考價值,感興趣的小伙伴們可以參考一下2019-11-11python3 pathlib庫Path類方法總結(jié)
這篇文章主要介紹了python3 pathlib庫Path類方法總結(jié),文中通過示例代碼介紹的非常詳細,對大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價值,需要的朋友可以參考下2019-12-12三個Python常用的數(shù)據(jù)清洗處理方式總結(jié)
這篇文章主要為大家詳細介紹了python數(shù)據(jù)處理過程中三個主要的數(shù)據(jù)清洗說明,分別是缺失值/空格/重復(fù)值的數(shù)據(jù)清洗,感興趣的小伙伴可以了解一下2022-12-12