怎么使用python生成詞云圖
詞云圖是什么?
詞云圖又稱文字云,是信息可視化的表現(xiàn)形式之一。詞云是把文本中出現(xiàn)頻率較高的關(guān)鍵詞進(jìn)行視覺上的突出顯示,形成關(guān)鍵詞云層或關(guān)鍵詞渲染,從而過濾掉大量的文本信息。讀者可以快速領(lǐng)略文本的主旨。
相對柱狀圖、折線圖、餅圖等用來顯示數(shù)據(jù)的圖表,詞云圖可以展示大量文本數(shù)據(jù)。每個詞的重要性(出現(xiàn)的頻率)以字號大小表示:字號越大,該關(guān)鍵詞越重要。如果想快速了解一段文本的重點(diǎn),就可以構(gòu)建一張?jiān)~云圖,從高頻詞匯去粗略了解。詞云圖以不同文字的雜亂組合,形成一定形狀的圖片,不僅能夠以很直觀的方式展示出重點(diǎn)內(nèi)容,而且形式炫酷,顏色多變,給人眼前一亮的感覺。
怎么使用python制作詞云圖?
制作詞云圖很簡單,首先需要導(dǎo)入3個庫:
import jieba import wordcloud import imageio
其中,jieba和wordcloud為第三方庫,需要自行安裝。而imageio為python自帶的庫,不需要自行安裝。
然后導(dǎo)入一個背景模板,以及需要制作詞云圖的底圖。注意:模板的背景一定要是白色的,不可以是其他顏色或者透明
bg=imageio.v2.imread('D:\kgr1.jpg') with open('D:/111.txt',encoding='utf-8') as f: t=f.read()
提取關(guān)鍵字
ls=jieba.lcut(t) txt=" ".join(ls)
生成詞云
w=wordcloud.WordCloud(width=1000,height=700,#詞云比例 font_path="msyh.ttc",colormap='pink',#字體&顏色 background_color='white',mask=bg)#背景色&模板 w.generate(txt) w.to_file(r'D:\pic.png')
效果圖如下:
背景模板圖片:
生成的詞云圖:
引用的文字為melt歌詞,由此可見ryo寫melt的高頻詞為:"了".如果用這首歌鬼畜,那么在te的發(fā)音出現(xiàn)時加速會有很好的鬼畜效果。
wordcloud還有其他功能,可以根據(jù)以下內(nèi)容適度選擇喜歡的功能添加:
wordcloud = WordCloud(font_path='simhei.ttf', # 字體 prefer_horizontal= ,#大部分都是橫向排放 background_color=' ', # 背景色 max_words= , # 顯示單詞數(shù) max_font_size= , #最大字號 stopwords= , # 過濾噪聲詞 mask= ,#背景輪廓 colormap= ,#使用自定義顏色 collocations=False ).generate(txt) image = wordcloud.to_image() image.show() # 展示圖片 wordcloud.to_file(' ') # 保存圖片
遇到的坑
做詞云圖會遇到第三方庫安裝失敗的情況。
試了很多的方法,最后發(fā)現(xiàn)以下的方法是可行的:
wordcloud:
安裝wordcloud庫可以到以下鏈接下載對應(yīng)自己的python版本、系統(tǒng)版本的.whl文件:
https://www.lfd.uci.edu/~gohlke/pythonlibs/
這是按首字母排序的。比如我下的是wordcloud?1.8.1?cp38?cp38?win32.whl,其中cp38就是指我的python版本號是3.8,如果是3.8.1等等也視為3.8;win32就是系統(tǒng)是32位的。如果你的python也沒有numpy等等的話也需要安裝,如果沒有這些那么wordcloud也可能運(yùn)行不了。
下好了以后,打開cmd,輸入pip install 文件所在路徑,比如pip install D:\wordcloud?1.8.1?cp38?cp38?win32.whl,等待提示安裝完成即可。如果在pycharm中還是不能運(yùn)行,可以試試在pycharm中點(diǎn)文件→設(shè)置→項(xiàng)目→python解釋器→+號搜索,或者直接把第三方庫的文件添加到項(xiàng)目/venv/Lib/sitepackages直到不報錯為止。
jieba:
同理,但可以試試到這個鏈接下下載:
https://pypi.tuna.tsinghua.edu.cn/simple/jieba/
總結(jié)
到此這篇關(guān)于怎么使用python生成詞云圖的文章就介紹到這了,更多相關(guān)python生成詞云圖內(nèi)容請搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!
相關(guān)文章
Python自動化運(yùn)維和部署項(xiàng)目工具Fabric使用實(shí)例
Fabric是一個Python庫,只要目標(biāo)機(jī)器支持ssh訪問,就可以借助fabric來進(jìn)行遠(yuǎn)程操作(如在host1上對host2遠(yuǎn)程運(yùn)行shell命令),顯然,由于fabric是個Python package,故其它Python package都可以被import到fabric特有的fabfile.py腳本中2016-09-09在pytorch中計(jì)算準(zhǔn)確率,召回率和F1值的操作
這篇文章主要介紹了在pytorch中計(jì)算準(zhǔn)確率,召回率和F1值的操作,具有很好的參考價值,希望對大家有所幫助。如有錯誤或未考慮完全的地方,望不吝賜教2021-05-05用tensorflow實(shí)現(xiàn)彈性網(wǎng)絡(luò)回歸算法
這篇文章主要介紹了用tensorflow實(shí)現(xiàn)彈性網(wǎng)絡(luò)回歸算法2018-01-01python的staticmethod與classmethod實(shí)現(xiàn)實(shí)例代碼
這篇文章主要介紹了python的staticmethod與classmethod實(shí)現(xiàn)實(shí)例代碼,分享了相關(guān)代碼示例,小編覺得還是挺不錯的,具有一定借鑒價值,需要的朋友可以參考下2018-02-02Python中ImportError錯誤的詳細(xì)解決方法
最近辛辛苦苦安裝完了python,最后再運(yùn)行的時候會出現(xiàn)錯誤,所以這篇文章主要給大家介紹了關(guān)于Python中ImportError錯誤的詳細(xì)解決方法,文中通過實(shí)例代碼介紹的非常詳細(xì),需要的朋友可以參考下2022-07-07Python IDE環(huán)境之 新版Pycharm安裝詳細(xì)教程
這篇文章主要介紹了Python IDE環(huán)境之 新版Pycharm安裝教程,本文教程給大家介紹的非常詳細(xì),對大家的學(xué)習(xí)或工作具有一定的參考借鑒價值,需要的朋友可以參考下2020-03-03Python批量加密Excel文件的實(shí)現(xiàn)示例
在日常工作中,保護(hù)敏感數(shù)據(jù)是至關(guān)重要的,本文主要介紹了Python批量加密Excel文件的實(shí)現(xiàn)示例,具有一定的參考價值,感興趣的可以了解一下2023-12-12淺談python中np.array的shape( ,)與( ,1)的區(qū)別
今天小編就為大家分享一篇python中np.array的shape ( ,)與( ,1)的區(qū)別,具有很好的參考價值,希望對大家有所幫助。一起跟隨小編過來看看吧2018-06-06