怎么使用python生成詞云圖
詞云圖是什么?
詞云圖又稱文字云,是信息可視化的表現(xiàn)形式之一。詞云是把文本中出現(xiàn)頻率較高的關鍵詞進行視覺上的突出顯示,形成關鍵詞云層或關鍵詞渲染,從而過濾掉大量的文本信息。讀者可以快速領略文本的主旨。
相對柱狀圖、折線圖、餅圖等用來顯示數(shù)據(jù)的圖表,詞云圖可以展示大量文本數(shù)據(jù)。每個詞的重要性(出現(xiàn)的頻率)以字號大小表示:字號越大,該關鍵詞越重要。如果想快速了解一段文本的重點,就可以構(gòu)建一張詞云圖,從高頻詞匯去粗略了解。詞云圖以不同文字的雜亂組合,形成一定形狀的圖片,不僅能夠以很直觀的方式展示出重點內(nèi)容,而且形式炫酷,顏色多變,給人眼前一亮的感覺。
怎么使用python制作詞云圖?
制作詞云圖很簡單,首先需要導入3個庫:
import jieba import wordcloud import imageio
其中,jieba和wordcloud為第三方庫,需要自行安裝。而imageio為python自帶的庫,不需要自行安裝。
然后導入一個背景模板,以及需要制作詞云圖的底圖。注意:模板的背景一定要是白色的,不可以是其他顏色或者透明
bg=imageio.v2.imread('D:\kgr1.jpg') with open('D:/111.txt',encoding='utf-8') as f: t=f.read()
提取關鍵字
ls=jieba.lcut(t) txt=" ".join(ls)
生成詞云
w=wordcloud.WordCloud(width=1000,height=700,#詞云比例 font_path="msyh.ttc",colormap='pink',#字體&顏色 background_color='white',mask=bg)#背景色&模板 w.generate(txt) w.to_file(r'D:\pic.png')
效果圖如下:
背景模板圖片:
生成的詞云圖:
引用的文字為melt歌詞,由此可見ryo寫melt的高頻詞為:"了".如果用這首歌鬼畜,那么在te的發(fā)音出現(xiàn)時加速會有很好的鬼畜效果。
wordcloud還有其他功能,可以根據(jù)以下內(nèi)容適度選擇喜歡的功能添加:
wordcloud = WordCloud(font_path='simhei.ttf', # 字體 prefer_horizontal= ,#大部分都是橫向排放 background_color=' ', # 背景色 max_words= , # 顯示單詞數(shù) max_font_size= , #最大字號 stopwords= , # 過濾噪聲詞 mask= ,#背景輪廓 colormap= ,#使用自定義顏色 collocations=False ).generate(txt) image = wordcloud.to_image() image.show() # 展示圖片 wordcloud.to_file(' ') # 保存圖片
遇到的坑
做詞云圖會遇到第三方庫安裝失敗的情況。
試了很多的方法,最后發(fā)現(xiàn)以下的方法是可行的:
wordcloud:
安裝wordcloud庫可以到以下鏈接下載對應自己的python版本、系統(tǒng)版本的.whl文件:
https://www.lfd.uci.edu/~gohlke/pythonlibs/
這是按首字母排序的。比如我下的是wordcloud?1.8.1?cp38?cp38?win32.whl,其中cp38就是指我的python版本號是3.8,如果是3.8.1等等也視為3.8;win32就是系統(tǒng)是32位的。如果你的python也沒有numpy等等的話也需要安裝,如果沒有這些那么wordcloud也可能運行不了。
下好了以后,打開cmd,輸入pip install 文件所在路徑,比如pip install D:\wordcloud?1.8.1?cp38?cp38?win32.whl,等待提示安裝完成即可。如果在pycharm中還是不能運行,可以試試在pycharm中點文件→設置→項目→python解釋器→+號搜索,或者直接把第三方庫的文件添加到項目/venv/Lib/sitepackages直到不報錯為止。
jieba:
同理,但可以試試到這個鏈接下下載:
https://pypi.tuna.tsinghua.edu.cn/simple/jieba/
總結(jié)
到此這篇關于怎么使用python生成詞云圖的文章就介紹到這了,更多相關python生成詞云圖內(nèi)容請搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關文章希望大家以后多多支持腳本之家!
相關文章
用tensorflow實現(xiàn)彈性網(wǎng)絡回歸算法
這篇文章主要介紹了用tensorflow實現(xiàn)彈性網(wǎng)絡回歸算法2018-01-01python的staticmethod與classmethod實現(xiàn)實例代碼
這篇文章主要介紹了python的staticmethod與classmethod實現(xiàn)實例代碼,分享了相關代碼示例,小編覺得還是挺不錯的,具有一定借鑒價值,需要的朋友可以參考下2018-02-02Python IDE環(huán)境之 新版Pycharm安裝詳細教程
這篇文章主要介紹了Python IDE環(huán)境之 新版Pycharm安裝教程,本文教程給大家介紹的非常詳細,對大家的學習或工作具有一定的參考借鑒價值,需要的朋友可以參考下2020-03-03淺談python中np.array的shape( ,)與( ,1)的區(qū)別
今天小編就為大家分享一篇python中np.array的shape ( ,)與( ,1)的區(qū)別,具有很好的參考價值,希望對大家有所幫助。一起跟隨小編過來看看吧2018-06-06