Python制作詞云圖代碼實(shí)例
詞云圖是將詞匯按照頻率的高低顯示不同大小而形成的圖,可以一目了然地看出關(guān)鍵詞。下面是詞云圖的python代碼~
#導(dǎo)入需要模塊
import jieba
import numpy as np
import matplotlib.pyplot as plt
from PIL import Image
from wordcloud import WordCloud, STOPWORDS, ImageColorGenerator
text_road=str(input('請(qǐng)輸入文章的路徑:'))
picture_road=str(input('請(qǐng)輸入圖片的路徑:'))
#加載需要分析的文章
text = open(text_road,'r',encoding='utf-8').read()
#對(duì)文章進(jìn)行分詞
wordlist_after_jieba = jieba.cut(text, cut_all=False)
wl_space_split = " ".join(wordlist_after_jieba)
#讀取照片通過(guò)numpy.array函數(shù)將照片等結(jié)構(gòu)數(shù)據(jù)轉(zhuǎn)化為np-array
mask=np.array(Image.open(picture_road))
#選擇屏蔽詞,不顯示在詞云里面
stopwords = set(STOPWORDS)
#可以加多個(gè)屏蔽詞
stopwords.add("<br/>")
#創(chuàng)建詞云對(duì)象
wc = WordCloud(
background_color="white",
font_path='/Library/Fonts/Arial Unicode.ttf',
max_words=1000, # 最多顯示詞數(shù)
mask=mask,
stopwords=stopwords,
max_font_size=100 # 字體最大值
)
#生成詞云
wc.generate(text)
#從背景圖建立顏色方案
image_colors =ImageColorGenerator(mask)
#將詞云顏色設(shè)置為背景圖方案
wc.recolor(color_func=image_colors)
#顯示詞云
plt.imshow(wc,interpolation='bilinear')
#關(guān)閉坐標(biāo)軸
plt.axis("off")
#顯示圖像
plt.show()
#保存詞云
wc.to_file('詞云圖.png')
下面這張圖是我爬了阿里巴巴招聘網(wǎng)站上所有數(shù)據(jù)分析職位需求,生成的詞云圖,大家可以看看阿里對(duì)數(shù)據(jù)分析師的要求~

以上就是本文的全部?jī)?nèi)容,希望對(duì)大家的學(xué)習(xí)有所幫助,也希望大家多多支持腳本之家。
相關(guān)文章
python 獲取sqlite3數(shù)據(jù)庫(kù)的表名和表字段名的實(shí)例
今天小編就為大家分享一篇python 獲取sqlite3數(shù)據(jù)庫(kù)的表名和表字段名的實(shí)例,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。一起跟隨小編過(guò)來(lái)看看吧2019-07-07
10個(gè)Python Itertools方法助你事半功倍
itertools模塊就是一個(gè)很好的例子,它為開發(fā)者提供了許多強(qiáng)大的工具,可以用更短的代碼來(lái)操作Python的可迭代對(duì)象,本文主要介紹了Python中itertools高效迭代工具,感興趣的可以了解一下2024-04-04
解決keras.datasets 在loaddata時(shí),無(wú)法下載的問(wèn)題
這篇文章主要介紹了解決keras.datasets 在loaddata時(shí),無(wú)法下載的問(wèn)題,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。2021-05-05
python使用循環(huán)打印所有三位數(shù)水仙花數(shù)的實(shí)例
今天小編就為大家分享一篇python使用循環(huán)打印所有三位數(shù)水仙花數(shù)的實(shí)例,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。一起跟隨小編過(guò)來(lái)看看吧2018-11-11
python數(shù)據(jù)分析之時(shí)間序列分析詳情
這篇文章主要介紹了python數(shù)據(jù)分析之時(shí)間序列分析詳情,時(shí)間序列分析是基于隨機(jī)過(guò)程理論和數(shù)理統(tǒng)計(jì)學(xué)方法,具體詳細(xì)內(nèi)容介紹,需要的小伙伴可以參考一下2022-08-08
虛擬環(huán)境及venv和virtualenv的區(qū)別說(shuō)明
這篇文章主要介紹了虛擬環(huán)境及venv和virtualenv的區(qū)別說(shuō)明,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。一起跟隨小編過(guò)來(lái)看看吧2021-02-02

