python根據(jù)文本生成詞云圖代碼實例
這篇文章主要介紹了python根據(jù)文本生成詞云圖代碼實例,文中通過示例代碼介紹的非常詳細,對大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價值,需要的朋友可以參考下
效果

代碼
from wordcloud import WordCloud
import codecs
import jieba
#import jieba.analyse as analyse
from scipy.misc import imread
import os
from os import path
import matplotlib.pyplot as plt
from PIL import Image, ImageDraw, ImageFont
# 繪制詞云
def draw_wordcloud():
#讀入一個txt文件
comment_text = open('data.txt','r',encoding='utf-8').read()
#結(jié)巴分詞,生成字符串,如果不通過分詞,無法直接生成正確的中文詞云
cut_text = " ".join(jieba.cut(comment_text))
d = path.dirname(__file__) # 當前文件文件夾所在目錄
color_mask = imread("bilibili.jpg") # 讀取背景圖片
cloud = WordCloud(
#設(shè)置字體,不指定就會出現(xiàn)亂碼
font_path="C:/Windows/Fonts/STXINGKA.TTF",
#font_path=path.join(d,'simsun.ttc'),
#設(shè)置背景色
background_color='white',
#詞云形狀
mask=color_mask,
#允許最大詞匯
max_words=2000,
#最大號字體
max_font_size=100
)
word_cloud = cloud.generate(cut_text) # 產(chǎn)生詞云
word_cloud.to_file("bilibilirankword.jpg") #保存圖片
# 顯示詞云圖片
plt.imshow(word_cloud)
plt.axis('off')
plt.show()
if __name__ == '__main__':
draw_wordcloud()
步驟以及注意點
1.首先要導(dǎo)入對應(yīng)的庫
2.文字會根據(jù)背景圖而分布
3.背景圖的選擇對于最終效果很重要,選一個盡量大一點的背景圖,這個背景圖隨便找就好,任何圖片都可以不過最好大一些,圖案不太復(fù)雜
4.如果字號小的話,可以調(diào)整字體,或者換個背景圖
5.font_path要使用自己的字體庫,不過你的電腦是windows的話,應(yīng)該不用改,用我這個就可以,除此之外呢,這個字體如果是別的的話,可能會出現(xiàn)
中文不能產(chǎn)生詞云圖的現(xiàn)象,總之用我的就好了。
以上就是本文的全部內(nèi)容,希望對大家的學(xué)習(xí)有所幫助,也希望大家多多支持腳本之家。
相關(guān)文章
解決Python中l(wèi)ist里的中文輸出到html模板里的問題
今天小編就為大家分享一篇解決Python中l(wèi)ist里的中文輸出到html模板里的問題,具有很好的參考價值,希望對大家有所幫助。一起跟隨小編過來看看吧2018-12-12
Python實現(xiàn)批量填補遙感影像的無效值NoData
這篇文章主要為大家介紹了如何基于Python中ArcPy模塊,對大量柵格遙感影像文件批量進行無效值(NoData值)填充的方法,感興趣的小伙伴可以了解一下2023-06-06
如何利用pandas工具輸出每行的索引值、及其對應(yīng)的行數(shù)據(jù)
這篇文章主要介紹了如何利用pandas工具輸出每行的索引值、及其對應(yīng)的行數(shù)據(jù),本文給大家介紹的非常詳細,對大家的學(xué)習(xí)或工作具有一定的參考借鑒價值,需要的朋友可以參考下2021-03-03
Django Path轉(zhuǎn)換器自定義及正則代碼實例
這篇文章主要介紹了Django Path轉(zhuǎn)換器自定義及正則代碼實例,文中通過示例代碼介紹的非常詳細,對大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價值,需要的朋友可以參考下2020-05-05
Python正則表達式re.compile()和re.findall()詳解
re?模塊提供了不少有用的函數(shù),用以匹配字符串,下面這篇文章主要給大家介紹了關(guān)于Python正則表達式re.compile()和re.findall()的相關(guān)資料,文中通過示例代碼介紹的非常詳細,需要的朋友可以參考下2022-07-07

