python利用WordCloud模塊實現(xiàn)詞云繪制
初步認識
wordcloud是詞云繪圖模塊,封裝了WordCloud詞云類,是詞云的基本載體。在新建一個詞云之后,通過generate裝載用以生成詞云的字符串,最后用to_file把詞云圖保存到文件中,例如
from wordcloud import WordCloud
w = WordCloud()
txt = "tinycool cool tiny Python WordCloud word cloud word not world"
w.generate(txt)
w.to_file("pywordcloud.png")
效果如下

基本參數(shù)
僅就這張圖像來說,我們能感受到的特性大概有
- 詞云圖的寬度、高度
- 背景顏色,文字顏色
- 字體
- 單詞長度,單詞個數(shù)
這些特性可受到下列參數(shù)調(diào)控
| 參數(shù) | 說明 | 備注 |
|---|---|---|
| font_path | 字體文件路徑 | otf或ttf文件 |
| width | 詞云寬度 | 默認400 |
| height | 詞云高度 | 默認200 |
| min_font_size | 最小文字尺寸 | 默認4 |
| max_font_size | 最大文字尺寸 | 默認為圖像高度 |
| relative_scaling | 詞頻對尺寸的影響 | 默認"auto" |
| font_step | 字體步長 | 默認1 |
| max_words | 最大單詞數(shù) | 默認200 |
| min_word_length | 最短單詞長度 | 默認0 |
| background_color | 背景色 | 默認"black" |
| mode | 顏色格式 | 默認RGB |
| colormap | 顏色映射 | |
| repeat | 是否重復(fù)單詞 | 默認False |
下面對這些參數(shù)稍作更改,并
# txt即本文前面所有文字,因為太多就不寫了
txt = r'''
'''
dct = dict(width=600, height=300,
font_path = r"C:\Windows\Fonts\simhei.ttf",
min_font_size = 10,
max_font_size = 100,
max_words = 20,
min_word_length = 2,
background_color = "white",
colormap = "jet")
w = WordCloud(**dct)
w.generate(txt)
w.to_file("pywordcloud.png")
效果如下,由于最多只顯示20個單詞,而且尺寸最小是10,最大100,所以不太好看。

掩模參數(shù)
所謂掩模,就是詞云組成的圖案,主要由以下參數(shù)調(diào)控。
| 參數(shù) | 說明 | 備注 |
|---|---|---|
| mask | 掩模數(shù)組 | 默認None |
| contour_width | 掩模寬度 | 默認為0 |
| contour_color | 掩模顏色 | 默認"black" |
掩模數(shù)組由0和1構(gòu)成,詞云只在掩模數(shù)組為1的位置顯示。下面畫一個橢圓作為掩模數(shù)組,橢圓圓周的方程為

import numpy as np
y, x = np.indices([300,600])
delta = np.sqrt(280**2-(2*y-300)**2)
mask = (x<300+delta) & (x>300-delta)
mask = (1-mask)*254+1
w = WordCloud( mask = mask, contour_width=100,
font_path = r"C:\Windows\Fonts\simhei.ttf")
w.generate(txt)
w.to_file("pywordcloud.png")
效果如下

到此這篇關(guān)于python利用WordCloud模塊實現(xiàn)詞云繪制的文章就介紹到這了,更多相關(guān)python WordCloud內(nèi)容請搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!
相關(guān)文章
python實現(xiàn)pdf轉(zhuǎn)換成word/txt純文本文件
這篇文章主要為大家詳細介紹了python實現(xiàn)pdf轉(zhuǎn)換成word和txt純文本文件,具有一定的參考價值,感興趣的小伙伴們可以參考一下2018-06-06
VSCODE配置Markdown及Markdown基礎(chǔ)語法詳解
這篇文章主要介紹了VSCODE配置Markdown及Markdown基礎(chǔ)語法詳解,本文給大家介紹的非常詳細,對大家的學(xué)習(xí)或工作具有一定的參考借鑒價值,需要的朋友可以參考下2021-01-01
如何使用python實現(xiàn)多個csv文件數(shù)據(jù)的合并和輸出
文章介紹了如何使用Python批量合并多個CSV文件,并提供具體代碼示例,代碼簡單易懂,感興趣的朋友一起看看吧2025-03-03
Python3之外部文件調(diào)用Django程序操作model等文件實現(xiàn)方式
這篇文章主要介紹了Python3之外部文件調(diào)用Django程序操作model等文件實現(xiàn)方式,具有很好的參考價值,希望對大家有所幫助。一起跟隨小編過來看看吧2020-04-04
PyTorch中torch.utils.data.DataLoader簡單介紹與使用方法
DataLoader是PyTorch中讀取數(shù)據(jù)的一個重要接口,基本上用PyTorch訓(xùn)練模型都會用到,下面這篇文章主要給大家介紹了關(guān)于PyTorch中torch.utils.data.DataLoader簡單介紹與使用方法的相關(guān)資料,需要的朋友可以參考下2022-06-06

