python利用WordCloud模塊實(shí)現(xiàn)詞云繪制
初步認(rèn)識(shí)
wordcloud是詞云繪圖模塊,封裝了WordCloud詞云類(lèi),是詞云的基本載體。在新建一個(gè)詞云之后,通過(guò)generate裝載用以生成詞云的字符串,最后用to_file把詞云圖保存到文件中,例如
from wordcloud import WordCloud w = WordCloud() txt = "tinycool cool tiny Python WordCloud word cloud word not world" w.generate(txt) w.to_file("pywordcloud.png")
效果如下
基本參數(shù)
僅就這張圖像來(lái)說(shuō),我們能感受到的特性大概有
- 詞云圖的寬度、高度
- 背景顏色,文字顏色
- 字體
- 單詞長(zhǎng)度,單詞個(gè)數(shù)
這些特性可受到下列參數(shù)調(diào)控
參數(shù) | 說(shuō)明 | 備注 |
---|---|---|
font_path | 字體文件路徑 | otf或ttf文件 |
width | 詞云寬度 | 默認(rèn)400 |
height | 詞云高度 | 默認(rèn)200 |
min_font_size | 最小文字尺寸 | 默認(rèn)4 |
max_font_size | 最大文字尺寸 | 默認(rèn)為圖像高度 |
relative_scaling | 詞頻對(duì)尺寸的影響 | 默認(rèn)"auto" |
font_step | 字體步長(zhǎng) | 默認(rèn)1 |
max_words | 最大單詞數(shù) | 默認(rèn)200 |
min_word_length | 最短單詞長(zhǎng)度 | 默認(rèn)0 |
background_color | 背景色 | 默認(rèn)"black" |
mode | 顏色格式 | 默認(rèn)RGB |
colormap | 顏色映射 | |
repeat | 是否重復(fù)單詞 | 默認(rèn)False |
下面對(duì)這些參數(shù)稍作更改,并
# txt即本文前面所有文字,因?yàn)樘嗑筒粚?xiě)了 txt = r''' ''' dct = dict(width=600, height=300, font_path = r"C:\Windows\Fonts\simhei.ttf", min_font_size = 10, max_font_size = 100, max_words = 20, min_word_length = 2, background_color = "white", colormap = "jet") w = WordCloud(**dct) w.generate(txt) w.to_file("pywordcloud.png")
效果如下,由于最多只顯示20個(gè)單詞,而且尺寸最小是10,最大100,所以不太好看。
掩模參數(shù)
所謂掩模,就是詞云組成的圖案,主要由以下參數(shù)調(diào)控。
參數(shù) | 說(shuō)明 | 備注 |
---|---|---|
mask | 掩模數(shù)組 | 默認(rèn)None |
contour_width | 掩模寬度 | 默認(rèn)為0 |
contour_color | 掩模顏色 | 默認(rèn)"black" |
掩模數(shù)組由0和1構(gòu)成,詞云只在掩模數(shù)組為1的位置顯示。下面畫(huà)一個(gè)橢圓作為掩模數(shù)組,橢圓圓周的方程為
import numpy as np y, x = np.indices([300,600]) delta = np.sqrt(280**2-(2*y-300)**2) mask = (x<300+delta) & (x>300-delta) mask = (1-mask)*254+1 w = WordCloud( mask = mask, contour_width=100, font_path = r"C:\Windows\Fonts\simhei.ttf") w.generate(txt) w.to_file("pywordcloud.png")
效果如下
到此這篇關(guān)于python利用WordCloud模塊實(shí)現(xiàn)詞云繪制的文章就介紹到這了,更多相關(guān)python WordCloud內(nèi)容請(qǐng)搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!
相關(guān)文章
python繪制散點(diǎn)圖和折線(xiàn)圖的方法
這篇文章主要為大家詳細(xì)介紹了python繪制散點(diǎn)圖和折線(xiàn)圖的方法,文中示例代碼介紹的非常詳細(xì),具有一定的參考價(jià)值,感興趣的小伙伴們可以參考一下2022-04-0410個(gè)Python Itertools方法助你事半功倍
itertools模塊就是一個(gè)很好的例子,它為開(kāi)發(fā)者提供了許多強(qiáng)大的工具,可以用更短的代碼來(lái)操作Python的可迭代對(duì)象,本文主要介紹了Python中itertools高效迭代工具,感興趣的可以了解一下2024-04-04python實(shí)現(xiàn)pdf轉(zhuǎn)換成word/txt純文本文件
這篇文章主要為大家詳細(xì)介紹了python實(shí)現(xiàn)pdf轉(zhuǎn)換成word和txt純文本文件,具有一定的參考價(jià)值,感興趣的小伙伴們可以參考一下2018-06-06VSCODE配置Markdown及Markdown基礎(chǔ)語(yǔ)法詳解
這篇文章主要介紹了VSCODE配置Markdown及Markdown基礎(chǔ)語(yǔ)法詳解,本文給大家介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或工作具有一定的參考借鑒價(jià)值,需要的朋友可以參考下2021-01-01python使用rsa非對(duì)稱(chēng)加密過(guò)程解析
這篇文章主要介紹了python使用rsa非對(duì)稱(chēng)加密過(guò)程解析,文中通過(guò)示例代碼介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友可以參考下2019-12-12如何使用python實(shí)現(xiàn)多個(gè)csv文件數(shù)據(jù)的合并和輸出
文章介紹了如何使用Python批量合并多個(gè)CSV文件,并提供具體代碼示例,代碼簡(jiǎn)單易懂,感興趣的朋友一起看看吧2025-03-03Django框架實(shí)現(xiàn)的分頁(yè)demo示例
這篇文章主要介紹了Django框架實(shí)現(xiàn)的分頁(yè)demo,結(jié)合實(shí)例形式分析了Django框架分頁(yè)的步驟、原理、相關(guān)操作技巧與注意事項(xiàng),需要的朋友可以參考下2019-05-05Python3之外部文件調(diào)用Django程序操作model等文件實(shí)現(xiàn)方式
這篇文章主要介紹了Python3之外部文件調(diào)用Django程序操作model等文件實(shí)現(xiàn)方式,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。一起跟隨小編過(guò)來(lái)看看吧2020-04-04PyTorch中torch.utils.data.DataLoader簡(jiǎn)單介紹與使用方法
DataLoader是PyTorch中讀取數(shù)據(jù)的一個(gè)重要接口,基本上用PyTorch訓(xùn)練模型都會(huì)用到,下面這篇文章主要給大家介紹了關(guān)于PyTorch中torch.utils.data.DataLoader簡(jiǎn)單介紹與使用方法的相關(guān)資料,需要的朋友可以參考下2022-06-06