欧美bbbwbbbw肥妇,免费乱码人妻系列日韩,一级黄片

Python詞云的正確實現(xiàn)方法實例

 更新時間:2021年05月08日 14:47:03   作者:運維汪  
這篇文章主要給大家介紹了關(guān)于Python詞云的正確實現(xiàn)方法的相關(guān)資料,文中通過示例代碼介紹的非常詳細(xì),對大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價值,需要的朋友們下面隨著小編來一起學(xué)習(xí)學(xué)習(xí)吧

一、相關(guān)模塊

jieba:中文分詞

wordcloud :Python詞云庫

imageio:讀取圖形數(shù)據(jù)

安裝:

pip install jieba
pip install wordcloud
pip install imageio

二、wordcloud四大類

功能
WordCloud([font_path, width, height, …]) 生成和繪制詞云對象
ImageColorGenerator(image[, default_color]) 基于圖片的色彩
random_color_func([word, font_size, …]) 隨機生成顏色
get_single_color_func(color) 創(chuàng)建一個顏色函數(shù),它返回一個色調(diào)和飽和度

三、wordcloud類

1、WordCloud類

class wordcloud.WordCloud(
    font_path=None, width=400, height=200, margin=2, 
    ranks_only=None, prefer_horizontal=0.9, mask=None, 
    scale=1, color_func=None, max_words=200, min_font_size=4, 
    stopwords=None, random_state=None, background_color='black', 
    max_font_size=None, font_step=1, mode='RGB', relative_scaling='auto', 
    regexp=None, collocations=True, colormap=None, normalize_plurals=True, 
    contour_width=0, contour_color='black', repeat=False, include_numbers=False, 
    min_word_length=0, collocation_threshold=30)

2、WordCloud參數(shù)詳解

參數(shù) 詳解
font_path 詞云圖的字體路徑(OTF或TTF格式)
width 畫布的寬度、默認(rèn)為400,如果mask不為空時,設(shè)置為mask獲取圖片的大小
height 畫布的高度,默認(rèn)為200,如果mask不為空時,設(shè)置為mask獲取圖片的大小
prefer_horizontal 默認(rèn)值0.9;當(dāng)值<1時,遇到不合適的地方時,算法將詞體自動旋轉(zhuǎn)
mask 默認(rèn)為None;如果不為空,指定了畫布的圖形,則width和height值不生效,使用提供的圖形的大小
contour_width 如果mask不為空,并且contour_width>0,將描繪出mask獲取圖片的輪廓,值越大,輪廓的線越粗
contour_color 使用Mask時,描繪圖片輪廓的顏色
scale 圖片生成后放大縮小時的分辨率
min_font_size 詞云圖顯示的最小字體,默認(rèn)為4
max_font_size 詞云圖顯示的最大字體
max_words 詞云顯示的最大詞數(shù)
font_step 字體步長
stopwords 不顯示的詞,如果沒有設(shè)置,則使用默認(rèn)的內(nèi)置的STOPWORdS列表;如果使用generate_from_frequencies參數(shù),則忽略
background_color 背景顏色
mode 默認(rèn)為"RGB",當(dāng)mode="RGBA"并且background_color為None時,將會顯示透明背景
relative_scaling 字體大小與詞頻的關(guān)系,默認(rèn)值為auto
color_func 默認(rèn)為None,color_func=lambda *args, **kwargs:(255,0,0)詞云的字體顏色將這設(shè)置為紅色
regexp 使用正則切分,默認(rèn)為r"\w[\w']+",如果使用generate_from_frequencies則此參數(shù)不生效
collocations 是否包含兩個詞的搭配,默認(rèn)為True,如果使用generate_from_frequencies則此參數(shù)不生效
colormap 設(shè)置顏色的參數(shù),默認(rèn)為"viridis",如果使用color_func參數(shù),則此參數(shù)不生效
normalize_plurals 是否刪除尾隨的詞,比如's,如果使用generate_from_frequencies參數(shù),則此參數(shù)不生效
repeat 是否重復(fù)詞組直到設(shè)置的最大的詞組數(shù)
include_numbers 是否包含數(shù)字,默認(rèn)我False
min_word_length 最小數(shù)量的詞,默認(rèn)為0
collocation_threshold 默認(rèn)為30,整體搭配的評分等級

3、WordCloud類方法詳解

方法 功能
fit_words() 根據(jù)詞頻生成詞云
generate_from_frequencies() 根據(jù)詞頻生成詞云
generate() 根據(jù)文本生成詞云
generate_from_text() 根據(jù)文本生成詞云
process_text() 將長文本分詞,并去除屏蔽詞
recolor() 對輸出顏色重新著色
to_array() 轉(zhuǎn)換為numpy數(shù)組
to_file() 保存為圖片文件
to_svg() 保存為SVG(可縮放矢量圖形)

四、實例

1、簡單圖案

代碼:

import wordcloud

# 詞云使用的文字
text = "lemon"

# 使用wordcloud.WordCloud類,并傳入相關(guān)的參數(shù)
wc = wordcloud.WordCloud(background_color="white", repeat=True)
wc.generate(text)

# 保存圖片
wc.to_file('test1.png')

2、自定義圖片

代碼:

import wordcloud

# 導(dǎo)入imageio庫中的imread函數(shù),并用這個函數(shù)讀取本地圖片,作為詞云形狀圖片
import imageio
mk = imageio.imread("333.jpg")

# 詞云使用的文字
text = "lemon"

# 使用wordcloud.WordCloud類,并傳入相關(guān)的參數(shù)
wc = wordcloud.WordCloud(background_color="white", repeat=True,mask=mk)
wc.generate(text)

# 保存圖片
wc.to_file('test1.png')

3、從文本讀取

代碼:

import wordcloud
import jieba

# 導(dǎo)入imageio庫中的imread函數(shù),并用這個函數(shù)讀取本地圖片,作為詞云形狀圖片
import imageio
mk = imageio.imread("chen.jpg")

# 使用wordcloud.WordCloud類,并傳入相關(guān)的參數(shù)
wc = wordcloud.WordCloud(background_color="white",
                         prefer_horizontal=0.5,
                         repeat=True,
                         mask=mk,
                         font_path='/System/Library/Fonts/STHeiti Light.ttc',
                         contour_width=2,
                         contour_color='pink',
                         collocation_threshold=100,
                         )

# 對來自外部文件的文本進行中文分詞,得到string
f = open('gong.txt', encoding='utf-8')
txt = f.read()
txtlist = jieba.lcut(txt)
string = " ".join(txtlist)

# 將string變量傳入w的generate()方法,給詞云輸入文字
wc.generate(string)

# 保存圖片
wc.to_file('test.png')



總結(jié)

到此這篇關(guān)于Python詞云的正確實現(xiàn)方法的文章就介紹到這了,更多相關(guān)Python詞云實現(xiàn)內(nèi)容請搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!

  • python爬蟲 線程池創(chuàng)建并獲取文件代碼實例

    python爬蟲 線程池創(chuàng)建并獲取文件代碼實例

    這篇文章主要介紹了python爬蟲 線程池創(chuàng)建并獲取文件代碼實例,文中通過示例代碼介紹的非常詳細(xì),對大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價值,需要的朋友可以參考下
    2019-09-09
  • 使用python-docx在word文檔中查找書簽,并在書簽處寫入數(shù)據(jù)方式

    使用python-docx在word文檔中查找書簽,并在書簽處寫入數(shù)據(jù)方式

    使用python-docx庫,可在Word文檔中查找書簽并寫入數(shù)據(jù)。首先打開文檔,通過bookmarks屬性獲取書簽對象,然后使用書簽名定位書簽位置,最后將數(shù)據(jù)寫入書簽處。這種方法適合自動化填充Word模板等場景
    2024-09-09
  • Python學(xué)習(xí)之str 以及常用的命令

    Python學(xué)習(xí)之str 以及常用的命令

    下面小編就為大家?guī)硪黄狿ython的str 以及常用的命令。小編覺得挺不錯的,現(xiàn)在就分享給大家,也給大家做個參考。一起跟隨小編過來看看吧
    2021-10-10
  • Python爬蟲設(shè)置Cookie解決網(wǎng)站攔截并爬取螞蟻短租的問題

    Python爬蟲設(shè)置Cookie解決網(wǎng)站攔截并爬取螞蟻短租的問題

    這篇文章主要介紹了Python爬蟲設(shè)置Cookie解決網(wǎng)站攔截并爬取螞蟻短租,本文給大家介紹的非常詳細(xì),對大家的學(xué)習(xí)或工作具有一定的參考借鑒價值,需要的朋友可以參考下
    2021-02-02
  • Python使用scrapy采集數(shù)據(jù)時為每個請求隨機分配user-agent的方法

    Python使用scrapy采集數(shù)據(jù)時為每個請求隨機分配user-agent的方法

    這篇文章主要介紹了Python使用scrapy采集數(shù)據(jù)時為每個請求隨機分配user-agent的方法,涉及Python使用scrapy采集數(shù)據(jù)的技巧,非常具有實用價值,需要的朋友可以參考下
    2015-04-04
  • Python的對象傳遞與Copy函數(shù)使用詳解

    Python的對象傳遞與Copy函數(shù)使用詳解

    今天小編就為大家分享一篇Python的對象傳遞與Copy函數(shù)使用詳解,具有很好的參考價值,希望對大家有所幫助。一起跟隨小編過來看看吧
    2019-12-12
  • Python語音合成的項目實戰(zhàn)(PyQt5+pyttsx3)

    Python語音合成的項目實戰(zhàn)(PyQt5+pyttsx3)

    本文主要介紹了Python語音合成的項目實戰(zhàn)(PyQt5+pyttsx3),文中通過示例代碼介紹的非常詳細(xì),對大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價值,需要的朋友們下面隨著小編來一起學(xué)習(xí)學(xué)習(xí)吧
    2023-02-02
  • 回調(diào)函數(shù)的意義以及python實現(xiàn)實例

    回調(diào)函數(shù)的意義以及python實現(xiàn)實例

    本篇文章主要介紹了回調(diào)函數(shù)的意義以及python實現(xiàn)實例,具有一定的參考價值,感興趣的小伙伴們可以參考一下
    2017-06-06
  • python中如何使用虛擬環(huán)境

    python中如何使用虛擬環(huán)境

    這篇文章主要介紹了python中如何使用虛擬環(huán)境,幫助大家更好的理解和使用python,感興趣的朋友可以了解下
    2020-10-10
  • 最新評論