欧美bbbwbbbw肥妇,免费乱码人妻系列日韩,一级黄片

Python生成詞云的實現(xiàn)代碼

 更新時間:2020年01月14日 10:24:48   作者:Blue  
這篇文章主要介紹了Python生成詞云,文中通過示例代碼介紹的非常詳細(xì),對大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價值,需要的朋友們下面隨著小編來一起學(xué)習(xí)學(xué)習(xí)吧

1 概述

利用Python生成簡單的詞云,需要的工具是cython,wordcloud與anaconda.

2 準(zhǔn)備工作

包括安裝cython,wordcloud與anaconda.

2.1 安裝anaconda

下載官網(wǎng)


選擇對應(yīng)的版本下載即可.

2.2 安裝cython

cython是為了安裝wordcloud準(zhǔn)備的.

pip -m pip install --upgrade cython

2.3 安裝wordcloud

安裝wordcloud前需要先安裝Microsoft Visuall C++ 14.0.
這里下載
安裝好了以后重啟,輸入

python -m easy_install wordcloud

3 使用

3.1 打開Jupyter

打開Jupyter Notebook.


然后會在瀏覽器打開這個頁面,新建一個notebook.


先把需要的庫導(dǎo)入:

from wordcloud import WordCloud
import matplotlib.pyplot as plt

3.2 創(chuàng)建文字庫

簡單的文字庫可以直接選擇一個txt文件,復(fù)雜的話可以選擇創(chuàng)建一個excel,導(dǎo)出為csv文件,然后利用pandas庫的read_csv()讀入文件.這里創(chuàng)建一個txt,空格分隔單詞即可.


然后上傳到Jupyter中:

3.3 生成詞云

首先讀入文件:

text = open('1.txt').read()

然后使用WordCloud().generate(text),在里面設(shè)置各種屬性.

wc=WordCloud(
  width=800,
  repeat=True,
  height=800).generate(text)

這里設(shè)置了高度與寬度,允許重復(fù).

plt.imshow(wc,interpolation="bilinear")
plt.axis("off")
plt.show()

顯示詞云,

interpolation='bilinear'

會使顯示平滑更加平滑,axis("off")表示不顯示坐標(biāo)軸.
下面是效果:

3.4 注意事項

如果含有漢字,首先在讀取時設(shè)置編碼:

text = open('1.txt',encoding='utf-8')

然后再生成詞云時設(shè)置字體:

wc = WordCloud(font_path=r'C:\Windows\Fonts\simfang.ttf')

測試:

text=open('1.txt',encoding='utf-8').read()
wc=WordCloud(
  width=1300,
  repeat=True,
  font_path=r'C:\Windows\Fonts\simfang.ttf',
  height=1300).generate(text)
plt.imshow(wc,interpolation="bilinear")
plt.axis("off")
plt.savefig('aaaa.jpg')


以上就是本文的全部內(nèi)容,希望對大家的學(xué)習(xí)有所幫助,也希望大家多多支持腳本之家。

相關(guān)文章

最新評論