從CentOS安裝完成到生成詞云python的實(shí)例
前言
人生苦短,我用python。學(xué)習(xí)python怎么能不搞一下詞云呢是不是(ง •̀_•́)ง
于是便有了這篇邊實(shí)踐邊記錄的筆記。
環(huán)境:VMware 12pro + CentOS7 + Python 2.7.5
安裝系統(tǒng)
之前一直用的是win10子系統(tǒng),現(xiàn)在試試CentOS,CentOS官網(wǎng)下載最新系統(tǒng)dvd版 安裝到VMware 12pro。網(wǎng)上很多教程。例如這個(gè)鏈接。等待安裝完成后開始。
第一個(gè)命令
用Ubuntu的時(shí)候沒有的命令會(huì)提示你安裝,感覺很簡(jiǎn)單的事。但是到CentOS上卻變得很頭痛。
打開終端在執(zhí)行以下命令安裝python-pip時(shí)提示。
sudo yum install python-pip 沒有可用軟件包 python-pip。
google了一下說是這個(gè)包在EPEL源里,要添加EPEL源才可以。
執(zhí)行下面兩個(gè)命令就安裝好了。
yum install epel-release.noarch yum install python-pip
python庫(kù)安裝
接下來安裝一個(gè)詞云wordcloud
pip install -i https://pypi.tuna.tsinghua.edu.cn/simple wordcloud 截取部分提示錯(cuò)誤信息 unable to execute gcc: No such file or directory error: command 'gcc' failed with exit status 1 連gcc都沒有(ง •̀_•́)ง。先安裝gcc yum install gcc
gcc裝完后繼續(xù)安裝wordcloud!又報(bào)了下面的錯(cuò)誤
_posixsubprocess.c:3:20: 致命錯(cuò)誤:Python.h:沒有那個(gè)文件或目錄 于是需要先安裝python-devel sudo yum install python-devel #注意這里不是python-dev
CentOS 下叫做 python-devel,Ubuntu 下還是叫做 python-dev。
wordcloud安裝完畢!
代碼
生成詞云一份代碼,并且隨便找一份英文(我在ChinaDaily找的文章 Recruiters starting to employ social media 放到 txt/word.txt中
# -*- coding: UTF-8 -*- import matplotlib # Force matplotlib to not use any Xwindows backend. #matplotlib.use('Agg') from wordcloud import WordCloud textfile = open(u'txt/word.txt','r').read() wordcloud = WordCloud(background_color="white",width=800, height=600, margin=5).generate(textfile) # width,height,margin可以設(shè)置圖片屬性 # generate 可以對(duì)全部文本進(jìn)行自動(dòng)分詞,但是它對(duì)中文支持不好 #background_color參數(shù)為設(shè)置背景顏色,默認(rèn)顏色為黑色 wordcloud.to_file('word.png')
執(zhí)行命令運(yùn)行 python clouddemo.py 報(bào)錯(cuò)提示
SyntaxError: Non-ASCII character '\xe5' in file clouddemo.py on line 6, but no encoding declared; see http://www.python.org/peps/pep-0263.html for details
原因如下
Python默認(rèn)是以ASCII作為編碼方式的,如果在Python源碼中包含了中文(或者其他非英語系的語言),此時(shí)即使你把自己編寫的Python源文件以UTF-8格式保存,但實(shí)際上,這依然是不行的。
解決辦法很簡(jiǎn)單,只要在文件開頭加入下面代碼;指定文件的編碼格式為utf-8。上面的代碼我已經(jīng)加好了(。・`ω´・)。
# -*- coding: UTF-8 -*-
編碼問題解決了。接下來重新運(yùn)行。
還是報(bào)錯(cuò)?。?!
ImportError: No module named Tkinter
首先yum list installed | grep ^tk
查看是否存在相應(yīng)模塊,如果不存在則通過yum install tkinter 和yum install -y tk-devel下載相應(yīng)模塊。
重新執(zhí)行命令提示下一個(gè)錯(cuò)誤
tkinter.TclError: no display name and no $DISPLAY environment variable
雖然一波N折,但是最后還是成功了?。?!看看源代碼目錄下的詞云圖!
效果圖如下:
以上這篇從CentOS安裝完成到生成詞云python的實(shí)例就是小編分享給大家的全部?jī)?nèi)容了,希望能給大家一個(gè)參考,也希望大家多多支持腳本之家。
相關(guān)文章
Python使用Joblib模塊實(shí)現(xiàn)加快任務(wù)處理速度
在Python編程中,處理大規(guī)模數(shù)據(jù)或者進(jìn)行復(fù)雜的計(jì)算任務(wù)時(shí),通常需要考慮如何提高程序的運(yùn)行效率,本文主要介紹了如何使用Joblib模塊來加快任務(wù)處理速度,需要的可以參考下2024-03-03Python實(shí)現(xiàn)統(tǒng)計(jì)mp4/avi視頻的時(shí)長(zhǎng)
moviepy是一個(gè)用于處理視頻和音頻的Python庫(kù),它提供了一組功能豐富的工具,所以本文將利用它實(shí)現(xiàn)統(tǒng)計(jì)mp4/avi視頻的時(shí)長(zhǎng),希望對(duì)大家有所幫助2023-07-07python 實(shí)現(xiàn)在txt指定行追加文本的方法
下面小編就為大家分享一篇python 實(shí)現(xiàn)在txt指定行追加文本的方法,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。一起跟隨小編過來看看吧2018-04-04python更換國(guó)內(nèi)鏡像源三種實(shí)用方法
這篇文章主要給大家介紹了關(guān)于python更換國(guó)內(nèi)鏡像源三種實(shí)用方法的相關(guān)資料,更換Python鏡像源可以幫助解決使用pip安裝包時(shí)速度過慢或無法連接的問題,需要的朋友可以參考下2023-09-09python 中的list和array的不同之處及轉(zhuǎn)換問題
python中的list是python的內(nèi)置數(shù)據(jù)類型,list中的數(shù)據(jù)類不必相同的,而array的中的類型必須全部相同。這篇文章給大家介紹了python 中的list和array的不同之處及轉(zhuǎn)換問題,需要的朋友參考下吧2018-03-03