欧美bbbwbbbw肥妇,免费乱码人妻系列日韩,一级黄片

Python?selenium把歌詞評論做成詞云圖

 更新時間:2022年01月19日 11:30:37   作者:魔王不會哭  
大家好,本篇文章主要講的是Python?selenium把歌詞評論做成詞云圖,感興趣的同學趕快來看一看吧,對你有幫助的話記得收藏一下

前言

一首歌熱門了,參與評論的人也很多,這時無論好壞評論都來了,沒有人控評得話,指不定亂七八糟

但是自己有喜歡看評論,不想影響好心情,想看看精彩評論,看看歌詞立意,那怎么辦呢?

那本次咱們就把歌詞給自動下載保存到電腦上,做成詞云圖給它分析分析…

本次目的

用selenium自動把歌詞評論下載下來,做成好看的詞云圖

本次用到的模塊和包:

re # 正則表達式 內(nèi)置模塊

selenium # 實現(xiàn)瀏覽器自動操作的

jieba # 中文分詞庫

wordcloud # 詞云圖庫

imageio # 圖像模塊

time # 內(nèi)置模塊

需要安裝的模塊安裝方法:

以 selenium 為例,直接pip install selenium

下載速度慢就用鏡像源下載

驅(qū)動安裝

要實現(xiàn)瀏覽器自動操作,咱們得安裝一個瀏覽器驅(qū)動。

網(wǎng)址我就不發(fā)了,網(wǎng)上直接搜谷歌瀏覽器驅(qū)動就可以找到,實在找不到的話私聊我

建議用谷歌瀏覽器,以谷歌瀏覽器為例,首先看一下咱們?yōu)g覽器的的版本。

瀏覽器右上角三個點,點開后點擊設置。

在這里插入圖片描述

然后點擊關于Chrome ,右邊的那一串數(shù)字就是版本號了。

在這里插入圖片描述

然后找到跟你的版本號相同的版本下載,沒有相同的就下載最相近的版本也可以。

在這里插入圖片描述

你的代碼放到一起,跟代碼放一起的話,缺點是你每次要使用,沒保存的話都得去下載。

還有一種辦法是直接放到你的python目錄,這種的優(yōu)點是一次搞定可以用很多次。缺點是每次版本更新,你還是得去下載新的。

我反正每次都是去下載新的,又不是經(jīng)常用。

一、下載歌曲評論

1.代碼實現(xiàn)

首先導入一下模塊

模塊是必須要導入的東西哦,沒有導入的話,運行時即使你代碼正確也是會報錯的哦~

from selenium import webdriver
import re 
import time  

Python文件名或者包名不要命名為selenium,會導致無法導入。

webdriver可以認為是瀏覽器的驅(qū)動器,要驅(qū)動瀏覽器必須用到webdriver,支持多種瀏覽器。

創(chuàng)建一個瀏覽器對象

driver = webdriver.Chrome()

請求頁面

driver.get('https://music.163.com/#/song?id=569213220')

driver.implicitly_wait(10)  # 隱式等待  瀏覽器渲染頁面  智能化等待
driver.maximize_window()  # 最大化瀏覽器
driver.switch_to.frame(0)
# document.documentElement.scrollTop  指定頁面的高度
# document.documentElement.scrollHeight  獲取頁面的高度
# document.documentElement.scrollTop  指定頁面的高度
# document.documentElement.scrollHeight  獲取頁面的高度
js = 'document.documentElement.scrollTop = document.documentElement.scrollHeight'
driver.execute_script(js)

獲取評論數(shù)據(jù)/保存/點擊下一頁

for click in range(10):
    divs = driver.find_elements_by_css_selector('.itm')
    for div in divs:
        cnt = div.find_element_by_css_selector('.cnt.f-brk').text
        cnt = cnt.replace('\n', ' ') # 替換換行符
        cnt = re.findall(':(.*)', cnt)[0]
        
        with open('contend.txt', mode='a', encoding='utf-8') as f:
            f.write(cnt + '\n')

    # 找到下一頁標簽點擊
    driver.find_element_by_css_selector('.znxt').click()
    time.sleep(1)


input('程序阻塞.')

最后退出瀏覽器

driver.quit()

2.爬取評論運行效果

在這里插入圖片描述

二、制作詞云圖

代碼實現(xiàn)

繪制詞云圖/大小設置,詞云圖圖案可以自己去挑選喜歡的哦

import jieba  # 中文分詞庫
import wordcloud  # 詞云圖庫
import imageio  # 圖像模塊


file = open('contend.txt', mode='r', encoding='utf-8')
txt = file.read()
# print(txt)
txt_list = jieba.lcut(txt)
print('分詞結(jié)果',txt_list)

string = ' '.join(txt_list)
print('合并分詞:', string)

"""制作詞云圖"""
# 讀取圖像
img = imageio.imread('音樂.png')


# 設置詞云圖
wc = wordcloud.WordCloud(
    width=1000, # 詞云圖的寬
    height=700, # 圖片的高
    background_color= 'black', # 詞云圖背景顏色
    font_path='msyh.ttc',  # 詞云字體, 微軟雅黑, 系統(tǒng)自帶
    scale=10, # 字體大小
    # mask=img,
    stopwords=set([line.strip() for line in open('cn_stopwords.txt', mode='r',
                                                 encoding='utf-8').readlines()])
)

print('正在繪制詞云圖')
wc.generate(string)
wc.to_file('output2.png')
print('詞云圖制作成功...')

效果展示

在這里插入圖片描述

總結(jié)

到此這篇關于Python selenium把歌詞評論做成詞云圖的文章就介紹到這了,更多相關Python selenium詞云圖內(nèi)容請搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關文章希望大家以后多多支持腳本之家!

相關文章

最新評論