欧美bbbwbbbw肥妇,免费乱码人妻系列日韩,一级黄片

使用Python做垃圾分類的原理及實(shí)例代碼附源碼

 更新時(shí)間:2019年07月02日 11:53:55   作者:上海小胖  
這篇文章主要介紹了用Python做垃圾分類的實(shí)現(xiàn)原理,本文通過(guò)實(shí)例代碼給大家介紹的非常詳細(xì),具有一定的參考借鑒價(jià)值 ,需要的朋友可以參考下

0 引言

紙巾再濕也是干垃圾?瓜子皮再干也是濕垃圾??最近大家都被垃圾分類折磨的不行,傻傻的你是否拎得清?😭😭😭自2019.07.01開始,上海已率先實(shí)施垃圾分類制度,違反規(guī)定的還會(huì)面臨罰款。

為了避免巨額損失,我決定來(lái)b站學(xué)習(xí)下垃圾分類的技巧。為什么要來(lái)b站,聽(tīng)說(shuō)這可是當(dāng)下年輕人最流行的學(xué)習(xí)途徑之一。

打開b站,搜索了下垃圾分類,上來(lái)就被這個(gè)標(biāo)題嚇(吸)到(引)了:在上海丟人的正確姿勢(shì)。


當(dāng)然,這里的丟人非彼丟人,指的是丟垃圾的丟。

點(diǎn)開發(fā)現(xiàn),原來(lái)是一段對(duì)口相聲啊,還是兩個(gè)萌妹子(AI)的對(duì)口相聲,瞬間就來(lái)了興趣,闡述的是關(guān)于如何進(jìn)行垃圾分類的。


原視頻鏈接:https://www.bilibili.com/video/av57129646?from=search&seid=9101123388170190749

看完一遍又一遍,簡(jiǎn)直停不下來(lái)了,已經(jīng)開啟了洗腦模式,畢竟視頻很好玩,視頻中的彈幕更是好玩!

獨(dú)樂(lè)樂(lè)不如眾樂(lè)樂(lè),且不如用Python把彈幕保存下來(lái),做個(gè)詞云圖?就這么愉快地決定了!

1 環(huán)境

操作系統(tǒng):Windows

Python版本:3.7.3

2 需求分析

我們先需要通過(guò)開發(fā)調(diào)試工具,查詢這條視頻的彈幕的 cid 數(shù)據(jù)。


拿到 cid 之后,再填入下面的鏈接中。

http://comment.bilibili.com/{cid}.xml

打開之后,就可以看到該視頻的彈幕列表。

有了彈幕數(shù)據(jù)后,我們需要先將解析好,并保存在本地,方便進(jìn)一步的加工處理,如制成詞云圖進(jìn)行展示。

3 代碼實(shí)現(xiàn)

在這里,我們獲取網(wǎng)頁(yè)的請(qǐng)求使用 requests 模塊;解析網(wǎng)址借助 beautifulsoup4 模塊;保存為CSV數(shù)據(jù),這里借用 pandas 模塊。因?yàn)槎际堑谌侥K,如環(huán)境中沒(méi)有可以使用 pip 進(jìn)行安裝。

pip install requests
pip install beautifulsoup4
pip install lxml
pip install pandas

模塊安裝好之后,進(jìn)行導(dǎo)入

import requests
from bs4 import BeautifulSoup
import pandas as pd

請(qǐng)求、解析、保存彈幕數(shù)據(jù)

# 請(qǐng)求彈幕數(shù)據(jù)
url = 'http://comment.bilibili.com/99768393.xml'
html = requests.get(url).content

# 解析彈幕數(shù)據(jù)
html_data = str(html, 'utf-8')
bs4 = BeautifulSoup(html_data, 'lxml')
results = bs4.find_all('d')
comments = [comment.text for comment in results]
comments_dict = {'comments': comments}

# 將彈幕數(shù)據(jù)保存在本地
br = pd.DataFrame(comments_dict)
br.to_csv('barrage.csv', encoding='utf-8')

接下來(lái),我們就對(duì)保存好的彈幕數(shù)據(jù)進(jìn)行深加工。

制作詞云,我們需要用到 wordcloud 模塊、matplotlib 模塊、jieba 模塊,同樣都是第三方模塊,直接用 pip 進(jìn)行安裝。

pip install wordcloud
pip install matplotlib
pip install jieba

模塊安裝好之后,進(jìn)行導(dǎo)入,因?yàn)槲覀冏x取文件用到了 panda 模塊,所以一并導(dǎo)入即可

from wordcloud import WordCloud, ImageColorGenerator
import matplotlib.pyplot as plt
import pandas as pd
import jieba

我們可以自行選擇一張圖片,并基于此圖片來(lái)生成一張定制的詞云圖。我們可以自定義一些詞云樣式,代碼如下:

# 解析背景圖片
mask_img = plt.imread('Bulb.jpg')

'''設(shè)置詞云樣式'''
wc = WordCloud(
 # 設(shè)置字體 
 font_path='SIMYOU.TTF',
 # 允許最大詞匯量
 max_words = 2000,
 # 設(shè)置最大號(hào)字體大小
 max_font_size = 80,
 # 設(shè)置使用的背景圖片
 mask = mask_img,
 # 設(shè)置輸出的圖片背景色
 background_color=None, mode="RGBA",
 # 設(shè)置有多少種隨機(jī)生成狀態(tài),即有多少種配色方案
 random_state=30)

接下來(lái),我們要讀取文本信息(彈幕數(shù)據(jù)),進(jìn)行分詞并連接起來(lái):

# 讀取文件內(nèi)容
br = pd.read_csv('barrage.csv', header=None)

# 進(jìn)行分詞,并用空格連起來(lái)
text = ''
for line in br[1]:
 text += ' '.join(jieba.cut(line, cut_all=False))

最后來(lái)看看我們效果圖


有沒(méi)有感受到大家對(duì)垃圾分類這個(gè)話題的熱情,莫名喜感涌上心頭。

4 后記

這兩個(gè)AI萌妹子說(shuō)的相聲很不錯(cuò),就不知道郭德綱看到這個(gè)作品會(huì)作何感想。回到垃圾分類的話題,目前《上海市生活垃圾管理?xiàng)l例》已正式施行,不在上海的朋友們也不要太開心,住建部表示,全國(guó)其它46個(gè)重點(diǎn)城市也即將體驗(yàn)到……

源碼,請(qǐng)點(diǎn)擊此處。

以上所述是小編給大家介紹的使用Python做垃圾分類的原理及實(shí)例代碼,希望對(duì)大家有所幫助,如果大家有任何疑問(wèn)請(qǐng)給我留言,小編會(huì)及時(shí)回復(fù)大家的。在此也非常感謝大家對(duì)腳本之家網(wǎng)站的支持!
如果你覺(jué)得本文對(duì)你有幫助,歡迎轉(zhuǎn)載,煩請(qǐng)注明出處,謝謝!

相關(guān)文章

  • Pandas時(shí)間類型轉(zhuǎn)換與處理的實(shí)現(xiàn)示例

    Pandas時(shí)間類型轉(zhuǎn)換與處理的實(shí)現(xiàn)示例

    本文主要介紹了Pandas時(shí)間類型轉(zhuǎn)換與處理的實(shí)現(xiàn)示例,文中通過(guò)示例代碼介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友們下面隨著小編來(lái)一起學(xué)習(xí)學(xué)習(xí)吧
    2022-07-07
  • Python撲克牌21點(diǎn)游戲?qū)嵗a

    Python撲克牌21點(diǎn)游戲?qū)嵗a

    大家好,本篇文章主要講的是Python撲克牌21點(diǎn)游戲?qū)嵗a,感興趣的同學(xué)趕快來(lái)看一看吧,對(duì)你有幫助的話記得收藏一下,方便下次瀏覽
    2021-12-12
  • pandas DataFrame實(shí)現(xiàn)幾列數(shù)據(jù)合并成為新的一列方法

    pandas DataFrame實(shí)現(xiàn)幾列數(shù)據(jù)合并成為新的一列方法

    今天小編就為大家分享一篇pandas DataFrame實(shí)現(xiàn)幾列數(shù)據(jù)合并成為新的一列方法,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。一起跟隨小編過(guò)來(lái)看看吧
    2018-06-06
  • Python爬蟲Scrapy框架CrawlSpider原理及使用案例

    Python爬蟲Scrapy框架CrawlSpider原理及使用案例

    這篇文章主要介紹了Python爬蟲Scrapy框架(CrawlSpider),文中通過(guò)示例代碼介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友可以參考下
    2020-11-11
  • Python熱重載調(diào)試新利器問(wèn)題解決

    Python熱重載調(diào)試新利器問(wèn)題解決

    Reloading是一個(gè)Python工具庫(kù),它讓我們可以在每次迭代之前從源代碼中重新加載(或函數(shù))而不丟失任何當(dāng)前已執(zhí)行過(guò)程,這篇文章主要介紹了Python熱重載調(diào)試新利器,需要的朋友可以參考下
    2024-06-06
  • python實(shí)現(xiàn)skywalking的trace模塊過(guò)濾和報(bào)警(實(shí)例代碼)

    python實(shí)現(xiàn)skywalking的trace模塊過(guò)濾和報(bào)警(實(shí)例代碼)

    Skywalking可以對(duì)鏈路追蹤到數(shù)據(jù)進(jìn)行告警規(guī)則配置,例如響應(yīng)時(shí)間、響應(yīng)百分比等。發(fā)送警告通過(guò)調(diào)用webhook接口完成。webhook接口用戶可以自定義。本文給大家介紹python實(shí)現(xiàn)skywalking的trace模塊過(guò)濾和報(bào)警,感興趣的朋友跟隨小編一起看看吧
    2021-12-12
  • 詳解Python中的join()函數(shù)的用法

    詳解Python中的join()函數(shù)的用法

    這篇文章主要介紹了詳解Python中的join()函數(shù)的用法,join()函數(shù)主要用來(lái)拼接字符串,是Python學(xué)習(xí)當(dāng)中的基礎(chǔ)知識(shí),需要的朋友可以參考下
    2015-04-04
  • OpenCV?基本圖形繪制函數(shù)詳解

    OpenCV?基本圖形繪制函數(shù)詳解

    這篇文章主要介紹了OpenCV?基本圖形繪制函數(shù),用于繪制圓的circle函數(shù),用于繪制填充的多邊形的fillPoly函數(shù),本文給大家提到好幾種,通過(guò)實(shí)例代碼給大家介紹的非常詳細(xì),需要的朋友可以參考下
    2021-12-12
  • 在Python中實(shí)現(xiàn)函數(shù)重載的示例代碼

    在Python中實(shí)現(xiàn)函數(shù)重載的示例代碼

    這篇文章主要介紹了在Python中實(shí)現(xiàn)函數(shù)重載的示例代碼,文中通過(guò)示例代碼介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友們下面隨著小編來(lái)一起學(xué)習(xí)學(xué)習(xí)吧
    2019-12-12
  • pytorch之torch.nn.Identity()的作用及解釋

    pytorch之torch.nn.Identity()的作用及解釋

    這篇文章主要介紹了pytorch之torch.nn.Identity()的作用及解釋,具有很好的參考價(jià)值,希望對(duì)大家有所幫助,如有錯(cuò)誤或未考慮完全的地方,望不吝賜教
    2023-08-08

最新評(píng)論