Python導(dǎo)出并分析聊天記錄詳解流程
導(dǎo)出聊天記錄生成詞云看看你和對(duì)象聊了什么(可惜我沒女朋友)
1.導(dǎo)出聊天記錄打開消息管理器
導(dǎo)出的格式選擇txt格式(我這里選擇導(dǎo)出的路徑是桌面所以在桌面上生成了一個(gè)包含聊天記錄的.txt文件)
2.編寫代碼圖中框出來的文本是我們不需要的(比如說圖片會(huì)在這里面顯示為[圖片]表情顯示為[表情]) 所以我們把它替換掉,我這里用到了正則:
string = open(r'C:\\Users\\l1768\\Desktop\\消息記錄.txt','r',encoding='utf-8').read() s = re.compile('2020.+洋仔|2020.+?﹏?? 大大大威鍋丶|表情|圖片|2019.+洋仔|2019.+?﹏?? 大大大威鍋丶|撤回了一條消息|系統(tǒng)消息')#編寫正則表達(dá)式 message = re.sub(s,'',string)#替換對(duì)應(yīng)的字符串為空字符串
然后我們把經(jīng)過處理的文本再進(jìn)行去除特殊字符處理
def getText(text):#該函數(shù)用來替換文本中出現(xiàn)的特殊字符 txt = text for ch in '!"#$%&()*+,-./:;<=>?@[\\]^_‘{|}~,。、 :': txt = txt.replace(ch, "") #將文本中特殊字符替換為空格 return txt message = getText(message)
使用jieba分詞并生成詞云
split_message = jieba.lcut(message) wordcloud_txt = ' '.join(split_message) w=wordcloud.WordCloud(background_color="white", font_path='./fonts/simhei.ttf', width=1600,height=800, max_words=2000)#設(shè)置生成詞云的參數(shù),background_color指定圖片背景顏色, #font_path設(shè)置中文字體,要不然中文會(huì)顯示不出來 #width=1600,height=800分別指定圖片的寬度像素和高度像素, #max_words指定生成詞云的詞最大是兩千詞 #還有很多可選參數(shù),大家可以自行百度 w.generate(wordcloud_txt)#向詞云傳遞文本 w.to_file("聊天記錄詞云.png")#最后生成詞云的圖片
3.最終生成的結(jié)果:
4.完整代碼:
import re import jieba import wordcloud def getText(text):#該函數(shù)用來替換文本中出現(xiàn)的特殊字符 txt = text for ch in '!"#$%&()*+,-./:;<=>?@[\]^_‘{|}~,。、 :': txt = txt.replace(ch, "") #將文本中特殊字符替換為空格 return txt string = open(r'C:\Users\l1768\Desktop\消息記錄.txt','r',encoding='utf-8').read() s = re.compile('2020.+洋仔|2020.+?﹏?? 大大大威鍋丶|表情|圖片|2019.+洋仔|2019.+?﹏?? 大大大威鍋丶|撤回了一條消息|系統(tǒng)消息') message = re.sub(s,'',string) message = getText(message) split_message = jieba.lcut(message) wordcloud_txt = ' '.join(split_message) w=wordcloud.WordCloud(background_color="white", font_path='./fonts/simhei.ttf',width=1600,height=800,max_words=2000)#設(shè)置生成詞云的參數(shù) w.generate(wordcloud_txt)#向詞云傳遞文本 w.to_file("聊天記錄詞云.png")#最后生成詞云的圖片
到此這篇關(guān)于Python導(dǎo)出并分析聊天記錄詳解流程的文章就介紹到這了,更多相關(guān)Python 分析聊天記錄內(nèi)容請(qǐng)搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!
相關(guān)文章
Python3.x+迅雷x 自動(dòng)下載高分電影的實(shí)現(xiàn)方法
這篇文章主要介紹了Python3.x+迅雷x 自動(dòng)下載高分電影的實(shí)現(xiàn)方法,文中通過示例代碼介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友們下面隨著小編來一起學(xué)習(xí)學(xué)習(xí)吧2020-01-01利用QT寫一個(gè)極簡(jiǎn)單的圖形化Python鬧鐘程序
這篇文章主要介紹了利用QT寫一個(gè)極簡(jiǎn)單的圖形化Python鬧鐘程序,核心代碼只有25行,顯示屏幕提示而沒有鬧鈴聲音,需要的朋友可以參考下2015-04-04python實(shí)現(xiàn)的守護(hù)進(jìn)程(Daemon)用法實(shí)例
這篇文章主要介紹了python實(shí)現(xiàn)的守護(hù)進(jìn)程(Daemon)用法,實(shí)例分析了Python進(jìn)程操作的相關(guān)技巧,需要的朋友可以參考下2015-06-06基于OpenCV的直方圖匹配的實(shí)現(xiàn)方法
這篇文章主要介紹了基于OpenCV的直方圖匹配的實(shí)現(xiàn)方法,文中通過示例代碼介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友們下面隨著小編來一起學(xué)習(xí)學(xué)習(xí)吧2021-04-04python實(shí)現(xiàn)從本地?cái)z像頭和網(wǎng)絡(luò)攝像頭截取圖片功能
這篇文章主要介紹了python實(shí)現(xiàn)從本地?cái)z像頭和網(wǎng)絡(luò)攝像頭截取圖片功能 ,文中給大家提到了python , opencv 打開網(wǎng)絡(luò)攝像頭讀取圖像的實(shí)現(xiàn)代碼,需要的朋友可以參考下2019-07-07利用Python?NumPy庫及Matplotlib庫繪制數(shù)學(xué)函數(shù)圖像
最近開始學(xué)習(xí)數(shù)學(xué)了,有一些題目的函數(shù)圖像非常有特點(diǎn),下面這篇文章主要給大家介紹了關(guān)于利用Python?NumPy庫及Matplotlib庫繪制數(shù)學(xué)函數(shù)圖像的相關(guān)資料,文中通過示例代碼介紹的非常詳細(xì),需要的朋友可以參考下2022-04-04python+jinja2實(shí)現(xiàn)接口數(shù)據(jù)批量生成工具
這篇文章主要介紹了python+jinja2實(shí)現(xiàn)接口數(shù)據(jù)批量生成工具的操作方法,本文給大家介紹的非常詳細(xì),具有一定的參考借鑒價(jià)值,需要的朋友可以參考下2019-08-08