基于python實(shí)現(xiàn)微信好友數(shù)據(jù)分析(簡單)
一、功能介紹
本文主要介紹利用網(wǎng)頁端微信獲取數(shù)據(jù),實(shí)現(xiàn)個(gè)人微信好友數(shù)據(jù)的獲取,并進(jìn)行一些簡單的數(shù)據(jù)分析,功能包括:
1.爬取好友列表,顯示好友昵稱、性別和地域和簽名, 文件保存為 xlsx 格式
2.統(tǒng)計(jì)好友的地域分布,并且做成詞云和可視化展示在地圖上
二、依賴庫
1、Pyecharts:一個(gè)用于生成echarts圖表的類庫,echarts是百度開源的一個(gè)數(shù)據(jù)可視化庫,用echarts生成的圖可視化效果非常棒,使用pyechart庫可以在python中生成echarts數(shù)據(jù)圖。
2、Itchat:一個(gè)開源的微信個(gè)人號接口,使用python調(diào)用微信從未如此簡單。
3、Jieba:簡單的分詞操作庫。
4、Numpy:NumPy 系統(tǒng)是 Python 的一種開源的數(shù)值計(jì)算擴(kuò)展。這種工具可用來存儲和處理大型矩 陣。
5、Pandas:pandas 是基于 NumPy 的一種工具,該工具是為了解決數(shù)據(jù)分析任務(wù)而創(chuàng)建的。
6、Pillow:圖像處理。
7、wxpy:wxpy 在 itchat 的基礎(chǔ)上,通過大量接口優(yōu)化提升了模塊的易用性,并進(jìn)行豐富的功能 擴(kuò)展。 (微信本身提供)
注:Pyecharts可能安裝0.5.*的版本比較好
以上的三方庫可以通過命令符(cmd)來實(shí)現(xiàn)安裝,具體命令:pip install ***
三,操作
from wxpy import * #導(dǎo)入模塊 bot = Bot(cache_path=True) #初始化機(jī)器人,選擇掃碼登錄 friend_all = bot.friends() #獲取微信好友信息
首先出現(xiàn)的是一張二維碼,然后掃描登錄
成功登錄好了就是這種顯示
之后就可以進(jìn)行操作了,好友數(shù)量,個(gè)人信息
print(len(friend_all)) #好友的數(shù)量 print(friend_all[0].raw) #輸出個(gè)人信息
顯示的結(jié)果
四、接下來把全部的好友信息轉(zhuǎn)化為一個(gè)xlsx文件
獲取全部好友信息
for a_friend in friend_all: NickName = a_friend.raw.get('NickName', None) #昵稱 #Sex = a_friend.raw.get('Sex', None) Sex = {1: "男", 2: "女", 0: "其它"}.get(a_friend.raw.get('Sex', None), None) #性別(優(yōu)化) City = a_friend.raw.get('City', None) #城市 Province = a_friend.raw.get('Province', None) #省份 Signature = a_friend.raw.get('Signature', None) #個(gè)性簽名 HeadImgUrl = a_friend.raw.get('HeadImgUrl', None) #頭像地址 HeadImgFlag = a_friend.raw.get('HeadImgFlag', None) #小Flag list_0=[NickName, Sex, City, Province, Signature, HeadImgUrl, HeadImgFlag] #存為一維數(shù)組 lis.append(list_0) #疊加數(shù)據(jù)
存為xlsx文件
def list_excel(filename,lis): ''' 將列表寫入excel中,其中列表中的元素是列表. filename:保存的文件名(含路徑) lis:元素為列表的列表,如下: lis = [["名稱", "價(jià)格", "出版社", "語言"], ["暗時(shí)間", "32.4", "人民郵電出版社", "中文"], ["拆掉思維里的墻", "26.7", "機(jī)械工業(yè)出版社", "中文"]] ''' import openpyxl wb = openpyxl.Workbook() #激活worksheet sheet = wb.active sheet.title = 'sheet1' #創(chuàng)建一個(gè)表格 file_name = filename +'.xlsx' for i in range(0, len(lis)): for j in range(0, len(lis[i])): sheet.cell(row=i+1, column=j+1, value=str(lis[i][j])) #每行每列的存入數(shù)據(jù) wb.save(file_name) print("寫入數(shù)據(jù)成功!") list_excel('wechat',lis)
效果如下:
可以看到其好友基本分布再廣東省,個(gè)性簽名也是非常的殺馬特
五、實(shí)現(xiàn)詞云圖(我們也可以從存儲在本地的 excel 中讀取數(shù)據(jù)進(jìn)行分析,并查看數(shù)據(jù)形式。在執(zhí)行以 下代碼之前,我們需要先把 excel 文件加一個(gè)列標(biāo)題行)
例如nickname sex city province signature headImgUrl headImgFlag
#導(dǎo)入模塊 from wordcloud import WordCloud import matplotlib.pyplot as plt import pandas as pd from pandas import DataFrame word_list= df['city'].fillna('0').tolist() #將 dataframe 的列轉(zhuǎn)化為 list,其中的 nan 用“0”替換 new_text = ' '.join(word_list) wordcloud = WordCloud(font_path='simhei.ttf', background_color="black").generate(new_text) #設(shè)計(jì)圖背景顏色,字體 plt.imshow(wordcloud) plt.axis("off") plt.show()
還可以將詞云圖存為HTML形式
#利用 pyechart 做詞云 import pandas as pd #count = df.city.value_counts() #對 dataframe 進(jìn)行全頻率統(tǒng)計(jì),排除了 nan city_list = df['city'].fillna('NAN').tolist()#將 dataframe 的列轉(zhuǎn)化為 list,其中的 nan 用“NAN” 替換 count_city = pd.value_counts(city_list)#對 list 進(jìn)行全頻率統(tǒng)計(jì) from pyecharts.charts.wordcloud import WordCloud #設(shè)置對象 name = count_city.index.tolist() value = count_city.tolist() wordcloud = WordCloud(width=1300, height=620) wordcloud.add("", name, value, word_size_range=[20, 100]) wordcloud.show_config() wordcloud.render(r'D:\python\wechatcloud.html')
再看看效果:
六、轉(zhuǎn)化為地圖形式
注:安裝地圖數(shù)據(jù)包:pip install echarts-china-provinces-pypkg pip install echarts-countries-pypkg
province_list = df['province'].fillna('NAN').tolist() #將 dataframe 的列轉(zhuǎn)化為 list,其中的 nan 用 “NAN”替換 count_province = pd.value_counts(province_list) #對 list 進(jìn)行全頻率統(tǒng)計(jì) from pyecharts import Map value =count_province.tolist() attr =count_province.index.tolist() map=Map("各省微信好友分布", width=1300, height=700) map.add("", attr, value, maptype='china', is_visualmap=True,visual_text_color='#000',is_label_show = True) #顯示地圖上的省份 map.show_config() map.render(r'D:\python\wechatProMap.html')
效果:
總結(jié)
以上所述是小編給大家介紹的基于python實(shí)現(xiàn)微信好友數(shù)據(jù)分析,希望對大家有所幫助!
相關(guān)文章
Pytorch上下采樣函數(shù)--interpolate用法
這篇文章主要介紹了Pytorch上下采樣函數(shù)--interpolate用法,具有很好的參考價(jià)值,希望對大家有所幫助。一起跟隨小編過來看看吧2020-07-07使用fiddler抓包工具Python requests報(bào)錯(cuò):ValueError: check_h
這篇文章主要介紹了使用fiddler抓包工具Python requests報(bào)錯(cuò):ValueError: check_hostname requires server_hostname的解決,具有很好的參考價(jià)值,希望對大家有所幫助,如有錯(cuò)誤或未考慮完全的地方,望不吝賜教2023-12-12python畫一個(gè)圣誕樹實(shí)現(xiàn)示例
這篇文章主要為大家介紹了使用python畫一個(gè)圣誕樹實(shí)現(xiàn)示例詳解,有需要的朋友可以借鑒參考下,希望能夠有所幫助,祝大家多多進(jìn)步,早日升職加薪2023-05-05python?pip安裝庫下載源更換(清華源、阿里源、中科大源、豆瓣源)
為了提高Python包的下載速度和穩(wěn)定性,可以配置國內(nèi)的鏡像源,如清華源、阿里源、中科大源和豆瓣源,設(shè)置方法簡單,只需更改pip的配置文件或使用命令行即可,需要的朋友可以參考下2024-10-10Python日期時(shí)間Time模塊實(shí)例詳解
這篇文章主要介紹了Python日期時(shí)間Time模塊,結(jié)合實(shí)例形式詳細(xì)分析了Python日期時(shí)間Time模塊常用函數(shù)及相關(guān)操作技巧,需要的朋友可以參考下2019-04-04