欧美bbbwbbbw肥妇,免费乱码人妻系列日韩,一级黄片

使用C# CefSharp Python采集某網(wǎng)站簡(jiǎn)歷并且自動(dòng)發(fā)送邀請(qǐng)短信的方法

 更新時(shí)間:2019年03月08日 11:04:45   作者:ROTA  
這篇文章主要給大家介紹了關(guān)于如何使用C# CefSharp Python采集某網(wǎng)站簡(jiǎn)歷并且自動(dòng)發(fā)送邀請(qǐng)短信的相關(guān)資料,文中通過(guò)示例代碼介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友們下面來(lái)一起看看吧

前言

以往爬蟲(chóng)沒(méi)怎么研究過(guò),最近有個(gè)需求,要從某網(wǎng)站采集敏感信息,稍稍考慮了一下,決定利用C# Winform和Python一起來(lái)解決這個(gè)事件。

整個(gè)解決方案不復(fù)雜:C#編寫WinForm窗體,進(jìn)行數(shù)據(jù)分析和采集, Python本來(lái)不想用的,一下子沒(méi)找到C#下Woff字體轉(zhuǎn)Xml的方案,而網(wǎng)上Python的則有很多,所以就加了一個(gè)Python項(xiàng)目,雖然就1個(gè)腳本。

 

一、幾個(gè)步驟:

首先要模擬登錄,登錄完了進(jìn)入簡(jiǎn)歷采集,然后模擬下載,下載完了以后就可以看到求職者的電話了。

這個(gè)電話號(hào)碼是使用動(dòng)態(tài)生成的Base64字體,所以直接提取文字是無(wú)法成功的。

1、先將Base64轉(zhuǎn)成Woff字體,這個(gè)可以用C#完成(這其中的iso-8859-1編碼是個(gè)坑,一般用Default會(huì)出現(xiàn)驚喜):

SetMainStatus("正在生成WOFF...");
   byte[] fontBytes = Convert.FromBase64String(CurFont);
   string fontStr = Encoding.GetEncoding("iso-8859-1").GetString(fontBytes).TrimEnd('\0');
   StreamWriter sw2 = new StreamWriter(@"R58.woff", false, Encoding.GetEncoding("iso-8859-1"));
   sw2.Write(fontStr);
   sw2.Close();

2、再將已經(jīng)生成的Woff轉(zhuǎn)成XML(WoffDec.exe是我用Python打包的Exe,其實(shí)有點(diǎn)小題大做了,為了這一個(gè)轉(zhuǎn)化專門打了一個(gè)包,有時(shí)間還是整一個(gè)C#下面的好)

//調(diào)用python exe 生成xml文件
   ProcessStartInfo info = new ProcessStartInfo
   {
    FileName = "WoffDec.exe",
    WindowStyle = ProcessWindowStyle.Hidden
   };
   Process.Start(info).WaitForExit(2000);//在2秒內(nèi)等待返回

整個(gè)WoffDec.py的代碼就3行:

from fontTools.ttLib import TTFont
font = TTFont('R12.woff')
font.saveXML('R12.xml')

這個(gè)打包是有點(diǎn)意思的,先試了py2exe,不成功,換pyinstaller, 成了,連EXE一起有11M,也不是很大。

https://github.com/pyinstaller/pyinstaller 下載 或者 本地下載 ,或者在VS2017 Python環(huán)境下搜索PyInstaller直接安裝。

右鍵使用“打開(kāi)此處的命令提示符”;輸入pyinstaller /path/to/yourscript.py即可打包成一個(gè)exe文件。在Winform應(yīng)用調(diào)用時(shí),應(yīng)該整個(gè)文件夾都拷貝過(guò)去。

3、XML文件有了以后,以上面的Woff文件為基準(zhǔn)準(zhǔn)備為一個(gè)數(shù)據(jù)字典存儲(chǔ)起來(lái)(這個(gè)地方有點(diǎn)繞,先找一個(gè)網(wǎng)站把Woff顯示成文字和編碼,然后根據(jù)編碼在XML中查找它的字體定位點(diǎn),我取的X和Y組成唯一值(X,Y就代表一個(gè)字),當(dāng)然也可以取更多;

internal static readonly Dictionary<string, string> DicChar = new Dictionary<string, string>()
  {
   {"91,744","0" },
   {"570,0","1"},
   {"853,1143","2" },
   {"143,259","3" },
   。。。。。。
  };

4、上面這一步是要花點(diǎn)時(shí)間的,基準(zhǔn)字典有了以后,就可以按每次生成的XML文件來(lái)進(jìn)行匹配真實(shí)文字了。

5、真實(shí)文字取出后面的就簡(jiǎn)單了,直接采集到數(shù)據(jù)庫(kù),再連上短信發(fā)送業(yè)務(wù),就可以自動(dòng)群發(fā)了。

二、使用場(chǎng)景

上班后開(kāi)啟采集服務(wù)即不用再理會(huì),由系統(tǒng)每間隔一段時(shí)間自動(dòng)下載簡(jiǎn)歷,并自動(dòng)推送面試邀請(qǐng)短信。只要有新人發(fā)布對(duì)口的求職信息,系統(tǒng)就會(huì)馬上給他發(fā)送邀請(qǐng),實(shí)為搶人利器。

BTW:網(wǎng)頁(yè)模擬操作使用的CEFSharp將另開(kāi)一章。

總結(jié)

以上就是這篇文章的全部?jī)?nèi)容了,希望本文的內(nèi)容對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,謝謝大家對(duì)腳本之家的支持。

相關(guān)文章

  • WPF通過(guò)線程使用ProcessBar的方法詳解

    WPF通過(guò)線程使用ProcessBar的方法詳解

    這篇文章主要給大家介紹了關(guān)于WPF通過(guò)線程使用ProcessBar的相關(guān)資料,文中通過(guò)示例代碼介紹的非常詳細(xì),對(duì)大家學(xué)習(xí)或者使用WPF具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友們下面來(lái)一起學(xué)習(xí)學(xué)習(xí)吧
    2019-04-04
  • C#設(shè)計(jì)模式之簡(jiǎn)單工廠模式

    C#設(shè)計(jì)模式之簡(jiǎn)單工廠模式

    這篇文章介紹了C#設(shè)計(jì)模式之簡(jiǎn)單工廠模式,文中通過(guò)示例代碼介紹的非常詳細(xì)。對(duì)大家的學(xué)習(xí)或工作具有一定的參考借鑒價(jià)值,需要的朋友可以參考下
    2022-03-03
  • C#?wpf?無(wú)邊框窗口添加陰影效果的實(shí)現(xiàn)

    C#?wpf?無(wú)邊框窗口添加陰影效果的實(shí)現(xiàn)

    在本篇內(nèi)容中小編給大家整理了一篇關(guān)于C#?wpf?無(wú)邊框窗口添加陰影效果的具體方法內(nèi)容,有興趣的朋友們可以學(xué)習(xí)參考下
    2022-11-11
  • c#訪問(wèn)this關(guān)鍵字和base關(guān)鍵字示例

    c#訪問(wèn)this關(guān)鍵字和base關(guān)鍵字示例

    this關(guān)鍵字引用類的當(dāng)前實(shí)例。靜態(tài)成員方法中不能使用this關(guān)鍵字,this關(guān)鍵字只能在實(shí)例構(gòu)造函數(shù)、實(shí)例方法或?qū)嵗L問(wèn)器中使用。base關(guān)鍵字用于從派生類中訪問(wèn)基類的成員。下面學(xué)習(xí)一下這二個(gè)關(guān)鍵字的使用方法
    2014-01-01
  • 采用C#實(shí)現(xiàn)軟件自動(dòng)更新的方法

    采用C#實(shí)現(xiàn)軟件自動(dòng)更新的方法

    這篇文章主要介紹了采用C#實(shí)現(xiàn)軟件自動(dòng)更新的方法,非常實(shí)用的功能,需要的朋友可以參考下
    2014-08-08
  • C#中Stopwatch的使用及說(shuō)明

    C#中Stopwatch的使用及說(shuō)明

    這篇文章主要介紹了C#中Stopwatch的使用及說(shuō)明,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。如有錯(cuò)誤或未考慮完全的地方,望不吝賜教
    2023-02-02
  • Unity3D使用UGUI開(kāi)發(fā)原生虛擬搖桿

    Unity3D使用UGUI開(kāi)發(fā)原生虛擬搖桿

    這篇文章主要為大家詳細(xì)介紹了Unity3D使用UGUI開(kāi)發(fā)原生虛擬搖桿,文中示例代碼介紹的非常詳細(xì),具有一定的參考價(jià)值,感興趣的小伙伴們可以參考一下
    2020-04-04
  • c#批量抓取免費(fèi)代理并且驗(yàn)證有效性的實(shí)戰(zhàn)教程

    c#批量抓取免費(fèi)代理并且驗(yàn)證有效性的實(shí)戰(zhàn)教程

    突破反爬蟲(chóng)限制的方法之一就是多用幾個(gè)代理IP,下面這篇文章主要給大家介紹了關(guān)于利用c#批量抓取免費(fèi)代理并且驗(yàn)證有效性的相關(guān)資料,文中通過(guò)示例代碼介紹的非常詳細(xì),需要的朋友可以參考下
    2018-07-07
  • VS2010中l(wèi)ib與dll文件的生成與使用方法

    VS2010中l(wèi)ib與dll文件的生成與使用方法

    這篇文章主要介紹了VS2010中l(wèi)ib與dll文件的生成與使用方法,需要的朋友可以參考下
    2018-01-01
  • C#圖書管理系統(tǒng) 附源碼下載

    C#圖書管理系統(tǒng) 附源碼下載

    這篇文章主要為大家詳細(xì)介紹了C#圖書管理系統(tǒng),文章中附源碼下載,示例代碼介紹的非常詳細(xì),具有一定的參考價(jià)值,感興趣的小伙伴們可以參考一下
    2016-09-09

最新評(píng)論