欧美bbbwbbbw肥妇,免费乱码人妻系列日韩,一级黄片

python爬取微信公眾號(hào)文章圖片并轉(zhuǎn)為PDF

 更新時(shí)間:2022年02月08日 14:32:01   作者:三十歲開始學(xué)編程的大叔  
大家好,本篇文章主要講的是python爬取微信公眾號(hào)文章圖片并轉(zhuǎn)為PDF,感興趣的同學(xué)趕快來看一看吧,對你有幫助的話記得收藏一下

遇到那種有很多圖的微信公眾號(hào)文章咋辦?一個(gè)一個(gè)存很麻煩,應(yīng)朋友的要求自己寫了個(gè)爬蟲。
2.0版本完成了!完善了生成pdf的功能,可根據(jù)圖片比例自動(dòng)調(diào)節(jié)大小,防止超出頁面范圍,增加了序號(hào)方面查看

#-----------------settings---------------
#url='https://mp.weixin.qq.com/s/8JwB_SXQ-80uwQ9L97BMgw'
print('jd3096 for king 2.0 VIP8鉆石永久會(huì)員版')
print('愿你遠(yuǎn)離流氓軟件每一天')
url=input('請輸入網(wǎng)址:')
#-----------------get data----------------
import requests
import re
from bs4 import BeautifulSoup
import os
from PIL import Image

try:
    os.makedirs('pics')
except:
    pass

os.chdir('pics')

page=requests.get(url).text
soup = BeautifulSoup(page, 'html.parser')
jdata = soup.find_all('img')
pn=0
for i in jdata:
    try:
        src=i['data-src']
        print(src)
        rp = requests.get(src)
        with open(str(pn)+'.jpg','wb+')as f : # 循環(huán)寫入圖片
            print(str(pn)+'.jpg')
            f.write(rp.content)
        pn+=1
    except:
        pass
#--------------------make pdf--------------------
from fpdf import FPDF
import os
path=os.getcwd()
print(path)
pdf = FPDF()
pdf.set_auto_page_break(1)
imagelist = [i for i in os.listdir()]
imagelist.sort(key=lambda x: int(x.split('.')[0]))
print(imagelist)
for image in imagelist:
    try:
        img = Image.open(image)
        w = img.width       #圖片的寬
        h = img.height      #圖片的高
        ii=h/w
        print(ii)
        if ii>1.41:
            ww=int(250/ii)
            pdf.add_page()
            pdf.set_xy(0,0)
            pdf.set_font('arial','B',14)
            pdf.cell(60)
            pdf.cell(70,10,image,border=0, ln=1, align='C')
            pdf.image(os.path.join(path, image), w=ww, h=250)
        else:
            hh=int(180*ii)
            pdf.add_page()
            pdf.set_xy(0,0)
            pdf.set_font('arial','B',14)
            pdf.cell(60)
            pdf.cell(70,10,image,border=0, ln=1, align='C')
            pdf.image(os.path.join(path, image), w=180, h=hh)
    except:
        pass

pdf.output(os.path.join(path, "merge.pdf"), "F")


爬完了長這樣:

在這里插入圖片描述

PDF長這樣,比例適中適合閱讀

在這里插入圖片描述

到此這篇關(guān)于python爬取微信公眾號(hào)文章圖片并轉(zhuǎn)為PDF的文章就介紹到這了,更多相關(guān)python微信公眾號(hào)文章圖片內(nèi)容請搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!

相關(guān)文章

最新評論