Python爬取12306車(chē)次信息代碼詳解
詳情查看下面的代碼:
如果被識(shí)別就要添加一個(gè)cookie如果沒(méi)有被識(shí)別的話就要一個(gè)user—agent就好了。如果出現(xiàn)亂碼就設(shè)置編碼格式為utf-8
#靜態(tài)的數(shù)據(jù)一般在elements中(復(fù)制文字到sources按ctrl+f搜索。找到的為靜態(tài)),而動(dòng)態(tài)去network中去尋找相關(guān)的信息 import requests import re def send_request(): headers = {'user-agent':'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/74.0.3729.131 Safari/537.36' ,'Cookie':'_uab_collina=159618052151589201474313; JSESSIONID=D33C89D8BEC6A692C79CFA69FC0B0D29; BIGipServerotn=233832970.24610.0000; BIGipServerpool_passport=216859146.50215.0000; RAIL_EXPIRATION=1596443951465; RAIL_DEVICEID=nMo94O2Z21cXLblW7otLoxUZ_LP9Q01PYj_I89OqU6MqjxyX9814Jc3CH5TNwgBVJqnBaBG8OGiBWo2QtNcu5wVu-asNk6YLa49g0fMwVp03XFJQ-GkhHYHcqIgUd-nqQB_VEdWH1Om_D2yAgIu8QcEavt02pmH5; route=c5c62a339e7744272a54643b3be5bf64; _jc_save_fromStation=%u5317%u4EAC%2CBJP; _jc_save_toStation=%u5929%u6D25%2CTJP; _jc_save_fromDate=2020-07-31; _jc_save_toDate=2020-07-31; _jc_save_wfdc_flag=dc'}#創(chuàng)建頭部信息 url='https://kyfw.12306.cn/otn/leftTicket/query?leftTicketDTO.train_date=2020-07-31&leftTicketDTO.from_station=BJP&leftTicketDTO.to_station=TJP&purpose_codes=ADULT' #設(shè)置編碼格式。防止亂碼 resp=requests.get(url,headers=headers) resp.encoding='utf-8' return resp #解析數(shù)據(jù) #{}是字典。根據(jù)key獲取值。 def parse_json(resp,city): json_ticket=resp.json()#將相應(yīng)的數(shù)據(jù)轉(zhuǎn)換為json data_list=json_ticket['data']['result']#得到車(chē)次的列表 lst=[]#列表 for item in data_list: #遍歷車(chē)次信息進(jìn)行分割 d=item.split('|') lst.append([d[3],city[d[6]],city[d[7]],d[31],d[30],d[13]]) return lst ''' d[3]從列表中獲取索引為3的表示車(chē)次 d[6]查詢(xún)起始站 d[7]查詢(xún)到達(dá)站 d[31]一等座 d[30]表示二等座 d[13]表示出行時(shí)間''' #獲得station_name的信息 def get_city(): url='https://kyfw.12306.cn/otn/resources/js/framework/station_name.js?station_version=1.9151' headers = {'user-agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/74.0.3729.131 Safari/537.36'} resp=requests.get(url,headers=headers) resp.encoding='utf-8' #進(jìn)行數(shù)據(jù)的提取(只要一部分) stations=re.findall('([\u4e00-\u9fa5]+)\|([A-Z]+)',resp.text) #將列表進(jìn)行轉(zhuǎn)換為字典 stations_data=dict(stations) #key與value進(jìn)行互換 station_d={}#空字典。用于完成上述操作 for item in stations_data: station_d[stations_data[item]]=item #print(station_d) return station_d def start(): lst=parse_json(send_request(),get_city()) #進(jìn)行數(shù)據(jù)的篩選(得到有效的數(shù)據(jù)) for i in lst: if i[3]!='無(wú)' and i[3]!='': print(i) if __name__=='__main__': start() #開(kāi)始
運(yùn)行的截圖:
以上就是本文的全部?jī)?nèi)容,希望對(duì)大家的學(xué)習(xí)有所幫助,也希望大家多多支持腳本之家。
相關(guān)文章
Python數(shù)據(jù)可視化實(shí)現(xiàn)正態(tài)分布(高斯分布)
這篇文章主要介紹了Python數(shù)據(jù)可視化實(shí)現(xiàn)正態(tài)分布(高斯分布),文中通過(guò)示例代碼介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友們下面隨著小編來(lái)一起學(xué)習(xí)學(xué)習(xí)吧2019-08-08Python類(lèi)中方法getitem和getattr詳解
這篇文章主要介紹了Python類(lèi)中方法getitem和getattr詳解,文中通過(guò)示例代碼介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友可以參考下2019-08-08Python實(shí)例解析圖像形態(tài)學(xué)運(yùn)算技術(shù)
形態(tài)學(xué)處理方法是基于對(duì)二進(jìn)制圖像進(jìn)行處理的,卷積核決定圖像處理后的效果。本文將為大家詳細(xì)介紹一下OpenCV中的圖像形態(tài)學(xué),感興趣的可以了解一下2022-03-03Python實(shí)現(xiàn)簡(jiǎn)易過(guò)濾刪除數(shù)字的方法小結(jié)
這篇文章主要介紹了Python實(shí)現(xiàn)簡(jiǎn)易過(guò)濾刪除數(shù)字的方法,結(jié)合實(shí)例形式總結(jié)分析了Python基于正則及內(nèi)置函數(shù)過(guò)濾刪除數(shù)字的相關(guān)操作技巧,需要的朋友可以參考下2019-01-01關(guān)于Python面向?qū)ο缶幊痰闹R(shí)點(diǎn)總結(jié)
Python從設(shè)計(jì)之初就已經(jīng)是一門(mén)面向?qū)ο蟮恼Z(yǔ)言,正因?yàn)槿绱耍赑ython中創(chuàng)建一個(gè)類(lèi)和對(duì)象是很容易的。下面這篇文章將詳細(xì)給大家介紹關(guān)于Python面向?qū)ο缶幊痰闹R(shí)點(diǎn),需要的朋友可以參考借鑒,下面來(lái)一起看看吧。2017-02-02Python中將語(yǔ)音轉(zhuǎn)換為文本的實(shí)現(xiàn)方法
語(yǔ)音識(shí)別是計(jì)算機(jī)軟件識(shí)別口語(yǔ)中的單詞和短語(yǔ)并將其轉(zhuǎn)換為人類(lèi)可讀文本的能力,在本教程中,您將學(xué)習(xí)如何使用SpeechRecognition 庫(kù)在 Python 中將語(yǔ)音轉(zhuǎn)換為文本,文中有相關(guān)的代碼供大家參考,需要的朋友可以參考下2024-01-01