欧美bbbwbbbw肥妇,免费乱码人妻系列日韩,一级黄片

Python爬取數(shù)據(jù)保存為Json格式的代碼示例

 更新時(shí)間:2019年04月09日 11:43:48   作者:zhanghl150426  
今天小編就為大家分享一篇關(guān)于Python爬取數(shù)據(jù)保存為Json格式的代碼示例,小編覺(jué)得內(nèi)容挺不錯(cuò)的,現(xiàn)在分享給大家,具有很好的參考價(jià)值,需要的朋友一起跟隨小編來(lái)看看吧

python爬取數(shù)據(jù)保存為Json格式

代碼如下:

#encoding:'utf-8'
import urllib.request
from bs4 import BeautifulSoup
import os
import time
import codecs
import json
#找到網(wǎng)址
def getDatas():
  # 偽裝
  header={'User-Agent':"Mozilla/5.0 (X11; CrOS i686 2268.111.0) AppleWebKit/536.11 (KHTML, like Gecko) Chrome/20.0.1132.57 Safari/536.11"}
  # url="https://movie.douban.com/top250"
  url="file:///E:/scrapy/2018-04-27/movie/movie.html"
  ret=urllib.request.Request(url=url,headers=header)
  # 打開(kāi)網(wǎng)頁(yè)
  res=urllib.request.urlopen(ret)
  # 轉(zhuǎn)化格式
  response=BeautifulSoup(res,'html.parser')
  # 找到想要數(shù)據(jù)的父元素
  datas=response.find_all('div',{'class':'item'})
  # print(datas)
  #創(chuàng)建存放數(shù)據(jù)的文件夾
  folder_name="output"
  if not os.path.exists(folder_name):
      os.mkdir(folder_name)
  # 定義文件
  current_time=time.strftime('%Y-%m-%d',time.localtime())
  file_name="move"+current_time+".json"
  # 文件路徑
  file_path=folder_name+"/"+file_name
  for item in datas:
    # print(item)
    dict1={}
    dict1['rank']=item.find('div',{'class':'pic'}).find('em').get_text()
    dict1['title']=item.find('div',{'class':'info'}).find('div',{'class':'hd'}).find('a').find('span',{'class':'title'}).get_text()
    dict1['picUrl']=item.find('div',{'class':'pic'}).find('a').find('img').get('src')
    # print(picUrl)
    # 保存數(shù)據(jù)為json格式
    try:
      with codecs.open(file_path,'a',encoding="utf-8") as fp:
        fp.write(json.dumps(dict1,ensure_ascii=False)+",\n")
    except IOError as err:
      print('error'+str(err))
    finally:
      fp.close()
  pass
getDatas()
# 爬取數(shù)據(jù)

總結(jié)

以上就是這篇文章的全部?jī)?nèi)容了,希望本文的內(nèi)容對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,謝謝大家對(duì)腳本之家的支持。如果你想了解更多相關(guān)內(nèi)容請(qǐng)查看下面相關(guān)鏈接

相關(guān)文章

  • 使用Python對(duì)文件進(jìn)行批量改名的方法

    使用Python對(duì)文件進(jìn)行批量改名的方法

    這篇文章主要介紹了使用Python對(duì)文件進(jìn)行批量改名的方法,本文給大家介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或工作具有一定的參考借鑒價(jià)值,需要的朋友可以參考下
    2023-03-03
  • python能開(kāi)發(fā)游戲嗎

    python能開(kāi)發(fā)游戲嗎

    在本篇文章里小編給大家整理的是關(guān)于python進(jìn)行游戲開(kāi)發(fā)的相關(guān)知識(shí)點(diǎn),需要的朋友們參考學(xué)習(xí)下。
    2020-06-06
  • django模板加載靜態(tài)文件的方法步驟

    django模板加載靜態(tài)文件的方法步驟

    這篇文章主要介紹了django模板加載靜態(tài)文件的方法步驟,小編覺(jué)得挺不錯(cuò)的,現(xiàn)在分享給大家,也給大家做個(gè)參考。一起跟隨小編過(guò)來(lái)看看吧
    2019-03-03
  • Python在畫(huà)圖時(shí)使用特殊符號(hào)的方法總結(jié)

    Python在畫(huà)圖時(shí)使用特殊符號(hào)的方法總結(jié)

    在制作圖表時(shí),如果遇到需要利用特殊符號(hào)進(jìn)行表示時(shí)該怎么辦呢?不用慌,這篇文章為大家總結(jié)了python畫(huà)圖中使用各種特殊符號(hào)的方式,需要的可以參考一下
    2022-04-04
  • python編輯用戶登入界面的實(shí)現(xiàn)代碼

    python編輯用戶登入界面的實(shí)現(xiàn)代碼

    這篇文章主要介紹了python編輯用戶登入界面的實(shí)現(xiàn)代碼,非常不錯(cuò),代碼簡(jiǎn)單易懂,具有一定的參考借鑒價(jià)值,需要的朋友可以參考下
    2018-07-07
  • python如何提取英語(yǔ)pdf內(nèi)容并翻譯

    python如何提取英語(yǔ)pdf內(nèi)容并翻譯

    這篇文章主要為大家詳細(xì)介紹了python如何提取英語(yǔ)pdf內(nèi)容并翻譯,文中示例代碼介紹的非常詳細(xì),具有一定的參考價(jià)值,感興趣的小伙伴們可以參考一下
    2020-03-03
  • python計(jì)算波峰波谷值的方法(極值點(diǎn))

    python計(jì)算波峰波谷值的方法(極值點(diǎn))

    這篇文章主要介紹了python求極值點(diǎn)(波峰波谷)求極值點(diǎn)主要用到了scipy庫(kù),本文通過(guò)實(shí)例代碼給大家介紹的非常詳細(xì),具有一定的參考借鑒價(jià)值,需要的朋友可以參考下
    2020-02-02
  • 用Python一鍵搭建Http服務(wù)器的方法

    用Python一鍵搭建Http服務(wù)器的方法

    今天小編就為大家分享一篇用Python一鍵搭建Http服務(wù)器的方法,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。一起跟隨小編過(guò)來(lái)看看吧
    2018-06-06
  • Python利用Matplotlib繪制圖表詳解

    Python利用Matplotlib繪制圖表詳解

    Matplotlib是Python中最受歡迎的數(shù)據(jù)可視化軟件包之一,支持跨平臺(tái)運(yùn)行,它是Python常用的 2D 繪圖庫(kù)。本文將介紹如何通過(guò)Matplotlib繪制常用的圖表
    2022-01-01
  • python使用yaml格式文件的方法

    python使用yaml格式文件的方法

    本文主要介紹了python使用yaml格式文件的方法,文中通過(guò)示例代碼介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友們下面隨著小編來(lái)一起學(xué)習(xí)學(xué)習(xí)吧
    2023-07-07

最新評(píng)論