Python數(shù)據(jù)持久化存儲(chǔ)實(shí)現(xiàn)方法分析
本文實(shí)例講述了Python數(shù)據(jù)持久化存儲(chǔ)實(shí)現(xiàn)方法。分享給大家供大家參考,具體如下:
1、pymongo的使用
前三步為創(chuàng)建對(duì)象
- 第一步創(chuàng)建連接對(duì)象
conn = pymongo.MongoClient('IP地址',27017)
- 第二步創(chuàng)建庫(kù)
db = conn['庫(kù)名']
- 第三步創(chuàng)建表
myset = db['集合名']
- 第四步把數(shù)據(jù)插入數(shù)據(jù)庫(kù)
myset.inset.one({})
#!/usr/bin/python # -*- coding: utf-8 -*- # @Time : 2019/6/26 8:56 # @Author : ##### # @Site : # @File : 貓眼電影_mongo存儲(chǔ).py # @Software: PyCharm from urllib import request import re import time import pymongo class MaoyanSpider(object): def __init__(self): self.headers={'User-Agent':'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/63.0.3239.26 Safari/537.36 Core/1.63.5221.400 QQBrowser/10.0.1125.400'} #用來(lái)計(jì)數(shù) self.page=1 #連接對(duì)象 self.coon =pymongo.MongoClient('locslhost',27017) #創(chuàng)建庫(kù)對(duì)象 self.db=self.coon['maoyaodb'] #集合對(duì)象 self.myset=self.db['top100'] def get_page(self,url): req = request.Request(url,headers=self.headers) res = request.urlopen(req) html = res.read().decode('utf-8') self.parse_page(html) def parse_page(self,html): p = re.compile( '<div class="movie-item-info">.*?title="(.*?)".*?class="star">(.*?)</p>.*?class="releasetime">(.*?)</p>',re.S) r_list = p.findall(html) self.write_mongo(r_list) def write_mongo(self,r_list): for r_t in r_list: d={ '電影名稱:':r_t[0].strip(), '電影主演:':r_t[1].strip(), '上映時(shí)間:':r_t[2].strip() } #插入數(shù)據(jù)庫(kù) self.myset.inset.one(d) def work_on(self): for pn in range(0,41,10): url = 'https://maoyan.com/board/4?offset=%s' % str(pn) self.get_page(url) print('第%d頁(yè)爬取成功' % self.page) self.page += 1 time.sleep(4) if __name__ == '__main__': begin = time.time() spider = MaoyanSpider() spider.work_on() end = time.time() print("執(zhí)行時(shí)間%.2f" % (end - begin)) #注不完美,仍然需修改
2、mysql的使用
Mysql-front可視化工具,建庫(kù)建表添加字段
1、創(chuàng)建連接對(duì)象:db = pymysql.connet
2、創(chuàng)建游標(biāo)對(duì)象:cursor = db.sursor
3、執(zhí)行命令:cursor.execute()
4、提交到數(shù)據(jù)庫(kù)執(zhí)行
5、關(guān)閉:cursor.close
mysql-Front使用流程
1、創(chuàng)建數(shù)據(jù)庫(kù):
localhost--數(shù)據(jù)庫(kù)--新建---數(shù)據(jù)庫(kù)
數(shù)據(jù)庫(kù)名改為maoyan (項(xiàng)目mysql庫(kù)名)--- 字符集utf8 ---確定
2、創(chuàng)建表:
流程:選中maoyao數(shù)據(jù)庫(kù) --選中數(shù)據(jù) ----新建 ----出現(xiàn)添加菜單 ---名稱改為top100 ---創(chuàng)建成功
3、往表格中添加字段:
流程:選中top100表單 --- 數(shù)據(jù)庫(kù) ----新建 ----字段 ---出現(xiàn)添加界面 ----名稱改為name ---默認(rèn)varchar ---- 長(zhǎng)度50 --確定
用同樣的方法穿件字段star和time
ID一般設(shè)置為int 長(zhǎng)度視情況而定
更多關(guān)于Python相關(guān)內(nèi)容感興趣的讀者可查看本站專題:《Python常見(jiàn)數(shù)據(jù)庫(kù)操作技巧匯總》、《Python數(shù)學(xué)運(yùn)算技巧總結(jié)》、《Python數(shù)據(jù)結(jié)構(gòu)與算法教程》、《Python函數(shù)使用技巧總結(jié)》、《Python字符串操作技巧匯總》、《Python入門(mén)與進(jìn)階經(jīng)典教程》及《Python文件與目錄操作技巧匯總》
希望本文所述對(duì)大家Python程序設(shè)計(jì)有所幫助。
- python序列化與數(shù)據(jù)持久化實(shí)例詳解
- Python數(shù)據(jù)持久化shelve模塊用法分析
- Python中的數(shù)據(jù)對(duì)象持久化存儲(chǔ)模塊pickle的使用示例
- shelve 用來(lái)持久化任意的Python對(duì)象實(shí)例代碼
- 詳解python持久化文件讀寫(xiě)
- 將Python中的數(shù)據(jù)存儲(chǔ)到系統(tǒng)本地的簡(jiǎn)單方法
- Python通過(guò)調(diào)用mysql存儲(chǔ)過(guò)程實(shí)現(xiàn)更新數(shù)據(jù)功能示例
- Python3爬蟲(chóng)學(xué)習(xí)之MySQL數(shù)據(jù)庫(kù)存儲(chǔ)爬取的信息詳解
- python將類似json的數(shù)據(jù)存儲(chǔ)到MySQL中的實(shí)例
- python3爬蟲(chóng)學(xué)習(xí)之?dāng)?shù)據(jù)存儲(chǔ)txt的案例詳解
- Python編寫(xiě)通訊錄通過(guò)數(shù)據(jù)庫(kù)存儲(chǔ)實(shí)現(xiàn)模糊查詢功能
相關(guān)文章
python arcpy練習(xí)之面要素重疊拓?fù)錂z查
今天小編就為大家分享一篇Python ArcPy的面要素重疊拓?fù)錂z查,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。一起跟隨小編過(guò)來(lái)看看吧2021-09-09python numpy數(shù)組的索引和切片的操作方法
NumPy 是一個(gè) Python 包。 它代表 “Numeric Python”。它是一個(gè)由多維數(shù)組對(duì)象和用于處理數(shù)組的例程集合組成的庫(kù)。這篇文章主要介紹了python numpy 數(shù)組的索引和切片,需要的朋友可以參考下2018-10-10Python lxml解析HTML并用xpath獲取元素的方法
今天小編就為大家分享一篇Python lxml解析HTML并用xpath獲取元素的方法,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。一起跟隨小編過(guò)來(lái)看看吧2019-01-01opencv函數(shù)threshold、adaptiveThreshold、Otsu二值化的實(shí)現(xiàn)
這篇文章主要介紹了opencv函數(shù)threshold、adaptiveThreshold、Otsu二值化的實(shí)現(xiàn),文中通過(guò)示例代碼介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友們下面隨著小編來(lái)一起學(xué)習(xí)學(xué)習(xí)吧2021-03-03Python matplotlib繪圖建立畫(huà)布及坐標(biāo)系
這篇文章主要介紹了Python matplotlib繪圖建立畫(huà)布及坐標(biāo)系,建立畫(huà)布 figsize,它用width和height來(lái)控制畫(huà)布的寬和高,下面來(lái)一起倆姐更多內(nèi)容吧2021-12-12python讀取文件由于編碼問(wèn)題失敗匯總以及解決辦法
這篇文章主要給大家介紹了關(guān)于python讀取文件由于編碼問(wèn)題失敗匯總以及解決辦法的相關(guān)資料,文件編碼錯(cuò)誤指的是在Python讀取文件的過(guò)程中出現(xiàn)的編碼不匹配的問(wèn)題,需要的朋友可以參考下2023-10-10使用Python實(shí)現(xiàn)簡(jiǎn)單的服務(wù)器功能
socket的使用并不局限于Python語(yǔ)言,你可以用C或者Java來(lái)寫(xiě)出同樣的socket服務(wù)器,而所有語(yǔ)言使用socket的方式都類似(Apache就是使用C實(shí)現(xiàn)的服務(wù)器)2017-08-08python安裝pandas庫(kù)不成功原因分析及解決辦法
Pandas是python中非常常用的數(shù)據(jù)分析庫(kù),在數(shù)據(jù)分析、機(jī)器學(xué)習(xí)、深度學(xué)習(xí)等領(lǐng)域經(jīng)常被使用,下面這篇文章主要給大家介紹了關(guān)于python安裝pandas庫(kù)不成功原因分析及解決辦法的相關(guān)資料2023-11-11初學(xué)python的操作難點(diǎn)總結(jié)(新手必看篇)
下面小編就為大家?guī)?lái)一篇初學(xué)python的操作難點(diǎn)總結(jié)(新手必看篇)。小編覺(jué)得挺不錯(cuò)的,現(xiàn)在就分享給大家,也給大家做個(gè)參考。一起跟隨小編過(guò)來(lái)看看吧2017-08-08