python3爬取數據至mysql的方法

更新時間：2018年06月26日 08:38:49 作者：lcjasas

這篇文章主要為大家詳細介紹了python3爬取數據至mysql的方法，具有一定的參考價值，感興趣的小伙伴們可以參考一下

本文實例為大家分享了python3爬取數據至mysql的具體代碼，供大家參考，具體內容如下

直接貼代碼

#!/usr/local/bin/python3.5 
# -*- coding:UTF-8 -*- 
from urllib.request import urlopen 
from bs4 import BeautifulSoup 
import re 
import datetime 
import random 
import pymysql 
 
connect = pymysql.connect(host='192.168.10.142', unix_socket='/tmp/mysql.sock', user='root', passwd='1234', db='scraping', charset='utf8') 
cursor = connect.cursor() 
cursor.execute('USE scraping') 
 
random.seed(datetime.datetime.now()) 
 
 
def store(title, content): 
 
  execute = cursor.execute("select * from pages WHERE `title` = %s", title) 
  if execute <= 0: 
    cursor.execute("insert into pages(`title`, `content`) VALUES(%s, %s)", (title, content)) 
    cursor.connection.commit() 
  else: 
    print('This content is already exist.') 
 
 
def get_links(acticle_url): 
  html = urlopen('http://en.wikipedia.org' + acticle_url) 
  soup = BeautifulSoup(html, 'html.parser') 
  title = soup.h1.get_text() 
  content = soup.find('div', {'id': 'mw-content-text'}).find('p').get_text() 
  store(title, content) 
  return soup.find('div', {'id': 'bodyContent'}).findAll('a', href=re.compile("^(/wiki/)(.)*$")) 
 
links = get_links('') 
 
try: 
  while len(links) > 0: 
    newActicle = links[random.randint(0, len(links) - 1)].attrs['href'] 
    links = get_links(newActicle) 
    print(links) 
finally: 
  cursor.close() 
  connect.close()

以上就是本文的全部內容，希望對大家的學習有所幫助，也希望大家多多支持腳本之家。

您可能感興趣的文章:

pycharm安裝中文插件的2種方法圖文詳解
PyCharm可以說是當今最流行的一款Python?IDE了,下面這篇文章主要給大家介紹了關于pycharm安裝中文插件的2種方法,文中通過圖文介紹的非常詳細,需要的朋友可以參考下
2023-06-06
Virtualenv 搭建 Py項目運行環(huán)境的教程詳解
這篇文章主要介紹了Virtualenv 搭建 Py項目運行環(huán)境的詳細教程，本文通過圖文并茂的形式給大家介紹的非常詳細，對大家的學習或工作具有一定的參考借鑒價值,需要的朋友可以參考下
2020-06-06
Matplotlib的反轉軸、繪制雙軸和定制刻度詳解
這篇文章主要介紹了Matplotlib的反轉軸、繪制雙軸和定制刻度詳解,作為Python生態(tài)中應用最廣泛的繪圖庫,Matplotlib用起來非常簡單,也很容易上手,本文匯總了和軸、刻度相關的七個Matplotlib使用技巧,并給出了實例代碼,需要的朋友可以參考下
2023-08-08
python爬蟲學習筆記之Beautifulsoup模塊用法詳解
這篇文章主要介紹了python爬蟲學習筆記之Beautifulsoup模塊用法,結合實例形式詳細分析了python爬蟲Beautifulsoup模塊基本功能、原理、用法及操作注意事項,需要的朋友可以參考下
2020-04-04
python操作數據庫獲取結果之fetchone和fetchall的區(qū)別說明
這篇文章主要介紹了python操作數據庫獲取結果之fetchone和fetchall的區(qū)別說明，具有很好的參考價值，希望對大家有所幫助。一起跟隨小編過來看看吧
2021-04-04
使用批處理腳本自動生成并上傳NuGet包(操作方法)
這篇文章主要介紹了使用批處理腳本自動生成并上傳NuGet包的操作方法，非常不錯，具有一定的參考借鑒價值,需要的朋友可以參考下
2019-11-11
Python IDE環(huán)境之新版Pycharm安裝詳細教程
這篇文章主要介紹了Python IDE環(huán)境之新版Pycharm安裝教程，本文教程給大家介紹的非常詳細，對大家的學習或工作具有一定的參考借鑒價值,需要的朋友可以參考下
2020-03-03
Python使用unicodedata實現字符串標準化
這篇文章主要來和大家聊一聊 Python 的一個內置模塊：unicodedata，它是專門用來處理 unicode 字符串的，下面就一起來看看它的用法吧
2023-06-06
如何利用?Python?繪制動態(tài)可視化圖表
這篇文章主要介紹了如何利用?Python?繪制動態(tài)可視化圖表,主要介紹介紹如何進行保存gif格式的文件。那么我們就開始進入主題，來談一下Python當中的gif模塊,需要的朋友可以參考一下
2022-02-02
快速解決安裝python沒有scripts文件夾的問題
下面小編就為大家分享一篇快速解決安裝python沒有scripts文件夾的問題，具有很好的參考價值，希望對大家有所幫助。一起跟隨小編過來看看吧
2018-04-04

欧美bbbwbbbw肥妇,免费乱码人妻系列日韩,一级黄片

python3爬取數據至mysql的方法

相關文章

最新評論

大家感興趣的內容

最近更新的內容

常用在線小工具