python網絡爬蟲采集聯(lián)想詞示例

更新時間：2014年02月11日 10:03:47 作者：

這篇文章主要介紹了python網絡爬蟲采集聯(lián)想詞示例,需要的朋友可以參考下

python爬蟲_采集聯(lián)想詞代碼

#coding:utf-8
import urllib2
import urllib
import re
import time
from random import choice
#特別提示，下面這個list中的代理ip可能失效，請換上有效的代理ip
iplist = ['27.24.158.153:81','46.209.70.74:8080','60.29.255.88:8888']

list1 = ["集團","科技"]
for item in list1:
    ip= choice(iplist)
    gjc = urllib.quote(item)
    url = "http://sug.so.#/suggest/word?callback=suggest_so&encodein=utf-8&encodeout=utf-8&word="+gjc
    headers = {
                "GET":url,
                "Host":"sug.so.#",
                "Referer":"http://www.so.com/",
                "User-Agent":"sMozilla/5.0 (Macintosh; Intel Mac OS X 10_8_4) AppleWebKit/537.17 (KHTML, like Gecko) Chrome/24.0.1312.56 Safari/537.17",
                }

proxy_support = urllib2.ProxyHandler({'http':'http://'+ip})

    opener = urllib2.build_opener(proxy_support)
    urllib2.install_opener( opener )
    req = urllib2.Request(url)

    for key in headers:
        req.add_header(key,headers[key])

    html = urllib2.urlopen(req).read()

    ss = re.findall("\"(.*?)\"",html)
    for item in ss:
        print item
    time.sleep(2)

您可能感興趣的文章:

解析Mac OS下部署Pyhton的Django框架項目的過程
這篇文章主要介紹了Mac OS下部署Pyhton的Django框架項目的過程,還附帶將了一個gunicorn結合Nginx來部署Django應用的方法,需要的朋友可以參考下
2016-05-05
PyCharm專業(yè)最新版2019.1安裝步驟（含激活碼）
這篇文章主要介紹了PyCharm專業(yè)最新版2019.1安裝步驟（含激活碼），文中通過示例代碼介紹的非常詳細，對大家的學習或者工作具有一定的參考學習價值，需要的朋友們下面隨著小編來一起學習學習吧
2019-10-10
橫向對比分析Python解析XML的四種方式
這篇文章主要以橫向對比方式分析Python解析XML的四種方式，感興趣的小伙伴們可以參考一下
2016-03-03
Python os庫常用操作代碼匯總
這篇文章主要介紹了Python os庫常用操作代碼匯總,文中通過示例代碼介紹的非常詳細，對大家的學習或者工作具有一定的參考學習價值,需要的朋友可以參考下
2020-11-11
python生成器，可迭代對象，迭代器區(qū)別和聯(lián)系
這篇文章主要介紹了python生成器，可迭代對象，迭代器區(qū)別和聯(lián)系，通過對比用法讓大家更加深入理解相關知識，需要的朋友參考學習下吧。
2018-02-02
用python按照圖像灰度值統(tǒng)計并篩選圖片的操作(PIL,shutil,os)
這篇文章主要介紹了用python按照圖像灰度值統(tǒng)計并篩選圖片的操作(PIL,shutil,os)，具有很好的參考價值，希望對大家有所幫助。一起跟隨小編過來看看吧
2020-06-06
python異步編程之asyncio低階API的使用詳解
asyncio中低階API的種類很多,涉及到開發(fā)的5個方面,這篇文章主要為大家詳細介紹了這些低階API的具體使用,感興趣的小伙伴可以學習一下
2024-01-01
pandas實現(xiàn)DataFrame顯示最大行列,不省略顯示實例
今天小編就為大家分享一篇pandas實現(xiàn)DataFrame顯示最大行列,不省略顯示實例，具有很好的參考價值，希望對大家有所幫助。一起跟隨小編過來看看吧
2019-12-12
Python函數(shù)值傳遞引用傳遞及形式參數(shù)和實際參數(shù)的區(qū)別
這篇文章主要介紹了Python函數(shù)值傳遞引用傳遞及形式參數(shù)和實際參數(shù)的區(qū)別，具有一定的參考價值，需要的小伙伴可以參考一下，希望對你的學習有所幫助
2022-05-05
Python 如何測試文件是否存在
這篇文章主要介紹了Python 如何測試文件是否存在，文中講解非常細致，代碼幫助大家更好的理解和學習，感興趣的朋友可以了解下
2020-07-07