欧美bbbwbbbw肥妇,免费乱码人妻系列日韩,一级黄片

Python?socket如何解析HTTP請求內(nèi)容

 更新時間:2022年02月12日 10:03:06   作者:aefuimn  
這篇文章主要介紹了Python?socket如何解析HTTP請求內(nèi)容,具有很好的參考價值,希望對大家有所幫助。如有錯誤或未考慮完全的地方,望不吝賜教

socket解析HTTP請求內(nèi)容

思路

1. 解析HTTP請求的頭部

HTTP請求頭部的結(jié)束符行為"\r\n",可以按行讀取HTTP請求頭的內(nèi)容,如果讀到一行為"\r\n",說明HTTP請求頭結(jié)束。

2. 請求頭里面含有Content-Length參數(shù)

如果HTTP請求里面有Content-Length參數(shù),說明HTTP請求的內(nèi)容大小是確定的,請求直接讀取Content-Length的值,然后讀取相應(yīng)字節(jié)的的內(nèi)容即可。

3. 請求頭里面含有Transfer-Encoding: chunked 參數(shù)

如果HTTP請求里面有Transfer-Encoding參數(shù),說明HTTP請求的內(nèi)容大小是不確定的,這種內(nèi)容的結(jié)束符是"0\r\n\r\n",因此可以按行讀取HTTP請求的內(nèi)容部分,如果連續(xù)讀到"0\r\n"和"\r\n"說明內(nèi)容讀取完畢。

代碼實(shí)現(xiàn)

代碼中: self._file 代表的是socket.makefile() 

 def get_http_content(self):
        content_length = 0
        transfer_encoding = False
        while True:
            req_line = self._file.readline()
            req_line = str(req_line, "utf-8")
 
            # 遇到http頭結(jié)束符
            # 讀取http內(nèi)容
            if req_line == "\r\n":
                if content_length != 0:
                    content = self._file.read(content_length)
                    content = str(content, "utf-8")
                    self._content = content
                    return None
 
                if transfer_encoding:
                    content = ""
                    self._file.readline()
                    while True:
                        line = self._file.readline()
                        line = str(line, "utf-8")
                        if line == "0\r\n":
                            sub_line = self._file.readline()
                            sub_line = str(sub_line, "utf-8")
                            if sub_line == "\r\n":
                                self._content = content
                                return None
                        else:
                            content += line
                            continue
                    self._content = False
 
            # 頭文件沒有結(jié)束
            # 并且沒有找到關(guān)于內(nèi)容大小的字段
            else:
                if content_length == 0 and transfer_encoding is False:
                    words = req_line.split()
                    if words[0] == "Content-Length:":
                        content_length = int(words[1])
                    if words[0] == "Transfer-Encoding:":
                        transfer_encoding = True
 
            self._content = False

socket 模擬http請求

# coding: utf-8
import socket
from urllib.parse import urlparse
def get_url(url):
    url = urlparse(url)
    host = url.netloc
    path = url.path
    if path == "":
        path = "/"
    # 建立 socket 連接
    client = socket.socket(socket.AF_INET, socket.SOCK_STREAM)
    client.connect((host, 80))
    client.send("GET {} HTTP/1.1\r\nHost:{}\r\nConnection:close\r\n\r\n".format(path, host).encode("utf-8"))
    data = b""
    while True:
        d = client.recv(1024)
        if d:
            data += d
        else:
            break
    data = data.decode("utf-8")
    html_data = data.split("\r\n\r\n")[1]
    print(html_data)
    client.close()
    pass
if __name__ == '__main__':
    get_url("http://www.baidu.com")

以上為個人經(jīng)驗(yàn),希望能給大家一個參考,也希望大家多多支持腳本之家。

相關(guān)文章

  • python直接訪問私有屬性的簡單方法

    python直接訪問私有屬性的簡單方法

    下面小編就為大家?guī)硪黄猵ython直接訪問私有屬性的簡單方法。小編覺得挺不錯的,現(xiàn)在就分享給大家,也給大家做個參考。一起跟隨小編過來看看吧
    2016-07-07
  • python調(diào)用git出錯的解決

    python調(diào)用git出錯的解決

    這篇文章主要介紹了python調(diào)用git出錯的解決方案,具有很好的參考價值,希望對大家有所幫助。如有錯誤或未考慮完全的地方,望不吝賜教
    2023-06-06
  • python?+?pyqt5制作一個串口助手

    python?+?pyqt5制作一個串口助手

    這篇文章主要介紹了python?+?pyqt5制作一個串口助手,串口助手是串口通信使用的工具,為整合知識,打算做個串口助手,本文給大家講解的非常詳細(xì),需要的朋友可以參考下
    2023-04-04
  • Python全棧之學(xué)習(xí)CSS(2)

    Python全棧之學(xué)習(xí)CSS(2)

    這篇文章主要為大家介紹了Python全棧之CSS,具有一定的參考價值,感興趣的小伙伴們可以參考一下,希望能夠給你帶來幫助
    2022-01-01
  • python判斷完全平方數(shù)的方法

    python判斷完全平方數(shù)的方法

    今天小編就為大家分享一篇python判斷完全平方數(shù)的方法,具有很好的參考價值,希望對大家有所幫助。一起跟隨小編過來看看吧
    2018-11-11
  • 利用python實(shí)現(xiàn)對web服務(wù)器的目錄探測的方法

    利用python實(shí)現(xiàn)對web服務(wù)器的目錄探測的方法

    這篇文章主要介紹了利用python實(shí)現(xiàn)對web服務(wù)器的目錄探測的方法,文中通過示例代碼介紹的非常詳細(xì),對大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價值,需要的朋友們下面隨著小編來一起學(xué)習(xí)學(xué)習(xí)吧
    2019-02-02
  • python中的elasticsearch_dsl查詢語句轉(zhuǎn)換成es查詢語句詳解

    python中的elasticsearch_dsl查詢語句轉(zhuǎn)換成es查詢語句詳解

    這篇文章主要介紹了python中的elasticsearch_dsl查詢語句轉(zhuǎn)換成es查詢語句詳解,ElasticSearch在實(shí)際生產(chǎn)里通常和LogStash,Kibana,F(xiàn)ileBeat一起構(gòu)成Elastic?Stack來使用,它是這些組件里面最核心的一個,需要的朋友可以參考下
    2023-07-07
  • pygame播放音樂的方法

    pygame播放音樂的方法

    這篇文章主要介紹了pygame播放音樂的方法,以兩個簡單實(shí)例形式分析了pygame播放MP3音樂的實(shí)現(xiàn)方法,需要的朋友可以參考下
    2015-05-05
  • Python模塊、包和發(fā)布模塊示例代碼

    Python模塊、包和發(fā)布模塊示例代碼

    模塊是python程序架構(gòu)的一個核心概念,模塊名同樣也是一個標(biāo)識符,需要符合標(biāo)識符的命名規(guī)則,接下來通過本文給大家講解Python模塊、包和發(fā)布模塊,需要的朋友可以參考下
    2023-01-01
  • python如何使用contextvars模塊源碼分析

    python如何使用contextvars模塊源碼分析

    這篇文章主要介紹了python如何使用contextvars模塊源碼分析,contextvars是Python3.7后的官方庫,功能就是可以為多線程以及asyncio生態(tài)添加上下文功能,即使程序在多個協(xié)程并發(fā)運(yùn)行的情況下,也能調(diào)用到程序的上下文變量,?從而使我們的邏輯解耦
    2022-06-06

最新評論