通過實例解析Socket套接字通信原理
一、Socket是什么
Socket 的中文翻譯過來就是“套接字”。套接字是什么,我們先來看看它的英文含義:插座。
Socket 就像一個電話插座,負責連通兩端的電話,進行點對點通信,讓電話可以進行通信,端口就像插座上的孔,端口不能同時被其他進程占用。而我們建立連接就像把插頭插在這個插座上,創(chuàng)建一個 Socket 實例開始監(jiān)聽后,這個電話插座就時刻監(jiān)聽著消息的傳入,誰撥通我這個“IP 地址和端口”,我就接通誰。
實際上,Socket 是在應用層和傳輸層之間的一個抽象層,它把 TCP/IP 層復雜的操作抽象為幾個簡單的接口,供應用層調(diào)用實現(xiàn)進程在網(wǎng)絡(luò)中的通信。Socket 起源于 UNIX,在 UNIX 一切皆文件的思想下,進程間通信就被冠名為文件描述符(file descriptor),Socket 是一種“打開—讀/寫—關(guān)閉”模式的實現(xiàn),服務(wù)器和客戶端各自維護一個“文件”,在建立連接打開后,可以向文件寫入內(nèi)容供對方讀取或者讀取對方內(nèi)容,通訊結(jié)束時關(guān)閉文件。
另外我們經(jīng)常說到的Socket 所在位置如下圖:
二、Socket有哪些類型
世界上有很多種套接字(socket),比如 DARPA Internet 地址(Internet 套接字)、本地節(jié)點的路徑名(Unix套接字)、CCITT X.25地址(X.25 套接字)等。我們只介紹第一種套接字——Internet 套接字,它是最具代表性的,也是最經(jīng)典最常用的。以后我們提及套接字,指的都是 Internet 套接字。
根據(jù)數(shù)據(jù)的傳輸方式,可以將 Internet 套接字分成兩種類型。
流格式套接字(SOCK_STREAM)
流格式套接字(Stream Sockets)也叫“面向連接的套接字”,是一種可靠的、雙向的通信數(shù)據(jù)流,數(shù)據(jù)可以準確無誤地到達另一臺計算機,如果損壞或丟失,可以重新發(fā)送。
其特點:
- 數(shù)據(jù)在傳輸過程中不會消失;
- 數(shù)據(jù)是按照順序傳輸?shù)模?/li>
- 數(shù)據(jù)的發(fā)送和接收不是同步的(有的教程也稱“不存在數(shù)據(jù)邊界”)。
可以將SOCK_STREAM 比喻成一條傳送帶,只要傳送帶本身沒有問題(不會斷網(wǎng)),就能保證數(shù)據(jù)不丟失;同時,較晚傳送的數(shù)據(jù)不會先到達,較早傳送的數(shù)據(jù)不會晚到達,這就保證了數(shù)據(jù)是按照順序傳遞的。
為什么流格式套接字可以達到高質(zhì)量的數(shù)據(jù)傳輸呢?這是因為它使用了 TCP 協(xié)議(The Transmission Control Protocol,傳輸控制協(xié)議),TCP 協(xié)議會控制你的數(shù)據(jù)按照順序到達并且沒有錯誤。
你也許見過 TCP,是因為你經(jīng)常聽說“TCP/IP”。TCP 用來確保數(shù)據(jù)的正確性,IP(Internet Protocol,網(wǎng)絡(luò)協(xié)議)用來控制數(shù)據(jù)如何從源頭到達目的地,也就是常說的“路由”。
那么,“數(shù)據(jù)的發(fā)送和接收不同步”該如何理解呢?
假設(shè)傳送帶傳送的是水果,接收者需要湊齊 100 個后才能裝袋,但是傳送帶可能把這 100 個水果分批傳送,比如第一批傳送 20 個,第二批傳送 50 個,第三批傳送 30 個。接收者不需要和傳送帶保持同步,只要根據(jù)自己的節(jié)奏來裝袋即可,不用管傳送帶傳送了幾批,也不用每到一批就裝袋一次,可以等到湊夠了 100 個水果再裝袋。
流格式套接字的內(nèi)部有一個緩沖區(qū)(也就是字符數(shù)組),通過 socket 傳輸?shù)臄?shù)據(jù)將保存到這個緩沖區(qū)。接收端在收到數(shù)據(jù)后并不一定立即讀取,只要數(shù)據(jù)不超過緩沖區(qū)的容量,接收端有可能在緩沖區(qū)被填滿以后一次性地讀取,也可能分成好幾次讀取。
也就是說,不管數(shù)據(jù)分幾次傳送過來,接收端只需要根據(jù)自己的要求讀取,不用非得在數(shù)據(jù)到達時立即讀取。傳送端有自己的節(jié)奏,接收端也有自己的節(jié)奏,它們是不一致的。
流格式套接字有什么實際的應用場景嗎?瀏覽器所使用的 http 協(xié)議就基于面向連接的套接字,因為必須要確保數(shù)據(jù)準確無誤,否則加載的 HTML 將無法解析。
數(shù)據(jù)報格式套接字(SOCK_DGRAM)
數(shù)據(jù)報格式套接字(Datagram Sockets)也叫“無連接的套接字”。計算機只管傳輸數(shù)據(jù),不作數(shù)據(jù)校驗,如果數(shù)據(jù)在傳輸中損壞,或者沒有到達另一臺計算機,是沒有辦法補救的。也就是說,數(shù)據(jù)錯了就錯了,無法重傳。
因為數(shù)據(jù)報套接字所做的校驗工作少,所以在傳輸效率方面比流格式套接字要高。
有以下特征:
- 強調(diào)快速傳輸而非傳輸順序;
- 傳輸?shù)臄?shù)據(jù)可能丟失也可能損毀;
- 限制每次傳輸?shù)臄?shù)據(jù)大??;
- 數(shù)據(jù)的發(fā)送和接收是同步的
眾所周知,速度是快遞行業(yè)的生命。用摩托車發(fā)往同一地點的兩件包裹無需保證順序,只要以最快的速度交給客戶就行。這種方式存在損壞或丟失的風險,而且包裹大小有一定限制。因此,想要傳遞大量包裹,就得分配發(fā)送。
另外,用兩輛摩托車分別發(fā)送兩件包裹,那么接收者也需要分兩次接收,所以“數(shù)據(jù)的發(fā)送和接收是同步的”;換句話說,接收次數(shù)應該和發(fā)送次數(shù)相同。
總之,數(shù)據(jù)報套接字是一種不可靠的、不按順序傳遞的、以追求速度為目的的套接字。
數(shù)據(jù)報套接字也使用 IP 協(xié)議作路由,但是它不使用 TCP 協(xié)議,而是使用 UDP 協(xié)議(User Datagram Protocol,用戶數(shù)據(jù)報協(xié)議)。
QQ 視頻聊天和語音聊天就使用SOCK_DGRAM 來傳輸數(shù)據(jù),因為首先要保證通信的效率,盡量減小延遲,而數(shù)據(jù)的正確性是次要的,即使丟失很小的一部分數(shù)據(jù),視頻和音頻也可以正常解析,最多出現(xiàn)噪點或雜音,不會對通信質(zhì)量有實質(zhì)的影響。
注意:SOCK_DGRAM 沒有想象中的糟糕,不會頻繁的丟失數(shù)據(jù),數(shù)據(jù)錯誤只是小概率事件。
三、Socket通信過程
Socket 保證了不同計算機之間的通信,也就是網(wǎng)絡(luò)通信。對于網(wǎng)站,通信模型是服務(wù)器與客戶端之間的通信。兩端都建立了一個 Socket 對象,然后通過 Socket 對象對數(shù)據(jù)進行傳輸。通常服務(wù)器處于一個無限循環(huán),等待客戶端的連接。
下面是面向連接的 TCP 時序圖:
客戶端過程
客戶端的過程比較簡單,創(chuàng)建 Socket,連接服務(wù)器,將 Socket 與遠程主機連接(注意:只有 TCP 才有“連接”的概念,一些 Socket 比如 UDP、ICMP 和 ARP 沒有“連接”的概念),發(fā)送數(shù)據(jù),讀取響應數(shù)據(jù),直到數(shù)據(jù)交換完畢,關(guān)閉連接,結(jié)束 TCP 對話。
import socket import sys if __name__ == '__main__': sock = socket.socket(socket.AF_INET, socket.SOCK_STREAM) # 創(chuàng)建 Socket 連接 sock.connect(('127.0.0.1', 8001)) # 連接服務(wù)器 while True: data = input('Please input data:') if not data: break try: sock.sendall(data) except socket.error as e: print('Send Failed...', e) sys.exit(0) print('Send Successfully') res = sock.recv(4096) # 獲取服務(wù)器返回的數(shù)據(jù),還可以用 recvfrom()、recv_into() 等 print(res) sock.close()
sock.sendall(data)
這里也可用 send() 方法:不同在于 sendall() 在返回前會嘗試發(fā)送所有數(shù)據(jù),并且成功時返回 None,而 send() 則返回發(fā)送的字節(jié)數(shù)量,失敗時都拋出異常。
服務(wù)端過程
服務(wù)端先初始化 Socket,建立流式套接字,與本機地址及端口進行綁定,然后通知 TCP,準備好接收連接,調(diào)用accept()阻塞,等待來自客戶端的連接。如果這時客戶端與服務(wù)器建立了連接,客戶端發(fā)送數(shù)據(jù)請求,服務(wù)器接收請求并處理請求,然后把響應數(shù)據(jù)發(fā)送給客戶端,客戶端讀取數(shù)據(jù),直到數(shù)據(jù)交換完畢。最后關(guān)閉連接,交互結(jié)束。
import socket import sys if __name__ == '__main__': sock = socket.socket(socket.AF_INET, socket.SOCK_STREAM) # 創(chuàng)建 Socket 連接(TCP) print('Socket Created') try: sock.bind(('127.0.0.1', 8001)) # 配置 Socket,綁定 IP 地址和端口號 except socket.error as e: print('Bind Failed...', e) sys.exit(0) sock.listen(5) # 設(shè)置最大允許連接數(shù),各連接和 Server 的通信遵循 FIFO 原則 while True: # 循環(huán)輪詢 Socket 狀態(tài),等待訪問 conn, addr = sock.accept() try: conn.settimeout(10) # 如果請求超過 10 秒沒有完成,就終止操作 # 如果要同時處理多個連接,則下面的語句塊應該用多線程來處理 while True: # 獲得一個連接,然后開始循環(huán)處理這個連接發(fā)送的信息 data = conn.recv(1024) print('Get value ' + data, end='\n\n') if not data: print('Exit Server', end='\n\n') break conn.sendall('OK') # 返回數(shù)據(jù) except socket.timeout: # 建立連接后,該連接在設(shè)定的時間內(nèi)沒有數(shù)據(jù)發(fā)來,就會引發(fā)超時 print('Time out') conn.close() # 當一個連接監(jiān)聽循環(huán)退出后,連接可以關(guān)掉 sock.close()
conn, addr = sock.accept()
調(diào)用accept()時,Socket 會進入waiting狀態(tài)。客戶端請求連接時,方法建立連接并返回服務(wù)器。accept()返回一個含有兩個元素的元組 (conn, addr)。第一個元素 conn 是新的 Socket 對象,服務(wù)器必須通過它與客戶端通信;第二個元素 addr 是客戶端的 IP 地址及端口。
data = conn.recv(1024)
接下來是處理階段,服務(wù)器和客戶端通過send()和recv()通信(傳輸數(shù)據(jù))。
服務(wù)器調(diào)用send(),并采用字符串形式向客戶端發(fā)送信息,send()返回已發(fā)送的字符個數(shù)。
服務(wù)器調(diào)用recv()從客戶端接收信息。調(diào)用recv()時,服務(wù)器必須指定一個整數(shù),它對應于可通過本次方法調(diào)用來接收的最大數(shù)據(jù)量。recv()在接收數(shù)據(jù)時會進入blocked狀態(tài),最后返回一個字符串,用它表示收到的數(shù)據(jù)。如果發(fā)送的數(shù)據(jù)量超過了recv()所允許的,數(shù)據(jù)會被截短。多余的數(shù)據(jù)將緩沖于接收端,以后調(diào)用recv()時,會繼續(xù)讀剩余的字節(jié),如果有多余的數(shù)據(jù)會從緩沖區(qū)刪除(以及自上次調(diào)用recv()以來,客戶端可能發(fā)送的其它任何數(shù)據(jù))。傳輸結(jié)束,服務(wù)器調(diào)用 Socket 的close()關(guān)閉連接。
四、從 TCP 連接的視角看 Socket 過程TCP 三次握手的 Socket 過程
- 服務(wù)器調(diào)用 socket()、bind()、listen() 完成初始化后,調(diào)用 accept() 阻塞等待;
- 客戶端 Socket 對象調(diào)用 connect() 向服務(wù)器發(fā)送了一個 SYN 并阻塞;
- 服務(wù)器完成了第一次握手,即發(fā)送 SYN 和 ACK 應答;
- 客戶端收到服務(wù)端發(fā)送的應答之后,從 connect() 返回,再發(fā)送一個 ACK 給服務(wù)器;
- 服務(wù)器 Socket 對象接收客戶端第三次握手 ACK 確認,此時服務(wù)端從 accept() 返回,建立連接。
接下來就是兩個端的連接對象互相收發(fā)數(shù)據(jù)。
TCP 四次揮手的 Socket 過程
- 某個應用進程調(diào)用 close() 主動關(guān)閉,發(fā)送一個 FIN;
- 另一端接收到 FIN 后被動執(zhí)行關(guān)閉,并發(fā)送 ACK 確認;
- 之后被動執(zhí)行關(guān)閉的應用進程調(diào)用 close() 關(guān)閉 Socket,并也發(fā)送一個 FIN;
- 接收到這個 FIN 的一端向另一端 ACK 確認。
說明:上面的服務(wù)端代碼只有處理完一個客戶端請求才會去處理下一個客戶端的請求,這樣的服務(wù)器處理能力很弱,而實際中服務(wù)器都需要有并發(fā)處理能力,為了達到并發(fā)處理,服務(wù)器就需要 fork 一個新的進程或者線程去處理請求。
以上就是本文的全部內(nèi)容,希望對大家的學習有所幫助,也希望大家多多支持腳本之家。
相關(guān)文章
Spring-Web與Spring-WebFlux沖突問題解決
Spring WebFlux是一套全新的Reactive Web技術(shù)棧,實現(xiàn)完全非阻塞,支持Reactive Streams背壓等特性,這篇文章主要給大家介紹了關(guān)于Spring-Web與Spring-WebFlux沖突問題解決的相關(guān)資料,需要的朋友可以參考下2024-04-04SpringBoot超詳細講解集成Flink的部署與打包方法
昨天折騰了下SpringBoot與Flink集成,實際上集成特簡單,主要是部署打包的問題折騰了不少時間。想打出的包直接可以java -jar運行,同時也可以flink run運行,或者在flink的dashboard上上傳點擊啟動。結(jié)果是不行,但是使用不同的插件打包還是可以的2022-05-05springboot結(jié)合ehcache防止惡意刷新請求的實現(xiàn)
這篇文章主要介紹了springboot結(jié)合ehcache防止惡意刷新請求的實現(xiàn),文中通過示例代碼介紹的非常詳細,對大家的學習或者工作具有一定的參考學習價值,需要的朋友們下面隨著小編來一起學習學習吧2020-12-12JAVA構(gòu)造方法/構(gòu)造器以及this使用方式
這篇文章主要介紹了JAVA構(gòu)造方法/構(gòu)造器以及this使用方式,具有很好的參考價值,希望對大家有所幫助,如有錯誤或未考慮完全的地方,望不吝賜教2024-03-03全網(wǎng)最全最細的jmeter接口測試教程以及接口測試流程(入門教程)
本文主要介紹了全網(wǎng)最全最細的jmeter接口測試教程以及接口測試流程,文中介紹的非常詳細,具有一定的參考價值,感興趣的小伙伴們可以參考一下2021-11-11