Golang TCP粘包拆包問(wèn)題的解決方法
什么是粘包問(wèn)題
最近在使用Golang編寫Socket層,發(fā)現(xiàn)有時(shí)候接收端會(huì)一次讀到多個(gè)數(shù)據(jù)包的問(wèn)題。于是通過(guò)查閱資料,發(fā)現(xiàn)這個(gè)就是傳說(shuō)中的TCP粘包問(wèn)題。下面通過(guò)編寫代碼來(lái)重現(xiàn)這個(gè)問(wèn)題:
服務(wù)端代碼 server/main.go
func main() { l, err := net.Listen("tcp", ":4044") if err != nil { panic(err) } fmt.Println("listen to 4044") for { // 監(jiān)聽(tīng)到新的連接,創(chuàng)建新的 goroutine 交給 handleConn函數(shù) 處理 conn, err := l.Accept() if err != nil { fmt.Println("conn err:", err) } else { go handleConn(conn) } } } func handleConn(conn net.Conn) { defer conn.Close() defer fmt.Println("關(guān)閉") fmt.Println("新連接:", conn.RemoteAddr()) result := bytes.NewBuffer(nil) var buf [1024]byte for { n, err := conn.Read(buf[0:]) result.Write(buf[0:n]) if err != nil { if err == io.EOF { continue } else { fmt.Println("read err:", err) break } } else { fmt.Println("recv:", result.String()) } result.Reset() } }
客戶端代碼 client/main.go
func main() { data := []byte("[這里才是一個(gè)完整的數(shù)據(jù)包]") conn, err := net.DialTimeout("tcp", "localhost:4044", time.Second*30) if err != nil { fmt.Printf("connect failed, err : %v\n", err.Error()) return } for i := 0; i <1000; i++ { _, err = conn.Write(data) if err != nil { fmt.Printf("write failed , err : %v\n", err) break } } }
運(yùn)行結(jié)果
listen to 4044
新連接: [::1]:53079
recv: [這里才是一個(gè)完整的數(shù)據(jù)包][這里才是一個(gè)完整的數(shù)據(jù)包][這里才是一個(gè)完整的數(shù)據(jù)包][這里才是一個(gè)完整的數(shù)據(jù)包][這里才是一個(gè)完整的數(shù)據(jù)包][這里才是一個(gè)完整的數(shù)據(jù)包][這里才是一個(gè)完整的數(shù)據(jù)包][這里才是一個(gè)完整的數(shù)據(jù)包][這里才是一個(gè)完整的數(shù)據(jù)包][這里才是一個(gè)完整的數(shù)據(jù)包][這里才是一個(gè)完整的數(shù)據(jù)包][這里才是一個(gè)完整的數(shù)據(jù)包][這里才是一個(gè)完整的數(shù)據(jù)包][這里才是一個(gè)完整的數(shù)據(jù)包][這里才是一個(gè)完整的數(shù)據(jù)包][這里才是一個(gè)完整的數(shù)據(jù)包][這里才是一個(gè)完整的數(shù)據(jù)包][這里才是一個(gè)完整的數(shù)據(jù)包][這里才是一個(gè)完整的數(shù)據(jù)包][這里才是一個(gè)完整的數(shù)據(jù)包][這里才是一個(gè)完整的數(shù)據(jù)包][這里才是一個(gè)完整的數(shù)據(jù)包][這里才是一個(gè)完整的數(shù)據(jù)包][這里才是一個(gè)完整的數(shù)據(jù)包][這里才是一個(gè)完整的數(shù)據(jù)包][這里才是一個(gè)完整的數(shù)據(jù)包][這里才是一個(gè)完整的數(shù)據(jù)�
recv: �][這里才是一個(gè)完整的數(shù)據(jù)包][這里才是一個(gè)完整的數(shù)據(jù)包][這里才是一個(gè)完整的數(shù)據(jù)包][這里才是一個(gè)完整的數(shù)據(jù)包][這里才是一個(gè)完整的數(shù)據(jù)包]
recv: [這里才是一個(gè)完整的數(shù)據(jù)包]
recv: [這里才是一個(gè)完整的數(shù)據(jù)包]
recv: [這里才是一個(gè)完整的數(shù)據(jù)包][這里才是一個(gè)完整的數(shù)據(jù)包][這里才是一個(gè)完整的數(shù)據(jù)包]
recv: [這里才是一個(gè)完整的數(shù)據(jù)包]
...省略其它的...
從服務(wù)端的控制臺(tái)輸出可以看出,存在三種類型的輸出:
- 一種是正常的一個(gè)數(shù)據(jù)包輸出。
- 一種是多個(gè)數(shù)據(jù)包“粘”在了一起,我們定義這種讀到的包為粘包。
- 一種是一個(gè)數(shù)據(jù)包被“拆”開(kāi),形成一個(gè)破碎的包,我們定義這種包為半包。
為什么會(huì)出現(xiàn)半包和粘包?
- 客戶端一段時(shí)間內(nèi)發(fā)送包的速度太多,服務(wù)端沒(méi)有全部處理完。于是數(shù)據(jù)就會(huì)積壓起來(lái),產(chǎn)生粘包。
- 定義的讀的buffer不夠大,而數(shù)據(jù)包太大或者由于粘包產(chǎn)生,服務(wù)端不能一次全部讀完,產(chǎn)生半包。
什么時(shí)候需要考慮處理半包和粘包?
TCP連接是長(zhǎng)連接,即一次連接多次發(fā)送數(shù)據(jù)。
每次發(fā)送的數(shù)據(jù)是結(jié)構(gòu)的,比如 JSON格式的數(shù)據(jù) 或者 數(shù)據(jù)包的協(xié)議是由我們自己定義的(包頭部包含實(shí)際數(shù)據(jù)長(zhǎng)度、協(xié)議魔數(shù)等)。
解決思路
- 定長(zhǎng)分隔(每個(gè)數(shù)據(jù)包最大為該長(zhǎng)度,不足時(shí)使用特殊字符填充) ,但是數(shù)據(jù)不足時(shí)會(huì)浪費(fèi)傳輸資源
- 使用特定字符來(lái)分割數(shù)據(jù)包,但是若數(shù)據(jù)中含有分割字符則會(huì)出現(xiàn)Bug
- 在數(shù)據(jù)包中添加長(zhǎng)度字段,彌補(bǔ)了以上兩種思路的不足,推薦使用
拆包演示
通過(guò)上述分析,我們最好通過(guò)第三種思路來(lái)解決拆包粘包問(wèn)題。
Golang的bufio庫(kù)中有為我們提供了Scanner,來(lái)解決這類分割數(shù)據(jù)的問(wèn)題。
type Scanner
Scanner provides a convenient interface for reading data such as a file of newline-delimited lines of text. Successive calls to the Scan method will step through the 'tokens' of a file, skipping the bytes between the tokens. The specification of a token is defined by a split function of type SplitFunc; the default split function breaks the input into lines with line termination stripped. Split functions are defined in this package for scanning a file into lines, bytes, UTF-8-encoded runes, and space-delimited words. The client may instead provide a custom split function.
簡(jiǎn)單來(lái)講即是:
Scanner為 讀取數(shù)據(jù) 提供了方便的 接口。連續(xù)調(diào)用Scan方法會(huì)逐個(gè)得到文件的“tokens”,跳過(guò) tokens 之間的字節(jié)。token 的規(guī)范由 SplitFunc 類型的函數(shù)定義。我們可以改為提供自定義拆分功能。
接下來(lái)看看 SplitFunc 類型的函數(shù)是什么樣子的:
type SplitFunc func(data []byte, atEOF bool) (advance int, token []byte, err error)
Golang官網(wǎng)文檔上提供的使用例子🌰:
func main() { // An artificial input source. const input = "1234 5678 1234567901234567890" scanner := bufio.NewScanner(strings.NewReader(input)) // Create a custom split function by wrapping the existing ScanWords function. split := func(data []byte, atEOF bool) (advance int, token []byte, err error) { advance, token, err = bufio.ScanWords(data, atEOF) if err == nil && token != nil { _, err = strconv.ParseInt(string(token), 10, 32) } return } // Set the split function for the scanning operation. scanner.Split(split) // Validate the input for scanner.Scan() { fmt.Printf("%s\n", scanner.Text()) } if err := scanner.Err(); err != nil { fmt.Printf("Invalid input: %s", err) } }
于是,我們可以這樣改寫我們的程序:
服務(wù)端代碼 server/main.go
func main() { l, err := net.Listen("tcp", ":4044") if err != nil { panic(err) } fmt.Println("listen to 4044") for { conn, err := l.Accept() if err != nil { fmt.Println("conn err:", err) } else { go handleConn2(conn) } } } func packetSlitFunc(data []byte, atEOF bool) (advance int, token []byte, err error) { // 檢查 atEOF 參數(shù) 和 數(shù)據(jù)包頭部的四個(gè)字節(jié)是否 為 0x123456(我們定義的協(xié)議的魔數(shù)) if !atEOF && len(data) > 6 && binary.BigEndian.Uint32(data[:4]) == 0x123456 { var l int16 // 讀出 數(shù)據(jù)包中 實(shí)際數(shù)據(jù) 的長(zhǎng)度(大小為 0 ~ 2^16) binary.Read(bytes.NewReader(data[4:6]), binary.BigEndian, &l) pl := int(l) + 6 if pl <= len(data) { return pl, data[:pl], nil } } return } func handleConn2(conn net.Conn) { defer conn.Close() defer fmt.Println("關(guān)閉") fmt.Println("新連接:", conn.RemoteAddr()) result := bytes.NewBuffer(nil) var buf [65542]byte // 由于 標(biāo)識(shí)數(shù)據(jù)包長(zhǎng)度 的只有兩個(gè)字節(jié) 故數(shù)據(jù)包最大為 2^16+4(魔數(shù))+2(長(zhǎng)度標(biāo)識(shí)) for { n, err := conn.Read(buf[0:]) result.Write(buf[0:n]) if err != nil { if err == io.EOF { continue } else { fmt.Println("read err:", err) break } } else { scanner := bufio.NewScanner(result) scanner.Split(packetSlitFunc) for scanner.Scan() { fmt.Println("recv:", string(scanner.Bytes()[6:])) } } result.Reset() } }
客戶端代碼 client/main.go
func main() { l, err := net.Listen("tcp", ":4044") if err != nil { panic(err) } fmt.Println("listen to 4044") for { conn, err := l.Accept() if err != nil { fmt.Println("conn err:", err) } else { go handleConn2(conn) } } } func packetSlitFunc(data []byte, atEOF bool) (advance int, token []byte, err error) { // 檢查 atEOF 參數(shù) 和 數(shù)據(jù)包頭部的四個(gè)字節(jié)是否 為 0x123456(我們定義的協(xié)議的魔數(shù)) if !atEOF && len(data) > 6 && binary.BigEndian.Uint32(data[:4]) == 0x123456 { var l int16 // 讀出 數(shù)據(jù)包中 實(shí)際數(shù)據(jù) 的長(zhǎng)度(大小為 0 ~ 2^16) binary.Read(bytes.NewReader(data[4:6]), binary.BigEndian, &l) pl := int(l) + 6 if pl <= len(data) { return pl, data[:pl], nil } } return } func handleConn2(conn net.Conn) { defer conn.Close() defer fmt.Println("關(guān)閉") fmt.Println("新連接:", conn.RemoteAddr()) result := bytes.NewBuffer(nil) var buf [65542]byte // 由于 標(biāo)識(shí)數(shù)據(jù)包長(zhǎng)度 的只有兩個(gè)字節(jié) 故數(shù)據(jù)包最大為 2^16+4(魔數(shù))+2(長(zhǎng)度標(biāo)識(shí)) for { n, err := conn.Read(buf[0:]) result.Write(buf[0:n]) if err != nil { if err == io.EOF { continue } else { fmt.Println("read err:", err) break } } else { scanner := bufio.NewScanner(result) scanner.Split(packetSlitFunc) for scanner.Scan() { fmt.Println("recv:", string(scanner.Bytes()[6:])) } } result.Reset() } }
運(yùn)行結(jié)果
listen to 4044
新連接: [::1]:55738
recv: [這里才是一個(gè)完整的數(shù)據(jù)包]
recv: [這里才是一個(gè)完整的數(shù)據(jù)包]
recv: [這里才是一個(gè)完整的數(shù)據(jù)包]
recv: [這里才是一個(gè)完整的數(shù)據(jù)包]
recv: [這里才是一個(gè)完整的數(shù)據(jù)包]
recv: [這里才是一個(gè)完整的數(shù)據(jù)包]
recv: [這里才是一個(gè)完整的數(shù)據(jù)包]
recv: [這里才是一個(gè)完整的數(shù)據(jù)包]
...省略其它的...
總結(jié)
以上就是這篇文章的全部?jī)?nèi)容了,希望本文的內(nèi)容對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,謝謝大家對(duì)腳本之家的支持。
相關(guān)文章
GPT回答:go語(yǔ)言和C語(yǔ)言切片對(duì)比
這篇文章主要為大家介紹了GPT回答:go語(yǔ)言和C語(yǔ)言切片對(duì)比,有需要的朋友可以借鑒參考下,希望能夠有所幫助,祝大家多多進(jìn)步,早日升職加薪2023-10-10一文帶你了解Go語(yǔ)言中的I/O接口設(shè)計(jì)
I/O?操作在編程中扮演著至關(guān)重要的角色,它涉及程序與外部世界之間的數(shù)據(jù)交換,下面我們就來(lái)簡(jiǎn)單了解一下Go語(yǔ)言中的?I/O?接口設(shè)計(jì)吧2023-06-06GO語(yǔ)言中的方法值和方法表達(dá)式的使用方法詳解
這篇文章主要介紹了GO的方法值和方法表達(dá)式的使用方法,本文通過(guò)實(shí)例代碼給大家介紹的非常詳細(xì),具有一定的參考借鑒價(jià)值,需要的朋友可以參考下2020-02-02go語(yǔ)言通過(guò)odbc訪問(wèn)Sql Server數(shù)據(jù)庫(kù)的方法
這篇文章主要介紹了go語(yǔ)言通過(guò)odbc訪問(wèn)Sql Server數(shù)據(jù)庫(kù)的方法,實(shí)例分析了Go語(yǔ)言通過(guò)odbc連接與查SQL Server詢數(shù)據(jù)庫(kù)的技巧,需要的朋友可以參考下2015-03-03解析Golang和Java的優(yōu)勢(shì)與劣勢(shì)
Golang和Java是兩種流行的編程語(yǔ)言,它們?cè)诤芏喾矫嬗兄嗨浦?但也存在一些重要的區(qū)別,本文將對(duì)Golang和Java進(jìn)行對(duì)比,探討它們的特點(diǎn)和適用場(chǎng)景,需要的朋友可以參考下2023-10-10