redis分布式Jedis類型轉(zhuǎn)換的異常深入研究
1 類型轉(zhuǎn)換異常場景
我們在使用Jedis的時候,經(jīng)常會出現(xiàn)類型轉(zhuǎn)換異常,有如下情況:
多線程環(huán)境
Jedis是線程不安全的,如果存在多線程使用同一個Jedis,就會出現(xiàn)類型轉(zhuǎn)換異常網(wǎng)上也流傳著很多錯誤的解釋,下面我們以一個案例來復現(xiàn)下這個問題,這個很好理解。
單線程環(huán)境
即使在單線程的情況下,也是會出現(xiàn)類型轉(zhuǎn)換異常的,下面就針對此做一個案例分析
2 Jedis類型轉(zhuǎn)換異常案例
2.1 案例介紹
案例是從這里來的Jedis returnResource使用注意事項
代碼如下:
public static void main(String[] args) throws Exception{
Jedis jedis = new Jedis("192.168.126.131", 6379);
System.out.println("get name=" + jedis.get("name"));
System.out.println("Make SocketTimeoutException");
System.in.read(); //等待制造SocketTimeoutException
try {
System.out.println(jedis.get("name"));
} catch (Exception e) {
e.printStackTrace();
}
System.out.println("Recover from SocketTimeoutException");
Thread.sleep(50000); // 繼續(xù)休眠一段時間 等待網(wǎng)絡(luò)完全恢復
boolean isMember = jedis.sismember("urls", "baidu");
System.out.println("isMember " + isMember);
jedis.close();
}
以及包含2個阻斷和解除網(wǎng)絡(luò)通信的命令
阻斷網(wǎng)絡(luò)通信
sudo iptables -A INPUT -p tcp --dport 6379 -j DROP
解除網(wǎng)絡(luò)阻塞
sudo iptables -F
案例運行過程描述:
- 1 創(chuàng)建Jedis,發(fā)送get命令,啟動與redis的連接,連接成功后獲取到響應數(shù)據(jù)
- 2 程序阻塞在System.in.read(),等待輸入,此時我們需要將網(wǎng)絡(luò)連接阻塞,執(zhí)行上述阻斷網(wǎng)絡(luò)命令
- 3 輸入任意數(shù)據(jù),讓程序不再阻塞,繼續(xù)走下去,執(zhí)行g(shù)et命令,此時由于網(wǎng)絡(luò)不通,導致出現(xiàn)SocketTimeoutException異常
- 4 打印出異常,繼續(xù)往下走,sleep 50s,此時我們需要解除網(wǎng)絡(luò)阻塞,執(zhí)行上述對應命令
- 5 50s過完,就會執(zhí)行jedis的sismember方法,此時就會出現(xiàn)類型轉(zhuǎn)換異常
2.2 Jedis原理介紹
Jedis內(nèi)部有一個Socket與redis服務(wù)器建立連接。在創(chuàng)建Jedis對象的時候,并沒有去建立連接,而是在執(zhí)行命令的時候才會先檢查是否已連接,未連接的話,才建立連接。
Socket一旦連接建立,就會獲取到Socket的OutputStream,并用RedisOutputStream進行包裝,獲取到Socket的InputStream,并用RedisInputStream進行包裝。RedisOutputStream內(nèi)部含有一個byte buf[]數(shù)組。
也就是說在jedis在向OutputStream寫入命令的時候,會先寫入到上述buf數(shù)組中,然后在讀取的時候,才會flush上述數(shù)據(jù),將數(shù)據(jù)寫入到Socket的OutputStream中,并調(diào)用flush,以Jedis的get方法為例
public String get(final String key) {
checkIsInMulti();
client.sendCommand(Protocol.Command.GET, key);
return client.getBulkReply();
}
client.sendCommand方法會將數(shù)據(jù)寫入到RedisOutputStream內(nèi)部的buf中 client.getBulkReply方法會首先執(zhí)行一次flush,即將buf中數(shù)據(jù)寫入到Socket的OutputStream中,并調(diào)用Socket的OutputStream的flush。
2.3 類型轉(zhuǎn)換異常的原因
網(wǎng)上很多人說造成上述場景的類型轉(zhuǎn)換異常是因為:
出現(xiàn)SocketTimeoutException異常后,RedisOutputStream的buf中殘留上次命令,沒做清理處理,導致再執(zhí)行其他命令時連同之前的命令一起發(fā)送過去了。
經(jīng)過查看RedisOutputStream的源碼,buf中確實不會去主動清除原有數(shù)據(jù),而是每次都是直接覆蓋,有count指針來標記,但是這也不會造成上述所說的影響,RedisOutputStream是OK的。
首先我們要明白什么是SocketTimeoutException異常: 上述Jedis的Socket在發(fā)送完成數(shù)據(jù)后,就會去執(zhí)行讀取數(shù)據(jù),即讀取Socket的InputStream中的數(shù)據(jù),并且又一定的阻塞時間,如果redis服務(wù)器遲遲不返回數(shù)據(jù),一旦超過SO_TIMEOUT(即Socket的讀取超時時間),客戶端就會拋出一個SocketTimeoutException異常。
造成這種異常的原因有很多:
- 網(wǎng)絡(luò)閃斷(會TCP重傳):上述案例情景就是網(wǎng)絡(luò)斷開,數(shù)據(jù)包發(fā)送失敗,會TCP重傳
- 網(wǎng)絡(luò)沒有斷,但是傳輸比較慢,或者redis服務(wù)器處理很慢
上述原因都會造成客戶端讀取超時。一旦超時,我們的Jedis程序拋出異常,繼續(xù)往下走,如果此時再次執(zhí)行其他命令的話,仍然會讀取服務(wù)器端響應,此時讀到的響應就是上次請求的響應了,所以會導致類型轉(zhuǎn)換異常。如果與上次請求的類型一致,那就更可怕了,錯誤就會被深深的掩蓋過去了。
3 Jedis類型轉(zhuǎn)換異常的解決辦法
上述問題就是:我們沒有正確對待這個SocketTimeoutException異常,即一旦出現(xiàn)SocketTimeoutException異常,我們是必須要廢棄掉這個Jedis的。所以對于單線程環(huán)境下的Jedis來說,一旦出現(xiàn)這種異常,我們需要重新new一個新的Jedis來使用。
Jedis在內(nèi)部執(zhí)行出現(xiàn)異常,如SocketTimeoutException異常的時候,會標記一個boolean broken=true,即意味著該連接已經(jīng)廢棄了。
重要的大坑在這里,我們通常使用JedisPool來應對多線程環(huán)境下Jedis的使用,一般使用方式如下:
Jedis jedis = null;//從pool中獲取資源
try{
jedis = pool.getResource();
jedis.set("k1", "v1");
}catch(Exception e){
e.printStackTrace();
}finally{
if(jedis != null){
pool.returnResource(jedis);//向連接池“歸還”資源,千萬不要忘記。
}
}
而對于JedisPool,我們會使用returnResource方法來向pool中釋放回Jedis,而這個returnResource卻忽視了上述boolean broken屬性,直接將一個標記廢棄的連接放回到了pool中,下次別人取的時候,必然出問題。
所以針對JedisPool這種情況,解決辦法如下:
1 在上述catch中捕獲SocketTimeoutException異常,調(diào)用pool的returnBrokenResource方法來釋放Jedis(該方法會將Jedis實例標記為下線,無法被他人獲取到了),但是不推薦這種,還要考慮其他異常等等
2 另一個就是直接調(diào)用Jedis的close方法,最新版2.9.0(其他版本沒驗證)中close方法對上述boolean broken標記進行了處理,并且將returnResource標記成廢棄了,處理如下
public void close() {
if (dataSource != null) {
if (client.isBroken()) {
this.dataSource.returnBrokenResource(this);
} else {
this.dataSource.returnResource(this);
}
} else {
client.close();
}
}
上述this.dataSource可以理解為JedisPool。 即一旦是broken,則調(diào)用pool的returnBrokenResource方法,否則調(diào)用pool的returnResource方法。
所以最終寫法應該如下:
Jedis jedis = null;//從pool中獲取資源
try{
jedis = pool.getResource();
jedis.set("k1", "v1");
}finally{
if(jedis != null){
jedis.close();
}
}
4 問題深思
可以想到2方面的問題:
問題1:jedis為什么要暴漏這么個危險的API給用戶使用
即要求用戶自覺的close,不自覺后果自負
如果是我們在開發(fā)框架給被人使用,那就要盡量避免這種API的設(shè)計,把close自動隱藏在框架內(nèi)部,避免了使用人員的誤使用,同時減少了代碼的復雜度,即使是上述最終的寫法也是很丑陋的,要完成一個set功能,要關(guān)注太多地方了,這部分完全可以框架底層包裝起來,只給用戶一個set方法即可。
問題2:請求和響應的不匹配問題
這種不匹配的問題在同步和異步的時候分別怎么處理?
同步通信:
在設(shè)計的時候,必須發(fā)送一次請求就要讀取一次響應,通過這種方式來匹配。然而在某些情況下,讀取響應有一定的超時時間,一旦超時,就拋出SocketTimeoutException異常,從而結(jié)束本次讀取,而響應可能后來又到達了,這種情況就會造成不匹配的現(xiàn)象。要避免這種情況,就必須要廢棄掉這個Socket了,所以如果客戶端設(shè)計成同步通信的時候,一旦遇到這種異常,則就需要廢棄了,重新建立連接了。
異步通信:
在設(shè)計的時候一般會為每個請求分配一個請求id,服務(wù)器端在處理請求后,會把這個請求id返回給客戶端,客戶端根據(jù)返回的請求id來匹配是那一次的請求對應的響應,就不會出現(xiàn)上述那種匹配錯亂的問題。異步通信在讀取數(shù)據(jù)的時候也通常是有數(shù)據(jù)可讀才會去執(zhí)行讀操作,可以減少同步通信中因網(wǎng)絡(luò)擁堵或其他原因造成的SocketTimeoutException問題。異步通信好處的代價就是比同步通信復雜。
所以如果我們在設(shè)計的時候,就需要去考慮這樣的問題,避免造出一個大坑來。
以上就是redis分布式Jedis類型轉(zhuǎn)換的異常深入研究的詳細內(nèi)容,更多關(guān)于redis分布式Jedis類型轉(zhuǎn)換異常的資料請關(guān)注腳本之家其它相關(guān)文章!
相關(guān)文章
淺談redis的maxmemory設(shè)置以及淘汰策略
下面小編就為大家?guī)硪黄獪\談redis的maxmemory設(shè)置以及淘汰策略。小編覺得挺不錯的,現(xiàn)在就分享給大家,也給大家做個參考。一起跟隨小編過來看看吧2017-03-03
Spring?Boot實戰(zhàn)解決高并發(fā)數(shù)據(jù)入庫之?Redis?緩存+MySQL?批量入庫問題
這篇文章主要介紹了Spring?Boot實戰(zhàn)解決高并發(fā)數(shù)據(jù)入庫之?Redis?緩存+MySQL?批量入庫問題,本文通過圖文實例相結(jié)合給大家介紹的非常詳細,對大家的學習或工作具有一定的參考借鑒價值,需要的朋友可以參考下2022-02-02
spring?boot整合redis中間件與熱部署實現(xiàn)代碼
spring?boot整合redis最常用的有三個工具庫Jedis,Redisson,Lettuce,本文重點介紹spring?boot整合redis中間件與熱部署實現(xiàn),需要的朋友可以參考下2023-01-01
CentOS7.5使用mysql_multi方式安裝MySQL5.7.28多實例(詳解)
這篇文章主要介紹了CentOS7.5使用mysql_multi方式安裝MySQL5.7.28多實例,非常不錯,具有一定的參考借鑒價值,需要的朋友可以參考下2020-01-01

