python分布式環(huán)境下的限流器的示例
項(xiàng)目中用到了限流,受限于一些實(shí)現(xiàn)方式上的東西,手撕了一個(gè)簡單的服務(wù)端限流器。
服務(wù)端限流和客戶端限流的區(qū)別,簡單來說就是:
1)服務(wù)端限流
對接口請求進(jìn)行限流,限制的是單位時(shí)間內(nèi)請求的數(shù)量,目的是通過有損來換取高可用。
例如我們的場景是,有一個(gè)服務(wù)接收請求,處理之后,將數(shù)據(jù)bulk到Elasticsearch中進(jìn)行索引存儲,bulk索引是一個(gè)很耗費(fèi)資源的操作,如果遭遇到請求流量激增,可能會壓垮Elasticsearch(隊(duì)列阻塞,內(nèi)存激增),所以需要對流量的峰值做一個(gè)限制。
2)客戶端限流
限制的是客戶端進(jìn)行訪問的次數(shù)。
例如,線程池就是一個(gè)天然的限流器。限制了并發(fā)個(gè)數(shù)max_connection,多了的就放到緩沖隊(duì)列里排隊(duì),排隊(duì)擱不下了>queue_size就扔掉。
本文是服務(wù)端限流器。
我這個(gè)限流器的優(yōu)點(diǎn):
1)簡單
2)管事
缺點(diǎn):
1)不能做到平滑限流
例如大家嘗嘗說的令牌桶算法和漏桶算法(我感覺這兩個(gè)算法本質(zhì)上都是一個(gè)事情)可以實(shí)現(xiàn)平滑限流。什么是平滑限流?舉個(gè)栗子,我們要限制5秒鐘內(nèi)訪問數(shù)不超過1000,平滑限流能做到,每秒200個(gè),5秒鐘不超過1000,很平衡;非平滑限流可能,在第一秒就訪問了1000次,之后的4秒鐘全部限制住。•2)不靈活
只實(shí)現(xiàn)了秒級的限流。
支持兩個(gè)場景:
1)對于單進(jìn)程多線程場景(使用線程安全的Queue做全局變量)
這種場景下,只部署了一個(gè)實(shí)例,對這個(gè)實(shí)例進(jìn)行限流。在生產(chǎn)環(huán)境中用的很少。
2)對于多進(jìn)程分布式場景(使用redis做全局變量)
多實(shí)例部署,一般來說生產(chǎn)環(huán)境,都是這樣的使用場景。
在這樣的場景下,需要對流量進(jìn)行整體的把控。例如,user服務(wù)部署了三個(gè)實(shí)例,對外暴露query接口,要做的是對接口級的流量限制,也就是對query這個(gè)接口整體允許多大的峰值,而不去關(guān)心到底負(fù)載到哪個(gè)實(shí)例。
題外話,這個(gè)可以通過nginx做。
下面說一下限流器的實(shí)現(xiàn)吧。
1、接口BaseRateLimiter
按照我的思路,先定義一個(gè)接口,也可以叫抽象類。
初始化的時(shí)候,要配置rate,限流器的限速。
提供一個(gè)抽象方法,acquire(),調(diào)用這個(gè)方法,返回是否限制流量。
class BaseRateLimiter(object):
__metaclass__ = abc.ABCMeta
@abc.abstractmethod
def __init__(self, rate):
self.rate = rate
@abc.abstractmethod
def acquire(self, count):
return
2、單進(jìn)程多線程場景的限流ThreadingRateLimiter
繼承BaseRateLimiter抽象類,使用線程安全的Queue作為全局變量,來消除競態(tài)影響。
后臺有個(gè)進(jìn)程每秒鐘清空一次queue;
當(dāng)請求來了,調(diào)用acquire函數(shù),queue incr一次,如果大于限速了,就返回限制。否則就允許訪問。
class ThreadingRateLimiter(BaseRateLimiter):
def __init__(self, rate):
BaseRateLimiter.__init__(self, rate)
self.queue = Queue.Queue()
threading.Thread(target=self._clear_queue).start()
def acquire(self, count=1):
self.queue.put(1, block=False)
return self.queue.qsize() < self.rate
def _clear_queue(self):
while 1:
time.sleep(1)
self.queue.queue.clear()
2、分布式場景下的限流DistributeRateLimiter
繼承BaseRateLimiter抽象類,使用外部存儲作為共享變量,外部存儲的訪問方式為cache。
class DistributeRateLimiter(BaseRateLimiter):
def __init__(self, rate, cache):
BaseRateLimiter.__init__(self, rate)
self.cache = cache
def acquire(self, count=1, expire=3, key=None, callback=None):
try:
if isinstance(self.cache, Cache):
return self.cache.fetchToken(rate=self.rate, count=count, expire=expire, key=key)
except Exception, ex:
return True
為了解耦和靈活性,我們實(shí)現(xiàn)了Cache類。提供一個(gè)抽象方法getToken()
如果你使用redis的話,你就繼承Cache抽象類,實(shí)現(xiàn)通過redis獲取令牌的方法。
如果使用mysql的話,你就繼承Cache抽象類,實(shí)現(xiàn)通過mysql獲取令牌的方法。
cache抽象類
class Cache(object):
__metaclass__ = abc.ABCMeta
@abc.abstractmethod
def __init__(self):
self.key = "DEFAULT"
self.namespace = "RATELIMITER"
@abc.abstractmethod
def fetchToken(self, rate, key=None):
return
給出一個(gè)redis的實(shí)現(xiàn)RedisTokenCache
每秒鐘創(chuàng)建一個(gè)key,并且對請求進(jìn)行計(jì)數(shù)incr,當(dāng)這一秒的計(jì)數(shù)值已經(jīng)超過了限速rate,就拿不到token了,也就是限制流量。
對每秒鐘創(chuàng)建出的key,讓他超時(shí)expire。保證key不會持續(xù)占用存儲空間。
沒有什么難點(diǎn),這里使用redis事務(wù),保證incr和expire能同時(shí)執(zhí)行成功。
class RedisTokenCache(Cache):
def __init__(self, host, port, db=0, password=None, max_connections=None):
Cache.__init__(self)
self.redis = redis.Redis(
connection_pool=
redis.ConnectionPool(
host=host, port=port, db=db,
password=password,
max_connections=max_connections
))
def fetchToken(self, rate=100, count=1, expire=3, key=None):
date = datetime.now().strftime("%Y-%m-%d %H:%M:%S")
key = ":".join([self.namespace, key if key else self.key, date])
try:
current = self.redis.get(key)
if int(current if current else "0") > rate:
raise Exception("to many requests in current second: %s" % date)
else:
with self.redis.pipeline() as p:
p.multi()
p.incr(key, count)
p.expire(key, int(expire if expire else "3"))
p.execute()
return True
except Exception, ex:
return False
多線程場景下測試代碼
limiter = ThreadingRateLimiter(rate=10000)
def job():
while 1:
if not limiter.acquire():
print '限流'
else:
print '正常'
threads = [threading.Thread(target=job) for i in range(10)]
for thread in threads:
thread.start()
分布式場景下測試代碼
token_cache = RedisTokenCache(host='10.93.84.53', port=6379, password='bigdata123')
limiter = DistributeRateLimiter(rate=10000, cache=token_cache)
r = redis.Redis(connection_pool=redis.ConnectionPool(host='10.93.84.53', port=6379, password='bigdata123'))
def job():
while 1:
if not limiter.acquire():
print '限流'
else:
print '正常'
threads = [multiprocessing.Process(target=job) for i in range(10)]
for thread in threads:
thread.start()
可以自行跑一下。
說明:
我這里的限速都是秒級別的,例如限制每秒400次請求。有可能出現(xiàn)這一秒的前100ms,就來了400次請求,后900ms就全部限制住了。也就是不能平滑限流。
不過如果你后臺的邏輯有隊(duì)列,或者線程池這樣的緩沖,這個(gè)不平滑的影響其實(shí)不大。
以上就是本文的全部內(nèi)容,希望對大家的學(xué)習(xí)有所幫助,也希望大家多多支持腳本之家。
相關(guān)文章
tensorflow訓(xùn)練中出現(xiàn)nan問題的解決
本篇文章主要介紹了tensorflow訓(xùn)練中出現(xiàn)nan問題的解決,小編覺得挺不錯(cuò)的,現(xiàn)在分享給大家,也給大家做個(gè)參考。一起跟隨小編過來看看吧2018-02-02
python在前端頁面使用?MySQLdb?連接數(shù)據(jù)
這篇文章主要介紹了MySQLdb?連接數(shù)據(jù)的使用,文章主要介紹的相關(guān)內(nèi)容又插入數(shù)據(jù),刪除數(shù)據(jù),更新數(shù)據(jù),搜索數(shù)據(jù),需要的小伙伴可以參考一下2022-03-03
django中模板繼承與ModelForm實(shí)例詳解
ModelForm類是form是組件中Form的一個(gè)子類,所以也是處理表單的,下面這篇文章主要給大家介紹了關(guān)于django中模板繼承與ModelForm的相關(guān)資料,文中通過實(shí)例代碼介紹的非常詳細(xì),需要的朋友可以參考下2022-04-04
requests.gPython?用requests.get獲取網(wǎng)頁內(nèi)容為空?’?’問題
這篇文章主要介紹了requests.gPython?用requests.get獲取網(wǎng)頁內(nèi)容為空?’?’,溫行首先舉例說明,具有一定得參考價(jià)值,需要的小伙伴可以參考一下2022-01-01
Python greenlet和gevent使用代碼示例解析
這篇文章主要介紹了Python greenlet和gevent使用代碼示例解析,文中通過示例代碼介紹的非常詳細(xì),對大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友可以參考下2020-04-04
基于python實(shí)現(xiàn)獲取網(wǎng)頁圖片過程解析
這篇文章主要介紹了基于python實(shí)現(xiàn)獲取網(wǎng)頁圖片過程解析,文中通過示例代碼介紹的非常詳細(xì),對大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友可以參考下2020-05-05

