欧美bbbwbbbw肥妇,免费乱码人妻系列日韩,一级黄片

解讀FastAPI異步化為transformers模型打造高性能接口

 更新時(shí)間:2024年06月29日 09:04:00   作者:yuanzhoulvpi  
這篇文章主要介紹了解讀FastAPI異步化為transformers模型打造高性能接口問(wèn)題,具有很好的參考價(jià)值,希望對(duì)大家有所幫助,如有錯(cuò)誤或未考慮完全的地方,望不吝賜教

背景

最近公司需要用到一個(gè)Bert模型,使用這個(gè)模型對(duì)一個(gè)短文本做實(shí)時(shí)的encode(也就是實(shí)現(xiàn)文本轉(zhuǎn)換成向量)。

因?yàn)槟P褪腔趐ython的transformers和sentence_transfromers。也就是只能使用python來(lái)做。

整體的數(shù)據(jù)流都是通過(guò)java來(lái)調(diào)用,而python這端只需要提供文本轉(zhuǎn)向量的接口即可。

因?yàn)橹熬捅容^喜歡使用fastapi,而且fastapi也比f(wàn)lask快得多。因此將fastapi結(jié)合sentence_transfromers是再正常不過(guò)的了。

過(guò)程

簡(jiǎn)單版本

需要注意的是,這個(gè)代碼是cpu密集型的,非常吃cpu的計(jì)算。

要想實(shí)現(xiàn)這樣的一個(gè)功能,其實(shí)非常簡(jiǎn)單,創(chuàng)建一個(gè)python文件叫nlp_api.py,填寫(xiě)代碼如下:

# 導(dǎo)入包
import numpy as np
import pandas as pd
import torch as t
from tqdm import tqdm
from fastapi import FastAPI
from fastapi.middleware.cors import CORSMiddleware
from sentence_transformers import SentenceTransformer as SBert
import uvicorn
from asgiref.sync import sync_to_async
import asyncio

# 加載模型
model = SBert("/home/dataai/文檔/huzheng/模型部分/預(yù)訓(xùn)練模型/paraphrase-multilingual-MiniLM-L12-v2")

# 啟動(dòng)app
app = FastAPI()

# 讓app可以跨域
origins = ["*"]
app.add_middleware(
    CORSMiddleware,
    allow_origins=origins,
    allow_credentials=True,
    allow_methods=["*"],
    allow_headers=["*"],
)


@app.get("/")
async def main():
    return {"message": "Hello World"}
    
# 實(shí)現(xiàn)功能
@app.get('/get_vector_simple')
def sentenc2vector_simple(sentence):
    """
    這里是提供文本轉(zhuǎn)向量的接口,
    :param sentence: 文本字符串
    :return: 文本向量
    """
    encode1 = model.encode(sentence)
    encode1 = encode1.flatten().tolist()
    return {'vector': encode1}

if __name__ == '__main__':
    uvicorn.run(app='nlp_api:app', host="0.0.0.0",
                port=8000, reload=True, debug=True)

運(yùn)行這個(gè)代碼也是非常簡(jiǎn)單,直接python運(yùn)行即可:python nlp_api.py。

上面代碼其實(shí)已經(jīng)實(shí)現(xiàn)了這個(gè)功能。但是要對(duì)這個(gè)接口 做壓測(cè)。這里使用的工具是wrk。我們?cè)O(shè)置了100個(gè)thread、1000個(gè)connection、時(shí)間是100秒。最終得到的結(jié)果是:

在1.67分鐘內(nèi),接受了2529個(gè)請(qǐng)求;平均下來(lái)是每秒接受25.27個(gè)請(qǐng)求。這個(gè)時(shí)候我其實(shí)比較滿意了。但是技術(shù)不滿意,說(shuō)這個(gè)太低了。

我使用htop查看了服務(wù)器的運(yùn)行情況,發(fā)現(xiàn)cpu基本上都是吃滿狀態(tài)。負(fù)荷非常高。

改進(jìn)

既然要考慮到每秒請(qǐng)求這么多的情況下,我用異步試一試。然后把上面的接口 做了異步處理。只要加上這個(gè)代碼就行。

async def encode2list(encode):
    return encode.flatten().tolist()

@app.get('/get_vector_async')
async def sentenc2vector_async(sentence):
    """
    異步版本
    這里是提供文本轉(zhuǎn)向量的接口,
    :param sentence: 文本字符串
    :return: 文本向量
    """
    encode1 = await sync_to_async(model.encode)(sentence)
    encode1 = await encode2list(encode1)
    return {'vector': encode1}

這個(gè)時(shí)候,就創(chuàng)建了一個(gè)異步接口。然后我又使用wrk。設(shè)置了100個(gè)thread、1000個(gè)connection、時(shí)間是100秒。測(cè)試這個(gè)接口,最終得到的結(jié)果是:

在1.67分鐘內(nèi),接受了7691個(gè)請(qǐng)求,平均下來(lái)說(shuō)每秒接受76.84個(gè)請(qǐng)求。

我把這個(gè)給技術(shù),技術(shù)那邊也基本是滿意了。這樣算下來(lái),我平均一個(gè)句子轉(zhuǎn)向量的時(shí)間大概需要13ms。這個(gè)其實(shí)已經(jīng)非常高了。

對(duì)比

下圖就是一個(gè)接口對(duì)比:

  • 最上面的框是同步接口效率展示
  • 最下面的框是異步接口效率展示

在這次cpu密集型中,異步接口的效率是同步接口效率的3倍。我后來(lái)又測(cè)試了幾次,基本上都是在3倍以上。

在兩種不同的接口下,我使用htop查看了cpu的運(yùn)行情況:

  • 同步接口被請(qǐng)求時(shí),cpu負(fù)載情況:
  • 異步接口被請(qǐng)求時(shí),cpu負(fù)載情況:

可以看出來(lái),相同的任務(wù)下,cpu的負(fù)載沒(méi)有那么高,但是效率反而還提高了。

總結(jié)

這個(gè)模型400MB,底層基于python,使用了pytorch、transformers、Fastapi等包,實(shí)現(xiàn)了文本轉(zhuǎn)向量功能,并且這個(gè)接口的效率可以達(dá)到每秒處理76條。折合每條的文本轉(zhuǎn)向量的時(shí)間只需要13ms左右,我還是很開(kāi)心的。起碼不用去搞c++、TensorRT之類的東西。python yyds??!

但是我還沒(méi)搞懂為什么在cpu密集型的這種任務(wù)下,異步接口效率比同步接口效率高這么多,而且還降低了cpu的使用率。

這條路走通,起碼代表Fastapi一點(diǎn)也不差!??!我后面如果要開(kāi)別的接口,可能都會(huì)用這種方式試一試。

numpy這種,以及Sbert模型其實(shí)都不能異步操作的,但是我使用了asgiref.sync,這個(gè)可以將非異步的轉(zhuǎn)換成異步。非常方便。

作為Fastapi擁鱉,我還是很開(kāi)心將他用在生產(chǎn)環(huán)境中。希望可以接受住考驗(yàn)!

以上為個(gè)人經(jīng)驗(yàn),希望能給大家一個(gè)參考,也希望大家多多支持腳本之家。

參考資料:

相關(guān)文章

  • Python?clip與range函數(shù)保姆級(jí)使用教程

    Python?clip與range函數(shù)保姆級(jí)使用教程

    本文主要和大家介紹了詳解Python中clip與range函數(shù)的用法,小編覺(jué)得挺不錯(cuò)的,現(xiàn)在分享給大家,也給大家做個(gè)參,希望能幫助到大家
    2022-06-06
  • 如何利用Python處理excel表格中的數(shù)據(jù)

    如何利用Python處理excel表格中的數(shù)據(jù)

    Excel做為職場(chǎng)人最常用的辦公軟件,具有方便、快速、批量處理數(shù)據(jù)的特點(diǎn),下面這篇文章主要給大家介紹了關(guān)于如何利用Python處理excel表格中數(shù)據(jù)的相關(guān)資料,需要的朋友可以參考下
    2022-03-03
  • Python實(shí)戰(zhàn)之生成有關(guān)聯(lián)單選問(wèn)卷

    Python實(shí)戰(zhàn)之生成有關(guān)聯(lián)單選問(wèn)卷

    這篇文章主要為大家分享了一個(gè)Python實(shí)戰(zhàn)小案例——生成有關(guān)聯(lián)單選問(wèn)卷,并且能根據(jù)問(wèn)卷總分?jǐn)?shù)生成對(duì)應(yīng)判斷文案結(jié)果,感興趣的可以了解一下
    2023-04-04
  • Python socket 套接字實(shí)現(xiàn)通信詳解

    Python socket 套接字實(shí)現(xiàn)通信詳解

    這篇文章主要介紹了Python socket 套接字實(shí)現(xiàn)通信詳解,文中通過(guò)示例代碼介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友可以參考下
    2019-08-08
  • OpenCV模板匹配matchTemplate的實(shí)現(xiàn)

    OpenCV模板匹配matchTemplate的實(shí)現(xiàn)

    這篇文章主要介紹了OpenCV模板匹配matchTemplate的實(shí)現(xiàn),文中通過(guò)示例代碼介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友們下面隨著小編來(lái)一起學(xué)習(xí)學(xué)習(xí)吧
    2019-10-10
  • python 定義n個(gè)變量方法 (變量聲明自動(dòng)化)

    python 定義n個(gè)變量方法 (變量聲明自動(dòng)化)

    今天小編就為大家分享一篇python 定義n個(gè)變量方法 (變量聲明自動(dòng)化),具有很好的參考價(jià)值,希望對(duì)大家有所幫助。一起跟隨小編過(guò)來(lái)看看吧
    2018-11-11
  • 解決Django layui {{}}沖突的問(wèn)題

    解決Django layui {{}}沖突的問(wèn)題

    今天小編就為大家分享一篇解決Django layui {{}}沖突的問(wèn)題,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。一起跟隨小編過(guò)來(lái)看看吧
    2019-08-08
  • 利用python實(shí)現(xiàn)簡(jiǎn)易版的貪吃蛇游戲(面向python小白)

    利用python實(shí)現(xiàn)簡(jiǎn)易版的貪吃蛇游戲(面向python小白)

    這篇文章主要給大家介紹了關(guān)于如何利用python實(shí)現(xiàn)簡(jiǎn)易版的貪吃蛇游戲的相關(guān)資料,文中通過(guò)示例代碼介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友們下面隨著小編來(lái)一起學(xué)習(xí)學(xué)習(xí)吧
    2018-12-12
  • Python辦公自動(dòng)化處理的10大場(chǎng)景應(yīng)用示例

    Python辦公自動(dòng)化處理的10大場(chǎng)景應(yīng)用示例

    這篇文章主要為大家介紹了Python辦公自動(dòng)化處理的10大場(chǎng)景應(yīng)用示例詳解,有需要的朋友可以借鑒參考下,希望能夠有所幫助,祝大家多多進(jìn)步,早日升職加薪
    2022-06-06
  • pycharm使用技巧之自動(dòng)調(diào)整代碼格式總結(jié)

    pycharm使用技巧之自動(dòng)調(diào)整代碼格式總結(jié)

    這篇文章主要給大家介紹了關(guān)于pycharm使用技巧之自動(dòng)調(diào)整代碼格式總結(jié)的相關(guān)資料,文中通過(guò)示例代碼介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友們下面隨著小編來(lái)一起學(xué)習(xí)學(xué)習(xí)吧
    2020-11-11

最新評(píng)論