欧美bbbwbbbw肥妇,免费乱码人妻系列日韩,一级黄片

深入解析HetuEngine實現(xiàn)On Yarn原理

 更新時間:2022年01月12日 16:09:29   作者:華為云開發(fā)者社區(qū)  
這篇文章主要介紹了HetuEngine實現(xiàn)On Yarn原理,介紹了HetuEngine On Yarn的原理,其實現(xiàn)主要是借助了Yarn Service提供的能力,感興趣的朋友一起通過本文學(xué)習(xí)下

摘要:本文介紹HetuEngine實現(xiàn)On Yarn的原理,通過閱讀本文,讀者可以了解HetuEngine如何在資源使用方面融入Hadoop生態(tài)體系。

本文分享自華為云社區(qū)《MRS HetuEngine 特性之 On Yarn原理介紹》,作者:一顆檸檬。

HetuEngine是華為自研高性能分布式SQL查詢&數(shù)據(jù)虛擬化引擎。與大數(shù)據(jù)生態(tài)無縫融合,實現(xiàn)海量數(shù)據(jù)秒級查詢;支持多源異構(gòu)協(xié)同,使能數(shù)據(jù)湖內(nèi)一站式SQL融合分析。在整合開源能力的同時,MRS HetuEngine相較于開源社區(qū)也做了大量的優(yōu)化,其中一個重要的特性就是On Yarn。

什么是On Yarn?

顧名思義,就是將進程運行在Yarn上,由Yarn進行資源的管理和調(diào)度。

不論是TrinoDB/PrestoDB還是openLooKeng,部署方式都是將coordinator和worker進程直接運行在主機上,與主機上的其他應(yīng)用程序共享資源,無法做到資源隔離,并且難以擴展。

MRS HetuEngine借助Yarn Service提供的能力,將coordinator和worker進程以Yarn application的形式運行在Yarn container中,通過MRS集群的租戶劃分,可以將HetuEngine計算實例啟動在特定租戶隊列里,從而實現(xiàn)資源隔離。

HetuEngine架構(gòu)

下圖是HetuEngine的拓撲圖。HetuEngine向下可以對接各類數(shù)據(jù)源(比如Hive,GaussDB,HBASE,Elasticsearch等),對外向用戶提供CLI/JDBC接口。在同一套MRS集群中,HetuEngine可以在不同租戶隊列中啟動多個HetuEngine計算實例,支持一個租戶隊列上啟動一個計算實例。由HetuEngine的HSBroker實例與Yarn Service交互,將租戶隊列與計算實例綁定,由HSConsole提供運維管理頁面,對HetuEngine的多個計算實例進行運維管理操作,包括啟動、停止、刪除計算實例,對計算實例進行資源配置,擴縮容等。

HetuEngine On Yarn原理

如前所述,On Yarn就是把進程運行在了Yarn 的container中。HetuEngine 是如何實現(xiàn)將coordinator 和worker運行中Yarn中呢?

Yarn Service提供了一系列API以及一個通用的AM,讓用戶可以調(diào)用API即可將任務(wù)提交到Y(jié)arn上,由Yarn實現(xiàn)任務(wù)的容器化,對容器進行資源和生命周期管理。詳細請參考開源社區(qū)的介紹。https://hadoop.apache.org/docs/r3.1.0/hadoop-yarn/hadoop-yarn-site/yarn-service/Overview.html

HetuEngine的 On Yarn實現(xiàn)正是借助了Yarn Service所提供的能力。在HetuEngine的HSBroker中,調(diào)用Yarn Service的API,拉起application,在container中運行HetuEngine自己的進程,也就是coordinator和worker。其中有以下幾個關(guān)鍵點:

Yarn Service API

創(chuàng)建一個Yarn Service服務(wù)的接口是/app/v1/services,參數(shù)json結(jié)構(gòu)如下。

POST /app/v1/services
{
  "name": "hello-world",
  "version": "1.0.0",
  "description": "hello world example",
  "components" :
    [
      {
        "name": "hello",
        "number_of_containers": 1,
        "artifact": {
          "id": "nginx:latest",
          "type": "DOCKER"
        },
        "launch_command": "./start_nginx.sh",
        "resource": {
          "cpus": 1,
          "memory": "256",
          "additional" : {
            "yarn.io/gpu" : {
              "value" : 4,
              "unit" : ""
            }
          }     
        }
      }
    ]
  • name:服務(wù)名稱,顯示在Yarn的resource manager WEB界面servicename;
  • version:版本號
  • description:服務(wù)的描述
  • components:一個service中可以包含多個component,以運行不同的任務(wù);
  • components.name:component名稱
  • number_of_containers:此component中container的數(shù)量;
  • artifact:進程依賴的資源文件,包含id和type信息,type支持docker和tarball
  • launch_command:進程啟動命令
  • resource:此component所需的資源。

HetuEngine的HSBroker根據(jù)用戶輸入構(gòu)造此json,然后調(diào)用Yarn Service API,實現(xiàn)On Yarn。此外Yarn Service還提供stop/delete等API,也由HSBroker調(diào)用,實現(xiàn)對HetuEngine計算實例的停止/刪除等運維操作。

依賴文件

Yarn Service支持資源文件在HDFS上的形式啟動進程,其提供的API可以接收tar包以及docker等形式的資源文件,由Yarn Service自行將HDFS上的文件進行資源本地化。因此,HetuEngine只需將依賴的jar包和資源文件提前部署在HDFS上的指定位置,在調(diào)用Yarn Service的API時指定資源文件即可。

租戶綁定

HetuEngine支持將計算實例與Yarn的租戶隊列綁定,每個隊列上都可以運行一套coordinator + worker的組合?;谇懊鎅arn Service能力,只需在構(gòu)造json時,指定隊列信息即可。除了隊列,還可以設(shè)置container的放置策略(plecement policy),這里不進行詳述,可以參考yarn的文檔。

資源管理

HetuEngine支持用戶自定義coordinator和worker的個數(shù)以及CPU內(nèi)存大小。如下圖,在HetuEngine的HSConsole頁面,用戶可以設(shè)置計算實例的CPU,內(nèi)存,節(jié)點個數(shù)。內(nèi)部實現(xiàn)是由HSBroker接收用戶輸入,將container運行所需的資源大小設(shè)置在json的resource段中。

當(dāng)前HetuEngine支持橫向擴展worker的個數(shù),實現(xiàn)資源的彈性伸縮。即使在計算實例處于運行中時,也可以手動調(diào)整worker的個數(shù),無需重啟計算實例。這得益于Yarn Service的API中提供的flex接口,可以實現(xiàn)向一個運行中的application增加或者減少container的數(shù)量。

客戶端使用

HetuEngine的計算實例創(chuàng)建完成后,用戶可以通過hetu-cli或者JDBC程序進行訪問,需要用戶綁定對應(yīng)的租戶隊列權(quán)限,才能向指定的隊列提交任務(wù)。

Hetu CLI示例:

hetu-cli --catalog hive --tenant tenantName --schema schemaName

租戶名:(可選)租戶名。指定HetuEngine啟動的租戶資源隊列,不指定為租戶的默認隊列。使用此參數(shù)時,kinit的用戶需要具有該租戶對應(yīng)角色的權(quán)限。

Hetu JDBC示例:

Properties properties = new Properties();
...…
properties.setProperty("tenant", "default");       
properties.setProperty("deploymentMode", "on_yarn");
……
connection = DriverManager.getConnection(url, properties);
……

本文主要介紹了HetuEngine On Yarn的原理,其實現(xiàn)主要是借助了Yarn Service提供的能力,感興趣的讀者可以深入閱讀開源社區(qū)相關(guān)的介紹。

到此這篇關(guān)于解析HetuEngine實現(xiàn)On Yarn原理的文章就介紹到這了,更多相關(guān)HetuEngine實現(xiàn)On Yarn原理內(nèi)容請搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!

相關(guān)文章

  • Kettle下載與安裝保姆級教程(最新)

    Kettle下載與安裝保姆級教程(最新)

    Kettle是一個實現(xiàn)ETL開發(fā)的一款開發(fā)工具,Spoon是Kettle工具提供的圖形化界面,它由Java開發(fā),支持跨平臺運行,本文給大家分享Kettle下載與安裝配置教程,感興趣的朋友一起看看吧
    2022-11-11
  • 百萬行WPF項目代碼重構(gòu)記錄分析

    百萬行WPF項目代碼重構(gòu)記錄分析

    這篇文章主要為大家介紹了一次百萬行WPF項目代碼的重構(gòu)記錄,有需要的朋友可以借鑒參考下,希望能夠有所幫助,祝大家多多進步,早日升職加薪
    2022-05-05
  • Git的基本操作流程及工作區(qū)版本庫暫存區(qū)的關(guān)系

    Git的基本操作流程及工作區(qū)版本庫暫存區(qū)的關(guān)系

    這篇文章主要為大家介紹了Git的基本操作流程及工作區(qū)版本庫暫存區(qū)的關(guān)系,有需要的朋友可以借鑒參考下,希望能夠有所幫助,祝大家多多進步,早日升職加薪
    2022-04-04
  • 詳解ansible批量管理服務(wù)

    詳解ansible批量管理服務(wù)

    這篇文章主要介紹了ansible批量管理服務(wù)的相關(guān)知識,非常不錯,具有一定的參考借鑒價值,需要的朋友可以參考下
    2019-08-08
  • 聯(lián)邦學(xué)習(xí)FedAvg中模型聚合過程的理解分析

    聯(lián)邦學(xué)習(xí)FedAvg中模型聚合過程的理解分析

    這篇文章主要為大家介紹了FedAvg中模型聚合過程的理解,有需要的朋友可以借鑒參考下,希望能夠有所幫助,祝大家多多進步,早日升職加薪
    2022-05-05
  • 微信小程序應(yīng)用號開發(fā)教程詳解

    微信小程序應(yīng)用號開發(fā)教程詳解

    這篇文章主要介紹了微信小程序應(yīng)用號開發(fā)教程詳解的相關(guān)資料,需要的朋友可以參考下
    2016-09-09
  • 2018年最值得一讀的互聯(lián)網(wǎng)書單

    2018年最值得一讀的互聯(lián)網(wǎng)書單

    2018年已經(jīng)過去了近三分之二了,是不是感覺時光匆匆、一去不復(fù)返,過去的時間我們追不回,但是我們可以更加珍惜以后的時間!下面這篇文章主要給大家分享了2018年最值得一讀的互聯(lián)網(wǎng)書單,希望以后的日子里大家可以多讀書,讀好書
    2018-08-08
  • HTTP協(xié)議詳細介紹

    HTTP協(xié)議詳細介紹

    HTTP是訪問互聯(lián)網(wǎng)使用的核心通信協(xié)議,也是所有web應(yīng)用程序使用的通信協(xié)議。本文詳細介紹了HTTP協(xié)議,對大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價值,需要的朋友們下面隨著小編來一起學(xué)習(xí)學(xué)習(xí)吧
    2022-06-06
  • 幾道和「黑洞照片」那種海量數(shù)據(jù)有關(guān)的算法問題

    幾道和「黑洞照片」那種海量數(shù)據(jù)有關(guān)的算法問題

    昨晚被一則新聞刷屏:北京時間 4 月 10 日今晚 9 點,人類首張黑洞照片正式發(fā)布
    2019-04-04
  • idea激活碼最新獲取方法(idea2020激活碼匯總)

    idea激活碼最新獲取方法(idea2020激活碼匯總)

    針對idea激活碼失效的情況,我們給大家?guī)碜钚碌膇dea激活碼以及相關(guān)激活教程,分享最新idea激活參數(shù)等信息。
    2020-02-02

最新評論