Docker中cgroups資源控制實戰(zhàn)
什么是cgroups?
cgroups是Linux內(nèi)核中的一項功能,最初由Google的工程師提出,后來被整合進(jìn)Linux內(nèi)核;
它允許用戶將一系列系統(tǒng)任務(wù)及其子任務(wù)整合或分隔到按資源劃分等級的不同組內(nèi),從而為系統(tǒng)資源管理提供一個統(tǒng)一的框架。
基本功能
- 資源限制:cgroups可以對進(jìn)程組使用的資源進(jìn)行限制,如CPU時間、內(nèi)存使用量、I/O帶寬等。一旦進(jìn)程組使用的資源達(dá)到限額,再申請資源時可能會受到限制或觸發(fā)相應(yīng)的錯誤處理機制(如OOM,Out of Memory)。
- 優(yōu)先級控制:通過cgroups,用戶可以為進(jìn)程組分配特定的CPU份額,從而控制其運行的優(yōu)先級。
- 資源記錄:cgoups還可以記錄進(jìn)程組使用的資源數(shù)量,如CPU時間、內(nèi)存使用量等,便于用戶進(jìn)行監(jiān)控和分析。
- 進(jìn)程組隔離:使用cgroups,用戶可以使不同的進(jìn)程組使用不同的命名空間(namespace),以達(dá)到隔離的目的。不同的進(jìn)程組將有各自的進(jìn)程、網(wǎng)絡(luò)、文件系統(tǒng)掛載空間等。
- 進(jìn)程組控制:cgroups提供了對進(jìn)程組的控制功能,如掛起、恢復(fù)等。
組成結(jié)構(gòu)
- 任務(wù)(Task):在cgroups中,任務(wù)就是系統(tǒng)的一個進(jìn)程。一個進(jìn)程可以加入到某個cgroup中,也可以從一個cgroup遷移到另一個cgroup。
- 控制族群(Control Group):cgroup表示按某種資源控制標(biāo)準(zhǔn)劃分而成的任務(wù)組,包含一個或多個子系統(tǒng)。cgroups中的資源控制都是以控制族群為單位實現(xiàn)的。
- 層級(Hierarchy):cgroups具有層次結(jié)構(gòu),類似于文件系統(tǒng)的層次樹。每個cgroup可以包含多個子CGroup,資源控制是自上而下繼承的。層級中的cgroup節(jié)點可以包含零個或多個子節(jié)點,子節(jié)點繼承父節(jié)點掛載的子系統(tǒng)。
- 子系統(tǒng)(Subsystem):一個子系統(tǒng)就是一個資源調(diào)度控制器(又稱controllers),如CPU子系統(tǒng)可以控制CPU的時間分配,內(nèi)存子系統(tǒng)可以限制內(nèi)存的使用量。子系統(tǒng)必須附加到一個層級上才能起作用,一個子系統(tǒng)附加到某個層級以后,這個層級上的所有cgroup都受到這個子系統(tǒng)的控制。
為什么使用cgroups?
它能夠?qū)pu、內(nèi)存等資源做到精細(xì)的控制,目前的輕量級容器Docker和k8s就是使用了cgroup提供的資源限制能力對cpu、內(nèi)存等資源進(jìn)行資源控制。
比如要使用內(nèi)存的時候,假如全部有2G內(nèi)存,我們能夠根據(jù)我們的需求具體分配出400m內(nèi)存出來供資源使用,達(dá)到上限時就會觸發(fā)OOM;
cgroups控制子系統(tǒng)
名稱 | 功能 |
---|---|
blkio | 對塊設(shè)備的 IO 進(jìn)行限制 |
cpu | 限制 CPU 時間片的分配 |
cpuacct | 生成 cgroup 中的任務(wù)占用 CPU 資源的報告,與 cpu 掛載在同一目錄 |
cpuset | 給 cgroup 中的任務(wù)分配獨立的 CPU(多處理器系統(tǒng)) 和內(nèi)存節(jié)點 |
devices | 限制設(shè)備文件的創(chuàng)建,和對設(shè)備文件的讀寫 |
memory | 對 cgroup 中的任務(wù)的可用內(nèi)存進(jìn)行限制,并自動生成資源占用報告 |
freezer | 暫停/恢復(fù) cgroup 中的任務(wù) |
hugetlb | 限制使用的內(nèi)存頁數(shù)量 |
perf_event | 允許 perf 觀測 cgroup 中的 task |
pids | 限制任務(wù)的數(shù)量 |
rdma | 限制 RDMA 資源(Remote Direct Memory Access,遠(yuǎn)程直接數(shù)據(jù)存取) |
命令:pidstat
pidstat是Linux系統(tǒng)中的一個性能分析工具,它屬于sysstat套件的一部分。這個命令可以用來監(jiān)控特定進(jìn)程或所有進(jìn)程的CPU使用率、內(nèi)存使用情況、I/O活動以及上下文切換等資源使用狀況。
基本語法
pidstat [options] [interval] [count]
- interval:指定兩次采樣之間的間隔時間(單位為秒)。
- count:可選參數(shù),用于指定要顯示統(tǒng)計信息的次數(shù)。
關(guān)鍵參數(shù)
- -u:默認(rèn)參數(shù),顯示每個進(jìn)程的CPU利用率(用戶空間、內(nèi)核空間)。
- -r:顯示每個進(jìn)程的內(nèi)存使用情況,包括頁面錯誤(minflt/majflt)和虛擬內(nèi)存大小(VSZ)及實際使用的物理內(nèi)存(RSS)。
- -d:顯示每個進(jìn)程的磁盤I/O統(tǒng)計,如讀寫操作的數(shù)量和帶寬。
- -w:顯示每個進(jìn)程的上下文切換次數(shù)(自愿和非自愿)。
- -p PID:監(jiān)視指定PID的進(jìn)程。
- -t:包含線程級別的統(tǒng)計信息。
如:
每2秒輸出一次所有進(jìn)程的CPU和內(nèi)存使用情況:
pidstat -ru 2
監(jiān)視PID為1234的進(jìn)程的CPU、內(nèi)存和磁盤I/O,并每隔5秒輸出一次:
pidstat -urd 5 -p 1234
顯示特定進(jìn)程及其線程的CPU使用率:
pidstat -ut 1 -p <process_id>
命令:stress
stress命令是一個用于對Linux系統(tǒng)進(jìn)行壓力測試的工具,它可以模擬多種類型的負(fù)載,包括CPU、內(nèi)存、磁盤、網(wǎng)絡(luò)等。
基本語法:
stress [OPTION [ARG]]
- -c ,–cpu N:模擬N個CPU核心的負(fù)載。
- -m --vm N:模擬N個虛擬內(nèi)存設(shè)備的負(fù)載。
- –vm-bytes B:指定每個虛擬內(nèi)存設(shè)備的大小為B(單位可以是K、M、G)。
- -i, --io N:模擬N個磁盤I/O操作的負(fù)載(注意:在某些版本中,這個選項可能被–hdd替代)。
- -t, --timeout T:指定壓力測試運行T秒后自動停止。
例如:
監(jiān)控壓力測試進(jìn)程,每兩秒監(jiān)控一次:
pidstat-C stress-p ALL-u2 10000
壓力測試cpu:
stress-c 1
通過pidstat監(jiān)控看到
壓力測試IO,system資源會被占用:
stress-i 1
壓力測試內(nèi)存,虛擬內(nèi)存是不變的,而真實內(nèi)存是不斷變化的;
因為需要不斷進(jìn)行數(shù)據(jù)交換
stress-m --vm-bytes 50m
壓力進(jìn)程的寫入能力測試
stress -d 1
cgroups信息查看
版本查看
cat /proc/filesystems | grep cg
如果看到 cgroup2,表示支持cgroup v2;
子系統(tǒng)查看
cat /proc/cgroups
cgroup 掛載信息查看
mount | grep cgroup
顯示當(dāng)前掛載的文件系統(tǒng),這些行顯示了不同的cgroup子系統(tǒng)是如何掛載到文件系統(tǒng)中的tmpfs
是一種基于內(nèi)存的文件系統(tǒng),這里它被用來掛載cgroup的根目錄。cgroup
類型表示這是一個cgroup掛載點,后面的參數(shù)(如name=systemd)指定了cgroup子系統(tǒng)的名稱。
顯示當(dāng)前shell進(jìn)程所屬的cgroup(控制組)信息
ll /sys/fs/cgroup/memory/user.slice
當(dāng)使用了systemd作為初始化系統(tǒng)(init system)時,/sys/fs/cgroup/目錄下會包含各種cgroup(控制組)子系統(tǒng)的掛載點。user.slice
是systemd用來管理用戶會話的一個cgroup層級,它包含了所有用戶級別的進(jìn)程和服務(wù)。
查看該目錄下的文件:
這些文件允許你讀取或設(shè)置cgroup的內(nèi)存限制和統(tǒng)計信息。
使用cgroups對內(nèi)存的控制
先進(jìn)入到內(nèi)存控制目錄
cd/sys/fs/cgroup/memory
創(chuàng)建一個測試目錄,并進(jìn)入;
mkdir test_memlimit cd test_memlimit
內(nèi)存限制文件已經(jīng)自動在新目錄中建立;
更改內(nèi)存最大限制為20M:
echo "20971520" > memory.limit_in_bytes
開啟對內(nèi)存的監(jiān)控和壓力測試:
pidstat -C stress -p ALL -r 2 10000 stress -m 1 --vm-bytes 50m
將stress進(jìn)程放入cgroup策略中:
echo "3605712" > tasks
進(jìn)程無法申請到足夠的內(nèi)存而退出.
使用cgroups對cpu進(jìn)行控制
mount | grep cg
創(chuàng)建測試目錄并進(jìn)入:
mkdir test_cpu cd test_cpu
開啟cpu壓力測試并監(jiān)控:
stress -c 1 pidstat -C stress -p ALL-u 2 10000
cpu_period_us:表示cpu可以使用的帶寬,默認(rèn)值是100000
cpu_quota_us:表示cgroup可以使用的帶寬,-1表示CPU不受cgroup的限制;
我們將cpu_quota_us/cpu_period_us就能表示cpu的利用率
將cpu利用率改到20%:
echo "20000"> cpu.cfs_quota_us
將進(jìn)程放入tasks進(jìn)行控制:
echo "3615387" > tasks
cpu利用率變?yōu)?0%
到此這篇關(guān)于Docker中cgroups資源控制實戰(zhàn)的文章就介紹到這了,更多相關(guān)Docker cgroups資源控制內(nèi)容請搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!
相關(guān)文章
docker實現(xiàn)MySQL數(shù)據(jù)同步的方法
docker的一大好處是在本地可以很方便快速的搭建負(fù)載均衡,主從同步等需要多主機的環(huán)境,本文主要介紹了docker實現(xiàn)MySQL數(shù)據(jù)同步的方法,文中通過示例代碼介紹的非常詳細(xì),具有一定的參考價值,感興趣的小伙伴們可以參考一下2022-03-03使用Docker快速部署openGauss數(shù)據(jù)庫的詳細(xì)操作流程
本文介紹使用Docker部署openGauss數(shù)據(jù)庫的全流程,包括鏡像獲取、容器運行、連接測試、數(shù)據(jù)持久化配置及常見問題解決,突出其高性能、高安全特性與簡化安裝的優(yōu)勢,感興趣的朋友跟隨小編一起看看吧2025-06-06如何運用docker配合python開發(fā)環(huán)境實例
本篇文章主要介紹了如何運用docker配合python開發(fā)實例,小編覺得挺不錯的,現(xiàn)在分享給大家,也給大家做個參考。一起跟隨小編過來看看吧2017-07-07docker環(huán)境調(diào)用mysqldump進(jìn)行數(shù)據(jù)備份方式
這篇文章主要介紹了docker環(huán)境調(diào)用mysqldump進(jìn)行數(shù)據(jù)備份方式,具有很好的參考價值,希望對大家有所幫助,如有錯誤或未考慮完全的地方,望不吝賜教2025-06-06將Docker鏡像從服務(wù)器A遷移到服務(wù)器B的三種方法
這篇文章主要介紹了將postgres:15鏡像從服務(wù)器A傳到服務(wù)器B的三種方法:推薦使用Docker Save和Load,通過DockerHub或私有倉庫中轉(zhuǎn),適用于內(nèi)網(wǎng)環(huán)境,每種方法涉及保存/傳輸/加載或推送步驟,注意權(quán)限及網(wǎng)絡(luò)條件,需要的朋友可以參考下2025-06-06Docker 部署 Prometheus的安裝詳細(xì)教程
這篇文章主要介紹了Docker 部署 Prometheus及安裝方法,本文給大家介紹的非常詳細(xì),對大家的學(xué)習(xí)或工作具有一定的參考借鑒價值,需要的朋友可以參考下2021-08-08使用Docker安裝向量數(shù)據(jù)庫milvus并且安裝圖形化界面的方法
文章介紹了如何在Windows上使用Docker安裝并配置Milvus向量數(shù)據(jù)庫,包括啟用WSL2、安裝Ubuntu、配置Docker倉庫、安裝Milvus服務(wù)端和用戶圖形界面Attu,并提供了一個修改后的Dockerfile以提高Attu的安裝速度,感興趣的朋友一起看看吧2025-02-02