Docker中cgroups資源控制實(shí)戰(zhàn)
什么是cgroups?
cgroups是Linux內(nèi)核中的一項(xiàng)功能,最初由Google的工程師提出,后來(lái)被整合進(jìn)Linux內(nèi)核;
它允許用戶將一系列系統(tǒng)任務(wù)及其子任務(wù)整合或分隔到按資源劃分等級(jí)的不同組內(nèi),從而為系統(tǒng)資源管理提供一個(gè)統(tǒng)一的框架。
基本功能
- 資源限制:cgroups可以對(duì)進(jìn)程組使用的資源進(jìn)行限制,如CPU時(shí)間、內(nèi)存使用量、I/O帶寬等。一旦進(jìn)程組使用的資源達(dá)到限額,再申請(qǐng)資源時(shí)可能會(huì)受到限制或觸發(fā)相應(yīng)的錯(cuò)誤處理機(jī)制(如OOM,Out of Memory)。
- 優(yōu)先級(jí)控制:通過(guò)cgroups,用戶可以為進(jìn)程組分配特定的CPU份額,從而控制其運(yùn)行的優(yōu)先級(jí)。
- 資源記錄:cgoups還可以記錄進(jìn)程組使用的資源數(shù)量,如CPU時(shí)間、內(nèi)存使用量等,便于用戶進(jìn)行監(jiān)控和分析。
- 進(jìn)程組隔離:使用cgroups,用戶可以使不同的進(jìn)程組使用不同的命名空間(namespace),以達(dá)到隔離的目的。不同的進(jìn)程組將有各自的進(jìn)程、網(wǎng)絡(luò)、文件系統(tǒng)掛載空間等。
- 進(jìn)程組控制:cgroups提供了對(duì)進(jìn)程組的控制功能,如掛起、恢復(fù)等。
組成結(jié)構(gòu)
- 任務(wù)(Task):在cgroups中,任務(wù)就是系統(tǒng)的一個(gè)進(jìn)程。一個(gè)進(jìn)程可以加入到某個(gè)cgroup中,也可以從一個(gè)cgroup遷移到另一個(gè)cgroup。
- 控制族群(Control Group):cgroup表示按某種資源控制標(biāo)準(zhǔn)劃分而成的任務(wù)組,包含一個(gè)或多個(gè)子系統(tǒng)。cgroups中的資源控制都是以控制族群為單位實(shí)現(xiàn)的。
- 層級(jí)(Hierarchy):cgroups具有層次結(jié)構(gòu),類似于文件系統(tǒng)的層次樹。每個(gè)cgroup可以包含多個(gè)子CGroup,資源控制是自上而下繼承的。層級(jí)中的cgroup節(jié)點(diǎn)可以包含零個(gè)或多個(gè)子節(jié)點(diǎn),子節(jié)點(diǎn)繼承父節(jié)點(diǎn)掛載的子系統(tǒng)。
- 子系統(tǒng)(Subsystem):一個(gè)子系統(tǒng)就是一個(gè)資源調(diào)度控制器(又稱controllers),如CPU子系統(tǒng)可以控制CPU的時(shí)間分配,內(nèi)存子系統(tǒng)可以限制內(nèi)存的使用量。子系統(tǒng)必須附加到一個(gè)層級(jí)上才能起作用,一個(gè)子系統(tǒng)附加到某個(gè)層級(jí)以后,這個(gè)層級(jí)上的所有cgroup都受到這個(gè)子系統(tǒng)的控制。
為什么使用cgroups?
它能夠?qū)pu、內(nèi)存等資源做到精細(xì)的控制,目前的輕量級(jí)容器Docker和k8s就是使用了cgroup提供的資源限制能力對(duì)cpu、內(nèi)存等資源進(jìn)行資源控制。
比如要使用內(nèi)存的時(shí)候,假如全部有2G內(nèi)存,我們能夠根據(jù)我們的需求具體分配出400m內(nèi)存出來(lái)供資源使用,達(dá)到上限時(shí)就會(huì)觸發(fā)OOM;
cgroups控制子系統(tǒng)
名稱 | 功能 |
---|---|
blkio | 對(duì)塊設(shè)備的 IO 進(jìn)行限制 |
cpu | 限制 CPU 時(shí)間片的分配 |
cpuacct | 生成 cgroup 中的任務(wù)占用 CPU 資源的報(bào)告,與 cpu 掛載在同一目錄 |
cpuset | 給 cgroup 中的任務(wù)分配獨(dú)立的 CPU(多處理器系統(tǒng)) 和內(nèi)存節(jié)點(diǎn) |
devices | 限制設(shè)備文件的創(chuàng)建,和對(duì)設(shè)備文件的讀寫 |
memory | 對(duì) cgroup 中的任務(wù)的可用內(nèi)存進(jìn)行限制,并自動(dòng)生成資源占用報(bào)告 |
freezer | 暫停/恢復(fù) cgroup 中的任務(wù) |
hugetlb | 限制使用的內(nèi)存頁(yè)數(shù)量 |
perf_event | 允許 perf 觀測(cè) cgroup 中的 task |
pids | 限制任務(wù)的數(shù)量 |
rdma | 限制 RDMA 資源(Remote Direct Memory Access,遠(yuǎn)程直接數(shù)據(jù)存取) |
命令:pidstat
pidstat是Linux系統(tǒng)中的一個(gè)性能分析工具,它屬于sysstat套件的一部分。這個(gè)命令可以用來(lái)監(jiān)控特定進(jìn)程或所有進(jìn)程的CPU使用率、內(nèi)存使用情況、I/O活動(dòng)以及上下文切換等資源使用狀況。
基本語(yǔ)法
pidstat [options] [interval] [count]
- interval:指定兩次采樣之間的間隔時(shí)間(單位為秒)。
- count:可選參數(shù),用于指定要顯示統(tǒng)計(jì)信息的次數(shù)。
關(guān)鍵參數(shù)
- -u:默認(rèn)參數(shù),顯示每個(gè)進(jìn)程的CPU利用率(用戶空間、內(nèi)核空間)。
- -r:顯示每個(gè)進(jìn)程的內(nèi)存使用情況,包括頁(yè)面錯(cuò)誤(minflt/majflt)和虛擬內(nèi)存大小(VSZ)及實(shí)際使用的物理內(nèi)存(RSS)。
- -d:顯示每個(gè)進(jìn)程的磁盤I/O統(tǒng)計(jì),如讀寫操作的數(shù)量和帶寬。
- -w:顯示每個(gè)進(jìn)程的上下文切換次數(shù)(自愿和非自愿)。
- -p PID:監(jiān)視指定PID的進(jìn)程。
- -t:包含線程級(jí)別的統(tǒng)計(jì)信息。
如:
每2秒輸出一次所有進(jìn)程的CPU和內(nèi)存使用情況:
pidstat -ru 2
監(jiān)視PID為1234的進(jìn)程的CPU、內(nèi)存和磁盤I/O,并每隔5秒輸出一次:
pidstat -urd 5 -p 1234
顯示特定進(jìn)程及其線程的CPU使用率:
pidstat -ut 1 -p <process_id>
命令:stress
stress命令是一個(gè)用于對(duì)Linux系統(tǒng)進(jìn)行壓力測(cè)試的工具,它可以模擬多種類型的負(fù)載,包括CPU、內(nèi)存、磁盤、網(wǎng)絡(luò)等。
基本語(yǔ)法:
stress [OPTION [ARG]]
- -c ,–cpu N:模擬N個(gè)CPU核心的負(fù)載。
- -m --vm N:模擬N個(gè)虛擬內(nèi)存設(shè)備的負(fù)載。
- –vm-bytes B:指定每個(gè)虛擬內(nèi)存設(shè)備的大小為B(單位可以是K、M、G)。
- -i, --io N:模擬N個(gè)磁盤I/O操作的負(fù)載(注意:在某些版本中,這個(gè)選項(xiàng)可能被–hdd替代)。
- -t, --timeout T:指定壓力測(cè)試運(yùn)行T秒后自動(dòng)停止。
例如:
監(jiān)控壓力測(cè)試進(jìn)程,每?jī)擅氡O(jiān)控一次:
pidstat-C stress-p ALL-u2 10000
壓力測(cè)試cpu:
stress-c 1
通過(guò)pidstat監(jiān)控看到
壓力測(cè)試IO,system資源會(huì)被占用:
stress-i 1
壓力測(cè)試內(nèi)存,虛擬內(nèi)存是不變的,而真實(shí)內(nèi)存是不斷變化的;
因?yàn)樾枰粩噙M(jìn)行數(shù)據(jù)交換
stress-m --vm-bytes 50m
壓力進(jìn)程的寫入能力測(cè)試
stress -d 1
cgroups信息查看
版本查看
cat /proc/filesystems | grep cg
如果看到 cgroup2,表示支持cgroup v2;
子系統(tǒng)查看
cat /proc/cgroups
cgroup 掛載信息查看
mount | grep cgroup
顯示當(dāng)前掛載的文件系統(tǒng),這些行顯示了不同的cgroup子系統(tǒng)是如何掛載到文件系統(tǒng)中的tmpfs
是一種基于內(nèi)存的文件系統(tǒng),這里它被用來(lái)掛載cgroup的根目錄。cgroup
類型表示這是一個(gè)cgroup掛載點(diǎn),后面的參數(shù)(如name=systemd)指定了cgroup子系統(tǒng)的名稱。
顯示當(dāng)前shell進(jìn)程所屬的cgroup(控制組)信息
ll /sys/fs/cgroup/memory/user.slice
當(dāng)使用了systemd作為初始化系統(tǒng)(init system)時(shí),/sys/fs/cgroup/目錄下會(huì)包含各種cgroup(控制組)子系統(tǒng)的掛載點(diǎn)。user.slice
是systemd用來(lái)管理用戶會(huì)話的一個(gè)cgroup層級(jí),它包含了所有用戶級(jí)別的進(jìn)程和服務(wù)。
查看該目錄下的文件:
這些文件允許你讀取或設(shè)置cgroup的內(nèi)存限制和統(tǒng)計(jì)信息。
使用cgroups對(duì)內(nèi)存的控制
先進(jìn)入到內(nèi)存控制目錄
cd/sys/fs/cgroup/memory
創(chuàng)建一個(gè)測(cè)試目錄,并進(jìn)入;
mkdir test_memlimit cd test_memlimit
內(nèi)存限制文件已經(jīng)自動(dòng)在新目錄中建立;
更改內(nèi)存最大限制為20M:
echo "20971520" > memory.limit_in_bytes
開啟對(duì)內(nèi)存的監(jiān)控和壓力測(cè)試:
pidstat -C stress -p ALL -r 2 10000 stress -m 1 --vm-bytes 50m
將stress進(jìn)程放入cgroup策略中:
echo "3605712" > tasks
進(jìn)程無(wú)法申請(qǐng)到足夠的內(nèi)存而退出.
使用cgroups對(duì)cpu進(jìn)行控制
mount | grep cg
創(chuàng)建測(cè)試目錄并進(jìn)入:
mkdir test_cpu cd test_cpu
開啟cpu壓力測(cè)試并監(jiān)控:
stress -c 1 pidstat -C stress -p ALL-u 2 10000
cpu_period_us:表示cpu可以使用的帶寬,默認(rèn)值是100000
cpu_quota_us:表示cgroup可以使用的帶寬,-1表示CPU不受cgroup的限制;
我們將cpu_quota_us/cpu_period_us就能表示cpu的利用率
將cpu利用率改到20%:
echo "20000"> cpu.cfs_quota_us
將進(jìn)程放入tasks進(jìn)行控制:
echo "3615387" > tasks
cpu利用率變?yōu)?0%
到此這篇關(guān)于Docker中cgroups資源控制實(shí)戰(zhàn)的文章就介紹到這了,更多相關(guān)Docker cgroups資源控制內(nèi)容請(qǐng)搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!
相關(guān)文章
docker安裝mysql并實(shí)現(xiàn)數(shù)據(jù)卷掛載的示例代碼
本文介紹了如何通過(guò)Docker安裝MySQL并實(shí)現(xiàn)了數(shù)據(jù)卷掛載,詳細(xì)說(shuō)明了創(chuàng)建容器、配置掛載以及驗(yàn)證數(shù)據(jù)持久性的步驟,對(duì)于需要在Docker環(huán)境下部署MySQL的用戶非常有幫助2024-10-10Docker?link實(shí)現(xiàn)容器互聯(lián)的方式
通過(guò)link方式創(chuàng)建容器,然后我們可以使用被link容器的別名進(jìn)行訪問(wèn)。本文重點(diǎn)給大家介紹Docker?link實(shí)現(xiàn)容器互聯(lián)的方式,感興趣的朋友一起看看吧2021-12-12docker容器中登陸并操作postgresql的實(shí)現(xiàn)
本文主要介紹了docker容器中登陸并操作postgresql的實(shí)現(xiàn),文中通過(guò)示例代碼介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友們下面隨著小編來(lái)一起學(xué)習(xí)學(xué)習(xí)吧2024-02-02第一次構(gòu)建、運(yùn)行、發(fā)布、獲取docker鏡像的步驟詳解
今天小編就為大家分享一篇關(guān)于第一次構(gòu)建、運(yùn)行、發(fā)布、獲取docker鏡像的步驟詳解,小編覺得內(nèi)容挺不錯(cuò)的,現(xiàn)在分享給大家,具有很好的參考價(jià)值,需要的朋友一起跟隨小編來(lái)看看吧2019-03-03docker prune命令可定時(shí)清理不常用數(shù)據(jù)的實(shí)現(xiàn)
磁盤使用過(guò)久就會(huì)導(dǎo)致磁盤空間越來(lái)越小,這時(shí)候就需要?jiǎng)h除不相關(guān)的數(shù)據(jù)來(lái)釋放磁盤空間,本文主要使用docker prune命令可定時(shí)清理不常用數(shù)據(jù)的實(shí)現(xiàn),感興趣的可以了解一下2021-10-10