Docker中cgroups資源控制實戰(zhàn)
什么是cgroups?
cgroups是Linux內(nèi)核中的一項功能,最初由Google的工程師提出,后來被整合進Linux內(nèi)核;
它允許用戶將一系列系統(tǒng)任務(wù)及其子任務(wù)整合或分隔到按資源劃分等級的不同組內(nèi),從而為系統(tǒng)資源管理提供一個統(tǒng)一的框架。
基本功能
- 資源限制:cgroups可以對進程組使用的資源進行限制,如CPU時間、內(nèi)存使用量、I/O帶寬等。一旦進程組使用的資源達到限額,再申請資源時可能會受到限制或觸發(fā)相應(yīng)的錯誤處理機制(如OOM,Out of Memory)。
- 優(yōu)先級控制:通過cgroups,用戶可以為進程組分配特定的CPU份額,從而控制其運行的優(yōu)先級。
- 資源記錄:cgoups還可以記錄進程組使用的資源數(shù)量,如CPU時間、內(nèi)存使用量等,便于用戶進行監(jiān)控和分析。
- 進程組隔離:使用cgroups,用戶可以使不同的進程組使用不同的命名空間(namespace),以達到隔離的目的。不同的進程組將有各自的進程、網(wǎng)絡(luò)、文件系統(tǒng)掛載空間等。
- 進程組控制:cgroups提供了對進程組的控制功能,如掛起、恢復(fù)等。
組成結(jié)構(gòu)
- 任務(wù)(Task):在cgroups中,任務(wù)就是系統(tǒng)的一個進程。一個進程可以加入到某個cgroup中,也可以從一個cgroup遷移到另一個cgroup。
- 控制族群(Control Group):cgroup表示按某種資源控制標準劃分而成的任務(wù)組,包含一個或多個子系統(tǒng)。cgroups中的資源控制都是以控制族群為單位實現(xiàn)的。
- 層級(Hierarchy):cgroups具有層次結(jié)構(gòu),類似于文件系統(tǒng)的層次樹。每個cgroup可以包含多個子CGroup,資源控制是自上而下繼承的。層級中的cgroup節(jié)點可以包含零個或多個子節(jié)點,子節(jié)點繼承父節(jié)點掛載的子系統(tǒng)。
- 子系統(tǒng)(Subsystem):一個子系統(tǒng)就是一個資源調(diào)度控制器(又稱controllers),如CPU子系統(tǒng)可以控制CPU的時間分配,內(nèi)存子系統(tǒng)可以限制內(nèi)存的使用量。子系統(tǒng)必須附加到一個層級上才能起作用,一個子系統(tǒng)附加到某個層級以后,這個層級上的所有cgroup都受到這個子系統(tǒng)的控制。
為什么使用cgroups?
它能夠?qū)pu、內(nèi)存等資源做到精細的控制,目前的輕量級容器Docker和k8s就是使用了cgroup提供的資源限制能力對cpu、內(nèi)存等資源進行資源控制。
比如要使用內(nèi)存的時候,假如全部有2G內(nèi)存,我們能夠根據(jù)我們的需求具體分配出400m內(nèi)存出來供資源使用,達到上限時就會觸發(fā)OOM;
cgroups控制子系統(tǒng)
名稱 | 功能 |
---|---|
blkio | 對塊設(shè)備的 IO 進行限制 |
cpu | 限制 CPU 時間片的分配 |
cpuacct | 生成 cgroup 中的任務(wù)占用 CPU 資源的報告,與 cpu 掛載在同一目錄 |
cpuset | 給 cgroup 中的任務(wù)分配獨立的 CPU(多處理器系統(tǒng)) 和內(nèi)存節(jié)點 |
devices | 限制設(shè)備文件的創(chuàng)建,和對設(shè)備文件的讀寫 |
memory | 對 cgroup 中的任務(wù)的可用內(nèi)存進行限制,并自動生成資源占用報告 |
freezer | 暫停/恢復(fù) cgroup 中的任務(wù) |
hugetlb | 限制使用的內(nèi)存頁數(shù)量 |
perf_event | 允許 perf 觀測 cgroup 中的 task |
pids | 限制任務(wù)的數(shù)量 |
rdma | 限制 RDMA 資源(Remote Direct Memory Access,遠程直接數(shù)據(jù)存取) |
命令:pidstat
pidstat是Linux系統(tǒng)中的一個性能分析工具,它屬于sysstat套件的一部分。這個命令可以用來監(jiān)控特定進程或所有進程的CPU使用率、內(nèi)存使用情況、I/O活動以及上下文切換等資源使用狀況。
基本語法
pidstat [options] [interval] [count]
- interval:指定兩次采樣之間的間隔時間(單位為秒)。
- count:可選參數(shù),用于指定要顯示統(tǒng)計信息的次數(shù)。
關(guān)鍵參數(shù)
- -u:默認參數(shù),顯示每個進程的CPU利用率(用戶空間、內(nèi)核空間)。
- -r:顯示每個進程的內(nèi)存使用情況,包括頁面錯誤(minflt/majflt)和虛擬內(nèi)存大?。╒SZ)及實際使用的物理內(nèi)存(RSS)。
- -d:顯示每個進程的磁盤I/O統(tǒng)計,如讀寫操作的數(shù)量和帶寬。
- -w:顯示每個進程的上下文切換次數(shù)(自愿和非自愿)。
- -p PID:監(jiān)視指定PID的進程。
- -t:包含線程級別的統(tǒng)計信息。
如:
每2秒輸出一次所有進程的CPU和內(nèi)存使用情況:
pidstat -ru 2
監(jiān)視PID為1234的進程的CPU、內(nèi)存和磁盤I/O,并每隔5秒輸出一次:
pidstat -urd 5 -p 1234
顯示特定進程及其線程的CPU使用率:
pidstat -ut 1 -p <process_id>
命令:stress
stress命令是一個用于對Linux系統(tǒng)進行壓力測試的工具,它可以模擬多種類型的負載,包括CPU、內(nèi)存、磁盤、網(wǎng)絡(luò)等。
基本語法:
stress [OPTION [ARG]]
- -c ,–cpu N:模擬N個CPU核心的負載。
- -m --vm N:模擬N個虛擬內(nèi)存設(shè)備的負載。
- –vm-bytes B:指定每個虛擬內(nèi)存設(shè)備的大小為B(單位可以是K、M、G)。
- -i, --io N:模擬N個磁盤I/O操作的負載(注意:在某些版本中,這個選項可能被–hdd替代)。
- -t, --timeout T:指定壓力測試運行T秒后自動停止。
例如:
監(jiān)控壓力測試進程,每兩秒監(jiān)控一次:
pidstat-C stress-p ALL-u2 10000
壓力測試cpu:
stress-c 1
通過pidstat監(jiān)控看到
壓力測試IO,system資源會被占用:
stress-i 1
壓力測試內(nèi)存,虛擬內(nèi)存是不變的,而真實內(nèi)存是不斷變化的;
因為需要不斷進行數(shù)據(jù)交換
stress-m --vm-bytes 50m
壓力進程的寫入能力測試
stress -d 1
cgroups信息查看
版本查看
cat /proc/filesystems | grep cg
如果看到 cgroup2,表示支持cgroup v2;
子系統(tǒng)查看
cat /proc/cgroups
cgroup 掛載信息查看
mount | grep cgroup
顯示當(dāng)前掛載的文件系統(tǒng),這些行顯示了不同的cgroup子系統(tǒng)是如何掛載到文件系統(tǒng)中的tmpfs
是一種基于內(nèi)存的文件系統(tǒng),這里它被用來掛載cgroup的根目錄。cgroup
類型表示這是一個cgroup掛載點,后面的參數(shù)(如name=systemd)指定了cgroup子系統(tǒng)的名稱。
顯示當(dāng)前shell進程所屬的cgroup(控制組)信息
ll /sys/fs/cgroup/memory/user.slice
當(dāng)使用了systemd作為初始化系統(tǒng)(init system)時,/sys/fs/cgroup/目錄下會包含各種cgroup(控制組)子系統(tǒng)的掛載點。user.slice
是systemd用來管理用戶會話的一個cgroup層級,它包含了所有用戶級別的進程和服務(wù)。
查看該目錄下的文件:
這些文件允許你讀取或設(shè)置cgroup的內(nèi)存限制和統(tǒng)計信息。
使用cgroups對內(nèi)存的控制
先進入到內(nèi)存控制目錄
cd/sys/fs/cgroup/memory
創(chuàng)建一個測試目錄,并進入;
mkdir test_memlimit cd test_memlimit
內(nèi)存限制文件已經(jīng)自動在新目錄中建立;
更改內(nèi)存最大限制為20M:
echo "20971520" > memory.limit_in_bytes
開啟對內(nèi)存的監(jiān)控和壓力測試:
pidstat -C stress -p ALL -r 2 10000 stress -m 1 --vm-bytes 50m
將stress進程放入cgroup策略中:
echo "3605712" > tasks
進程無法申請到足夠的內(nèi)存而退出.
使用cgroups對cpu進行控制
mount | grep cg
創(chuàng)建測試目錄并進入:
mkdir test_cpu cd test_cpu
開啟cpu壓力測試并監(jiān)控:
stress -c 1 pidstat -C stress -p ALL-u 2 10000
cpu_period_us:表示cpu可以使用的帶寬,默認值是100000
cpu_quota_us:表示cgroup可以使用的帶寬,-1表示CPU不受cgroup的限制;
我們將cpu_quota_us/cpu_period_us就能表示cpu的利用率
將cpu利用率改到20%:
echo "20000"> cpu.cfs_quota_us
將進程放入tasks進行控制:
echo "3615387" > tasks
cpu利用率變?yōu)?0%
到此這篇關(guān)于Docker中cgroups資源控制實戰(zhàn)的文章就介紹到這了,更多相關(guān)Docker cgroups資源控制內(nèi)容請搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!
相關(guān)文章
docker安裝mysql并實現(xiàn)數(shù)據(jù)卷掛載的示例代碼
本文介紹了如何通過Docker安裝MySQL并實現(xiàn)了數(shù)據(jù)卷掛載,詳細說明了創(chuàng)建容器、配置掛載以及驗證數(shù)據(jù)持久性的步驟,對于需要在Docker環(huán)境下部署MySQL的用戶非常有幫助2024-10-10Docker?link實現(xiàn)容器互聯(lián)的方式
通過link方式創(chuàng)建容器,然后我們可以使用被link容器的別名進行訪問。本文重點給大家介紹Docker?link實現(xiàn)容器互聯(lián)的方式,感興趣的朋友一起看看吧2021-12-12docker容器中登陸并操作postgresql的實現(xiàn)
本文主要介紹了docker容器中登陸并操作postgresql的實現(xiàn),文中通過示例代碼介紹的非常詳細,對大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價值,需要的朋友們下面隨著小編來一起學(xué)習(xí)學(xué)習(xí)吧2024-02-02第一次構(gòu)建、運行、發(fā)布、獲取docker鏡像的步驟詳解
今天小編就為大家分享一篇關(guān)于第一次構(gòu)建、運行、發(fā)布、獲取docker鏡像的步驟詳解,小編覺得內(nèi)容挺不錯的,現(xiàn)在分享給大家,具有很好的參考價值,需要的朋友一起跟隨小編來看看吧2019-03-03docker prune命令可定時清理不常用數(shù)據(jù)的實現(xiàn)
磁盤使用過久就會導(dǎo)致磁盤空間越來越小,這時候就需要刪除不相關(guān)的數(shù)據(jù)來釋放磁盤空間,本文主要使用docker prune命令可定時清理不常用數(shù)據(jù)的實現(xiàn),感興趣的可以了解一下2021-10-10