快捷導(dǎo)航

一文詳解如何分析python程序cpu占用率問題

更新時(shí)間：2025年06月02日 08:25:20 作者：小郎碎碎念

如果程序處理的數(shù)據(jù)比較多、比較復(fù)雜,那么在程序運(yùn)行的時(shí)候,會(huì)占用大量的內(nèi)存,當(dāng)內(nèi)存占用到達(dá)一定的數(shù)值,程序就有可能被操作系統(tǒng)終止,這篇文章主要介紹了python程序cpu占用率問題的相關(guān)資料,需要的朋友可以參考下

問題

某天我看了一下目前在跑的一個(gè) python 程序的 CPU 利用率，發(fā)現(xiàn)跑到了 100%

這個(gè)程序本身執(zhí)行的任務(wù)很多，開啟了很多的線程，跑到 100% 也可以說的過去。但是作為程序員的好奇心就被勾引起來了

java 可以通過 “top -Hp + jstack + 代碼” 精準(zhǔn)定位到 cpu 高利用率的原因。那么在 python 中，通過什么方式可以實(shí)現(xiàn)相同的目的？

一、方案調(diào)研

經(jīng)過簡單的調(diào)研，python 和 java 排查的思路不太一樣，有下面三種工具可以使用：cProfile、py-spy、yappi

	cProfile	py-spy	yappi
使用便捷性	無需安裝，使用簡單（直接導(dǎo)入標(biāo)準(zhǔn)庫）	需額外安裝，命令行操作，可能需要管理員權(quán)限	需額外安裝，需在代碼中初始化/啟動(dòng)/停止
功能特性	統(tǒng)計(jì)函數(shù)調(diào)用次數(shù)、執(zhí)行時(shí)間等基礎(chǔ)信息，不支持多線程/異步代碼	支持多線程/異步分析，可實(shí)時(shí)分析運(yùn)行中的進(jìn)程，生成火焰圖	支持多線程/協(xié)程分析，可自定義時(shí)鐘類型（CPU時(shí)間或墻鐘時(shí)間）
性能影響	對(duì)性能有一定影響（大型程序更明顯）	非侵入式，對(duì)目標(biāo)進(jìn)程性能影響極小	性能影響較小，但大規(guī)模程序可能有開銷
分析結(jié)果展示	文本輸出（復(fù)雜場景難解讀）	火焰圖可視化，直觀定位瓶頸	詳細(xì)統(tǒng)計(jì)數(shù)據(jù)（需學(xué)習(xí)成本），支持多種輸出格式
適用場景	開發(fā)階段初步性能分析（定位耗時(shí)函數(shù)）	生產(chǎn)環(huán)境實(shí)時(shí)分析（快速定位CPU高負(fù)載問題）	復(fù)雜多線程/異步程序深度分析

二、每個(gè)工具實(shí)際使用的效果

2.1 cProfile

基本使用方式是修改程序的啟動(dòng)入口

import cProfile

def main():
    ...  # 程序入口

if __name__ == "__main__":
    cProfile.run('main()', sort='cumtime')

然后控制臺(tái)啟動(dòng)程序，運(yùn)行足夠長的時(shí)間后，終止程序（ctrl + c）時(shí)就會(huì)輸出對(duì)應(yīng)的函數(shù)執(zhí)行統(tǒng)計(jì)，如下圖：

輸出表格各列含義如下

ncalls：函數(shù)被調(diào)用的次數(shù)。
tottime：函數(shù)自身執(zhí)行所耗費(fèi)的總時(shí)間，不包含調(diào)用其他函數(shù)的時(shí)間。
percall：每次調(diào)用函數(shù)所花費(fèi)的平均時(shí)間，即 tottime / ncalls。
cumtime：函數(shù)執(zhí)行的累積時(shí)間，包含調(diào)用其他函數(shù)的時(shí)間。
percall：函數(shù)每次調(diào)用的累積平均時(shí)間，即 cumtime / ncalls。
filename:lineno(function)：函數(shù)所在的文件名、行號(hào)以及函數(shù)名。

整體上看相對(duì)來說不夠直觀，所以我的策略是，將結(jié)果拷貝進(jìn) excel 表格，分別按照 tottime 和 cumtime 排序，然后將結(jié)果取前 20 行放入大語言模型進(jìn)行分析。提示詞如下

你是一位資深的 python 專家和系統(tǒng)運(yùn)維專家

你的任務(wù)是使用 cProfile 工具排查 python 程序 cpu 利用率過高的問題，并提出對(duì)應(yīng)的優(yōu)化和解決建議

cProfile 的輸出如下

按照 cumtime 排序

---
ncalls	tottime  pe	rcall	cumtime  pe	rcall	filename:lineno(function)
91313	0.516	0	56.86	0.001	conv.py:53(forward_fuse)
27123	0.685	0	35.403	0.001	block.py:346(forward)
10435/10350	0.086	0	34.571	0	03 {method 'extend' of 'list' objects}
19892	0.086	0	32.822	0.002	block.py:239(<genexpr>)
97642	0.352	0	32.226	0	conv.py:553(forward)
3616	0.097	0	26.887	0.007	block.py:236(forward)
97642	0.259	0	21.341	0	conv.py:536(_conv_forward)
3616	0.106	0	20.761	0.006	block.py:459(forward)
97642	10.577	0	17.058	0	{built-in method torch.conv2d}
2372/2090	0.051	0	15.157	0.007	pooled_db.py:360(cache)
3671/3328	0.115	0	14.816	0.004	serving.py:259(write)
14464	0.043	0	13.573	0.001	block.py:462(<genexpr>)
7713/7070	0.046	0	12.46	0.002	socket.py:500(close)
3669/2219	0.1	0	12.376	0.006	selectors.py:451(select)
3798/3596	0.047	0	12.338	0.003	connections.py:431(_force_close)
2372/2091	0.042	0	12.221	0.006	steady_db.py:326(_reset)
904	0.107	0	11.436	0.013	head.py:317(forward)
87697	0.187	0	11.194	0	activation.py:431(forward)
2372/2091	0.024	0	9.936	0.005	steady_db.py:436(rollback)
3671/3585	0.056	0	9.425	0.003	server.py:493(send_response)
...(省略)
---

按照 tottime 如下

---
ncalls	tottime  pe	rcall	cumtime  pe	rcall	filename:lineno(function)
97642	10.577	0	17.058	0	{built-in method torch.conv2d}
1492/89	10.445	0.007	0.751	0.008	{method 'read' of 'cv2.VideoCapture' objects}
3660/317	9.277	0.003	2.85	0.009	{method 'poll' of 'select.poll' objects}
741/0	6.681	0.009	0		{built-in method time.sleep}
3669/2219	3.78	0.001	7.225	0.003	{method 'poll' of 'select.epoll' objects}
1522/185	2.446	0.002	0.4	0.002	{flip}
6328	1.948	0	3.359	0.001	{built-in method torch.einsum}
345354/12	1.613	0	1.368	0.114	module.py:1740(_call_impl)
903/1	1.581	0.002	0.003	0.003	{resize}
87697	1.573	0	4.584	0	{built-in method torch._C._nn.silu_}
16399/10112	1.556	0	3.308	0	00 {method 'recv_into' of '_socket.socket' objects}
23770/139	1.544	0	0.19	0.001	{method 'sendall' of '_socket.socket' objects}
345353/12	1.184	0	1.368	0.114	module.py:1732(_wrapped_call_impl)
3616	1.117	0	1.921	0.001	{built-in method torch._C._nn.linear}
439192	1.1	0	1.347	0	client.py:75(__setitem__)
9352/153	1.043	0	0.016	0	{method 'recv' of '_socket.socket' objects}
53147/50648	0.798	0	2.345	0	00 {method 'settimeout' of '_socket.socket' objects}
516359	0.783	0	0.783	0	module.py:1918(__getattr__)
18081	0.722	0	1.736	0	{built-in method torch.cat}
3616	0.689	0	7.775	0.002	block.py:426(forward)
...(省略)
---

你的分析結(jié)果應(yīng)該包含每個(gè)問題的影響程度，以及你分析的依據(jù)（即從 cProfile 哪個(gè)數(shù)據(jù)得到的這個(gè)結(jié)論）

具體輸出就不展示了，大語言模型每次都可以分析出問題的原因之一在于模型推理存在大量的 cpu 使用（未經(jīng)過工程上的優(yōu)化）。但是一些其他問題，輸出不太穩(wěn)定，例如 connections.py:431(_force_close) 有時(shí)能捕捉到是因?yàn)轭l繁地關(guān)閉數(shù)據(jù)庫連接問題，但很多時(shí)候有捕捉不到這個(gè)問題。

主要的問題在于，cProfile 輸出的每一行，都是以函數(shù)為維度的，函數(shù)之間的關(guān)聯(lián)無法很好的捕捉到，例如 method 'extend' of 'list' objects 有點(diǎn)模糊。

2.2 py-spy

安裝

pip install py-spy

使用（需要 sudo 權(quán)限），輸出火焰圖

# -o 輸出文件名
# -d 采樣多久
py-spy record -o profile.svg -d 60 -p <pid>

svg 文件可以直接使用瀏覽器打開，從下圖可以看出，火焰圖可以很直觀地定位到一些瓶頸問題

不過遺憾的是，svg 文件大語言模型還無法很好的支持，如果截圖給 AI 分析，又有很多文字省略了。

2.3 yappi

安裝

pip install yappi

使用，對(duì)于有執(zhí)行結(jié)束的程序

yappi.set_clock_type("cpu")  # cpu or wall
yappi.start()

my_function()

yappi.stop()
stats = yappi.get_func_stats()
# stats.print_all()
stats.save('yappi_stats.callgrind', type='callgrind')

對(duì)于無法結(jié)束的程序，例如網(wǎng)絡(luò)接口，可以如下（使用 kill -10 <pid> 來觸發(fā)寫入結(jié)果，實(shí)測寫的過程會(huì) hang 住主進(jìn)程，最好再單獨(dú)開啟一個(gè)寫文件線程！）

import yappi
import signal

def start_all():
    app.run(debug=False, host='0.0.0.0', port=5000)


def handle_sigusr1(signum, frame):
    print("接收到 SIGUSR1 信號(hào)，正在停止 yappi 分析并保存結(jié)果...")
    yappi.stop()
    stats = yappi.get_func_stats()
    stats.save('yappi_stats.callgrind', type='callgrind')
    print("yappi 分析結(jié)果已保存為 yappi_stats.callgrind")

if __name__ == '__main__':
    yappi.set_clock_type("cpu")
    yappi.start()

    # 注冊 SIGUSR1 信號(hào)處理函數(shù)
    signal.signal(signal.SIGUSR1, handle_sigusr1)

    start_all()

callgrind 是一種特殊格式的文件，windows 可以使用 QCacheGrind 查看（下載地址）

我仔細(xì)看了這里列的熱點(diǎn)代碼，整體上來說和 cProfile 以及 py-spy 相差較多，基本分析不出來什么有用信息。

我也不知道是不是自己使用姿勢有問題，但如果這個(gè)工具學(xué)習(xí)成本這么高，說明它實(shí)際上也不是一個(gè)簡單易用的工具。

總結(jié)

整體使用下來，cProfile 和 py-spy 的結(jié)果是可以相互印證的。但我還是 比較推薦 py-spy，原因如下

安裝簡單
不需要改代碼，使用方便
火焰圖結(jié)果看起來直觀易懂
看文檔還可以把完整的執(zhí)行棧 dump 出來，這樣實(shí)際可以和 java 的排查思路一致了（上面例子中沒有嘗試，后面有實(shí)際問題可以嘗試一下）

當(dāng)然，實(shí)際情況下，很可能要多種工具齊上陣，綜合分析才能得到準(zhǔn)確的問題排查結(jié)果。

到此這篇關(guān)于python程序cpu占用率問題的文章就介紹到這了,更多相關(guān)python程序cpu占用率問題內(nèi)容請搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家！

您可能感興趣的文章:

相關(guān)文章

Django自定義插件實(shí)現(xiàn)網(wǎng)站登錄驗(yàn)證碼功能
這篇文章主要為大家詳細(xì)介紹了Django自定義插件實(shí)現(xiàn)網(wǎng)站登錄驗(yàn)證碼功能，具有一定的參考價(jià)值，感興趣的小伙伴們可以參考一下
2017-04-04
Python?EasyDict庫以屬性方式訪問字典元素(無需使用方括號(hào)和鍵)
在Python中,字典（dict）是一種常用的數(shù)據(jù)結(jié)構(gòu),用于存儲(chǔ)鍵值對(duì),然而,有時(shí)候我們希望以屬性的方式訪問字典中的元素,而無需使用方括號(hào)和鍵,這就是EasyDict庫的用武之地,本文將深入介紹EasyDict庫,展示其強(qiáng)大的功能和如何通過示例代碼更好地利用它
2023-12-12
python妙用之編碼的轉(zhuǎn)換詳解
在日常滲透，漏洞挖掘，甚至是CTF比賽中會(huì)遇到各種編碼，常常伴隨著這些編碼之間的各種轉(zhuǎn)換。下面這篇文章主要介紹了python中編碼轉(zhuǎn)換妙用的相關(guān)資料，需要的朋友們可以參考借鑒，下面來一起看看吧。
2017-04-04
python實(shí)現(xiàn)單目標(biāo)、多目標(biāo)、多尺度、自定義特征的KCF跟蹤算法(實(shí)例代碼)
這篇文章主要介紹了python實(shí)現(xiàn)單目標(biāo)、多目標(biāo)、多尺度、自定義特征的KCF跟蹤算法,本文通過實(shí)例代碼給大家介紹的非常詳細(xì)，具有一定的參考借鑒價(jià)值，需要的朋友可以參考下
2020-01-01
Python機(jī)器學(xué)習(xí)NLP自然語言處理基本操作之Seq2seq的用法
Seq2Seq模型是輸出的長度不確定時(shí)采用的模型，這種情況一般是在機(jī)器翻譯的任務(wù)中出現(xiàn)，將一句中文翻譯成英文，那么這句英文的長度有可能會(huì)比中文短，也有可能會(huì)比中文長，所以輸出的長度就不確定了
2021-10-10
python實(shí)現(xiàn)的守護(hù)進(jìn)程(Daemon)用法實(shí)例
這篇文章主要介紹了python實(shí)現(xiàn)的守護(hù)進(jìn)程(Daemon)用法,實(shí)例分析了Python進(jìn)程操作的相關(guān)技巧,需要的朋友可以參考下
2015-06-06
python實(shí)現(xiàn)自動(dòng)登錄跳轉(zhuǎn)頁面并獲取信息
這篇文章主要為大家詳細(xì)介紹了如何使用python實(shí)現(xiàn)自動(dòng)登錄跳轉(zhuǎn)頁面并獲取信息功能,文中的示例代碼講解詳細(xì),有需要的小伙伴可以跟隨小編一起學(xué)習(xí)一下
2025-05-05
在本篇文章里小編給大家整理的是關(guān)于如何理解python面向?qū)ο缶幊痰南嚓P(guān)知識(shí)點(diǎn)，需要的朋友們可以學(xué)習(xí)下。
2020-06-06