用Python進(jìn)行屏幕錄制的實(shí)現(xiàn)
引言
關(guān)于屏幕錄制這個功能需求,之前用過基于ffmpeg的Capture錄屏軟件,但是fps拉高以后會變得很卡,聲音也同樣出現(xiàn)卡頓。也自己嘗試過在python中調(diào)用ffmpeg的庫函數(shù),效果也不盡人意。網(wǎng)絡(luò)上下載了幾款錄屏軟件,不是要收費(fèi)就是下載到捆綁軟件或廣告很是心累,因此想借此機(jī)會重新研究一下屏幕錄制軟件的工作原理,同時當(dāng)作一個小項目練手。
gpt3.5給出的代碼
當(dāng)我還在猶豫是否要精心翻閱一下ffmpeg的說明書時,沒想到gpt已果斷給出了參考答案,可以使用Python的PyAutoGUI庫來實(shí)現(xiàn)錄屏功能。以下是一個簡單的示例代碼:
import pyautogui
import cv2
import numpy as np
# 獲取屏幕分辨率
screen_size = (1920, 1080)
# 設(shè)置視頻編碼器
fourcc = cv2.VideoWriter_fourcc(*"XVID")
# 創(chuàng)建視頻寫入對象
out = cv2.VideoWriter("output.avi", fourcc, 20.0, screen_size)
# 開始錄屏
while True:
# 獲取屏幕截圖
img = pyautogui.screenshot()
# 將截圖轉(zhuǎn)換為OpenCV格式
frame = np.array(img)
frame = cv2.cvtColor(frame, cv2.COLOR_BGR2RGB)
# 寫入視頻
out.write(frame)
# 按下q鍵退出錄屏
if cv2.waitKey(1) == ord("q"):
break
# 釋放資源
out.release()
cv2.destroyAllWindows()
從給出的代碼看來,屏幕錄制的工作原理就是以一定的幀率不斷地截圖,然后將截取的圖片以相同的幀率合成一個視頻。
放在安裝了pyautogui的python環(huán)境里運(yùn)行后,果然不出意外的話就要出意外了。gpt3.5給出的代碼卡在運(yùn)行中的界面紋絲不動,按’q’回車也并未退出循環(huán),再問gpt也死活給不出修改方案。
查閱資料后發(fā)現(xiàn)要先imshow()之后,在ui窗口區(qū)域內(nèi)按鍵才能有效終止循環(huán):
import numpy as np
import pyautogui
import cv2
# 設(shè)置錄制參數(shù)
SCREEN_SIZE = (1920, 1080)
FILENAME = 'recorded_video.avi'
FPS = 30.0
# 開始錄制
fourcc = cv2.VideoWriter_fourcc(*"XVID")
out = cv2.VideoWriter(FILENAME, fourcc, FPS, SCREEN_SIZE)
while True:
# 獲取屏幕截圖
img = pyautogui.screenshot()
# 轉(zhuǎn)換為OpenCV格式
frame = cv2.cvtColor(np.array(img), cv2.COLOR_RGB2BGR)
# 寫入視頻文件
out.write(frame)
cv2.imshow('Frame', frame)
cv2.resizeWindow('Frame', 1920, 1080)
# 檢測按鍵
if cv2.waitKey(1) == ord('q'):
break
# 停止錄制
out.release()
cv2.destroyAllWindows()
程序是能運(yùn)行了,但是效果依舊不好,窗口一直有遞歸的效果,而且導(dǎo)出的視頻其實(shí)是無法播放的。

更換截圖函數(shù)——ImageGrab.grab
pyautogui雖然能實(shí)現(xiàn)截圖,并在imshow里展示出來,但是導(dǎo)出的視頻卻無法播放,考慮肯能涉及到具體視頻編解碼參數(shù)問題,有懂的朋友請在評論區(qū)分享。這里采用更換PIL庫中的截圖函數(shù)ImageGrab.grab,可以實(shí)現(xiàn)截圖并導(dǎo)出視頻了,接下來最大的問題就是解決遞歸現(xiàn)象。
import numpy as np
import pyautogui
import cv2
# 設(shè)置錄制參數(shù)
SCREEN_SIZE = (1920, 1080)
FILENAME = 'recorded_video.avi'
FPS = 30.0
# 開始錄制
fourcc = cv2.VideoWriter_fourcc(*"XVID")
out = cv2.VideoWriter(FILENAME, fourcc, FPS, SCREEN_SIZE)
while True:
# 獲取屏幕截圖
img = pyautogui.screenshot()
# 轉(zhuǎn)換為OpenCV格式
frame = cv2.cvtColor(np.array(img), cv2.COLOR_RGB2BGR)
# 寫入視頻文件
out.write(frame)
cv2.imshow('Frame', frame)
cv2.resizeWindow('Frame', 1920, 1080)
# 檢測按鍵
if cv2.waitKey(1) == ord('q'):
break
# 停止錄制
out.release()
cv2.destroyAllWindows()

禁用imshow解決遞歸現(xiàn)象
視頻處理時的遞歸現(xiàn)象其實(shí)非常常見,除了物理中的鏡面效應(yīng)(觀察兩個平行放置的鏡子會出現(xiàn)遞歸的現(xiàn)象),
將攝像頭對準(zhǔn)顯示器,顯示器上的畫面也會觀察到遞歸的現(xiàn)象:

經(jīng)嘗試,將imshow()禁用后,改為幀計數(shù)的方式自定義終止循環(huán)就不會出現(xiàn)遞歸的問題了:
import numpy as np
from PIL import ImageGrab
import cv2
# 設(shè)置錄制參數(shù)
SCREEN_SIZE = (1920, 1080)
FILENAME = 'recorded_video.avi'
FPS = 30.0
# 開始錄制
fourcc = cv2.VideoWriter_fourcc(*"XVID")
out = cv2.VideoWriter(FILENAME, fourcc, FPS, SCREEN_SIZE)
cnt = 0
while True:
# 獲取屏幕截圖
# img = pyautogui.screenshot()
img = ImageGrab.grab(bbox=(0, 0, 1920, 1080))
print('recordin..')
# 轉(zhuǎn)換為OpenCV格式
frame = cv2.cvtColor(np.array(img), cv2.COLOR_RGB2BGR)
# 寫入視頻文件
out.write(frame)
# cv2.imshow('Frame', frame)
# cv2.resizeWindow('Frame', 1920, 1080)
# # 檢測按鍵
# if cv2.waitKey(1) == ord('q'):
# break
cnt = cnt + 1
if cnt == 100: #滿100幀后終止循環(huán)
break
# 停止錄制
out.release()
cv2.destroyAllWindows()

通過修改img = ImageGrab.grab(bbox=(0, 0, 2560, 1600))中的參數(shù)可以自定義錄屏區(qū)域,x,y,w,h分別代表左上角坐標(biāo)(起始坐標(biāo))和圖片寬度、高度。比如我的屏幕分辨率是2560*1600,那么設(shè)置為0, 0, 2560, 1600就是錄制全屏:

這樣,我們就可以基本實(shí)現(xiàn)用Python進(jìn)行屏幕錄制的功能了。動態(tài)圖預(yù)覽看上去分辨率不高是因為用的格式工廠把錄制的視頻轉(zhuǎn)了gif,壓縮前錄制的視頻其實(shí)蠻清楚的。
通過修改fps的值,我們還可以自行錄制一些高刷新率的電影、游戲畫面,fps越高,畫面越流暢哦。
攝像頭錄制代碼
類似的,也可以用python實(shí)現(xiàn)相機(jī)錄像的功能:
import cv2
import cv2 as cv
# 打開攝像頭
cap = cv2.VideoCapture(0)
fourcc = cv.VideoWriter_fourcc(*'XVID')
file_name = 'output'
output = cv.VideoWriter((file_name + '.avi'), fourcc, 24.0, (640, 480)) #設(shè)置文件名,fps,分辨率
while cap.isOpened():
res, frame = cap.read()
if not res:
print("Frame Cannot Be Received")
break
# Flipping the frame horizontally to get correct orientation
frame = cv2.flip(frame, 90)
# Displaying the current frame
output.write(frame)
cv2.imshow('Frame', frame)
# If no input is received for 1ms, or if the key 'x' is pressed, interpreter goes outside of the loop
if cv2.waitKey(1) == ord('x'):
break
# Releasing everything after coming out of loop
cap.release()
output.release()
cv2.destroyAllWindows()
后期需求
現(xiàn)在屏幕錄制的問題基本解決了,要想做一個實(shí)用的屏幕錄制軟件,還需要加上音頻錄制,并設(shè)計一個便捷的UI界面。
小結(jié)
到此這篇關(guān)于用Python進(jìn)行屏幕錄制的實(shí)現(xiàn)的文章就介紹到這了,更多相關(guān)Python屏幕錄制內(nèi)容請搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!
相關(guān)文章
用Python實(shí)現(xiàn)簡單的人臉識別功能步驟詳解
這篇文章主要介紹了用Python實(shí)現(xiàn)簡單的人臉識別功能步驟詳解,本文給大家介紹的非常詳細(xì),對大家的學(xué)習(xí)或工作具有一定的參考借鑒價值,需要的朋友可以參考下2021-03-03
python numpy中mat和matrix的區(qū)別
這篇文章主要介紹了python numpy中mat和matrix的區(qū)別,具有很好的參考價值,希望對大家有所幫助。一起跟隨小編過來看看吧2021-03-03
python利用拉鏈法實(shí)現(xiàn)字典方法示例
這篇文章主要介紹了python利用拉鏈法實(shí)現(xiàn)字典的方法,文中給出了詳細(xì)的示例代碼,相信對大家具有一定的參考價值,需要的朋友可以們下面來一起看看吧。2017-03-03
Django上使用數(shù)據(jù)可視化利器Bokeh解析
這篇文章主要介紹了Django上使用數(shù)據(jù)可視化利器Bokeh解析,文中通過示例代碼介紹的非常詳細(xì),對大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價值,需要的朋友可以參考下2019-07-07
使用Python實(shí)現(xiàn)下載并保存網(wǎng)絡(luò)圖片
這篇文章主要為大家詳細(xì)介紹了如何使用Python實(shí)現(xiàn)下載并保存網(wǎng)絡(luò)圖片,不需要有編程經(jīng)驗,本文將以最簡單的方式一步步教你完成,快了跟隨小編一起學(xué)習(xí)一下吧2024-12-12
Python輕松實(shí)現(xiàn)2位小數(shù)隨機(jī)生成
在Python中,我們經(jīng)常需要生成隨機(jī)數(shù),特別是2位小數(shù)的隨機(jī)數(shù),這在模擬實(shí)驗、密碼學(xué)、游戲開發(fā)等領(lǐng)域都很有用,下面是如何在Python中生成2位小數(shù)的隨機(jī)數(shù)的代碼示例,需要的朋友可以參考下2023-11-11

