Python使用PyAV提取視頻關(guān)鍵幀的實(shí)踐
1.軟件環(huán)境??
Windows10教育版64位Python3.6.3PyAV8.0.3
2.問題描述??
在提取視頻文件的關(guān)鍵內(nèi)容時(shí),手動(dòng)查看會(huì)非常耗時(shí)。即使你快進(jìn)視頻,一個(gè)小時(shí)的視頻也需要超過10分鐘;通常,一秒鐘的視頻包含24幀圖像。如果你能捕獲視頻中的關(guān)鍵幀(key frame,你可以把它理解成論文里面的摘要,看完關(guān)鍵幀就知道這個(gè)視頻主要在講什么了),尤其是在長時(shí)間拍攝類似鏡頭的場景中,對圖像進(jìn)行重復(fù)數(shù)據(jù)消除將有助于過濾掉大多數(shù)噪聲幀,并最大程度地提取視頻的核心內(nèi)容。
隨著短視頻越來越流行,視頻的內(nèi)容分析與文本的內(nèi)容分析一樣重要。然而,如果每個(gè)分析師都想看每一段視頻,那就需要太多時(shí)間。即使使用快進(jìn)功能,節(jié)省的時(shí)間仍然不夠。此外,由于人為疏忽,內(nèi)容分析會(huì)出現(xiàn)錯(cuò)誤和遺漏。相較于基于文本的內(nèi)容分析,會(huì)發(fā)現(xiàn)一個(gè)主要的區(qū)別:查看文本內(nèi)容可以一目十行,并且沒有強(qiáng)制的前后時(shí)間線。相反,觀看流媒體必須消耗流媒體的長度。然后我們會(huì)有一個(gè)問題:我們能一目了然地看到流媒體嗎?事實(shí)上,視頻流中的大量信息是冗余的,并且信息量非常低。信息量僅集中在一個(gè)關(guān)鍵幀(也稱為信息幀或I幀)圖片中。如果你把這些圖片一張一張地放在面前,你也可以做到像文本內(nèi)容一樣一目十行,減少人為疏忽。
關(guān)于視頻的相關(guān)概念可以看一下這個(gè)博客:
音視頻pts、dts基本概念及理解
那么有沒有什么方法能夠高效的提取視頻的關(guān)鍵幀呢
3.解決方法??
當(dāng)然有啦,這就是我們今天的主角——PyAV:

PyAV 是 FFmpeg 的Pythonic 綁定,其目標(biāo)是提供FFmpeg 底層庫的所有功能。 PyAV 通過容器、流、數(shù)據(jù)包、編解碼器和幀直接和精確地訪問視頻媒體。同時(shí),它能夠方便的和其他庫進(jìn)行對接,并幫助您從其他包(例如 Numpy 和 Pillow)獲取和修改數(shù)據(jù),提取視頻關(guān)鍵幀就更不在話下了!
不廢話了,直接上代碼:
'''
===========================================
@author: jayce
@file: extract_video_keyframes_av.py
@time: 2022/4/11 21:42
===========================================
'''
import av
import os
import shutil
path_to_video = r'E:\Code\Python\extract_video_keyframes\test video.mp4'
output_dir = r'E:\Code\Python\extract_video_keyframes\pyav'
# # 提取全部幀
# container = av.open(path_to_video)
#
# for frame in container.decode(video=0):
# frame.to_image().save(r'E:\Code\Python\比例尺鑒定\20220410比例尺鑒定\extract_video_keyframes\pyav\frame-%04d.png' % frame.index)
def extract_video_keyframes(path_to_video, output_dir):
try:
os.makedirs(output_dir, exist_ok=True)
# 提取關(guān)鍵幀
with av.open(path_to_video) as container:
# 表示我們只想查看關(guān)鍵幀
stream = container.streams.video[0]
stream.codec_context.skip_frame = 'NONKEY'
for frame in container.decode(stream):
print(frame)
# 使用frame.pts的原因是frame.index對skip_frame沒有意義,因?yàn)殛P(guān)鍵幀是從所有的幀中抽取中獨(dú)立的圖像,而pts顯示的就是這些獨(dú)立圖像的index;
# DTS(Decoding Time Stamp):即解碼時(shí)間戳,這個(gè)時(shí)間戳的意義在于告訴播放器該在什么時(shí)候解碼這一幀的數(shù)據(jù)。
# PTS(Presentation Time Stamp):即顯示時(shí)間戳,這個(gè)時(shí)間戳用來告訴播放器該在什么時(shí)候顯示這一幀的數(shù)據(jù)。
frame.to_image().save(os.path.join(output_dir, 'temporary-image-{:04d}.png'.format(frame.pts)))
except Exception as e:
print('Program error occurred:{}'.format(repr(e)))
if __name__ == "__main__":
extract_video_keyframes(path_to_video, output_dir)
# shutil.rmtree(output_dir)
4.結(jié)果預(yù)覽

到此這篇關(guān)于Python使用PyAV提取視頻關(guān)鍵幀的實(shí)踐的文章就介紹到這了,更多相關(guān)Python PyAV提取視頻關(guān)鍵幀 內(nèi)容請搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!
相關(guān)文章
win7 下搭建sublime的python開發(fā)環(huán)境的配置方法
Sublime Text具有漂亮的用戶界面和強(qiáng)大的功能,例如代碼縮略圖,Python的插件,代碼段等。還可自定義鍵綁定,菜單和工具欄。Sublime Text的主要功能包括:拼寫檢查,書簽,完整的 Python API,Goto功能,即時(shí)項(xiàng)目切換,多選擇,多窗口等等。2014-06-06
pandas數(shù)據(jù)探索之合并數(shù)據(jù)示例詳解
這篇文章主要為大家介紹了pandas數(shù)據(jù)探索之合并數(shù)據(jù)示例詳解,有需要的朋友可以借鑒參考下,希望能夠有所幫助,祝大家多多進(jìn)步,早日升職加薪2023-10-10
python try...finally...的實(shí)現(xiàn)方法
這篇文章主要介紹了python try...finally...的實(shí)現(xiàn)方法,幫助大家更好的理解和使用python,感興趣的朋友可以了解下2020-11-11
pandas讀取csv文件,分隔符參數(shù)sep的實(shí)例
今天小編就為大家分享一篇pandas讀取csv文件,分隔符參數(shù)sep的實(shí)例,具有很好的參考價(jià)值,希望對大家有所幫助。一起跟隨小編過來看看吧2018-12-12

