Qt音視頻開發(fā)之利用ffmpeg實現(xiàn)倍速播放
一、前言
用ffmpeg做倍速播放,是好多年都一直沒有實現(xiàn)的功能,有個做法是根據(jù)倍速參數(shù),不斷切換播放位置,實現(xiàn)效果不是很好,ffplay中的倍速就做得很好,而且聲音無論倍速多少還非常柔和,有特別的降噪處理啥的,ffplay中的倍速使用的濾鏡去實現(xiàn),并動態(tài)調(diào)整pts/dts的值,整個處理過程看起來比較復(fù)雜,想著有沒有稍微簡單一點的辦法,在經(jīng)過一個朋友的指點下,發(fā)現(xiàn)在音視頻同步的地方,對計算顯示時間差值的時候乘以倍速比例,就可以實現(xiàn)倍速效果,立馬測試立馬見到效果,這個和動態(tài)調(diào)整pts值效果類似,無非就是讓播放的時間進行倍速調(diào)整。所以這個倍速的功能推遲了好幾年終于實現(xiàn)了,之前由于一直沒有特別強烈的倍速需求推遲這沒有去實現(xiàn)。這樣實現(xiàn)的倍速唯一的缺點就是聲音在慢速快速播放中會有停頓效果不夠平滑柔和,也就是沒有變調(diào),在經(jīng)過幾次其他播放器比如vlc/mpv等,也有類似的問題,有部分播放器索性在非正常速度播放情況下音頻直接拒絕播放,都不敢直接面對。
為了驗證倍速是否和預(yù)期的效果完全一致,比如30幀的視頻,0.5倍速意味著一秒鐘解析15張,2倍速意味著一秒鐘解析60幀,依次類推,特意統(tǒng)計了打印信息,發(fā)現(xiàn)和預(yù)想的完全一致,4倍速確實解析了120張圖片,不過這種處理感覺是很占資源,可以考慮直接跳幀播放,尤其是找到關(guān)鍵幀跳躍播放,這樣可以節(jié)約很多資源,1倍速及以下倍速,可以將所有圖片解析,但是快速播放沒有必要將所有的解析繪制顯示,后期可以考慮將這兩種方式都支持。
二、功能特點
2.1 基礎(chǔ)功能
- 支持各種音頻視頻文件格式,比如mp3、wav、mp4、asf、rm、rmvb、mkv等。
- 支持本地攝像頭設(shè)備,可指定分辨率、幀率。
- 支持各種視頻流格式,比如rtp、rtsp、rtmp、http等。
- 本地音視頻文件和網(wǎng)絡(luò)音視頻文件,自動識別文件長度、播放進度、音量大小、靜音狀態(tài)等。
- 文件可以指定播放位置、調(diào)節(jié)音量大小、設(shè)置靜音狀態(tài)等。
- 支持倍速播放文件,可選0.5倍、1.0倍、2.5倍、5.0倍等速度,相當于慢放和快放。
- 支持開始播放、停止播放、暫停播放、繼續(xù)播放。
- 支持抓拍截圖,可指定文件路徑,可選抓拍完成是否自動顯示預(yù)覽。
- 支持錄像存儲,手動開始錄像、停止錄像,部分內(nèi)核支持暫停錄像后繼續(xù)錄像,跳過不需要錄像的部分。
- 支持無感知切換循環(huán)播放、自動重連等機制。
- 提供播放成功、播放完成、收到解碼圖片、收到抓拍圖片、視頻尺寸變化、錄像狀態(tài)變化等信號。
- 多線程處理,一個解碼一個線程,不卡主界面。
2.2 特色功能
- 同時支持多種解碼內(nèi)核,包括qmedia內(nèi)核(Qt4/Qt5/Qt6)、ffmpeg內(nèi)核(ffmpeg2/ffmpeg3/ffmpeg4/ffmpeg5)、vlc內(nèi)核(vlc2/vlc3)、mpv內(nèi)核(mpv1/mp2)、??祍dk、easyplayer內(nèi)核等。
- 非常完善的多重基類設(shè)計,新增一種解碼內(nèi)核只需要實現(xiàn)極少的代碼量,就可以應(yīng)用整套機制。
- 同時支持多種畫面顯示策略,自動調(diào)整(原始分辨率小于顯示控件尺寸則按照原始分辨率大小顯示,否則等比例縮放)、等比例縮放(永遠等比例縮放)、拉伸填充(永遠拉伸填充)。所有內(nèi)核和所有視頻顯示模式下都支持三種畫面顯示策略。
- 同時支持多種視頻顯示模式,句柄模式(傳入控件句柄交給對方繪制控制)、繪制模式(回調(diào)拿到數(shù)據(jù)后轉(zhuǎn)成QImage用QPainter繪制)、GPU模式(回調(diào)拿到數(shù)據(jù)后轉(zhuǎn)成yuv用QOpenglWidget繪制)。
- 支持多種硬件加速類型,ffmpeg可選dxva2、d3d11va等,mpv可選auto、dxva2、d3d11va,vlc可選any、dxva2、d3d11va。不同的系統(tǒng)環(huán)境有不同的類型選擇,比如linux系統(tǒng)有vaapi、vdpau,macos系統(tǒng)有videotoolbox。
- 解碼線程和顯示窗體分離,可指定任意解碼內(nèi)核掛載到任意顯示窗體,動態(tài)切換。
- 支持共享解碼線程,默認開啟并且自動處理,當識別到相同的視頻地址,共享一個解碼線程,在網(wǎng)絡(luò)視頻環(huán)境中可以大大節(jié)約網(wǎng)絡(luò)流量以及對方設(shè)備的推流壓力。國內(nèi)頂尖視頻廠商均采用此策略。這樣只要拉一路視頻流就可以共享到幾十個幾百個通道展示。
- 自動識別視頻旋轉(zhuǎn)角度并繪制,比如手機上拍攝的視頻一般是旋轉(zhuǎn)了90度的,播放的時候要自動旋轉(zhuǎn)處理,不然默認是倒著的。
- 自動識別視頻流播放過程中分辨率的變化,在視頻控件上自動調(diào)整尺寸。比如攝像機可以在使用過程中動態(tài)配置分辨率,當分辨率改動后對應(yīng)視頻控件也要做出同步反應(yīng)。
- 音視頻文件無感知自動切換循環(huán)播放,不會出現(xiàn)切換期間黑屏等肉眼可見的切換痕跡。
- 視頻控件同時支持任意解碼內(nèi)核、任意畫面顯示策略、任意視頻顯示模式。
- 視頻控件懸浮條同時支持句柄、繪制、GPU三種模式,非絕對坐標移來移去。
- 本地攝像頭設(shè)備支持指定設(shè)備名稱、分辨率、幀率進行播放。
- 錄像文件同時支持打開的視頻文件、本地攝像頭、網(wǎng)絡(luò)視頻流等。
- 瞬間響應(yīng)打開和關(guān)閉,無論是打開不存在的視頻或者網(wǎng)絡(luò)流,探測設(shè)備是否存在,讀取中的超時等待,收到關(guān)閉指令立即中斷之前的操作并響應(yīng)。
- 支持打開各種圖片文件,支持本地音視頻文件拖曳播放。
- 視頻控件懸浮條自帶開始和停止錄像切換、聲音靜音切換、抓拍截圖、關(guān)閉視頻等功能。
- 音頻組件支持聲音波形值數(shù)據(jù)解析,可以根據(jù)該值繪制波形曲線和柱狀聲音條,默認提供了聲音振幅信號。
- 各組件中極其詳細的打印信息提示,尤其是報錯信息提示,封裝的統(tǒng)一打印格式。針對現(xiàn)場復(fù)雜的設(shè)備環(huán)境測試極其方便有用,相當于精確定位到具體哪個通道哪個步驟出錯。
- 代碼框架和結(jié)構(gòu)優(yōu)化到最優(yōu),性能強悍,持續(xù)迭代更新升級。
- 源碼支持Qt4、Qt5、Qt6,兼容所有版本。
2.3 視頻控件
- 可動態(tài)添加任意多個osd標簽信息,標簽信息包括名字、是否可見、字號大小、文本文字、文本顏色、標簽圖片、標簽坐標、標簽格式(文本、日期、時間、日期時間、圖片)、標簽位置(左上角、左下角、右上角、右下角、居中、自定義坐標)。
- 可動態(tài)添加任意多個圖形信息,這個非常有用,比如人工智能算法解析后的圖形區(qū)域信息直接發(fā)給視頻控件即可。圖形信息支持任意形狀,直接繪制在原始圖片上,采用絕對坐標。
- 圖形信息包括名字、邊框大小、邊框顏色、背景顏色、矩形區(qū)域、路徑集合、點坐標集合等。
- 每個圖形信息都可指定三種區(qū)域中的一種或者多種,指定了的都會繪制。
- 內(nèi)置懸浮條控件,懸浮條位置支持頂部、底部、左側(cè)、右側(cè)。
- 懸浮條控件參數(shù)包括邊距、間距、背景透明度、背景顏色、文本顏色、按下顏色、位置、按鈕圖標代碼集合、按鈕名稱標識集合、按鈕提示信息集合。
- 懸浮條控件一排工具按鈕可自定義,通過結(jié)構(gòu)體參數(shù)設(shè)置,圖標可選圖形字體還是自定義圖片。
- 懸浮條按鈕內(nèi)部實現(xiàn)了錄像切換、抓拍截圖、靜音切換、關(guān)閉視頻等功能,也可以自行在源碼中增加自己對應(yīng)的功能。
- 懸浮條按鈕對應(yīng)實現(xiàn)了功能的按鈕,有對應(yīng)圖標切換處理,比如錄像按鈕按下后會切換到正在錄像中的圖標,聲音按鈕切換后變成靜音圖標,再次切換還原。
- 懸浮條按鈕單擊后都用名稱唯一標識作為信號發(fā)出,可以自行關(guān)聯(lián)響應(yīng)處理。
- 懸浮條空白區(qū)域可以顯示提示信息,默認顯示當前視頻分辨率大小,可以增加幀率、碼流大小等信息。
- 視頻控件參數(shù)包括邊框大小、邊框顏色、焦點顏色、背景顏色(默認透明)、文字顏色(默認全局文字顏色)、填充顏色(視頻外的空白處填充黑色)、背景文字、背景圖片(如果設(shè)置了圖片優(yōu)先取圖片)、是否拷貝圖片、縮放顯示模式(自動調(diào)整、等比例縮放、拉伸填充)、視頻顯示模式(句柄、繪制、GPU)、啟用懸浮條、懸浮條尺寸(橫向為高度、縱向為寬度)、懸浮條位置(頂部、底部、左側(cè)、右側(cè))。
2.4 內(nèi)核ffmpeg
- 支持各種音視頻文件、本地攝像頭設(shè)備,各種視頻流網(wǎng)絡(luò)流。
- 支持開始播放、暫停播放、繼續(xù)播放、停止播放、設(shè)置播放進度、倍速播放。
- 可設(shè)置音量、靜音切換、抓拍圖片、錄像存儲。
- 自動提取專輯信息比如標題、藝術(shù)家、專輯、專輯封面,自動顯示專輯封面。
- 完美支持音視頻同步和倍速播放。
- 解碼策略支持速度優(yōu)先、質(zhì)量優(yōu)先、均衡處理、最快速度。
- 支持手機視頻旋轉(zhuǎn)角度顯示,比如一般手機拍攝的視頻是旋轉(zhuǎn)了90度的,解碼顯示的時候需要重新旋轉(zhuǎn)90度才是正的。
- 自動轉(zhuǎn)換yuv420格式,比如本地攝像頭是yuyv422格式,有些視頻文件是xx格式,統(tǒng)一將非yuv420格式轉(zhuǎn)換,然后再進行處理。
- 支持硬解碼dxva2、d3d11va等,性能極高尤其是大分辨率比如4K視頻。
- 視頻響應(yīng)極低延遲0.2s左右,極速響應(yīng)打開視頻流0.5s左右,專門做了優(yōu)化處理。
- 硬解碼和GPU繪制組合,極低CPU占用,比??荡笕A等客戶端更優(yōu)。
- 支持視頻流中的各種音頻格式,AAC、PCM、G.726、G.711A、G.711Mu、G.711ulaw、G.711alaw、MP2L2等都支持,推薦選擇AAC兼容性跨平臺性最好。
- 視頻存儲支持yuv、h264、mp4多種格式,音頻存儲支持pcm、wav、aac多種格式。默認視頻mp4格式、音頻aac格式。
- 支持分開存儲音頻視頻文件,也支持合并到一個mp4文件,默認策略是無論何種音視頻文件格式存儲,最終都轉(zhuǎn)成mp4及aac格式,然后合并成音視頻一起的mp4文件。
- 支持本地攝像頭實時視頻顯示帶音頻輸入輸出,音視頻錄制合并到一個mp4文件。
- 支持H264/H265編碼(現(xiàn)在越來越多的監(jiān)控攝像頭是H265視頻流格式)生成視頻文件,內(nèi)部自動識別切換編碼格式。
- 自動識別視頻流動態(tài)分辨率改動,重新打開視頻流。
- 支持用戶信息中包含特殊字符(比如用戶信息中包含+#@等字符)的視頻流播放,內(nèi)置解析轉(zhuǎn)義處理。
- 純qt+ffmpeg解碼,非sdl等第三方繪制播放依賴,gpu繪制采用qopenglwidget,音頻播放采用qaudiooutput。
- 同時支持ffmpeg2、ffmpeg3、ffmpeg4、ffmpeg5版本,全部做了兼容處理。如果需要支持xp需要選用ffmpeg3及以下。
三、體驗地址
國內(nèi)站點:https://gitee.com/feiyangqingyun
國際站點:https://github.com/feiyangqingyun
體驗地址:https://pan.baidu.com/s/1YOVD8nkoOSYwX9KgSauLeQ 提取碼:kcgz 文件名:bin_video_demo/bin_linux_video。
四、效果圖
五、相關(guān)代碼
bool FFmpegSync::checkPtsTime() { //下面這幾個時間值是參考的別人的 bool ok = false; if (ptsTime > 0) { if (ptsTime > offsetTime + 100000) { bufferTime = ptsTime - offsetTime + 100000; } int offset = (type == 0 ? 1000 : 5000); //做夢都想不到倍速播放就這里控制個系數(shù)就行 offsetTime = (av_gettime() - startTime) * thread->speed + bufferTime; if ((offsetTime <= ptsTime && ptsTime - offsetTime <= offset) || (offsetTime > ptsTime)) { ok = true; } } else { ok = true; } return ok; } void FFmpegSync::checkShowTime() { //必須是文件(本地文件或網(wǎng)絡(luò)文件)才有播放進度 if (!thread->getIsFile()) { return; } //過濾重復(fù)發(fā)送播放時間 bool showPosition = false; bool existVideo = (thread->videoIndex >= 0); if (type == 0) { //音頻同步線程不能存在視頻 if (!existVideo) { showPosition = true; } } else if (type == 1) { //視頻同步線程必須存在視頻 if (existVideo) { showPosition = true; } } //需要顯示時間的時候發(fā)送對應(yīng)進度(限定差值大于200毫秒沒必要頻繁發(fā)送) if (showPosition && (offsetTime - showTime > 200000)) { showTime = offsetTime; thread->position = showTime / 1000; emit receivePosition(thread->position); } }
到此這篇關(guān)于Qt音視頻開發(fā)之利用ffmpeg實現(xiàn)倍速播放的文章就介紹到這了,更多相關(guān)Qt ffmpeg倍速播放內(nèi)容請搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!
相關(guān)文章
一文詳解C++子類函數(shù)為什么不能重載父類函數(shù)
這篇文章主要介紹了一文詳解C++子類函數(shù)為什么不能重載父類函數(shù),文章圍繞主題展開詳細的內(nèi)容戒殺,具有一定的參考價值,需要的朋友可以參考一下2022-09-09深入學(xué)習(xí)C語言mmap和shm*的使用方法技巧
本文將詳細介紹mmap和shm的工作原理,包括它們在內(nèi)存映射和共享內(nèi)存方面的優(yōu)勢和適用場景,同時,文章還會分享一些使用mmap和shm的技巧和經(jīng)驗,以幫助讀者優(yōu)化并提高程序性能,使你能夠在實際項目中更好地利用這些技術(shù)來加速數(shù)據(jù)共享和多線程應(yīng)用2023-10-10C++實現(xiàn)神經(jīng)網(wǎng)絡(luò)框架SimpleNN的詳細過程
本來自己想到用C++實現(xiàn)神經(jīng)網(wǎng)絡(luò)主要是想強化一下編碼能力并入門深度學(xué)習(xí),對C++實現(xiàn)神經(jīng)網(wǎng)絡(luò)框架SimpleNN的詳細過程感興趣的朋友一起看看吧2021-08-08全面解析設(shè)計模式中的建造者模式及相關(guān)C++實現(xiàn)
這篇文章主要介紹了設(shè)計模式中的建造者模式及相關(guān)C++實現(xiàn),需要的朋友可以參考下2016-03-03