欧美bbbwbbbw肥妇,免费乱码人妻系列日韩,一级黄片

Go語言調(diào)用ffmpeg-api實(shí)現(xiàn)音頻重采樣

 更新時(shí)間:2022年12月07日 09:25:02   作者:劍客阿良_ALiang  
最近對(duì)golang處理音視頻很感興趣,對(duì)golang音視頻常用庫(kù)goav進(jìn)行了一番研究。自己寫了一個(gè)wav轉(zhuǎn)采樣率的功能。給大家分享一下,中間遇到了不少坑,解決的過程中還是蠻有意思的,希望大家能喜歡

前言

最近對(duì)golang處理音視頻很感興趣,對(duì)golang音視頻常用庫(kù)goav進(jìn)行了一番研究。自己寫了一個(gè)wav轉(zhuǎn)采樣率的功能。給大家分享一下,中間遇到了不少坑,解決的過程中還是蠻有意思的。

環(huán)境部署

代碼運(yùn)行在Ubuntu環(huán)境上,需要使用到goav,goav是對(duì)ffmpeg源碼的golang封裝。

goav地址:https://github.com/giorgisio/goav

goav安裝如下

sudo apt-get -y install autoconf automake build-essential libass-dev libfreetype6-dev libsdl1.2-dev libtheora-dev libtool libva-dev libvdpau-dev libvorbis-dev libxcb1-dev libxcb-shm0-dev libxcb-xfixes0-dev pkg-config texi2html zlib1g-dev
 
sudo apt install -y libavdevice-dev libavfilter-dev libswscale-dev libavcodec-dev libavformat-dev libswresample-dev libavutil-dev
 
sudo apt-get install yasm
 
export FFMPEG_ROOT=$HOME/ffmpeg
export CGO_LDFLAGS="-L$FFMPEG_ROOT/lib/ -lavcodec -lavformat -lavutil -lswscale -lswresample -lavdevice -lavfilter"
export CGO_CFLAGS="-I$FFMPEG_ROOT/include"
export LD_LIBRARY_PATH=$HOME/ffmpeg/lib
``` 
 
``` 
go get github.com/xueqing/goav

代碼

先看代碼

package main
 
//#include<stdlib.h>
import "C"
import (
    "flag"
    "fmt"
    "github.com/google/logger"
    "github.com/xueqing/ffmpeg-demo/logutil"
    "github.com/xueqing/goav/libswresample"
    "github.com/youpy/go-wav"
    "io"
    "os"
    "reflect"
    "unsafe"
)
 
func main() {
    var (
        inputUrl      string = "./data/1.wav"
        inNumChannels int64  = 1
        inSampleRate  int    = 16000
        //inBitsPerSample  uint16                    = 16
        outNumChannels   int64                     = 1
        outSampleRate    int                       = 48000
        outBitsPerSample uint16                    = 16
        swr              *libswresample.SwrContext = libswresample.SwrAlloc()
    )
    flag.Parse()
    logutil.Init(true, false, "resample.log")
    defer logutil.Close()
    swr.SwrAllocSetOpts(outNumChannels,
        libswresample.AvSampleFormat(1),
        outSampleRate,
        inNumChannels,
        libswresample.AvSampleFormat(1),
        inSampleRate,
        0,
        0)
    swr.SwrInit()
    defer swr.SwrClose()
 
    _inputFile, err := os.Open(inputUrl)
    if err != nil {
        logger.Errorf("open input file error(%v)", err)
        return
    }
    defer _inputFile.Close()
    _reader := wav.NewReader(_inputFile)
    format, err := _reader.Format()
    if err != nil {
        logger.Errorf("input file format error(%v)", err)
        return
    }
    fmt.Printf("input file format info -> AudioFormat:%v,NumChannels:%v,SampleRate:%v,ByteRate:%v,BlockAlign:%v,BitsPerSample:%v", int(format.AudioFormat), format.NumChannels, format.SampleRate, format.ByteRate, format.BlockAlign, format.BitsPerSample)
 
    _tempFile, err := os.CreateTemp("", "*.wav")
    if err != nil {
        logger.Errorf("create temp file error(%v)", err)
        return
    }
    logger.Infof("Create tempFile %v", _tempFile.Name())
    defer func() {
        _tempFile.Close()
    }()
    _samples := []wav.Sample{}
    n := 4096
    for {
        spls, err := _reader.ReadSamples(uint32(n))
        if err == io.EOF {
            break
        }
        _samples = append(_samples, spls...)
    }
    _result := ResampleByFFmpegApi2(swr, _samples)
    _writer := wav.NewWriter(_tempFile, uint32(len(_result)), uint16(outNumChannels), uint32(outSampleRate), outBitsPerSample)
 
    err4 := _writer.WriteSamples(_result)
    if err4 != nil {
        logger.Errorf("write file error(%v)", err4)
        err = err4
        return
    }
}
 
func ResampleByFFmpegApi2(swr *libswresample.SwrContext, samples []wav.Sample) []wav.Sample {
    var (
        _inArr  **uint8
        _outArr **uint8
        _inptr  []uint16
        _outptr []uint16
    )
    _inArr = (**uint8)(C.malloc(C.sizeof_int))
    defer C.free(unsafe.Pointer(_inArr))
    _inptr = make([]uint16, len(samples))
    _outArr = (**uint8)(C.malloc(C.sizeof_int))
    defer C.free(unsafe.Pointer(_outArr))
    _outptr = make([]uint16, len(samples)*3)
    //fmt.Println(unsafe.Sizeof(uint16(0)))
    for i, v := range samples {
        _inptr[i] = uint16(v.Values[0])
    }
    *_inArr = (*uint8)(unsafe.Pointer((*reflect.SliceHeader)(unsafe.Pointer(&_inptr)).Data))
    *_outArr = (*uint8)(unsafe.Pointer((*reflect.SliceHeader)(unsafe.Pointer(&_outptr)).Data))
    ret := swr.SwrConvert(_outArr, len(samples)*3, _inArr, len(samples))
    if ret > 0 {
        fmt.Println(ret)
    }
    _result := make([]wav.Sample, ret)
 
    for i := 0; i < ret; i++ {
        _result[i] = wav.Sample{[2]int{int(_outptr[i]), 0}}
    }
    return _result
}

代碼說明:

1、代碼不是個(gè)工具方法,如果看懂邏輯的話,可以自行修改成工具方法。

2、里面會(huì)用到ffmpeg里面swresample庫(kù),對(duì)音頻數(shù)據(jù)進(jìn)行沖采樣。

3、可以細(xì)看一下,如果你想作實(shí)時(shí)處理也是可以改的。

4、其中SwrAllocSetOpts方法中有個(gè)參數(shù)libswresample.AvSampleFormat(1),為什么取1,這里主要是選擇采樣表示方式的枚舉,參考底層源碼枚舉,我發(fā)在下面。我這邊因?yàn)橐纛l是s16的,所以選擇1。

enum AVSampleFormat {
    AV_SAMPLE_FMT_NONE = -1,
    AV_SAMPLE_FMT_U8,          ///< unsigned 8 bits
    AV_SAMPLE_FMT_S16,         ///< signed 16 bits
    AV_SAMPLE_FMT_S32,         ///< signed 32 bits
    AV_SAMPLE_FMT_FLT,         ///< float
    AV_SAMPLE_FMT_DBL,         ///< double
 
    AV_SAMPLE_FMT_U8P,         ///< unsigned 8 bits, planar
    AV_SAMPLE_FMT_S16P,        ///< signed 16 bits, planar
    AV_SAMPLE_FMT_S32P,        ///< signed 32 bits, planar
    AV_SAMPLE_FMT_FLTP,        ///< float, planar
    AV_SAMPLE_FMT_DBLP,        ///< double, planar
    AV_SAMPLE_FMT_S64,         ///< signed 64 bits
    AV_SAMPLE_FMT_S64P,        ///< signed 64 bits, planar
 
    AV_SAMPLE_FMT_NB           ///< Number of sample formats. DO NOT USE if linking dynamically
};

音頻準(zhǔn)備,輸入音頻為16k采樣率音頻。

(base) xxx@hu:~/GolandProjects/MediaRelay/data$ ffmpeg -i 1.wav 
ffmpeg version 4.2.7-0ubuntu0.1 Copyright (c) 2000-2022 the FFmpeg developers
  built with gcc 9 (Ubuntu 9.4.0-1ubuntu1~20.04.1)
  configuration: --prefix=/usr --extra-version=0ubuntu0.1 --toolchain=hardened --libdir=/usr/lib/x86_64-linux-gnu --incdir=/usr/include/x86_64-linux-gnu --arch=amd64 --enable-gpl --disable-stripping --enable-avresample --disable-filter=resample --enable-avisynth --enable-gnutls --enable-ladspa --enable-libaom --enable-libass --enable-libbluray --enable-libbs2b --enable-libcaca --enable-libcdio --enable-libcodec2 --enable-libflite --enable-libfontconfig --enable-libfreetype --enable-libfribidi --enable-libgme --enable-libgsm --enable-libjack --enable-libmp3lame --enable-libmysofa --enable-libopenjpeg --enable-libopenmpt --enable-libopus --enable-libpulse --enable-librsvg --enable-librubberband --enable-libshine --enable-libsnappy --enable-libsoxr --enable-libspeex --enable-libssh --enable-libtheora --enable-libtwolame --enable-libvidstab --enable-libvorbis --enable-libvpx --enable-libwavpack --enable-libwebp --enable-libx265 --enable-libxml2 --enable-libxvid --enable-libzmq --enable-libzvbi --enable-lv2 --enable-omx --enable-openal --enable-opencl --enable-opengl --enable-sdl2 --enable-libdc1394 --enable-libdrm --enable-libiec61883 --enable-nvenc --enable-chromaprint --enable-frei0r --enable-libx264 --enable-shared
  libavutil      56. 31.100 / 56. 31.100
  libavcodec     58. 54.100 / 58. 54.100
  libavformat    58. 29.100 / 58. 29.100
  libavdevice    58.  8.100 / 58.  8.100
  libavfilter     7. 57.100 /  7. 57.100
  libavresample   4.  0.  0 /  4.  0.  0
  libswscale      5.  5.100 /  5.  5.100
  libswresample   3.  5.100 /  3.  5.100
  libpostproc    55.  5.100 / 55.  5.100
Guessed Channel Layout for Input Stream #0.0 : mono
Input #0, wav, from '1.wav':
  Metadata:
    date            : 2020-09-28
    encoder         : Lavf58.45.100
  Duration: 00:04:01.75, bitrate: 256 kb/s
    Stream #0:0: Audio: pcm_s16le ([1][0][0][0] / 0x0001), 16000 Hz, mono, s16, 256 kb/s

執(zhí)行情況

input file format info -> AudioFormat:1,NumChannels:1,SampleRate:16000,ByteRate:32000,BlockAlign:2,BitsPerSample:16INFO : 2022/12/06 17:14:49.937547 csdn_wav_util.go:62: Create tempFile /tmp/2402235346.wav
11603961

最終音頻

(base) xxx@hu:/tmp$ ffmpeg -i 2402235346.wav 
ffmpeg version 4.2.7-0ubuntu0.1 Copyright (c) 2000-2022 the FFmpeg developers
  built with gcc 9 (Ubuntu 9.4.0-1ubuntu1~20.04.1)
  configuration: --prefix=/usr --extra-version=0ubuntu0.1 --toolchain=hardened --libdir=/usr/lib/x86_64-linux-gnu --incdir=/usr/include/x86_64-linux-gnu --arch=amd64 --enable-gpl --disable-stripping --enable-avresample --disable-filter=resample --enable-avisynth --enable-gnutls --enable-ladspa --enable-libaom --enable-libass --enable-libbluray --enable-libbs2b --enable-libcaca --enable-libcdio --enable-libcodec2 --enable-libflite --enable-libfontconfig --enable-libfreetype --enable-libfribidi --enable-libgme --enable-libgsm --enable-libjack --enable-libmp3lame --enable-libmysofa --enable-libopenjpeg --enable-libopenmpt --enable-libopus --enable-libpulse --enable-librsvg --enable-librubberband --enable-libshine --enable-libsnappy --enable-libsoxr --enable-libspeex --enable-libssh --enable-libtheora --enable-libtwolame --enable-libvidstab --enable-libvorbis --enable-libvpx --enable-libwavpack --enable-libwebp --enable-libx265 --enable-libxml2 --enable-libxvid --enable-libzmq --enable-libzvbi --enable-lv2 --enable-omx --enable-openal --enable-opencl --enable-opengl --enable-sdl2 --enable-libdc1394 --enable-libdrm --enable-libiec61883 --enable-nvenc --enable-chromaprint --enable-frei0r --enable-libx264 --enable-shared
  libavutil      56. 31.100 / 56. 31.100
  libavcodec     58. 54.100 / 58. 54.100
  libavformat    58. 29.100 / 58. 29.100
  libavdevice    58.  8.100 / 58.  8.100
  libavfilter     7. 57.100 /  7. 57.100
  libavresample   4.  0.  0 /  4.  0.  0
  libswscale      5.  5.100 /  5.  5.100
  libswresample   3.  5.100 /  3.  5.100
  libpostproc    55.  5.100 / 55.  5.100
Guessed Channel Layout for Input Stream #0.0 : mono
Input #0, wav, from '2402235346.wav':
  Duration: 00:04:01.75, bitrate: 768 kb/s
    Stream #0:0: Audio: pcm_s16le ([1][0][0][0] / 0x0001), 48000 Hz, mono, s16, 768 kb/s 

總結(jié)

其實(shí)在寫代碼過程中,有個(gè)讓我特別頭疼的東西,就是怎么把數(shù)組轉(zhuǎn)為**uint。如果大家有興趣可以研究一下ResampleByFFmpegApi2方法的轉(zhuǎn)換邏輯,會(huì)學(xué)到不少東西。

以上就是Go語言調(diào)用ffmpeg-api實(shí)現(xiàn)音頻重采樣的詳細(xì)內(nèi)容,更多關(guān)于Go ffmpeg-api音頻重采樣的資料請(qǐng)關(guān)注腳本之家其它相關(guān)文章!

相關(guān)文章

  • go語言實(shí)現(xiàn)全排列的示例代碼

    go語言實(shí)現(xiàn)全排列的示例代碼

    本文主要介紹了go語言實(shí)現(xiàn)全排列的示例代碼,文中通過示例代碼介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友們下面隨著小編來一起學(xué)習(xí)學(xué)習(xí)吧
    2023-03-03
  • Go語言的代碼組織結(jié)構(gòu)詳細(xì)介紹

    Go語言的代碼組織結(jié)構(gòu)詳細(xì)介紹

    這篇文章主要介紹了Go語言的代碼碼組織結(jié)構(gòu)詳細(xì)介紹,即Go語言源碼的文件結(jié)構(gòu),本文講解了包、main和main.main、os包等內(nèi)容,需要的朋友可以參考下
    2014-10-10
  • 詳解Golang中Channel的用法

    詳解Golang中Channel的用法

    如果說goroutine是Go語言程序的并發(fā)體的話,那么channels則是它們之間的通信機(jī)制。這篇文章主要介紹Golang中Channel的用法,需要的朋友可以參考下
    2020-11-11
  • 一文帶你了解Go語言中鎖特性和實(shí)現(xiàn)

    一文帶你了解Go語言中鎖特性和實(shí)現(xiàn)

    Go語言中的sync包主要提供的對(duì)并發(fā)操作的支持,標(biāo)志性的工具有cond(條件變量)?once?(原子性)?還有?鎖,本文會(huì)主要向大家介紹Go語言中鎖的特性和實(shí)現(xiàn),感興趣的可以了解下
    2024-03-03
  • 淺析Go中原子操作的重要性與使用

    淺析Go中原子操作的重要性與使用

    這篇文章主要帶大家一起探索?Go?中原子操作的概念,了解為什么它們是重要的,以及如何有效地使用它們,文中的示例代碼講解詳細(xì),需要的可以了解下
    2023-11-11
  • 在?Go?語言中使用?regexp?包處理正則表達(dá)式的操作

    在?Go?語言中使用?regexp?包處理正則表達(dá)式的操作

    正則表達(dá)式是處理字符串時(shí)一個(gè)非常強(qiáng)大的工具,而?Go?語言的?regexp?包提供了簡(jiǎn)單而強(qiáng)大的接口來使用正則表達(dá)式,本文將介紹如何在?Go?中使用?regexp?包來編譯和執(zhí)行正則表達(dá)式,以及如何從文本中匹配和提取信息,感興趣的朋友一起看看吧
    2023-12-12
  • Go之接口型函數(shù)用法

    Go之接口型函數(shù)用法

    這篇文章主要介紹了Go之接口型函數(shù)用法,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。如有錯(cuò)誤或未考慮完全的地方,望不吝賜教
    2023-02-02
  • 深入了解Golang中的Slice底層實(shí)現(xiàn)

    深入了解Golang中的Slice底層實(shí)現(xiàn)

    本文主要為大家詳細(xì)介紹了Golang中slice的底層實(shí)現(xiàn),文中通過示例代碼介紹的非常詳細(xì),具有一定的參考價(jià)值,感興趣的小伙伴們可以參考一下
    2023-02-02
  • golang套接字的實(shí)現(xiàn)

    golang套接字的實(shí)現(xiàn)

    Go語言中通過標(biāo)準(zhǔn)庫(kù)net實(shí)現(xiàn)套接字編程,涵蓋了TCP和UDP兩種網(wǎng)絡(luò)類型,通過這些基本概念和實(shí)際代碼示例,可以幫助理解和掌握Go語言中的套接字編程
    2024-10-10
  • 詳解在Go語言中如何實(shí)現(xiàn)枚舉類型

    詳解在Go語言中如何實(shí)現(xiàn)枚舉類型

    枚舉類型是一種常用的數(shù)據(jù)類型,用于表示一組有限的、預(yù)定義的、具名的常量值。而在?Go?語言里是沒有內(nèi)置枚舉類型的,所以本文將介紹如何實(shí)現(xiàn)?“枚舉類型”,需要的可以參考一下
    2023-04-04

最新評(píng)論