Java實現(xiàn)Shazam聲音識別算法的實例代碼
Shazam算法采用傅里葉變換將時域信號轉換為頻域信號,并獲得音頻指紋,最后匹配指紋契合度來識別音頻。
1、AudioSystem獲取音頻
奈奎斯特-香農(nóng)采樣定理告訴我們,為了能捕獲人類能聽到的聲音頻率,我們的采樣速率必須是人類聽覺范圍的兩倍。人類能聽到的聲音頻率范圍大約在20Hz到20000Hz之間,所以在錄制音頻的時候采樣率大多是44100Hz。這是大多數(shù)標準MPEG-1 的采樣率。44100這個值最初來源于索尼,因為它可以允許音頻在修改過的視頻設備上以25幀(PAL)或者30幀( NTSC)每秒進行錄制,而且也覆蓋了專業(yè)錄音設備的20000Hz帶寬。所以當你在選擇錄音的頻率時,選擇44100Hz就好了。
定義音頻格式:
public static float sampleRate = 44100; public static int sampleSizeInBits = 16; public static int channels = 2; // double public static boolean signed = true; // Indicates whether the data is signed or unsigned public static boolean bigEndian = true; // Indicates whether the audio data is stored in big-endian or little-endian order public AudioFormat getFormat() { return new AudioFormat(sampleRate, sampleSizeInBits, channels, signed, bigEndian); }
調用麥克風獲取音頻,保存到out中
public static ByteArrayOutputStream out = new ByteArrayOutputStream();1 try { AudioFormat format = smartAuto.getFormat(); // Fill AudioFormat with the settings DataLine.Info info = new DataLine.Info(TargetDataLine.class, format); startTime = new Date().getTime(); System.out.println(startTime); SmartAuto.line = (TargetDataLine) AudioSystem.getLine(info); SmartAuto.line.open(format); SmartAuto.line.start(); new FileAnalysis().getDataToOut(""); while (smartAuto.running) { checkTime(startTime); } SmartAuto.line.stop(); SmartAuto.line.close(); } catch (Throwable e) { e.printStackTrace(); }
獲取到的out數(shù)據(jù)需要通過傅里葉變換,從時域信號轉換為頻域信號。
傅里葉變換
public Complex[] fft(Complex[] x) { int n = x.length; // 因為exp(-2i*n*PI)=1,n=1時遞歸原點 if (n == 1){ return x; } // 如果信號數(shù)為奇數(shù),使用dft計算 if (n % 2 != 0) { return dft(x); } // 提取下標為偶數(shù)的原始信號值進行遞歸fft計算 Complex[] even = new Complex[n / 2]; for (int k = 0; k < n / 2; k++) { even[k] = x[2 * k]; } Complex[] evenValue = fft(even); // 提取下標為奇數(shù)的原始信號值進行fft計算 // 節(jié)約內存 Complex[] odd = even; for (int k = 0; k < n / 2; k++) { odd[k] = x[2 * k + 1]; } Complex[] oddValue = fft(odd); // 偶數(shù)+奇數(shù) Complex[] result = new Complex[n]; for (int k = 0; k < n / 2; k++) { // 使用歐拉公式e^(-i*2pi*k/N) = cos(-2pi*k/N) + i*sin(-2pi*k/N) double p = -2 * k * Math.PI / n; Complex m = new Complex(Math.cos(p), Math.sin(p)); result[k] = evenValue[k].add(m.multiply(oddValue[k])); // exp(-2*(k+n/2)*PI/n) 相當于 -exp(-2*k*PI/n),其中exp(-n*PI)=-1(歐拉公式); result[k + n / 2] = evenValue[k].subtract(m.multiply(oddValue[k])); } return result; }
計算out的頻域值
private void setFFTResult(){ byte audio[] = SmartAuto.out.toByteArray(); final int totalSize = audio.length; System.out.println("totalSize = " + totalSize); int chenkSize = 4; int amountPossible = totalSize/chenkSize; //When turning into frequency domain we'll need complex numbers: SmartAuto.results = new Complex[amountPossible][]; DftOperate dfaOperate = new DftOperate(); //For all the chunks: for(int times = 0;times < amountPossible; times++) { Complex[] complex = new Complex[chenkSize]; for(int i = 0;i < chenkSize;i++) { //Put the time domain data into a complex number with imaginary part as 0: complex[i] = new Complex(audio[(times*chenkSize)+i], 0); } //Perform FFT analysis on the chunk: SmartAuto.results[times] = dfaOperate.fft(complex); } System.out.println("results = " + SmartAuto.results.toString()); }
總結
以上所述是小編給大家介紹的Java實現(xiàn)Shazam聲音識別算法的實例代碼,希望對大家有所幫助,如果大家有任何疑問請給我留言,小編會及時回復大家的。在此也非常感謝大家對腳本之家網(wǎng)站的支持!
相關文章
使用Flyway進行Java數(shù)據(jù)庫版本控制的操作指南
今天我們將深入探討如何使用Flyway進行Java數(shù)據(jù)庫版本控制,Flyway是一個流行的數(shù)據(jù)庫遷移工具,用于管理和自動化數(shù)據(jù)庫模式的演變,文中通過代碼示例介紹的非常詳細,對大家的學習或工作有一定的幫助,需要的朋友可以參考下2024-07-07Springboot RestTemplate設置超時時間的方法(Spring boot
這篇文章主要介紹了Springboot RestTemplate設置超時時間的方法,包括Spring boot 版本<=1.3和Spring boot 版本>=1.4,本文通過實例代碼給大家介紹的非常詳細,感興趣的朋友跟隨小編一起看看吧2024-08-08詳解SpringBoot如何實現(xiàn)統(tǒng)一后端返回格式
在前后端分離的項目中后端返回的格式一定要友好,不然會對前端的開發(fā)人員帶來很多的工作量。那么SpringBoot如何做到統(tǒng)一的后端返回格式呢?本文將為大家詳細講講2022-04-04在Mac OS上安裝Java以及配置環(huán)境變量的基本方法
這篇文章主要介紹了在Mac OS上安裝Java以及配置環(huán)境變量的基本方法,包括查看所安裝Java版本的方法,需要的朋友可以參考下2015-10-10SpringBoot實現(xiàn)動態(tài)數(shù)據(jù)源切換的方法總結
項目開發(fā)中經(jīng)常會遇到多數(shù)據(jù)源同時使用的場景,比如冷熱數(shù)據(jù)的查詢等情況,所以接下來本文就來介紹一下如何使用實現(xiàn)自定義注解的形式來實現(xiàn)動態(tài)數(shù)據(jù)源切換吧2023-12-12Java switch case數(shù)據(jù)類型原理解析
這篇文章主要介紹了Java switch case數(shù)據(jù)類型原理解析,文中通過示例代碼介紹的非常詳細,對大家的學習或者工作具有一定的參考學習價值,需要的朋友可以參考下2020-01-01