ZHCABF0A December 2021 – April 2022 PCM6120-Q1 , TLV320ADC5120 , TLV320ADC6120
本節介紹 VAD 結果。算法性能由 ROC 曲線顯示,該曲線說明了不同工作閾值(–12dB 至 –3dB)下的檢測性能。以下 ROC 圖顯示的是來自 Aurora 噪聲數據庫的噪聲場景(圖 3-1 表示汽車噪聲,圖 3-2 表示餐廳噪聲,圖 3-3 表示地鐵噪聲)和來自 NOIZEUS 語音數據庫的語音信號。測試向量是通過以所需的 12、18 和 24dB SNR(SNR 是語音功率級別和噪聲信號功率級別之間的差值)混合噪聲和語音信號來生成的(例如,12dB SNR 意味著噪聲功率級別比語音功率級別低 12dB)。工作點對于 12dB 閾值而言位于最左上角,并隨著閾值的增加而向右移動,對于語音命中率和非語音命中率,圖 3-4(–7dB 閾值)指示更高的性能。
圖 3-1 針對汽車噪聲的非語音命中率與語音命中率
圖 3-2 針對餐廳噪聲的非語音命中率與語音命中率
圖 3-3 針對地鐵噪聲的非語音命中率與語音命中率在分析收集到的數據之后,選擇了–7dB 閾值,以在不同噪聲類型下提供最佳語音命中率和非語音命中率。針對不同噪聲類型,在–7dB 閾值下的 ROC 曲線如圖所示。
圖 3-4 針對 12dB SNR 在–7dB 閾值下的非語音命中率與語音命中率