第一个场景,通话使用。 这是大部分智能硬件设计麦克风的主要原因,很多声学做起来感觉很简单的错觉也来源于此。
第二个场景,较安静环境下人机交互。 复用第一个场景的声学硬件,第二个场景马马虎虎也能用,虽然部分情况下效果不理想,但是,还没到完全不能用的状态。
第三个场景,高噪环境下人机交互。 主要是户外和人流量较多的环境下使用人机交互,第一个场景的声学硬件完全不能使用。
对于第一个场景,通话使用,现在的主流芯片基本上已经内置了通话降噪算法,再加上绝大部分通话都是在安静场景下,因此,只要麦克风的性能指标不是太拉跨、电路设计没有硬伤,第一个场景中智能硬件的声学部分并不用做额外的测试。但是,很多开发者带着这样的惯性开发第二个和第三个场景的智能硬件时,就完全走不通了,售后问题比比皆是,基本都集中在声音处理上。
那么,对于第二个和第三个场景,应该如何科学地自测声学部分呢?怎么判断声学部分是否符合量产条件呢?
测试环境准备:
- 环境安静,噪音<40dB,如无条件,选安静会议室
- 设备周围无遮挡物
测试工具准备:
- 待测设备---预留50MB存储空间
- 专业声压计--- 条件有限可使用手机app(例:手机应用市场-- Sound Meter HD)
- 音频分析软件---Audition
- 高保真音箱---条件有限可使用蓝牙音箱,无蓝牙音箱可使用电脑
- 密封材料---淘宝购买 EVA海绵密封胶带10mm厚度
测试音频准备:
- 密封性测试音频(白噪声)
- 1khz音频
- 信号质量测试音频
测试附件准备:单独提供
- 测试记录表格《声学测试结果目标》
- 测试音频附件
一、自播自录制测试
1-10项测试只录制一个音频:
(1)设备调节到100%音量
(2)设备先开始录制音频并保存,然后设备播放信号质量测试音频
(3) 自播自录后,人正常说话,测试mic处人声音量为65db,保存原始音频和识别音频
1、mic和回采幅度检查
最低幅度检查
1.用Audition软件打开音频,检查采样值。识别引擎要求采样值>2k,确保mic处65db人正常说话时峰值振幅采样值>2k。否则需要提高mic增益
截幅检查
- 检查每个声道振幅最大部分,确保每个声道无截幅
- 鼠标中间放大波形,保证波形连续,且无削顶
整改方式:减小增益或降低最大音量,让设备最大音量播放歌曲时,音频不截幅
2、幅度一致性(单麦免测)
(1)确保所有mic声道的幅度均值差值≤3db
示例:1声道(-12db ),2声道(-9db),相差3db合格
(2)回采的增益不能太小,最大音量时在 [-1,-9] DBFS之间
(3)双回采平均幅度差≤3db
3、通道顺序稳定性检查
多次录音, 同一个mic对应软件中的声道要固定。可以多次录音按相同顺序用手轻触麦克风,录音上会有比较明显的振幅,检查多次录音的麦序
4、底噪检查
(1)不播放音乐时,回采底噪<-65dbfs
安静环境下,设备底噪 < -50dbfs
操作方法:最右侧数字区域鼠标右键选择Decibels
(2)运行时底噪检查(设备运行时自噪较大的设备才需要测,比如投影仪运行时有风扇噪声,扫地机工作时的噪声,其他免测。)
让设备运行应用,使cpu占用>70%, 此时用声压计测量mic处噪声≤50db
5、丢数据检查
查看音频的长度(Duration)是否为21.6秒
丢数据可能原因:
(1)重采样算法异常
(2)驱动异常
2.在频谱上找一竖一竖的地方, 看时域波形采样点是否减少,如下图的频域波形,对应的时域少了5个采样点
6、最大音量检查
设备最大音量播放音频进行测试。
- AEC算法消除量为30db左右, 建议麦克风口处最大音量<=85dB,打断唤醒效果较好
- 特殊场景,例如全双工, 建议麦克风口处最大音量<=75db,打断唤醒效果较好
7、回采信号检查
(1)回采信号提前于mic信号,时间差<80ms
(2)每次录制时,回采和MIC时延差稳定
(3)回采与原信号波形基本一致,无畸变
(4)回采不能截幅
反例: (1)回采比MIC慢
(2)回采和MIC信号的时间差太长
(3)电视盒子外接电视的喇叭,时延差不可控,效果会受很大的影响
8、波形失真
原因:音量太大导致失真
质量测试音频原始波形(下图)
设备回采波形失真(下图)注:轻微型波形失真也算失真
9、单双回采检查
如果有2个喇叭,2回采信号效果更好
10、喇叭主观听感
测试方法:最大音量播放0dB 20Hz-20kHz的扫描信号,有无POP噪声/失真感/破音/共振音/杂音
11、麦克风阵列角度检查
二、相位一致性检查(单麦免测)
正常情况:麦克风同一时刻的相位一致(波形一致)
回采同一时刻可以一致或者反向
检查方法:找原始音频正弦波的位置进行检查
异常情况
三、密封性和通道顺序测试
1、录制音频
1.音箱和待测设备距离20~30cm
2.音箱播放,调节音量使待测设备麦克风(Mic)处音量为80~90dB(估算)
3.设备录音并保存文件,命名为 sealing_test.pcm
4.使用EVA海绵胶带10mm厚度(淘宝可购买)按逆时针顺序逐个密封mic,密封后停顿5~10秒,然后换下一个mic堵住继续该操作至结束。
2、 导入音频文件
1.结束录音,导出录音文件,确保格式为wav。
2.拖动文件到audition软件中,根据设备情况选择采样率和声道数
由于白噪声能量较高,可以清楚看到被堵mic的频段,同时也能看到mic的顺序。如下图所示,实际mic顺序和测试顺序一致,时域谱中每个通道振幅明显较大的部分(或者频域谱中每个通道中暗的部分)即为被堵住mic的部分。
3.、对比声道振幅
1.单击鼠标左键不松开,拖动选择区域后松开鼠标左键, 选中声道1中堵住mic停顿5s~10s区间的部分
注意:在选择扫描选区的时候,请选择停顿 5~10s 的中间的平坦部分,不要将有信号残留的部分选中,这部分会影响最后的结果!
2.依次点击窗口(Window),振幅统计(Amplitude Statistics),扫描选区(Scan Selection)
3.查看平均RMS振幅(Average RMS Amplitude),声道1密封 -57.26dB,其他声道未密封为-28dB,差值30dB>气密标准10dB,单声道气密性合格。要求设备所有mic气密性合格
反例:第2和第6声道气密性不合格
四、算法效果测试
使用降噪测试工具处理保存的质量测试音频,检查降噪后的音频回声残留量,残留噪声低于-30dbfs
以上,是整个声学部分自测的全部流程。