失调系数:收敛后,离真实值越远,系数越大。
¥
支付方式
请使用微信扫一扫 扫描二维码支付
请使用支付宝扫一扫 扫描二维码支付
开通会员,立省600元 立即开通
失调系数:收敛后,离真实值越远,系数越大。
远场语音面临的干扰:
混响,背景噪声(平稳,非平稳),人声干扰,回声
阵列技术:
回声消除(AEC),波达方向估计(DOA),波束形成技术(MVDR.GSC),单通道语音增强技术,去混响技术
AEC:维纳滤波,LMS->NLMS->PFBLMS,RLS
针对h很长,x很短的长卷积问题,可以采用PFBLMS算法,将滤波器分段进行操作
分的段越多,延迟越低,但是收敛以后离正常值的偏差越大
webrtc的时延估计可作为之后大延时检测参考
LMS:N这个量级复杂度
RLS:N平方复杂度
直接求逆:N三次方复杂度
1)cmedia (台湾,少),conexant(笔记本双mic降噪)
2)基于能量和相位的后置滤波??相干系数。
3)自己开发speex
4)国内李晓东。
5)给人听,用了大量的非线性手段。对机器影响大。亚马逊,请benesty 一小时600美刀。
6)回声消除已成熟。doa主说话人方向(学术上多个,实际上混响情况下单个效果)。自适应beamforming。去混响(对人没影响,对语音识别引擎影响很大,日本wpe,日本多通道线性预测)。
7)单通道语音增强(对语音识别,帮助不是很大),
8)两个派别 直接用。先降噪在处理
9)主要做音箱产品。
两麦处理方法:
1.基于能量后滤波:以两麦接收到的频率能量差异为对象处理.需要两麦离得远
2.自适应零陷波束形成(ANF):差分阵列,需要两麦离得近,不断调整零点,消除噪声
3.自适应波束形成+后滤波算法:两麦离得稍远,无法进行零陷波束形成,
国外:cohen,habets,loizou,kellermann,mcdonough,benesty
1)在会议系统中,四大难点中,人声干扰,我这边可以不考虑。
2)android -》google play
3)方向—echo ,收索入口(pc好123)百度杜亚科技。智能音响(小米,华为,网易)
4)驻极体电容,相位较差(京东音箱)。声望(5000),mems(尺寸小,原理一样。相位一致性好。echo。实际上究竟用哪种好??)
近场:95%以上 远场:60%不到