首页 AI学术青年与开发者社区

10年语音专家带你实战特训:远场语音交互技术

开课时间:录播回放,在线学习
开课时长:20+课时,课程上线后,至少两次直播答疑
会员价¥399.00
现价:¥999.00
原价:¥1,999.00

  开通会员,立省600元 立即开通

  当前课程,会员领券立减59元>>

该课程已关闭

失调系数:收敛后,离真实值越远,系数越大。

[展开全文]

远场语音面临的干扰:

混响,背景噪声(平稳,非平稳),人声干扰,回声

阵列技术:

回声消除(AEC),波达方向估计(DOA),波束形成技术(MVDR.GSC),单通道语音增强技术,去混响技术

AEC:维纳滤波,LMS->NLMS->PFBLMS,RLS

[展开全文]

针对h很长,x很短的长卷积问题,可以采用PFBLMS算法,将滤波器分段进行操作

分的段越多,延迟越低,但是收敛以后离正常值的偏差越大

[展开全文]

webrtc的时延估计可作为之后大延时检测参考  

  

[展开全文]

LMS:N这个量级复杂度

RLS:N平方复杂度

直接求逆:N三次方复杂度

[展开全文]

1)cmedia (台湾,少),conexant(笔记本双mic降噪)

2)基于能量和相位的后置滤波??相干系数。

3)自己开发speex

4)国内李晓东。

5)给人听,用了大量的非线性手段。对机器影响大。亚马逊,请benesty 一小时600美刀。

6)回声消除已成熟。doa主说话人方向(学术上多个,实际上混响情况下单个效果)。自适应beamforming。去混响(对人没影响,对语音识别引擎影响很大,日本wpe,日本多通道线性预测)。

7)单通道语音增强(对语音识别,帮助不是很大),

8)两个派别 直接用。先降噪在处理

9)主要做音箱产品。

两麦处理方法:

1.基于能量后滤波:以两麦接收到的频率能量差异为对象处理.需要两麦离得远

2.自适应零陷波束形成(ANF):差分阵列,需要两麦离得近,不断调整零点,消除噪声

3.自适应波束形成+后滤波算法:两麦离得稍远,无法进行零陷波束形成,

国外:cohen,habets,loizou,kellermann,mcdonough,benesty

 

 

[展开全文]

1)在会议系统中,四大难点中,人声干扰,我这边可以不考虑。

2)android -》google play

3)方向—echo ,收索入口(pc好123)百度杜亚科技。智能音响(小米,华为,网易)

4)驻极体电容,相位较差(京东音箱)。声望(5000),mems(尺寸小,原理一样。相位一致性好。echo。实际上究竟用哪种好??

近场:95%以上  远场:60%不到

 

 

[展开全文]

授课教师

微信扫码分享课程