推荐文档列表

如何运用RSC-3x开发出高性能的语音识别产品

时间:2021-10-01 08:12:13 电子通信论文 我要投稿

如何运用RSC-3x开发出高性能的语音识别产品

摘要:本文给出了在运用RSC-3x设计高性能的语音识别产品时应考虑的与硬件有关的若干问题:噪音降除、电路设计、PCB设计、麦克风的选择、麦克风的安放、电源设计。

    关键词:  RSC-3x, 识别率,噪音降除,电路设计,PCB设计,麦克风,电源

    RSC-3x是美国Sensory公司出品的交互式语音产品。它同RSC其他系列的产品一样运用神经元算法实现了语音识别的功能,在理想环境下,其识别率可达97%以上。并具有语音合成、录音回放、四声道音乐合成等语音处理功能。由于内含一个8位处理器,RSC-3x还可实现通用处理器的系统控制功能。RSC-3x的高性能和适中的价格使得它主要应用在消费类电子产品和价格敏感的家电产品上。

    但是,如何才能运用RSC-3x系列产品开发出性能良好的语音识别产品呢?本文给出了在设计语音识别产品时应在硬件方面考虑的若干问题。

    一、噪音降除

    语音识别的准确率(简称识别率)会受到诸多因素的干扰而下降。一个导致识别率下降最常见的因素就是噪音:来自系统内部的电子噪音和麦克风所拾取的声频噪音。RSC-3x的一个主要革新技术就是在其片内加入了一个声频预放电路。来自典型的驻极体麦克风的电压信号只是毫伏级的,而能被RSC-3x使用的整个预放增益信号却要放大到200倍以上。通过RSC-3x内置的预放电路,只需外加少许的几个被动元器件就可以达到这个放大作用。良好的接地措施和消除模拟电路中的交叉干扰会进一步确保良好的识别率。鼓励用户大声说话和接近麦克风可以辅助获得良好的信噪比。

    二、电路设计

    图一是RSC-3x声频预放部分的参考电路。阻值为1.5K的麦克风电阻(Rx)对系统增益具有很大的影响,因此应根据麦克风的敏感度来决定其值的大小。图中的1.5K是典型值。

    下表所列为Rx和Cx的推荐值:

 

Rx

Cx

1K

[1] [2] [3]