1.训练通常是离线完成的,对预先收集好的海量语音、语言数据库进行信号处理和知识挖掘,获取语音识别系统所需要的“声学模型”和“语言模型”。
2.识别过程通常是在线完成的,对用户实时的语音进行自动识别。
识别过程通常又可以分为“前端”和“后端”两大模块。
前端模块主要的作用是进行端点检测、降噪、特征提取等;后端模块的作用是利用训练好的“声学模型”和“语言模型”对用户说话的特征向量进行统计模式识别,得到其包含的文字信息。
语音识别技术,目标是将人类的语音中的词汇内容转换为计算机可读的输入。
工作原理:动态时间伸缩方法使用瞬间的、变动倒频通过交换字母顺序,用一个含义广泛的词汇定义了一个新的信号处理技术,倒频谱的计算通常使用快速傅立叶变换。
运用隐马尔可夫模型的方法,频谱特征的统计变差得以测量。
语音识别系统的应用可以分为两个发展方向,一个方向是大词汇量连续语音识别系统,主要应用于计算机的听写机,以及与电话网或者互联网相结合的语音信息查询服务系统,这些系统都是在计算机平台上实现的。
另外一个重要的发展方向是小型化,便携式语音产品的应用,如无线手机上的拨号,汽车设备的语音控制,智能玩具,家电遥控等方面的应用,这些应用系统大都使用专门的第三方软件来实现,特别是近几年来迅速发展的语音信号处理专用芯片和语音识别片上系统的出现。