实验语音学(汉文部分)

发布时间:2023-05-23 16:28:31 | 来源: | 作者: | 责任编辑:

三、实验语音学

近些年来,实验语音学研究已从过去的音素、音节分析扩展到句子和语音篇章的分析。除音色之外,超音段特征包括音高、音强和音长成为实验语音学的重要研究对象。语音规则的合成和识别、人工智能等,都是实验语音学关注的重点。

基于神经网络理论的研究越来越被学界关注,神经网络技术被应用于语音合成与识别,相关研究有:黄晓辉、李京《基于循环神经网络的藏语语音识别声学模型》(《中文信息学报》第5期)一文,将循环神经网络和连接时序分类算法应用于藏语语音识别声学建模,实现端到端的训练;实验结果显示,与传统基于隐马尔可夫模型的声学建模方法相比,循环神经网络模型在藏语拉萨话音素识别上性能优越。

相关研究还有:梁宁娜、邓彦松《基于DTW的藏语语音识别系统设计》(《电子技术与软件工程》10期)一文指出,语音识别技术是让计算机识别人类的语音,并将人类的语音转换为与之对应的命令或操作。基于藏语的语音系统的识别研究现在还不成熟,文章将语音识别技术和藏语的声学特征结合起来,用DTW算法实现对藏语语音进行了识别设计。赵悦、李要嫱等《临近最优主动学习的藏语语音识别方法研究》(《计算机工程与应用》第22期)一文,基于主动学习的藏语拉萨话语音语料标注及选择,该研究提出了一种临近最优的批量样本选择目标函数,并验证了其具有submodular函数性质。通过实验验证,该方法能够使用较少的训练数据保证语音识别模型的精度,从而减少了人工标注语料的工作量。

语音特征参数是语音信号分析的重要依据,藏语语音特征参数的精确度直接影响藏语语音合成、语音识别及语音压缩、降噪等处理的效果。涉及藏语的相关研究有:卓嘎、姜军、董志诚《藏语语音时域参数提取关键技术研究》(《电脑知识与技术》第8期)一文,介绍了藏语时域语音信号处理过程中的语音特征参数及其提取关键技术和算法,分析了语音的时域特征参数在藏语语音分析中的实际应用。都格草、才让卓玛、南措吉《基于谱减法的藏语语音减噪研究》(《广西科学院学报》第1期)一文指出,谱减法是语音减噪中最常用的方法,文章通过统计分析谱减法的增益补偿因子和过减因子参数,研究基于谱减法的藏语语音减噪处理,并取得较为理想的实验结果。

版权所有 。 保留所有权利。 京ICP备06045333号-1

京公网安备 11010502035580号

Baidu
map