三、实验语音学
实验语音学的成果为自然语言的处理提供了强有力的支持。相关的成果有:夏吾措的《基于PAS6600的藏语送气/不送气辅音气流信号研究》(《西北民族大学学报》自然科学版第3期)一文,以藏文字母中七组送气与不送气辅音为研究对象,利用语音空气动力学PAS6600提取各个辅音的气流信号参数,从呼气时长、平均呼气速度、呼出气流量等三项参数,分析相同辅音的各项参数在不同性别间存在的差异,即男性的呼出气流量比女性的呼出气流量要大,这主要跟其生理特征有直接的关系。王庆楠、郭武、解传栋的《基于端到端技术的藏语语音识别》(《模式识别与人工智能》第4期)一文,提出将已有的语言学知识结合至端到端的声学建模中,采用绑定的三音子作为建模单元,解决建模单元的稀疏性问题,大幅提高声学建模的区分度和鲁棒性。在藏语测试集上,通过实验证明文中方法提高基于链接时序分类技术的声学模型的识别率,并验证语言学知识和基于端到端声学建模技术结合的有效性。代龙翔、李冠宇、马宁的《基于谱减法语音增强效果研究》(《西北民族大学学报》自然科学版第2期)一文,介绍了语音增强的发展历程以及面向藏语语音的研究现状。文章选择经典的谱减法作为语音增强方法,并介绍了谱减法原理,同时设计实验方案,实验语料使用纯净语音和噪音混合成的带噪语音,按照不同信噪比进行语音测试,得出结论:使用谱减法能够明显提升语音质量,提升效果随着噪音语音相关度的多少而变化。曲珍、扎西加、春燕的《最大熵软决策树HMM最大似然藏语音合成》(《计算机工程与设计》第4期)一文,针对传统的硬决策树藏语音合成系统存在泛化性能不强的问题,设计改进一种二进制软决策树算法,实现基于语境因子的藏语音合成模型参数估计。内部节点根据子代节点隶属度进行选取,每个节点可视为基于语境依赖隶属度的模糊集合,将每个语境分配给几个重叠的叶节点,提高模型概括和函数逼近性能;采用最大熵平滑分布进行局部一阶矩和全局二阶矩特征捕捉,实现隐式马尔可夫(HMM)输出概率分布的软决策参数最大似然估计。仿真验证结果表明,所提算法在满足应用实时性要求的前提下,可有效提高藏语音合成效果。才让卓玛、才智杰的《基于语料库的藏语语音合成单元选择算法》(《中文信息学报》第5期)一文,针对藏语言文字的特点,提出以基本构件、组合构件、字、词及句单元相融合的混合单元语音合成策略,并提出了藏语语音合成混合单元选择算法。主观评价与客观评测数据表明该策略与算法有效和合理,各类合成单元在开放语料上的覆盖率与语音合成效果均达到预期的目标。
版权所有 。 保留所有权利。 京ICP备06045333号-1
京公网安备 11010502035580号