鉴于藏语实验语音学和计算语言学在研究方法和研究对象上各有偏重,在实践过程中又互有交叉,本文将二者放在一起进行讨论。藏语实验语音学和计算语言学在2009年都取得了令人可喜的成绩,据不完全统计,2009年度有近30篇相关论文发表。
(一)实验语音学
藏语实验语音学,主要以人的发音生理为主要研究对象。语音韵律、音节时长、语音识别和具体的语音特征等都是藏语实验语音学研究关注的对象。相关的研究有:李勇、于洪志、达哇彭措的《基于关联规则的藏语语音韵律参数提取》(《微计算机信息》第6期),陈琪、李永宏、陈小莹、周一心、于洪志等人的《藏语天气预报语音基于词汇层面的藏语拉萨话音节时长统计》(《科技信息》第19期),姚徐、李永宏、单广荣、于洪志等人的《藏语孤立词语音识别系统研究》(《西北民族大学学报》自然科学版第1期),陈小莹、陈晨、胡妍茹、李永宏、华侃的《基于EGG信号的安多藏语元音嗓音特征研究》(《第十届全国人机语音通讯学术会议暨国际语音语言处理研讨会论文摘要集》2009年),龙从军的《藏语玛曲话元音央化分析》(《第十届全国人机语音通讯学术会议暨国际语音语言处理研讨会论文摘要集》2009年)。
言语声学参数系统和语音语料库的设计对实验语音学的研究来讲极其重要。杨阳蕊、李永宏、于洪志等的《言语声学参数分析系统设计》(《西北民族大学学报》自然科学版第1期)和《基于半音节的藏语连续语音语料库设计》(《第十届全国人机语音通讯学术会议暨国际语音语言处理研讨会论文摘要集》2009年)对上述问题进行了阐述。文章结合实验语音学和传统语言学的研究方法,以不同语音类型所表现出的具有代表性的声学参数为基础,设计并实现了言语声学参数分析系统并根据古藏文音韵体系,建立了基于半音节的藏语连续语音语料库,为语音的分析和研究提供了方便的工具。
(二)计算语言学
计算语言学通常意义上是指通过建立形式化的数学模型,来分析、处理自然语言,并在计算机上用程序来实现分析和处理语言材料,从而达到以机器来模拟人的部分乃至全部语言能力。2009年度藏语计算语言学研究涉及藏语文数据库的结构设计、分类、编码、排列、选择、统计等,还有部分研究涉及人工智能、机器翻译以及藏语文的信息化。
藏文的编码与识别是实现藏语文信息化的基础。与之相关的研究主要有:李永宏、何向真、艾金勇、于洪志的《藏文编码方式及其相互转换》(《计算机应用》7期),张高杰、付涛、于洪志的《藏文桑布扎1.0编码与同元编码转换技术》(《电脑知识与技术》27期),武光利、于洪志、柳春的《藏文同元码与基本集相互转换的规则与实现》(《计算机工程与应用》29期),群诺的《藏文短消息UNICODE编码传输协议的实现》(《西藏大学学报》自然科学版第1期),安见才让的《多编码环境下藏字内码识别算法的研究》(《微机处理》第5期),陈蕙的《藏语非编网编译制作系统的应用》(《电视技术》第9期),陈小莹、李永宏、陈晨、陈琪、于洪志的《基于大字符集编码的藏梵文的混合排序》(《西北民族大学学报》自然科学版第3期),梁弼、王维兰、钱建军的《基于HMM的分类器在联机手写藏文识别中的应用》(《微电子学与计算机》第4期)以及才智杰的《藏文自动分词系统中紧缩词的识别》(《中文信息学报》第1期)。
高定国、关白的《回顾藏文信息处理技术的发展》(《西藏大学学报》社科版第3期)和石方夏、王亮的《藏文信息处理历史及现状分析》(《西藏民族学院学报》第4期)是对中国藏语文信息化建设的一次总结。文章通过对藏文信息处理历史的回顾,结合目前的研究状况和研究成果,对藏文信息处理的标准化工作、藏文字处理工作、藏文操作系统的研发等方面进行了分析,对我国在藏文信息处理方面所取得的成就作了介绍,并对这一领域研究工作中存在的问题进行了分析,旨在从整体上掌握和了解我国藏文信息处理的研发情况,有利于今后藏文信息处理研究工作的开展。
藏语文数据库的结构设计、排列、数据分类、统计等同样是藏语文计算语言学关注的重点。这方面的主要研究成果有:才让加的《藏语语料库词语分类体系及标记集研究》(《中文信息报》第4期),姚徐、郭淑妮、李永宏、于洪志的《多级索引的藏语分词词典设计》(《计算机应用》S1期),杨阳蕊、李永宏、于洪志的《基于半音节的藏语连续语音语料库设计》,(《第十届全国人机语音通讯学术会议暨国际语音语言处理研讨会论文摘要集》2009),刘文香的《藏文音节校对模型建设研究》(《西北民族大学学报》自然科学版第2期);廖艳莎、杨阳蕊、李永宏、于洪志、华侃等人的《藏文单音节动词的形态变化及类型统计》(《科技信息》第5期),苏俊峰、祁坤钰、本太的《基于HMM的藏语语料库词性自动标注研究》(《西北民族大学学报》自然科学版第1期),曹玉林、索南当周的《英藏机器翻译系统的语言模型及总体结构设计》(《西南民族大学学报》自然科学版第2期);才藏太的《班智达藏文语料切分词典的建立与算法研究》(《计算机应用》第7期),艾金勇、于洪志、李永宏的《藏文字形结构计量统计分析》(《计算机应用》第7期)和金慧敏、廖燕莎、史菁、陈琪等的《藏语方言计算机辅助系统的研究》(《科技信息》第1期)。
版权所有 。 保留所有权利。 京ICP备06045333号-1
京公网安备 11010502035580号