格萨尔:说唱语音研究
一、 研究进展情况
1、课题开题与子课题进展情况
研究计划顺利执行,各子课题取得进展。
2016年4月1日,“《格萨尔》说唱语音的自动识别与格萨尔学的创新发展”项目启动暨专家咨询会在西藏大学召开。来自西藏本地和北京的7位专家在认真听取项目总体情况和研究方案优化情况,以及各个子课题的汇报情况后,纷纷发表意见,提出建议,充分肯定并高度评价《格萨尔》项目,给予项目组成员以极大的帮助和鼓励。各子课题分别消化吸收了专家咨询会上各位专家的意见建议。项目首席专家召开了子课题负责人第一次例会,各子课题负责人分别汇报了修订完善后的研究方案和研究计划,并进行了相关任务的对接。一年多来,各子课题均取得了基础性的进展:
子课题一“基于文献计量分析的《格萨尔》研究历史、现状和趋势”。一是定制专门的文献计量分析软件工具,包括基于文献计量学方法的论文形式和关键词内容分析工具研发,以及基于词向量的短文本分析技术的文献内容挖掘工具研发,已经运用其他领域的数据集进行了多次测试和优化,很快即可在本项目应用;二是筛选《格萨尔》研究的学术文献,尤其是藏文文献,已经选出187篇藏文研究论文。
子课题二“《格萨尔》说唱语音的声学和韵律建模及音字转换研究”。一是录制了斯塔多吉说唱本4部,计200多个小时;二是对多语言言语识别方法开展了相关研究,提出了基于多尺度特征的语音识别建模方法、基于参数共享神经网络的双语语音识别建模方法;三是基于言语中的多层次线索,对融合发音姿态信息的深层神经网络语音识别建模方法进行了探索;四是提出了基于深层循环条件随机场的中文自动分词方法并对藏语的分词和注音进行了探索,实现了藏文分词以及藏语方言国际音标转换的系统。
子课题三“《格萨尔》的多媒体数据库及文本自动标引和知识检索系统”。一是建立了54049词条的藏语短语词条库和133226词条的藏语词语库,为藏文连续文本的切分提供了依据,并对藏文虚词的自动识别方法和技术进行了探索;二是结合子课题一的“短文本分析技术”和子课题二的“基于深层循环条件随机场的中文自动分词方法”,设计并初步论证了中文文献内容的自动标引和检索的技术路线。
子课题四“基于《格萨尔》知识图谱的格萨尔学创新发展”。一是在分析格萨尔学的成长特征和成长空间的基础上,从情报学的多个视角探讨了格萨尔学的多方面成长机制,为前面三个子课题的研究目标实现提供进一步的参考;二是在西藏大学组建了“格萨尔史诗研究科研创新团队”。
2、调查研究及学术交流情况
调查研究工作主要是对非在线的藏文有关文献的调查筛选、《格萨尔学集成》(5卷)等早期文献的复制、在线中英文有关文献的抓取等。学术交流还仅限于项目组内部,等基础性研究更加充分并在说唱语音自动识别有重大突破后再进行国内外学术交流活动。
3、成果推介与宣传
成果宣传推荐方面,报送了两期《工作简报》,因尚处基础研究阶段,还没有举行成果发布会、没有向国家社科基金专刊投稿。
二、 研究成果情况
代表性成果:实现了藏文分词以及藏文文本到藏语方言国际音标转换的系统。
要实现藏语方言语音的识别和分析,需要以国际音标IPA的形式分析藏文文本到藏语方言的发音,构建不同藏文方言由文本到发音的转换对照表。该系统由藏文文本分词系统和藏语方言国际音标转换系统两个子系统构成,后者又包括藏文词汇国际音标转换系统和藏文单音节方言国际音标转换系统两个部分。
藏语在书面语上是统一的,即藏语方言在书写形式上是一样的。藏语主要划分为卫藏、康以及安多三大方言。不同的藏语方言在语音上体现在多个方面,主要特性包括:方言是否有声调、是否有清浊声母的对立以及辅音韵尾是否多寡。首先,基于《格西曲扎藏文辞典》中的藏文词汇,经人工整理、挑选和校对,最终获得七万五千条藏文词汇的电子词典。分词词典的每条词汇都包含藏文、对应的中文、部分词汇带有词性以及对应的拉丁形式。基于格助词添接法,将词典中的名词等转换为对应格的形式,然后将名词的格形式作为词典词条进行词典的扩充,最后在分词时使用扩充后的词典,实现对紧缩词的识别。其次,基于对藏文三大方言六大话系的分析,归纳出了拉萨、日喀则、德格、巴塘、泽库和拉卜楞等六个话系的藏文文本到国际音标的声母、韵母以及声调的转换对照表。
该系统的实现,将有力地推进针对斯塔多吉说唱语音的自动识别和音字转换的研究工作。