logo

《藏文高频词辞典》出版发行

作者: 来源:民族出版社 时间:2025-06-27 08:55:28 点击数:
  《藏文高频词辞典》 是一部针对藏文常用词汇编纂的藏汉双解工具书,兼具科学性、知识性与实用性。本书既可供具备中等藏汉双语水平的读者日常查阅,也适合藏语初学者学习使用。
一、编纂目的
  对于广大藏语学习者及使用者而言,掌握多少词汇、具体是哪些词汇,才能满足日常学习、阅读与工作的需求?本辞典的编纂正是对这一核心问题的重要回应。从语言学理论与实践两方面看,高频词(即常用词)在语言中的构词能力、使用频率及语料覆盖率均占有显著优势。因此,学习和掌握藏文高频词,对提升藏文阅读理解能力和实际运用水平至关重要。作为业界权威辞书,《藏汉大辞典》以词语为主体,兼收百科,是一部综合性藏汉双解巨著,共收录词条约5.3万余条。本辞典以《藏汉大辞典》为主要蓝本,结合词汇频率统计结果,筛选出使用频次在10次及以上的词条,共计约1.17万余条。这些高频词汇的累计覆盖率达99.5%,基本能够满足日常学习、阅读及工作的词汇需求。
二、词条遴选
  (一)词频统计用《词表》的构建
  本辞典词频统计用《词表》的词汇容量为34,142条。从语料库中检出的词汇有23,526条。《词表》词汇主要选自张怡荪先生主编的《藏汉大辞典》(民族出版社,1993年12月第1版);另外从以下7种藏文词典和正字法中选取了《藏汉大辞典》中未收录的310多个词条。
  1.格西曲吉札巴.《格西曲札藏文辞典》.北京,民族出版社,1957年12月;
  2.本字典编写组.《新编藏文字典》.西宁,青海民族出版社,1979年6月;
  3.西北民院藏文教研室编.《藏汉词典》.兰州,甘肃人民出版社,1979年10月;
  4.索朗降村编著.《藏文词典》.拉萨,西藏人民出版社,1980年5月;
  5.堪本编著.《中小学生藏语文词语解释集》.兰州,甘肃民族出版社,1990年7月;
  6.泽旺朗嘉编.《藏文同音词典》.北京,民族出版社,1958年6月;
  7.贝康译师.《藏文正字法——语灯详释》.北京,民族出版社,1989年10月。
  (二)词条遴选规则
  1.理论依据:参考了近年来语料库语言学、计算语言学、词汇学和词汇频度统计研究的成果。词汇的选词原则与方法参照了《信息处理用现代汉语分词规范及自动分词方法》《现代汉语语法信息词典》和GB10112-88《确立术语的一般原则与方法》等专著和国家标准。
  2.选词范围:
  (1)入选词条:《藏汉大辞典》以及其他7种词典和正字法中的词条,无论是“十明”中的词汇,还是古词、敬语、藻词、梵文和方言,凡符合下列条件的就全部入选。
  ①单纯词:单音节、双音节和多音节的单纯词均入选,其中包括音译词和梵音词。藏文的单音节单纯词大多是合成词的词根或语素。单纯词的统计对全面了解藏文语素的状况,尤其是其中使用频度高、构词能力强的语素的状况具有重要作用。
  ②合成词:双音节的合成词均入选。这类合成词是藏语词汇系统的主体,也是词频统计的主要对象,其中的高频词均收入本辞典。
  ③其他:凡属划分成语素或合成词后,会失去原有词语意义的多音节词汇,像成语、熟语、缩略词、合称词等均入选。如:བཀྲ་ཤིས་བདེ་ལེགས། (吉祥如意)、ཕུན་སུམ་ཚོགས་པ།(丰盛圆满)。
  (2)未选词条:凡人名、地名(包括山名、水名、寺名)、书名一般不选,但其中一些比较常见的适当入选。
  (3)词组词条:对词组词条的入选作了比较严格的限制,具体规则有以下2条:
  ①词组选取:词组是语素或词按照一定方式结合起来的语言单位。一般来说,若词组划分成语素或词后不影响对语义理解的不予收入。如:མི་དམངས་དངུལ་ཁང་།(人民银行)、ལག་རྩལ་སློབ་གྲྭ།(技术学校);而由语法虚词关联的词组,若是划分成词后会失去原有意义的则予以收入。如:ལྟ་ན་སྡུག་པ།(美丽)、བསམ་གྱིས་མི་ཁྱབ།(出乎意料)。
  ②凡属“十明”范畴的术语,无论是词还是词组一般都选取。
  (三)语料库规模及相关频度信息
  本辞典词频统计所采用的藏文语料来自20世纪末国内出版的藏文图书、报纸、期刊的电子文档。从1.3亿字节的语料库中,按7个分类,即报刊、文学、教育、科技、佛学、历史和五明等,随机各抽取了1千万字节语料。总抽取字节数为70,040,328(bytes),字符数(北大方正藏文编码,2个字节为1个字符)为34,070,212个,其中包括极少量非藏文字符,不包括ASCII码。本辞典的词条及其频率数据依据《现代藏文频率辞典》(卢亚军主编,民族出版社2007年10月出版)。
  本辞典选取的频次10次以上的词条11,700多个,累计频率达到99.5%。其中:第1,000条词条的频次为1,543,前1000条累计频率83.37%;第3,000条的频次为251,前3000条累计频率94.31%;第5,000条的频次为148,前5000条累计频率96.02%;第9,000条的频次为28,前9000条累计频率99%;其余14,526个词条的覆盖率仅占1%,频次为0次的词条有10,598条,占《词表》词条总数的31.057%。
三、词条注释

  本辞典词条的藏汉双解注释,主要参照《藏汉大辞典》。编撰过程中,对部分词条的汉文释义进行了酌情修订;替换了若干语义晦涩的例句;并酌情增补了部分例句。 所有替换及新增的例句,均选自编者多年加工积累的、规模达百万句对的藏汉对照平行语料库。
相关推荐