“世界语言文字‘两库一蓝本’”和“汉语语音
中国日报4月23日电(记者 邹硕)4月22日,北京语言大学语言资源高精尖创新中心通过线上学术发布会的形式,正式推出世界语言和文字基本知识库、世界语言文字名称中文译写规则(简称“两库一蓝本”)以及“汉语语音点查询系统”。
语言是了解一个国家最好的钥匙,为了让国人更好地了解全世界的语言文字基本情况,语言资源高精尖创新中心设立了由孙宏开先生和黄行先生联合主持的“语言识别理论及语言数量统计的方法论研究”重大项目,在全球范围内汇聚各种权威开源信息,经整理加工,构建“世界语言基本知识库”和“世界文字基本知识库”,重点展现世界上7000多种已知语言的存在状况和使用状况,具体内容包括:世界诸语言的国际标准语言代码(ISO 639-3)、语言名称、使用人口、地理分布、语言地位和活力、语言系属、语言类型、方言情况、文字情况等。此外,项目组还基于我国已有国家标准和全球主流翻译软件的翻译结果,以英语音节和汉字对照的方式,研制了“世界语言文字名称中文译写规则”,为世界语言文字名称的中文翻译和文献检索提供了学术蓝本。
本次发布会上,语言资源高精尖创新中心特聘研究员黄行先生还介绍了诸多基于“两库一蓝本”提炼总结的知识点,包括:世界上语言数量最多和最少的国家,世界诸语言的活力地位情况,所辖语种超过100种的全球10大语系,世界上作为母语使用人口最多的20种语言,世界上作为官方语言分布国家最多的10种语言,中国和14个陆地邻国共有的50余种跨境语言,全世界主要文字的样态和源流关系以及中国文字与世界文字的源流关系,依据“一蓝本”首次译写的部分语言的中文名称等。
北京语言大学李宇明教授在点评环节高度评价了“两库一蓝本”。他认为“两库”进一步向国内普及了世界语言文字基本知识,将在诸多领域发挥重要的应用价值:第一,服务教育和科研,将世界语言文字的最新知识补充到教科书中,有利于学生更加客观全面地了解世界的语言文字情况,相关知识库也为今后编写《世界语言志》、更科学地划分语言和方言等提供了知识支撑;第二,服务国家外语规划,例如,阿拉伯语、俄语、英语是“一带一路”地区作为官方语言使用最广的三种语言,因此要重视培养俄语和阿拉伯语的人才语言规划;第三,服务国家安全,例如,我国和周边国家有数量众多的跨境语言,研究好利用好这些语言,对睦邻友好和边防安全等都大有裨益。他还认为“世界语言文字名称中文译写规则”为规范和新译世界语言的中文名称提供了重要的学术蓝本,希望能不断完善争取在不远的将来成为国家标准。
中国社会科学院、北京外国语大学顾曰国教授认为以往的语言学研究更多关注的是语言与个人的关系,对世界语言的总体情况尤其是语言与国家的关系关注不够。“两库一蓝本”基于科学的规划方案,充分考虑了语言和国家之间的关系,取得的成果对语言本体研究、人工智能、语言学习等都具有重要的参考借鉴意义。他还详细介绍了国内外在语言与人脑、语言与人工智能、语言与人类健康等方面的最新研究动态。
语言资源高精尖创新中心特聘研究员、“汉语国际教育优质学习资源建设与应用”重大项目负责人姜丽萍教授在本次发布会上详细介绍了汉语语音点查询系统,该系统主要面向海内外汉语教师、普通话培训人员及相关研究人员等专业人士,为可用于汉语教学、教材编写、汉语语音研究以及普通话测试练习等领域的一个辅助教研平台。
汉语语音点查询系统目前仅开发电脑版,尚未开发手机版,主要提供以语音点为检索条件的词汇查询,对不同词表里的所有字词进行筛选和展示,查询结果穷尽列出符合某一语音点或某一语音点组合信息的所有字词,同时提供词表来源及等级的限定。这里的语音点包括:声母、韵母、声调、声韵母语音特征,及轻声、儿化、变调等音变现象。
汉语语音点查询系统有五种查询方式,具体为:单字搜索、汉语拼音、声母和韵母语音特征、双音节及多音节组合、音变。用户可根据自己的需求选择相应的查询方式进行检索。
汉语语音点查询系统的数据来源,目前收录了《汉语国际教育用分级汉字表》(简称3000字表)、《HSK词汇大纲》(简称HSK5000词)、《普通话水平测试用普通话词语表》(简称PSC词表)等字词表,共有3800多个汉字,多个词条。系统对所录入汉字的拼音、声母、韵母、声调、来源等进行了标注,对所录入词汇的拼音、音节数、等级/来源等也进行了标注。
上一篇:世界最大语言资源库是怎样建起来的?
下一篇:没有了