世界最大语言资源库是如何建成的?
中国是当今世界上语言资源最丰富的国家之一,“五里不同音,十里不同调”“殊俗问津言语异”说的正是我国语言方言的丰富多样。
打开“中国语言资源保护工程采录展示平台”,首页上是一幅中国地图,一个个红色、蓝色的圆形标记点密密麻麻地交织、遍布于整个中国版图,它们代表了中国语言资源保护工程历时5年完成的1712个调查点的语言资源调查采集。红色代表汉语方言调查点,蓝色代表少数民族语言调查点,涵盖123个语种和全部汉语方言,点击进去,就进入到一个丰富多彩的语言方言世界。
2015年,中国语言资源保护工程(下简称“语保工程”)启动。历经五年建设的一期工程,产出了这项最重要的成果——世界上最大规模的语言资源库和展示平台。
这个覆盖全中国各地区、各语言的大数据库,凝结着全国350多家高校和科研机构4500多名专家学者以及9000余位语言方言发音人的心血和汗水,一大批濒危汉语方言和少数民族语言得到科学系统的调查保护。
方言和母语是祖先一代一代流传下来的声音,连接着过去、现在与未来。不久前,语保工程二期正式启动,在新的五年周期,将利用现代化技术手段,对采集的语言资源进行全面深度的开发应用,全面提升我国语言资源保护和利用水平。
乡音,是刻在我们身体里的思乡密码。这些来自田野调查的珍贵语料将被永久保存、被开发利用。哪怕在更遥远的未来,人们都能从如此丰富的语言中,感受到在这片土地上生活过的人们的喜怒哀乐。
“语言抢救”与时间赛跑
一支古老的阿侬语歌谣响起,浑厚沧桑的男性嗓音、优美的曲调,瞬间把人带到苍翠的山谷中,天边是悠悠的白云,脚下是流淌不息的江水,农田里是劳作的阿爸阿妈,在这动听的歌谣里,有世代生息繁衍的泥土的气息,有老屋上的袅袅炊烟……这歌谣,正是来自语保工程的田野调查。
阿侬人是怒族的一个支系,分布在云南省怒江傈僳族自治州中缅边境地区。
2015年秋天,语保工程启动不久,81岁的中国社会科学院荣誉学部委员、少数民族语言专家孙宏开先生第10次来到怒江傈僳族自治州,对阿侬语开展深入的田野调查。
回望1960年第一次调查阿侬语,那时他还是一个血气方刚的小伙子。在半个多世纪中,他对这个支系语言长时间地跟踪观察,亲历了阿侬语由濒危走向严重濒危的全过程。
▲中国社会科学院民族研究所研究员孙宏开先生及夫人刘光坤编审在四川甘洛调查尔苏语时与当地群众合影
孙宏开先生清晰记得,第一次调查时,这个支系一共有5000多人,有800多人还使用自己的母语。但当他1983年调查的时候,只有500人能够使用自己的母语,而且大部分都是50岁左右的中老年人,小孩则根本不会。1987年、1995年、1999年,他连续6次进行跟踪调查,最后一次去的时候,只有380多个人还能讲母语。
“以前多次调查的发音人,有的已经去世。这次语保工程需要重新物色发音人,但是好不容易找到的发音人,有些词和句子就不如年龄大的发音人知道的多,最后是几个人在讨论中才完成了3000词词表的调查。”孙宏开先生说,使用人口不足1000人的弱势语言,陆续消失是社会发展的趋势,不可逆转,这是人类共同的损失。如果不进行视频记录,这些口头语言很可能就会消失在历史长河中。
上世纪50年代,中国进行了历史上第一次大规模汉语方言和少数民族语言普查工作。
孙宏开先生和今年84岁的语保工程湖南省首席专家、湖南师范大学教授鲍厚星,以及89岁的语保工程山东省首席专家、山东大学教授钱曾怡,都参加了第一次全国普查。时隔60年,当语保工程启动,他们再次“出征”,带队奔赴田野,进行全面系统的抢救性调查记录。
许多语种、方言今天趋于濒危或面临消亡。语保工程宣传片里有一组触目惊心的数据: “在我国现存的130多种语言中,有68种使用人口在万人以下,有48种使用人口在5000人以下,其中有25种使用人口不足千人,赫哲语、苏龙语等使用人数不足百人。”
“语言保护”更像是在与时间赛跑的“语言抢救”。
北京语言大学教授、中国语言资源保护研究中心常务副主任王莉宁介绍,语保工程一期完成了1712个调查点的语言资源调查采集,涵盖全国所有省区市,调查收集到123种语言和全国各地方言的原始文件数据超过1000万条,其中音频数据超过560万条,视频数据超过500万条。一大批濒危汉语方言和少数民族语言得到科学系统的调查保护。
上一篇:八个肢体语言,说明他喜欢你
下一篇:没有了