计算机软件及计算机应用论文_类型感知的汉越
文章摘要:针对汉越跨语言事件检测缺少平行语料,越南语标注困难,需要统一跨语言语义空间,且触发词存在较大的歧义和局限性等问题,提出基于事件类型感知的汉越跨语言事件检测方法。构造类型感知的注意力机制突显事件特征,融入汉越的词位置、词性和命名实体信息,并通过梯度反转(gradient reversal layer,GRL),实现有标注汉语和无标注越南语之间的对抗训练,将从大量汉语新闻文本中学到的语言无关的事件类型特征融入到联合特征提取器中,进行汉越跨语言的无触发词事件检测,缓解越南语的数据稀缺和触发词的局限性。实验结果较最好的基线模型准确率提升了4.32%,取得最优。
文章关键词:汉越跨语言事件检测,无触发词,事件类型感知,梯度反转,语言对抗,
项目基金:国家自然科学基金(61972186,61761026,61762056),国家重点研发计划(2018YFC0830105,2018YFC0830101,2018YFC0830100),