×
语言研究

航空航天科学与工程论文_基于自然语言处理的空

文章摘要:为了预防空管系统不安全事件的发生,利用人为因素分析和分类系统模型(HFACS)和自然语言处理技术,研究空管系统危险源文本分类方法。根据改进的HFACS模型建立空管系统危险源指标体系,选取民航安全管理系统的危险源数据库作为生语料库,将空管系统危险源生语料库划分为四层进行编码。为解决空管系统危险源数据库小样本、多标签、样本不均衡的问题,分别采用基于TFIDF-TextRank关键词提取文本分类方法和基于CNN和BERT模型的文本分类方法进行试验,试验结果表明:TFIDF-TextRank的关键词提取的文本分类方法的准确率和召回率明显优于基于CNN和BERT模型的分类方法, 关键词提取提取方法可以有效处理小语料库文本分类问题,并有助于进一步研究空管系统不安全事件的形成机理。此外,构建的危险源关键词库有助于安全信息描述的规范化。

文章关键词:

项目基金: