计算机软件及计算机应用论文_英语网络非正规语
文章目录
引言
1 相关工作
2 英语NILE特征分析
2.1 英语NILE的类型
2.2 英语NILE的特征
(1)缩略词分析
(2)新义词分析
3 融合统计和规则的英语网络非正规语言表达识别
3.1 英语NILE识别方法
(1)基于统计的方法
(2)基于规则的方法
第一,所有字母都为大写字母的语言单元。
第二,带有“#”的语言单元。
第三,混合数字、符号和字母的语言单元。
3.2英语NILE识别系统设计
4 英语网络非正规语言表达术语库构建
5 结语
文章摘要:网络非正规语言表达(Network Informal Language Expression, NILE)具有的创新性强、超常规化、表达方式口语化等特点,为许多自然语言处理任务带来了挑战。在使用网络语言进行交流的过程中,部分网络非正规语言表达逐渐标准化和规范化,形成网络非正规语言表达术语。通过对46万余条Twitter数据的收集、处理和分析,英语网络非正规语言表达可以在音、形、义层面划分为13类,并对其特征进行分析和总结。结合统计方法和规则方法的优点,设计了统计和规则融合的英语网络非正规语言表达自动识别方法。最终构建规模为7000余条的网络非正规语言表达术语库。
文章关键词: