基于BERT的中文虚词检测分析

2026.05.07点击:

摘要:<正>中文的虚词虽然没有实际意义,但在语义表达中起到了语法、连接、强调、语气等作用,因此,检测和识别虚词的任务在机器翻译、信息提取和问答系统等中文自然语言处理(NLP)应用程序中至关重要。本文研究了目前较为先进的基于转换器(Transformer)的双向编码器表示(BERT)模型在检测中文虚词任务中的应用,并在CCIR2021-NER数据集上对几种转换器模型进行了验证和评估。最终结果表明,相比于长短期记忆(LSTM)方法,BERT模型能更好地处理中文虚词检测任务,其中MacBERT和LEBERT有最好的性能。

基金资助: 云南省教育厅科学研究基金(2021J0797);

专辑: 信息科技

专题: 计算机软件及计算机应用

分类号: TP391.1