一种新词检测方法研究 一种新词检测方法研究

一种新词检测方法研究

  • 期刊名字:数字通信
  • 文件大小:
  • 论文作者:钟将,耿升华,董高峰
  • 作者单位:重庆大学计算机学院
  • 更新时间:2022-10-24
  • 下载次数:
论文简介

汉语自动分词是进行中文信息处理的基础.目前,困扰汉语自动分词的一个主要难题就是新词自动识别,尤其是非专名新词的自动识别.同时,新词自动识别对于汉语词典的编纂也有着极为重要的意义.提出一种新的未登录词识别方法,该方法混合了互信息、信息熵及词频等3个评价指标评价新词,并在此基础上添加了垃圾串过滤机制,大幅度提高了新词识别准确率和召回率.

论文截图
版权:如无特殊注明,文章转载自网络,侵权请联系cnmhg168#163.com删除!文件均为网友上传,仅供研究和学习使用,务必24小时内删除。