文本处理中的MapReduce技术 文本处理中的MapReduce技术

文本处理中的MapReduce技术

  • 期刊名字:中文信息学报
  • 文件大小:
  • 论文作者:李锐,王斌
  • 作者单位:中国科学院计算技术研究所,中国科学院研究生院
  • 更新时间:2023-02-24
  • 下载次数:
论文简介

用于文本处理的很多数据集已经达到TB、PB甚至更大规模,传统的单机方法难以对这些数据进行有效处理.近年来出现的MapReduce计算框架能够以简洁的形式和分布式的方案来解决大规模数据的并行处理问题,得到了学术界和工业界的广泛认可和使用.目前,MapReduce已经被用于自然语言处理、机器学习及大规模图处理等领域.该文首先对MapReduce做了简单的介绍,并分析了其特点、优势还有不足;然后对MapReduce近年来在文本处理各个方面的应用进行分类总结和整理;最后对MapReduce的系统和性能方面的研究也做了一些介绍与展望.

论文截图
版权:如无特殊注明,文章转载自网络,侵权请联系cnmhg168#163.com删除!文件均为网友上传,仅供研究和学习使用,务必24小时内删除。