

基于文本主题相似性的专题文献检索结果的聚类分析
- 期刊名字:情报学报
- 文件大小:
- 论文作者:王秀艳,崔雷
- 作者单位:中国医科大学信息管理与信息系统(医学)系
- 更新时间:2022-04-11
- 下载次数:次
论文简介
在向文献数据库发送检索提问后,用户检索到的往往是数量众多且线性排列的文献记录,如何进一步分类这些文献记录以方便用户使用是信息检索领域的重要课题之一.本文以一个比较狭小的主题(脊髓损伤)为文献查询提问,探索利用原数据库中提供的论文主题相似性信息对检索到的文献记录进行聚类的方法,并对每个类别赋予类别标签.本文①利用生物医学权威文献数据库Medline,分别检索PubMed中有关脊髓损伤的部分文献(源文献),实际操作中我们抽取近两年发表的有关脊髓损伤的1906篇文献中前50篇;②利用PubMed中的"相关文献"功能分别检索出源文献的相关文献(共5108篇),筛选出频次较高的相关文献(出现频次大于或等于5次,共31篇);③形成源文献和相关文献的关联矩阵,根据该矩阵对来源文献进行聚类分析;④分别采用人工分析和主题词的向量空间模型算法提取各类的文献内容或类标签,初步评价分类结果的正确性.经过基于相似性的聚类分析,可以将脊髓损伤的源文献分为3个大类,对比人工分析和主题词向量空间模型方法对来源文献的内容提取,二者基本相符.就本文研究涉及的主题而言,利用文献数据库中提供的论文相关性信息对检索结果进行再次分类的方法是可行的.
论文截图
版权:如无特殊注明,文章转载自网络,侵权请联系cnmhg168#163.com删除!文件均为网友上传,仅供研究和学习使用,务必24小时内删除。
热门推荐
-
C4烯烃制丙烯催化剂 2022-04-11
-
煤基聚乙醇酸技术进展 2022-04-11
-
生物质能的应用工程 2022-04-11
-
我国甲醇工业现状 2022-04-11
-
JB/T 11699-2013 高处作业吊篮安装、拆卸、使用技术规程 2022-04-11
-
石油化工设备腐蚀与防护参考书十本免费下载,绝版珍藏 2022-04-11
-
四喷嘴水煤浆气化炉工业应用情况简介 2022-04-11
-
Lurgi和ICI低压甲醇合成工艺比较 2022-04-11
-
甲醇制芳烃研究进展 2022-04-11
-
精甲醇及MTO级甲醇精馏工艺技术进展 2022-04-11