数据清理研究
- 期刊名字:计算机工程与应用
- 文件大小:
- 论文作者:张志兵,李华旸,张勇
- 作者单位:华中科技大学计算机学院
- 更新时间:2023-02-25
- 下载次数:次
论文简介
异构数据的数据清理,侧重于重复记录,异常数值的探测,有效地发现数据源中的重复记录、异常等,笔者通过增加过滤条件的方法提高了字符串匹配算法的效率,加快了重复记录的识别,另外在刷新数据仓库的数据提出了增量式算法,有效地减少了比较的次数,节省了大量时间并确保数据仓库中数据的质量.文章实现了一个数据清理工具原型-DMCleaner,并用其进行了试验,结果表明采用了这些改进以后,数据清理的速度、效率和正确性都有了很大的提高,数据质量得到了保证.
论文截图
热门推荐
-
C4烯烃制丙烯催化剂 2023-02-25
-
煤基聚乙醇酸技术进展 2023-02-25
-
生物质能的应用工程 2023-02-25
-
我国甲醇工业现状 2023-02-25
-
JB/T 11699-2013 高处作业吊篮安装、拆卸、使用技术规程 2023-02-25
-
石油化工设备腐蚀与防护参考书十本免费下载,绝版珍藏 2023-02-25
-
四喷嘴水煤浆气化炉工业应用情况简介 2023-02-25
-
Lurgi和ICI低压甲醇合成工艺比较 2023-02-25
-
甲醇制芳烃研究进展 2023-02-25
-
精甲醇及MTO级甲醇精馏工艺技术进展 2023-02-25
