ISODATA算法的实现与分析 ISODATA算法的实现与分析

ISODATA算法的实现与分析

  • 期刊名字:采矿技术
  • 文件大小:866kb
  • 论文作者:杨小明,罗云
  • 作者单位:长江大学地球物理与石油资源学院,长江大学计算机科学学院
  • 更新时间:2020-09-25
  • 下载次数:
论文简介

ISSN 1671 -2900采矿技术第6卷第2期_2006年6月CN 43 - 1347/TDMining Technology, Vol. 6 ,No.2Jun. 2006ISODATA算法的实现与分析杨小明’,罗云(1.长江大学地球物理与石油资源学院,湖北 荆州市434023;2.长江大学计算机科学学院,湖北荆州市434203)摘要::ISODATA算法是一种基于统计模式识别的非监督学习动态聚类算法,有较强的实用性。介绍了ISODATA算法原理和实现步骤,结合具体算例进行了聚类分析,得到了理想的分类结果,并分析了参数的选取将对分类结果产生的影响。关键词:ISODATA;算法;聚类;模式识别ISODATA算法是- -种聚类划分算法,称为迭代获得的聚类集进行分裂和合并处理,以获得新的聚自组织数据分析或动态聚类。与传统分类方法的根类中心和分类集(其中(4)为分裂处理,(5)为合并本区别是,它是--种软性分类,而传统聚类划分是硬处理)。性的划分。软性分类可以认识到大多数分类对象在(6)再次迭代运算,重新计算各项指标,判别聚初始认知或是初始分类时不太可能显示的最本质属类结果是否符合要求,以此反复经过多次迭代运算,性,这种模糊聚类的过程以一种逐步进化的方式来直至得到理想的聚类结果。逼近事物的本质,可以客观的反映人们认识事物的2具体算例与分析过程,是一-种更科学的聚类方式。依据ISODATA算法,采用C+ +编程语言实1 ISODATA算法现,输入10个样本组成样本集{X,X,,Xg},XISODATA算法是在没有什么先验知识的情况{0.0,0.0} ,X{3.0,8.0} ,X2{2.0,2.0} ,X{1.0,下进行分类,是- -种无监督分类,它是先选择若干样1.0} ,X{5.0,3.0},Xs{4.0,8.0},X{6.0,3.0},品作为聚类中心,再按照最小距离准则使其余样品X,{5.0,4.0} ,X。{6.0,4.0} ,X{7.0,5.0} ,见图1。向各中心聚集,从而得到初始聚类,然后判断初始聚10.类结果是否符合要求,若不符,则将聚类集进行分裂8.0 t和合并处理,以获得新的聚类中心(聚类中心是通.0 t过样品均值的迭代运算来决定的) ,再判断聚类结.0果是否符合要求。如此反复迭代,直到完成聚类刘分操作。ISODATA算法步骤如下:(1)设置聚类分析控制参数,主要包括:期望得到的聚类数K;-一个聚类中的最少样本数θN ,如小于10.0此数就不作为一个独立的聚类;一个聚类域中样本图1输入样本坐标距离分布的标准差Os;两聚类中心之间的最小距离从图1中可以直观地看出,样本集分为3类是θc ,如小于此数,两个聚类进行合并;一次迭代运算较合理的,{Xo,Xz,X}为第1类,{X,X;}为第2中可以合并的聚类中心的最多对数L;允许迭代的类,{X,X,X,X,X,}为第3类。当规定期望得到次数1。的|中国煤化工ATA算法进行迭代计(2)初始分类,将准备分类的N个模式样本JHCNMHG与直观看到的结果是{X;,i= 1,2,.-,N}读人,预选N。个初始聚类中心,- -致时,验证」IDUUAIA 异法分类的准确性。按照与聚类中心距离最小的原则将各样本分类。分别取K (期望得到的聚类数) =2,3,4,运用(3) ~(5)按控制参数给定的要求,将前一次(下转第68页)8采矿技术2006 ,6(2)余设计。操作过程实现双线控制方式,对提升机运部故障时,提升机能实现低速故障运行(2 m/s)在行关健的信号(如速度、位置、安全、减速、过卷等)PLC、监测系统控制软件检测有故障而硬件及连接均采用多重保护,互为监视。完全取代了原机械监无故障时,可以通过旁路工作方式,以旁路软件故障控器的功能;将本次运行结束;,(3) PLC操作控制系统能完成提升机手动、半(7)井上、下信号工可在井上、下信号房内根据自动、全自动、检修及紧急控制等各种运行方式的控实际需要,通过按钮完成慢动功能;制要求以及特殊工I况如下爆破器材、下大件、低速爬(8)整个电控系统的各部分可以通过网络进行行等,并根据提升种类、运行方式、运行的区间自动数据和信号交换,具有远程监视功能。确定运行速度,实现有机联锁;(4)整个电控系统中有不少于3套的提升机安3结束语全保护回路,除每个PLC中具备的软件安全保护随着科技进步与新技术的发展,工业生产过程外,还采用继电器硬接线方式组成的安全保护回路,的自动化程度越来越高,对老设备进行技术改造是对关健环节采用3重或多重保护,保护功能齐全;提高生产力的一-种行之有效的方法。实践证明该控(5)监控系统可实现多画面实时监控,多参量制系统能较好地满足生产的要求,技术先进,控制精数码及曲线显示并加以自动记录,各种故障的报警度高,故障率低,保证了提升系统安全稳定的运行。及记录;(6)故障开车功能。在PLC、监测系统出现局(收稿日期:2005 -05 -24)(上接第66页)迭代次数过大,会引起过度分类;迭代次数过小,又ISODATA算法进行迭代计算,规定的控制参数见表会导致分类不到位,因此要根据具体情况选择合适1 ,输出的分类结果见表2。的迭代次数。标准偏差参数和合并参数改变后对分表1控制参数类结果的改善受到迭代次数大小的影响;当迭代次K初始聚类中 初始聚0N0s0cLI数增加到- -定程度时(约10) ,如果保持标准偏差参心数(N.)类中心数和合并参数不变,则分类结果变化很小。x2X0.5 23结论4以上介绍了ISODATA算法原理和实现步骤,结表2运算结果输出合算例进行了聚类分析,得到了理想的分类结果,并聚类数聚类中心包含的样本2 (5.14,5.00)X,X,Xs, X,x, Xg,X,分析了参数的选取将对分类结果产生的影响。该算(1.00,1.00)Xo,X2,X法要求在分类之前地确定- -些参数,- -定程度上反(3. 50,8. 00)X, Xs映了人机交互的特点,正因为这种人为干预的存在,(1. 00,1.00)X,x,X在某种程度上减少了聚类的盲目性,有利于取得较(5. 80,3.80)X,X;x,X,X(3. 50,8.00)X,X好的分类效果。作者没有在迭代过程中动态修改初X,X2,X始设定的参数,所以可以从该方面改进此算法。(6.004.33)X,Xg,X.参考文献:(5. s0,3.00)X,X。[1]边肇祺,张学工,等 模式识别[ M].北京:清华大学出版社,在运用ISODATA算法分类之前,人为确定- -些2000控制参数,参数的选取将对分类结果产生影响,如表[2] 沈清,汤 霖.模式识别导论[M].长沙:国防科技大学出版社.19912中3种不同的分类结果。算法中r的3个参数:标[3]中国煤化工计教程[M].北京:清华准偏差参数0s、合并参数θc和迭代次数I较重要。标准偏差参数越大,执行分裂的可能性越小,分类数DHCNMH G(收稿日期:2005-12-16)目趋少;合并参数越小,算法迭代过程中合并的可能作者简介:杨小明(1981-),男,湖北孝感人,2003年江汉石性越小,因此在较大程度上保留以前的分类结果。油学院毕业,硕士生,主要从事地球物理测井研究工作。

论文截图
版权:如无特殊注明,文章转载自网络,侵权请联系cnmhg168#163.com删除!文件均为网友上传,仅供研究和学习使用,务必24小时内删除。