K-Means聚類(lèi)算法研究綜述
摘要:K-均值(K-Means)算法是聚類(lèi)分析中一種基于劃分的算法,同時(shí)也是無(wú)監(jiān)督學(xué)習(xí)算法。其具有思想簡(jiǎn)單、效果好和容易實(shí)現(xiàn)的優(yōu)點(diǎn),廣泛應(yīng)用于機(jī)器學(xué)習(xí)等領(lǐng)域。但是K-Means算法也有一定的局限性,比如:算法中聚類(lèi)數(shù)目K值難以確定,初始聚類(lèi)中心如何選取,離群點(diǎn)的檢測(cè)與去除,距離和相似性度量等。從多個(gè)方面對(duì)K-Means算法的改進(jìn)措施進(jìn)行概括,并和傳統(tǒng)K-Means算法進(jìn)行比較,分析了改進(jìn)算法的優(yōu)缺點(diǎn),指出了其中存在的問(wèn)題。對(duì)K-Means算法的發(fā)展方向和趨勢(shì)進(jìn)行了展望。
注: 保護(hù)知識(shí)產(chǎn)權(quán),如需閱讀全文請(qǐng)聯(lián)系計(jì)算機(jī)工程與應(yīng)用雜志社