精品国产一级毛片大全,毛片一级在线,毛片免费观看的视频在线,午夜毛片福利

我要投稿 投訴建議

kmeans算法報(bào)告總結(jié)

時(shí)間:2021-05-09 18:54:55 其他報(bào)告 我要投稿

關(guān)于kmeans算法報(bào)告總結(jié)

  一、 背景知識(shí)簡(jiǎn)介:

關(guān)于kmeans算法報(bào)告總結(jié)

  Kmeans算法是一種經(jīng)典的聚類算法,在模式識(shí)別中得到了廣泛的應(yīng)用,基于Kmeans的變種算法也有很多,模糊Kmeans、分層Kmeans等。

  Kmeans和應(yīng)用于混合高斯模型的受限EM算法是一致的。高斯混合模型廣泛用于數(shù)據(jù)挖掘、模式識(shí)別、機(jī)器學(xué)習(xí)、統(tǒng)計(jì)分析。Kmeans的迭代步驟可以看成E步和M步,E:固定參數(shù)類別中心向量重新標(biāo)記樣本,M:固定標(biāo)記樣本調(diào)整類別中心向量。K均值只考慮(估計(jì))了均值,而沒(méi)有估計(jì)類別的方差,所以聚類的結(jié)構(gòu)比較適合于特征協(xié)方差相等的類別。

  二、 k-means聚類算法

  k-means 算法接受參數(shù) k ;然后將事先輸入的n個(gè)數(shù)據(jù)對(duì)象劃分為 k個(gè)聚類以便使得所獲得的聚類滿足:同一聚類中的對(duì)象相似度較高;而不同聚類中的對(duì)象相似度較小。聚類相似度是利用各聚類中對(duì)象的均值所獲得一個(gè)“中心對(duì)象”(引力中心)來(lái)進(jìn)行計(jì)算的。

  K-means算法是最為經(jīng)典的基于劃分的聚類方法,是十大經(jīng)典數(shù)據(jù)挖掘算法之一。K-means算法的基本思想是:以空間中k個(gè)點(diǎn)為中心進(jìn)行聚類,對(duì)最靠近他們的對(duì)象歸類。通過(guò)迭代的方法,逐次更新各聚類中心的'值,直至得到最好的聚類結(jié)果。

  (1)算法思路:

  首先從n個(gè)數(shù)據(jù)對(duì)象任意選擇 k 個(gè)對(duì)象作為初始聚類中心;而對(duì)于所剩下其它對(duì)象,則根據(jù)它們與這些聚類中心的相似度(距離),分別將它們分配給與其最相似的(聚類中心所代表的)聚類;然 后再計(jì)算每個(gè)所獲新聚類的聚類中心(該聚類中所有對(duì)象的均值);不斷重復(fù)這一過(guò)程直到標(biāo)準(zhǔn)測(cè)度函數(shù)開(kāi)始收斂為止。一般都采用均方差作為標(biāo)準(zhǔn)測(cè)度函數(shù). k個(gè)聚類具有以下特點(diǎn):各聚類本身盡可能的緊湊,而各聚類之間盡可能的分開(kāi)。

  該算法的最大優(yōu)勢(shì)在于簡(jiǎn)潔和快速。算法的關(guān)鍵在于初始中心的選擇和距離公式。

  (2)算法步驟:

  step.1---初始化距離K個(gè)聚類的質(zhì)心(隨機(jī)產(chǎn)生)

  step.2---計(jì)算所有數(shù)據(jù)樣本與每個(gè)質(zhì)心的歐氏距離,將數(shù)據(jù)樣本加入與其歐氏距離最短的那個(gè)質(zhì)心的簇中(記錄其數(shù)據(jù)樣本的編號(hào))

  step.3---計(jì)算現(xiàn)在每個(gè)簇的質(zhì)心,進(jìn)行更新,判斷新質(zhì)心是否與原質(zhì)心相等,若相等,則迭代結(jié)束,若不相等,回到step2繼續(xù)迭代。

【關(guān)于kmeans算法報(bào)告總結(jié)】相關(guān)文章:

算法類論文開(kāi)題報(bào)告11-11

績(jī)效工資的算法10-13

失業(yè)保險(xiǎn)的算法06-10

年假加班工資的算法10-10

辭退員工補(bǔ)償扣稅算法05-17

《基于導(dǎo)納的圖像加密算法的研究》的開(kāi)題報(bào)告09-20

工齡的四種算法12-03

常見(jiàn)的算法面試題解法09-21

個(gè)人所得稅計(jì)算法09-07