聚類與分類有什麼區別?
01-07
首先對經驗數據進行分析,得到特徵屬性,以此特性進行挖掘,希望得到劃分結果,這屬於聚類還是分類?例如,已購買某產品的用戶具有一些特性,得到用戶畫像,我採用某種演算法分析出大量用戶中可能購買此商品的用戶群,這是聚類還是分類?雖然我事先知道劃分的結果是可能/不可能,但這個應該屬於聚類吧?另外,如能夠傳授些聚類演算法,用於分析用戶的就更感謝了!
-----好吧-----自己的坑自己填上,以下都是自己總結和研究--我盡量以非常通俗的語言解釋
-----------------------------------------------開始-------------------------------------------------------------聚類有一天老闆給你一堆數據,就像是這樣的。。。。。然後他說,你給我分類(聚類)出來,然後拍拍屁股走人了,辦公室里留下你孤獨的身影。。。
誒?這個我給的數據明明是三維的,你咋給我拍成二維了,因為我用了二向箔武器啊。。。。。。
不鬧你要三維的,給你便是;然後數據是這樣的;
「好」
分類分為有監督,無監督,半監督,分別對應有無標籤為-有-無-有一點有監督就是樣本數據給定所有標籤,然後去訓練分類器,這是能達到最高精度的一種無監督也就是通常意義上的聚類,只給數據,不給標籤半監督這個厲害了,絕大多數數據不給標籤,然後給一小部分數據貼上標籤,再送分類器裡面,用有監督的方式解決偏聚類問題!給個形象的圖就是;謝邀:首先你要明白一個概念,聚類和分類的最基本區別。分類簡單來說,就是根據文本的特徵或屬性,劃分到已有的類別中。也就是說,這些類別是已知的,通過對已知分類的數據進行訓練和學習,找到這些不同類的特徵,再對未分類的數據進行分類。而聚類的理解更簡單,就是你壓根不知道數據會分為幾類,通過聚類分析將數據或者說用戶聚合成幾個群體,那就是聚類了。聚類不需要對數據進行訓練和學習。分類屬於監督學習,聚類屬於無監督學習。常見的分類比如決策樹分類演算法、貝葉斯分類演算法等聚類的演算法最基本的有系統聚類,K-means均值聚類,這些都很常見,網上資料一大推,不再贅述。
1一個是監督學習,另一個是非監督的學習 還有一個半監督的學習2. 無監督的分類就是聚類
我的老師把聚類演算法統稱為 「Yes Sir!」 演算法
因為每次你用聚類演算法的時候:「請把這些數據分成3類」
「Yes Sir!」「請把這些數據分成30類」「Yes Sir!」「請把這些數據分成300類」
「Yes Sir!」...關鍵是你怎麼知道要分成幾類。。。攤手推薦閱讀:
※數據挖掘SPSS,Python,《機器學習實戰》先學什麼好?
※LDA訓練出主題之後,怎麼再通過主題計算出一篇文檔對於所有主題的分布呢?
※IBM spss modeler 是什麼?
※如何從數據挖掘入門到數據挖掘高手?
※數據降維和特徵選取有什麼區別?
TAG:數據挖掘 |