PageRank 演算法為什麼會躋身數據挖掘十大經典演算法之列?
the IEEE International Conference on Data Mining (ICDM) 2006年12月評選出了數據挖掘領域的十大經典演算法:C4.5, k-Means, SVM, Apriori, EM, PageRank, AdaBoost, kNN, Naive Bayes,CART
為什麼其中會有Google網頁排名的演算法呢,看到很多數據挖掘,機器學習的書上都不會講這個演算法。它跟數據挖掘有什麼聯繫嗎?
在學習數據挖掘和機器學習的演算法過程中,確實有很多教材不會專門寫 PageRank 演算法,但是這並不表明 PageRank 演算法不重要。在圖演算法領域中,個人覺得 PageRank 演算法應該是非常經典的演算法,除此之外,還有 FastUnfolding 演算法等。另外,可以去 GOOGLE 上搜索一下 PageRank 那篇經典文章的引用量,這個指標也能夠反映一定的重要性。
之前在研究圖演算法的時候,專門學習了 PageRank 演算法,並且整理過一份資料,供大家參考。《Graph Analysis and Its Application》
謝邀。
很多機器學習的書沒有提到它,是因為PageRank比較像graph theory或network之類的演算法,和傳統的演算法(supervised和unsupervised)的都不一樣。但新一點的課本有一課專門提到它,如Anand Rajaraman和Jeffrey Ullman的《Mining of Massive Datasets》(http://infolab.stanford.edu/~ullman/mmds/book.pdf)。
PageRank的厲害很多處都有提,在此不詳述。但要知道的是,PageRank這個點子引發了很多相關的演算法,如社交網路尋找重要人物、專業論壇算出專家(ExpertiseRank)、金融危機中找出最重要的金融機構去救市(DebtRank)等。2013年8月16日谷歌當機5分鐘,全球網路流量下降4成。如果一個演算法可以如此深刻的影響人類的話那麼他就是經典演算法了,即使他的設計思想非常簡單(正如其他的演算法也都有「要是我早生10年我也能想出來」這種感覺一樣)。
剛剛用了PageRank演算法給電網節點重要度給排了個序,好用不貴
可能死變現能力最強的演算法了吧
大概是因為 PageRank 背後的數學原理 (Perron-Frobenius theorem) 十分的優雅。
好用啊, 隨便整個圖, 就能給結點來個權值
十大演算法里也沒有FP-Growth么?差評
推薦閱讀:
※100 個數,如何遍歷得到所有全排列?
※『一道很難的智力題』解法
※我有一個1*n的格子帶,上面有n個單位格子,需要把其中m個格子染上色。我現在有三種演算法,哪種符合要求?
※這套神奇的演算法,比網易雲音樂更懂你
※遊戲中渲染層實體如何平滑的做插值?