google pagerank 演算法解析

Google PageRank 演算法解析  什麼是PageRank?PageRank 是Google衡量網頁重要性的工具,測量值範圍為從1至10分別表示某網頁的重要性。在Google工具欄可以隨時獲得某網頁的PageRank值。在這裡我們將透視PageRank的一些特殊之處,從而對其能夠獲得較為深入的了解,使廣大用戶能夠更好的使用和了解Googel。  網站排名的歷史淵源  上世紀90年代早期網路剛剛興起之時,每天都有大量的含有特別行業內容的站點發佈於網上。網上衝浪者卻沒有相應的工具定位這些他們認為存在的,但是卻沒有辦法找到域名或網址的站點。到了1993年,雅虎誕生了。雅虎的誕生為網民減輕了這些煩惱。雅虎最初將每一個它所找到的網站,按照所屬的分類目錄進行劃分組織,建立起一個整潔的、可以逐級查找的資料庫,雅虎同時也在網站上置入一個搜索引擎可以根據資料庫中存在的「關鍵詞」搜索到網站。接著其他搜索引擎如Altavista ,Excite, Lycos等也相繼推出供用戶使用的搜索工具。他們中的大多數是根據找到的元標識中的關鍵詞來識別網站的相關性。    事情好像發展地很順利,但是當站主及網管意識到可以在元標識中插入行業關鍵詞或其他站點代碼,就可以巧妙的得到搜索結果頁面上的較高的位置的時候問題來了。有一段時間,搜索引擎的結果被這些垃圾網站搞得亂七八糟,他們用某些相關的關鍵詞充斥於網站的各個角落,可是展現在用戶面前的實際內容確實糟糕透頂。那些信用較高、地位重要的搜索引擎開始受到挑戰,他們必須採取更好的措施精確為用戶輸出的搜索結果。  Google網頁級別祥解  Google意識到了傳統搜索引擎所面臨的這種問題。如果相關性有網管來控制的話,那麼排名結果必將被他們人為安排的大量相關關鍵詞所污染,掩蔽了真正的相關性。  網路的本質就是超鏈接。我們從邏輯上分析,每個人都讓自己的網站與某些重要的站點相鏈接,那麼,本質上,這個站點就投了對方的一票。當上百上千個站點鏈接到這個站點時,我們認為這個站點是一個很好的很重要的站點也就非常符合邏輯了。  就是在這樣的邏輯推理下,Google的兩位創始人Sergey Brin及Larry Page建立了一個搜索引擎演算法公式,即將排名比重轉移到了網頁意外的因素上。他們的公式被命名為「PageRank」(以創建人Larry Page的名字命名)。Google就是利用這一公式計算鏈接到某一網頁的網站數量,然後按照從1-10分別給予表示重要度的分數。鏈接到網頁的站點越多,PageRank的分數越高。  Sergey Brin和Larry Page在1998年把PageRank技術配置進Google一同推出。結果出乎的成功。Google這種難以認為控制的演算法公司得出的出眾的相關結果大大超過了競爭對手。這種新的演算法不僅有助於提供出權威的高質量的信息,而且使得站主即網管很難利用作弊手段取得較高排名。  Google的PageRank之所以如此重要,就是因為影響網頁排名的因素主要是依賴於網頁意外的因素,而非能夠認為操縱的因素。  Google對PageRank的解釋  在Google網站上有一個專門的域名介紹PageRank(http://www.Google.com/technology/)  PageRank完全依靠的是網路的民主特性,利用大量的鏈接結構表明某個單獨頁面的價值。本質上來說,Google把鏈接轉換為一次投票,當從網頁 A 鏈接到網頁 B 時,Google 就認為「網頁 A 投了網頁 B 一票」。 Google 也不是純粹考慮投票的數量,還對投票的網頁進行分析。本身很重要的網頁的投票有助於增強其他對方網頁的重要度。  重要的是, Google會記錄每次的搜索行為,高質量的網站能夠獲得較高的PageRank分值。當然,重要的網頁如果不能匹配你的查詢就沒有任何價值。所以, Google把PageRank技術及文本匹配技術進行結合從而搜索出既重要又相關的的結果。Google的匹配技術不是只考慮詞條在網頁上的出現次數,而是檢查網頁內容(及鏈接網頁的內容)的所有方面,從而決定該網頁是否匹配你的查詢。  更多信息訪問Google PageRank介紹:  搜索引擎排名與PageRank的關係  雖然每個搜索引擎都嚴格保密各自的明確的搜索演算法,但是搜索引擎分析人士相信搜索引擎結果(排名列表)是「Page Relevance」與「PageRank」因素綜合承繼的結果。  Ranking = (Page Relevance) x (PageRank)  PageRank邏輯演算法無疑是具有重大意義的,而且這種演算法不能夠被網管人員輕易操縱。Google的搜索結果能夠顯示出如此高的相關性無疑也是它能夠獲得徹底成功的重要原因之一。大多數其他搜索引擎已經完全採用同類模式作為自己的搜索演算法,而有的搜索引擎將這種演算法在決定結果排名中的重要程度進行定義後應用與自己的搜索結果中。自網路發展的初期,搜索引擎就一直不斷的努力試圖開發出可以排列相關網頁的搜索演算法。大多數搜索引擎重視於「鏈接流行度」(link popularity),作為評價網頁重要度及用於索引的標準  Google 工具欄  Google工具欄供人免費下載安裝,除了某些有用的功能外,比較顯著的一個特點就是它可以告訴用戶目前正在訪問的每個網頁的PageRank值。  下載後的Google工具欄位於瀏覽器窗口下部,可隨時隨地進行網上搜索。工具欄顯示出每個頁面從1-10不等的PageRank分值。對於Google未索引的網頁,工具欄不會顯示出該頁的PageRank分值。需要提醒的是,該分值是針對網頁而言,而非網站。  註:PR值越高,說明營銷人員要針對相應的搜索詞條獲得較高的排名位置就有更多的競爭。所以,我們建議根據關鍵詞優化你的網頁PR值。  什麼是鏈接流行度?  「鏈接流行度」系統是基於網頁獲得的鏈接的數量及質量而定的。也就是說,指向你的網頁的鏈接數量越多,你的網頁將被搜索引擎認為越重要。數量並不是決定網站重要度的唯一因素,重要度還取決於其他因素,包括被鏈接到本站點的站點的質量、他們的內容的質量及與本站點的行業相關性等。  鏈接到本站點的網頁會把PageRank的部分分值分配到本站點。所以鏈接頁面的PageRank分值越高,分配給本站點的分值也就越高。  PageRank也會被鏈接頁面商店所有導出鏈接所瓜分。譬如,同樣PR為5的鏈接網頁,導出鏈接只有15個的網頁會比導出鏈接為100個的網頁分配給你更多的分值。  所以重要的是要從PR值較高並且總體導出鏈接數量較少網頁才能獲得安全鏈接。  如何檢測鏈接流行度  最簡單的檢測網站流行度的方法就是利用Google搜索,方法如下:  link:www.yoursite.com  其它主要搜索引擎在搜索你的鏈接流行度時都有不同的規則。  建立鏈接流行度提高PageRank  建立鏈接流行度是搜索引擎營銷的一個重要方面。儘管認為的提高PageRank不是意見容易的事,但是你通過改善鏈接流行度就可以不難做到。通過長期不懈的關注建立鏈接的工作,你就會提高站點的PageRank,大大改善自己的站點排名。  就在不久前,Google及其他搜索引擎配製了某些類似與PageRank的演算法成分(如TSPR」Topic Sensitive PageRank」,Hilltop「Links from expert documents」),進一步將決定排名的比重放置在頁面以外因素上。  隨著頁面以外因素在網站排名中受到重視,所以提高加強這些因素的重視就變得越來越重要。當越來越多的網管意識到PageRank及鏈接流行度的重要性時,就不難在同行業中與其他站點進行鏈接交換了。
推薦閱讀:

大學成績的加權平均分的不同演算法間有什麼區別?
子平演算法管理應用(二)
0x5f3759df這個快速開方中的常數的數學依據是什麼?
??讀書筆記 |《未來簡史》簡直就是一部哈姆雷特,一千個人讀過之後都會產生自己對未來不一樣的看法
形象易懂講解演算法II——壓縮感知

TAG:演算法 | 解析 | 算法 |