為什麼 Google.com 中文版與英文版搜索結果不同?


http://Google.com.hk 的簡體中文版是默認開啟SafeSearch的,而且無法關閉。

另外Google已經再次啟動對http://Google.com.hk簡體中文版的內容審查。

http://Google.com 的問題,造成這個現象的原因有幾種。

不同數據中心

由於搜索引擎的訪問量都十分巨大,一般搜索結果都會由多個數據中心提供,利用負載均衡技術把用戶轉到不同的數據中心。

這些不同數據中心之間的數據由於種種原因可能並不同步,所以當不同的人在同一個搜索引擎搜索相同關鍵詞的時候,卻有可能使用的是不同的數據中心,因為數據內容不同而看到不同的結果。

就算是同一個人在前後幾秒刷新瀏覽器後,也可能是在使用著不同的數據中心。

用戶IP地址和地理位置

所謂geotargeting。

搜索引擎會檢測用戶的IP地址,並判斷用戶所在地理位置,然後返回更適合這一地理位置的搜索結果。

比如如果用戶來自中國,那麼他看到的結果和來自美國的用戶就很可能不一樣,排在前面的網站有可能會更偏重於與中國相關的內容,這是一個非常常見的現象。

不同國家域名的同一個搜索引擎

大部分搜索引擎除了.com的版本外,還都有不同國家的不一樣版本,比如http://google.com,http://google.cn,google.com.sg,http://google.co.uk,這些不同國家的版本所給出的搜索結果也會不太一樣。

在http://google.co.uk搜索,給的結果就會偏重於與英國有關的網站。在google.com.sg做搜索,又會偏重於與新加坡有關的網站。

這裡所說的」有關」指內容,伺服器地理位置,網站域名等。

個性化搜索

不少搜索引擎比如Google,都提供用戶一個個性化設置。如果這個個性化搜索是打開狀態,Google就會根據用戶以前的搜索記錄,適當調整搜索結果。

網站的排名和以前你做的搜索,所看的網站之間會有一定的關係,按用戶的口味進行調節。

也有人報道個性化搜索沒有打開,Google有時候也會根據以前的搜索記錄,對不同用戶的搜索做出調整。

電腦設置

比如操作系統語言,和擁護地理位置有類似效果。

並且我們在搜索某一keyword的時候,搜索引擎伺服器會把結果緩存起來一段時間,這也是為什麼你連續兩次搜索的時候所用的時間有明顯變化,當緩存失效的時候,結果是可能需要重新經過一輪計算的.


推薦閱讀:

垂直搜索引擎的 suggest 設計,最重要的是什麼呢?
搜索引擎的工作原理是什麼?
周鴻禕似乎在商場四面樹敵人人喊打,那為什麼奇虎 360 依然發展得那麼好?
如何看待豌豆莢改版加入生活服務搜索??
人肉搜索軟體是什麼原理?

TAG:A和B有什麼不同 | 搜索引擎 |