介紹 Google 搜索技術的書有哪些?

演算法及技術實現


介紹純google搜索技術的書籍比較少

(國內的經典著作有天網實驗室出品的: 搜索引擎技術,原理和系統是介紹天網的技術細節的

http://book.douban.com/subject/1481158/

國外的書籍接觸的比較少),

在可公開的範圍內技術交流還是主要通過論文的形式, 一些經典的東西現在來看, 仍然有非常高的價值, 雖然各種技術和演算法更新很多, 從了解技術的角度來看, 不算過時. 貼幾篇高引用的google 論文

信息檢索部分:

  • google開山之作: google 98論文

The Anatomy of a Large-Scale Hypertextual Web Search Engine

原文: http://infolab.stanford.edu/~backrub/google.html#1

譯文: http://wenku.baidu.com/view/99e15e1755270722192ef7e0.html譯文有些專有名字翻的比較怪, 還有一些表述不準確的地方, 僅供參考.

  • google的立身之本: PageRank論文

The PageRank Citation Ranking: Bringing Order to the Web.

原文: http://ilpubs.stanford.edu:8090/422/

分散式系統部分:

  • Mapreduce:

MapReduce: Simplified Data Processing on Large Clusters

原文: http://labs.google.com/papers/mapreduce.html

  • Bigtable:

Bigtable: A Distributed Storage System for Structured Data

原文: http://research.google.com/archive/bigtable.html

其他的細分方向和深入論文, 請參考

http://research.google.com/pubs/papers.html


在豆瓣上找到了一個有關Google的豆列,僅供參考:http://book.douban.com/doulist/37033/


Google搜索核心演算法是PageRank,僅有Pagerank還不夠,需要有強大的後台支持。

Google搜索的後台程序:爬蟲+桶+索引

這些後台程序都是運行在GFS+BigTable只上的.

這裡有一篇簡析 Google Architecture and PageRank


推薦閱讀:

那些互聯網公司,特別是像中國的BAT,google,facebook,twitter這些大公司,是怎麼樣賺錢的?
為什麼有人喜歡用原生安卓?
微軟最大的競爭對手究竟是誰,蘋果、谷歌還是亞馬遜?
為什麼安卓系統下收費軟體不如蘋果系統普及,對於安卓系統下的收費平台會如何發展有什麼看法?
如何看待黃旭東作為谷歌演講嘉賓?

TAG:谷歌Google | Google文獻搜索技巧 |