介紹 Google 搜索技術的書有哪些?
演算法及技術實現
介紹純google搜索技術的書籍比較少
(國內的經典著作有天網實驗室出品的: 搜索引擎技術,原理和系統是介紹天網的技術細節的http://book.douban.com/subject/1481158/
國外的書籍接觸的比較少), 在可公開的範圍內技術交流還是主要通過論文的形式, 一些經典的東西現在來看, 仍然有非常高的價值, 雖然各種技術和演算法更新很多, 從了解技術的角度來看, 不算過時. 貼幾篇高引用的google 論文信息檢索部分:- google開山之作: google 98論文
The Anatomy of a Large-Scale Hypertextual Web Search Engine
原文: http://infolab.stanford.edu/~backrub/google.html#1
譯文: http://wenku.baidu.com/view/99e15e1755270722192ef7e0.html譯文有些專有名字翻的比較怪, 還有一些表述不準確的地方, 僅供參考.
- google的立身之本: PageRank論文
The PageRank Citation Ranking: Bringing Order to the Web.
原文: http://ilpubs.stanford.edu:8090/422/
分散式系統部分:
- Mapreduce:
MapReduce: Simplified Data Processing on Large Clusters
原文: http://labs.google.com/papers/mapreduce.html
- Bigtable:
Bigtable: A Distributed Storage System for Structured Data
原文: http://research.google.com/archive/bigtable.html
其他的細分方向和深入論文, 請參考
http://research.google.com/pubs/papers.html
在豆瓣上找到了一個有關Google的豆列,僅供參考:http://book.douban.com/doulist/37033/
Google搜索核心演算法是PageRank,僅有Pagerank還不夠,需要有強大的後台支持。Google搜索的後台程序:爬蟲+桶+索引
這些後台程序都是運行在GFS+BigTable只上的.
這裡有一篇簡析 Google Architecture and PageRank推薦閱讀:
※那些互聯網公司,特別是像中國的BAT,google,facebook,twitter這些大公司,是怎麼樣賺錢的?
※為什麼有人喜歡用原生安卓?
※微軟最大的競爭對手究竟是誰,蘋果、谷歌還是亞馬遜?
※為什麼安卓系統下收費軟體不如蘋果系統普及,對於安卓系統下的收費平台會如何發展有什麼看法?
※如何看待黃旭東作為谷歌演講嘉賓?
TAG:谷歌Google | Google文獻搜索技巧 |