想要了解 Google、亞馬遜等公司最前沿的技術可以去哪些網站?

關於Google,亞馬遜等公司最前沿的技術(大數據)可以去哪裡獲取學習資料


一 Google、AMPLab的論文,Cloudera、Databricks等的blog

1. Distributed Systems and Parallel Computing

2. Data Mining - Research at Google

3. Data Management

4. Machine Learning and Artificial Intelligence

5. AMPLab – UC Berkeley

6. Hortonworks Blog

7. Blog – Databricks

8. Blog | Cloudera Engineering Blog

9. https://developer.yahoo.com/blogs/hadoop/

10. High Scalability -

11. Highly Scalable Systems

二 分散式系統論文翻譯集

1. 銀河裡的星星

三 資料集

1. onurakpolat/awesome-bigdata · GitHub

2. youngwookim/awesome-hadoop · GitHub

四 其它

如 @杜龍回答的,微博上關注該領域的大牛,他們時常會分享一些有價值的內容。


如果你想了解IT企業的技術背景等知識,我覺得可以去這些IT公司的官方Tech Blog去找答案,下面我就給你總結一下這些IT公司的官方Tech Blog。

Amazon Seattle, WA

http://aws.typepad.com

Cloudera Palo Alto, CA

http://www.cloudera.com/blog/

Dropbox San Francisco, CA

https://tech.dropbox.com/

Facebook Menlo Park, CA

https://developers.facebook.com/blog/

FourSquare NewYork

http://engineering.foursquare.com/

Google CA

https://developers.googleblog.com/

Github San Francisco, CA

https://github.com/blog/category/engineering

Groupon Chicago, IL

https://engineering.groupon.com/

Linkedin Mountain View, CA

http://engineering.linkedin.com/blog

Netflix Los Gatos, CA

http://techblog.netflix.com/

Quora Mountain View, CA

http://engineering.quora.com/

Square San Francisco, CA

http://corner.squareup.com/

Twitter San Francisco, CA

http://engineering.twitter.com/

Uber San Francisco, CA

https://eng.uber.com/

Yelp San Francisco, CA

http://engineeringblog.yelp.com/

我的微信公眾號:ninechapter中有更多的IT公司的技術和面試介紹,有興趣的可以關注一下


之前做CSDN線上實習生的時候,有找過這些。不過,是spark方向的,但是終究是BD領域的。可能不是特別全,我儘力了,歡迎補充!自取。

其實主要來源很簡單:1.官方論壇、博客;2.各大公司技術博客;3.相關領域活躍網站、ML;4.牛人微博、博客。

l 目前國外Spark資訊、資料(如視頻、音頻、幻燈片)網站主要有哪些;

1.
官方

官方主頁

Welcome to Apache? Hadoop?!

Apache Spark?

2.
知名公司官方博客

cloudera官方博客

Blog | Cloudera Engineering Blog

MapR官方博客

Blog | MapR

Hortonworks官方博客

Hortonworks Blog

DATABRICKS官方博客

Blog – Databricks

Yahoo! 官方博客

https://developer.yahoo.com/blogs/hadoop/

Yahoo Developer Network

3.
其他

http://dzone.com

大數據板塊

Big Data/Analytics Zone

UC-Berkeley amplab

Spark | Search Results

l 目前國內Spark資訊、資料(如視頻、音頻、幻燈片)網站主要有哪些;

1.
IT168旗下論壇

Spark板塊融合進入Hadoop板塊。

Hadoop_分散式數據處理_itpub社區_it168旗下專業技術社區-it168旗下專業技術社區

2.
Chinahadoop

Hadoop相關內容綜合付費/免費在線教育服務平台

小象學院 - 中國最專業的Hadoop,Spark大數據在線教育平台——權威課程:Hadoop培訓,Spark培訓,HBase培訓,Hive培訓,Mahout培訓等

3.
開源中國

Spark板塊

Spark首頁、文檔和下載

4.
Hadooper

中國科學院計算技術研究所
網路科學與技術重點實驗室下屬網站

http://www.hadooper.cn/

l 國外Spark社區(或網上討論組)有哪幾個,規模、特點分別是什麼;

1.
官方

Issues

Spark - ASF JIRA

Apache官方Spark issues社區,活躍度、專業度最高。

Mailing Lists

user@spark.apache.org

供發布用戶幫助、問題、申明使用,使用者甚廣。

dev@spark.apache.org

供貢獻代碼的開發者使用、使用者甚廣。

Summit-Conferences

2014 | Spark Summit

2013 | Spark Summit

Spark峰會,每年一屆,已經舉辦兩屆,是業界最有影響力事件。

Meetups

Spark Meetup Groups

- Meetup

中小型開發者聚會。由開發者自行組織,遍布全球,是重要交流渠道。

Github

Pull Requests · apache/spark · GitHub

官方github pull requests,活躍度高。

2.
知名公司官方社區

Hortonworks官方社區

Forums Archive

cloudera官方社區

Home - Cloudera Community

以上知名公司官方社區特點:社區內容涵蓋了業界動向、技術發展、公司產品討論、技術討論等,但除了公司產品討論板塊比較熱以外,其他的都不溫不火。

3.
其他

Stackoverflow

Posts containing "spark"

較活躍

l 國內Spark用戶目前主要在哪裡交流,規模、特點分別是什麼;

1.
開源中國

Spark交流版塊

Spark首頁、文檔和下載

2.
中國Spark峰會

AMPLab、Databricks、Intel、淘寶、網易等公司的Spark貢獻者參與。Andy
Konwinski(美國Spark Summit組織者)出席

Spark中國峰會

3.
知乎Spark話題板塊

裡面所討論問題較基礎,活躍度不高

Spark - 話題精華

4.
Meetup國內小組

Shanghai Spark Meetup (Shanghai)

- Meetup

http://www.meetup.com/Shenzhen-Spark-Meetup/

5.
個人博客

流量較高,參與度小。

董的博客

l 目前熱心參與國內Spark技術討論的專家有哪些,請整理嘗試他們的聯繫方式;

1.
辛湜

Databricks大數據公司聯合創始人、Spark的核心成員

Weibo @hashjoin

2.
CrazyJvm

皮皮網數據平台負責人

Weibo @CrazyJvm

3.
明風

淘寶技術部,數據挖掘與計算團隊負責人

Weibo @明風Andy

4.
孫元浩

星環科技創始人、前英特爾亞太研發有限公司數據中心軟體部CTO

Weibo @孫元浩pixelray

5.
JerryLead

Spark研究者

Weibo @JerryLead

Github JerryLead (Lijie Xu) · GitHub

6.
連城

Databricks 軟體工程師, Apache Spark 貢獻者

Weibo @連城404

7.
董西成

《Hadoop技術內幕:深入解析MapReduce架構設計與實現原理》和《Hadoop技術內幕:深入解析YARN架構設計與實現原理》作者,目前專註於分散式資源管理和數據計算相關技術.

Weibo @西成懂

Blog 董的博客

張包峰

阿里巴巴數據平台事業部

Weibo @張包峰

Blog 張包峰的博客

尹緒森

Intel 工程師

Weibo @尹緒森

Blog wtf AI ?

Github yinxusen (Xusen Yin) · GitHub


你只能加入他們


大數據云計算技術及應用:數客網 http://www.shookr.com,很多行業的線下活動信息

編程開發問答:http://www.segmentfaulf.co, http://www.stackoverflow.com,用了好多年

IT技術論壇:http://www.csdn.com, 技術內容多年

一些行業的新聞產品:http://www.zdnet.com, 商業化比較嚴重

國外大數據網站:www.datasciencecentral.com, 內容很好,但是英文的


怒答一記Amazon的。

了解Amazon技術的一個好辦法是玩AWS,Amazon Web Services (AWS) AWS提供了雲、資料庫、大數據/MapReduce、流媒體傳輸等各種各樣的技術支持,以及軟體部署等服務。而且AWS的服務範圍還在擴展(比如我很期待的版本庫管理,分分鐘不想公開的project就不用放Github有沒有,也不用自己放一個EC2 Instance專門當遠程倉庫了)。而且大部分服務都有配套的文檔和樣例,慢慢玩,可以玩很久。

Amazon還使用了很多開源的代碼,可以看看 Amazon Web Services · GitHub

其它公司不是很了解,但應該也類似的,可以去Github上找他們的開源項目擼下來看看!如果想非常非常深入了解的話,也許就只能像@vczh 說的一樣,入伙吧...


混進來看代碼吧~


techtarget

computerweekly

這兩個還不錯,訂閱之後可以收到一些技術新聞快遞

另外,感覺csdn的專欄做的也還是不錯的


上微博關注幾個這領域的大牛,慢慢什麼都就知道了


歡迎來36大數據。


推薦閱讀:

對於中國地區熱愛互聯網行業的學生,怎樣規劃自己的職業發展路線,以進入 Google、Facebook 這樣的公司?
如何評價 Google Play 網頁端在 2013 年 7 月的改版?
MIUI 7 會遵循 Material Design 嗎?
Google Play 上面有哪些專門為平板設計的應用和遊戲,怎麼找?
怎樣用google學術搜索一個研究方向被引用次數最多的幾篇文獻?

TAG:亞馬遜Amazoncom | 數據挖掘 | 谷歌Google | 大數據 |