想要了解 Google、亞馬遜等公司最前沿的技術可以去哪些網站?
關於Google,亞馬遜等公司最前沿的技術(大數據)可以去哪裡獲取學習資料
一 Google、AMPLab的論文,Cloudera、Databricks等的blog1. Distributed Systems and Parallel Computing2. Data Mining - Research at Google3. Data Management
4. Machine Learning and Artificial Intelligence
5. AMPLab – UC Berkeley6. Hortonworks Blog7. Blog – Databricks8. Blog | Cloudera Engineering Blog9. https://developer.yahoo.com/blogs/hadoop/10. High Scalability -11. Highly Scalable Systems二 分散式系統論文翻譯集1. 銀河裡的星星三 資料集
1. onurakpolat/awesome-bigdata · GitHub2. youngwookim/awesome-hadoop · GitHub四 其它如 @杜龍回答的,微博上關注該領域的大牛,他們時常會分享一些有價值的內容。如果你想了解IT企業的技術背景等知識,我覺得可以去這些IT公司的官方Tech Blog去找答案,下面我就給你總結一下這些IT公司的官方Tech Blog。
Amazon Seattle, WA
http://aws.typepad.com
Cloudera Palo Alto, CA
http://www.cloudera.com/blog/
Dropbox San Francisco, CA
https://tech.dropbox.com/
Facebook Menlo Park, CA
https://developers.facebook.com/blog/
FourSquare NewYork
http://engineering.foursquare.com/
Google CA
https://developers.googleblog.com/
Github San Francisco, CA
https://github.com/blog/category/engineering
Groupon Chicago, IL
https://engineering.groupon.com/
Linkedin Mountain View, CA
http://engineering.linkedin.com/blog
Netflix Los Gatos, CA
http://techblog.netflix.com/
Quora Mountain View, CA
http://engineering.quora.com/
Square San Francisco, CA
http://corner.squareup.com/
Twitter San Francisco, CA
http://engineering.twitter.com/
Uber San Francisco, CA
https://eng.uber.com/
Yelp San Francisco, CA
http://engineeringblog.yelp.com/
我的微信公眾號:ninechapter中有更多的IT公司的技術和面試介紹,有興趣的可以關注一下
之前做CSDN線上實習生的時候,有找過這些。不過,是spark方向的,但是終究是BD領域的。可能不是特別全,我儘力了,歡迎補充!自取。其實主要來源很簡單:1.官方論壇、博客;2.各大公司技術博客;3.相關領域活躍網站、ML;4.牛人微博、博客。 l 目前國外Spark資訊、資料(如視頻、音頻、幻燈片)網站主要有哪些; 1.
官方
官方主頁
Welcome to Apache? Hadoop?!
Apache Spark?
2.
知名公司官方博客
cloudera官方博客
Blog | Cloudera Engineering Blog
MapR官方博客
Blog | MapR
Hortonworks官方博客
Hortonworks Blog
DATABRICKS官方博客
Blog – Databricks
Yahoo! 官方博客
https://developer.yahoo.com/blogs/hadoop/
Yahoo Developer Network
3.
其他
http://dzone.com
大數據板塊
Big Data/Analytics Zone
UC-Berkeley amplab
Spark | Search Results
l 目前國內Spark資訊、資料(如視頻、音頻、幻燈片)網站主要有哪些;
1.IT168旗下論壇
Spark板塊融合進入Hadoop板塊。
Hadoop_分散式數據處理_itpub社區_it168旗下專業技術社區-it168旗下專業技術社區
2.
Chinahadoop
Hadoop相關內容綜合付費/免費在線教育服務平台
小象學院 - 中國最專業的Hadoop,Spark大數據在線教育平台——權威課程:Hadoop培訓,Spark培訓,HBase培訓,Hive培訓,Mahout培訓等
3.
開源中國
Spark板塊
Spark首頁、文檔和下載
4.
Hadooper
中國科學院計算技術研究所
網路科學與技術重點實驗室下屬網站
http://www.hadooper.cn/
l 國外Spark社區(或網上討論組)有哪幾個,規模、特點分別是什麼;
1.官方
Issues
Spark - ASF JIRA
Apache官方Spark issues社區,活躍度、專業度最高。
Mailing Lists
user@spark.apache.org
供發布用戶幫助、問題、申明使用,使用者甚廣。
dev@spark.apache.org
供貢獻代碼的開發者使用、使用者甚廣。
Summit-Conferences
2014 | Spark Summit
2013 | Spark Summit
Spark峰會,每年一屆,已經舉辦兩屆,是業界最有影響力事件。
Meetups
Spark Meetup Groups
- Meetup
中小型開發者聚會。由開發者自行組織,遍布全球,是重要交流渠道。
Github
Pull Requests · apache/spark · GitHub
官方github pull requests,活躍度高。
2.
知名公司官方社區
Hortonworks官方社區
Forums Archive
cloudera官方社區
Home - Cloudera Community
以上知名公司官方社區特點:社區內容涵蓋了業界動向、技術發展、公司產品討論、技術討論等,但除了公司產品討論板塊比較熱以外,其他的都不溫不火。
3.
其他
Stackoverflow
Posts containing "spark"
較活躍
l 國內Spark用戶目前主要在哪裡交流,規模、特點分別是什麼;
1.開源中國
Spark交流版塊
Spark首頁、文檔和下載
2.
中國Spark峰會
AMPLab、Databricks、Intel、淘寶、網易等公司的Spark貢獻者參與。Andy
Konwinski(美國Spark Summit組織者)出席
Spark中國峰會
3.
知乎Spark話題板塊
裡面所討論問題較基礎,活躍度不高
Spark - 話題精華
4.
Meetup國內小組
Shanghai Spark Meetup (Shanghai)
- Meetup
http://www.meetup.com/Shenzhen-Spark-Meetup/
5.
個人博客
流量較高,參與度小。
董的博客
l 目前熱心參與國內Spark技術討論的專家有哪些,請整理嘗試他們的聯繫方式;
1.辛湜
Databricks大數據公司聯合創始人、Spark的核心成員
Weibo @hashjoin
2.
CrazyJvm
皮皮網數據平台負責人
Weibo @CrazyJvm
3.
明風
淘寶技術部,數據挖掘與計算團隊負責人
Weibo @明風Andy
4.
孫元浩
星環科技創始人、前英特爾亞太研發有限公司數據中心軟體部CTO
Weibo @孫元浩pixelray
5.
JerryLead
Spark研究者
Weibo @JerryLead
Github JerryLead (Lijie Xu) · GitHub
6.
連城
Databricks 軟體工程師, Apache Spark 貢獻者
Weibo @連城404
7.
董西成
《Hadoop技術內幕:深入解析MapReduce架構設計與實現原理》和《Hadoop技術內幕:深入解析YARN架構設計與實現原理》作者,目前專註於分散式資源管理和數據計算相關技術.
Weibo @西成懂
Blog 董的博客
張包峰
阿里巴巴數據平台事業部
Weibo @張包峰
Blog 張包峰的博客
尹緒森
Intel 工程師
Weibo @尹緒森
Blog wtf AI ?
Github yinxusen (Xusen Yin) · GitHub
你只能加入他們
大數據云計算技術及應用:數客網 http://www.shookr.com,很多行業的線下活動信息編程開發問答:http://www.segmentfaulf.co, http://www.stackoverflow.com,用了好多年IT技術論壇:http://www.csdn.com, 技術內容多年一些行業的新聞產品:http://www.zdnet.com, 商業化比較嚴重國外大數據網站:www.datasciencecentral.com, 內容很好,但是英文的
怒答一記Amazon的。
了解Amazon技術的一個好辦法是玩AWS,Amazon Web Services (AWS) AWS提供了雲、資料庫、大數據/MapReduce、流媒體傳輸等各種各樣的技術支持,以及軟體部署等服務。而且AWS的服務範圍還在擴展(比如我很期待的版本庫管理,分分鐘不想公開的project就不用放Github有沒有,也不用自己放一個EC2 Instance專門當遠程倉庫了)。而且大部分服務都有配套的文檔和樣例,慢慢玩,可以玩很久。
Amazon還使用了很多開源的代碼,可以看看 Amazon Web Services · GitHub
其它公司不是很了解,但應該也類似的,可以去Github上找他們的開源項目擼下來看看!如果想非常非常深入了解的話,也許就只能像@vczh 說的一樣,入伙吧...混進來看代碼吧~
techtarget
computerweekly這兩個還不錯,訂閱之後可以收到一些技術新聞快遞另外,感覺csdn的專欄做的也還是不錯的上微博關注幾個這領域的大牛,慢慢什麼都就知道了
歡迎來36大數據。
推薦閱讀:
※對於中國地區熱愛互聯網行業的學生,怎樣規劃自己的職業發展路線,以進入 Google、Facebook 這樣的公司?
※如何評價 Google Play 網頁端在 2013 年 7 月的改版?
※MIUI 7 會遵循 Material Design 嗎?
※Google Play 上面有哪些專門為平板設計的應用和遊戲,怎麼找?
※怎樣用google學術搜索一個研究方向被引用次數最多的幾篇文獻?
TAG:亞馬遜Amazoncom | 數據挖掘 | 谷歌Google | 大數據 |