在阿里做機器學習是一種怎樣的體驗?


我原來是做QR的,現在主要做演算法架構了。

在阿里做機器學習,真的主要時間花在演算法模型優化的場景是很少的,很多時候演算法是奔著業務指標去的。大搞快搞一個模型上去,沒效果就下,有效果就上去,然後接著奔下一個業務指標。什麼LR,GBDT,不是沒人研究怎麼優化,只是少,只有全職只做排序的那幾號人天天討論來討論去。其他技術,比如主題模型、詞向量、協同過濾,別看技術很粗淺,只要找到合適的場景,效果一樣很出彩。

純粹從學術角度看,業務導向的大環境是一個不利因素,很難有能靜下來鑽研深入的人——你半年沒優質產出,直接3.25了,玩屁啊。但在阿里也有好處,就是有真實的大數據,你想怎麼玩都可以,只要保證有產出就可以。


The art of feature selection.


匿了,實話說你不要期望太高。阿里的技術比較落後原始。。。公司內部90%以上都是用logistic regression解決。當然也有其他一些演算法,但是實現的都比較差。真要做比較前沿有趣的,不建議來阿里。

題主更新了,我也補充一下,我說的就是廣告搜索部門,他們的ppt做的很好,技術宣傳的也不錯,實際上,呵呵。

杭州的話,這方面相關的確實不多,一定要做數據挖掘,建議去北京。


在支付寶某風控部門實習過一段時間。

說實話主管們學歷都是很厲害的,各種牛校博士。

雖說我們組的任務是搞模型搞機器學習,其實大部分任務還是面向業務的。

做過最有成就感也是最學術的一個任務是:和一個同事調研了 Online Random Forests 演算法,用C++改了一下然後做評估。最後用到了AliExpress的風控上。

大部分時間就是每天寫寫SQL,放到集群上跑跑LR,決策樹,GBDT。

模型組到頭來還不是看著策略組的臉色。面向業務才是白花花錢啊!


現身說法一下吧

1.我是去年本科畢業,在阿里旗下的UC旗下的神馬工作。

2.剛去的時候機器學習0基礎。

3.從一些基礎知識學起,tf idf之類的。

4.大部分時間在跑數據。

5.大部分時間在跑數據

6.大部分時間在跑數據。

7.另外一大部分時間在改bug。

8.另外一大部分時間在改bug。

9.另外一大部分時間在改bug。

10.有多大的人工,就有多大的智能。

11.從數據出發解決問題。多看數據,演算法是死的,數據是活的。


1)商業公司追求利潤天經地義,技術為業務服務天經地義,要想做純學術研究請進象牙塔;

2)阿里內部機器學習團隊很多,阿里雲這塊由來自微軟的周靖人領銜做機器學習相關研發工作,微軟最年輕的partner之一,VLDB、CIKM等國際頂級會議的決策委員會員,OSDI、NIPS、VLDB等雜誌的撰稿人或審稿人。


占坑,,等入職了來答


有沒有對阿里媽媽了解的?想請問下阿里媽媽那邊的情況,也是機器學習崗位,目前只是聽他們說做了很多的廣告演算法,但是不清楚是不是和機器學習關係密切,還是更加偏向於廣告的業務呢


以前面過阿里,有神人說hadoop是渣,spark是渣,storm是渣,他們花了五個月自己寫了一套基於c的高性能並行機器學習平台,實現了所有主流機器學習演算法,我問他們你們都這麼牛了還招我幹嘛呢?然後就呵呵了

還以為是我自己太傲氣讓人家不開心,後來有一個朋友面試阿里類似的職位又聽到一樣的說法。就讓他們重新發明輪子去吧


推薦閱讀:

加入阿里星計劃需要有多強?
阿里巴巴數據挖掘工程師要求什麼技能?
阿里巴巴為何不在國內上市?
rocketmq怎麼保證隊列完全順序消費?
阿里巴巴馬雲和facebook扎克伯格為什麼關係這麼好?

TAG:阿里巴巴集團 | 數據挖掘 | 機器學習 | 阿里媽媽 |