在阿里做機器學習是一種怎樣的體驗?
我原來是做QR的,現在主要做演算法架構了。
在阿里做機器學習,真的主要時間花在演算法模型優化的場景是很少的,很多時候演算法是奔著業務指標去的。大搞快搞一個模型上去,沒效果就下,有效果就上去,然後接著奔下一個業務指標。什麼LR,GBDT,不是沒人研究怎麼優化,只是少,只有全職只做排序的那幾號人天天討論來討論去。其他技術,比如主題模型、詞向量、協同過濾,別看技術很粗淺,只要找到合適的場景,效果一樣很出彩。
純粹從學術角度看,業務導向的大環境是一個不利因素,很難有能靜下來鑽研深入的人——你半年沒優質產出,直接3.25了,玩屁啊。但在阿里也有好處,就是有真實的大數據,你想怎麼玩都可以,只要保證有產出就可以。
The art of feature selection.匿了,實話說你不要期望太高。阿里的技術比較落後原始。。。公司內部90%以上都是用logistic regression解決。當然也有其他一些演算法,但是實現的都比較差。真要做比較前沿有趣的,不建議來阿里。
題主更新了,我也補充一下,我說的就是廣告搜索部門,他們的ppt做的很好,技術宣傳的也不錯,實際上,呵呵。杭州的話,這方面相關的確實不多,一定要做數據挖掘,建議去北京。
在支付寶某風控部門實習過一段時間。
說實話主管們學歷都是很厲害的,各種牛校博士。雖說我們組的任務是搞模型搞機器學習,其實大部分任務還是面向業務的。做過最有成就感也是最學術的一個任務是:和一個同事調研了 Online Random Forests 演算法,用C++改了一下然後做評估。最後用到了AliExpress的風控上。
大部分時間就是每天寫寫SQL,放到集群上跑跑LR,決策樹,GBDT。
模型組到頭來還不是看著策略組的臉色。面向業務才是白花花錢啊!現身說法一下吧
1.我是去年本科畢業,在阿里旗下的UC旗下的神馬工作。
2.剛去的時候機器學習0基礎。3.從一些基礎知識學起,tf idf之類的。
4.大部分時間在跑數據。5.大部分時間在跑數據6.大部分時間在跑數據。7.另外一大部分時間在改bug。
8.另外一大部分時間在改bug。
9.另外一大部分時間在改bug。10.有多大的人工,就有多大的智能。11.從數據出發解決問題。多看數據,演算法是死的,數據是活的。
1)商業公司追求利潤天經地義,技術為業務服務天經地義,要想做純學術研究請進象牙塔;2)阿里內部機器學習團隊很多,阿里雲這塊由來自微軟的周靖人領銜做機器學習相關研發工作,微軟最年輕的partner之一,VLDB、CIKM等國際頂級會議的決策委員會員,OSDI、NIPS、VLDB等雜誌的撰稿人或審稿人。
占坑,,等入職了來答
有沒有對阿里媽媽了解的?想請問下阿里媽媽那邊的情況,也是機器學習崗位,目前只是聽他們說做了很多的廣告演算法,但是不清楚是不是和機器學習關係密切,還是更加偏向於廣告的業務呢以前面過阿里,有神人說hadoop是渣,spark是渣,storm是渣,他們花了五個月自己寫了一套基於c的高性能並行機器學習平台,實現了所有主流機器學習演算法,我問他們你們都這麼牛了還招我幹嘛呢?然後就呵呵了
還以為是我自己太傲氣讓人家不開心,後來有一個朋友面試阿里類似的職位又聽到一樣的說法。就讓他們重新發明輪子去吧
推薦閱讀:
※加入阿里星計劃需要有多強?
※阿里巴巴數據挖掘工程師要求什麼技能?
※阿里巴巴為何不在國內上市?
※rocketmq怎麼保證隊列完全順序消費?
※阿里巴巴馬雲和facebook扎克伯格為什麼關係這麼好?