數據挖掘實習生面試會被問到哪些問題?

包括數據挖掘相關的實習職位,比如推薦系統,廣告演算法實習生等。


新春第一答竟被位摳腳大漢@wepon 邀了,多謝看得起在下了,安利一波wepon大神在github開源的數據挖掘類比賽代碼庫,裡面竟然全是優質高清不打碼的原碼!!!需要的朋友猛戳此處高價廣告位:wepe (wepon),代碼分享我只服他~~~
說實話,本人實習就準備了阿里,因為阿里實習招聘最早(實習的要抓緊上車,內推3月份就開始),到手offer就沒怎麼準備其他公司了。實習可以說是半隻腳踏入校招,還是值得認真對待的,尤其阿里校招縮招,實習重要性你懂的。
下面就逼逼摻雜點正式校招面試的問題吧,大致被問到的主要有以下幾類:

  1. 項目相關問題,建議不要在簡歷上寫崗位無關的項目啦,沒項目就多參加些比賽,在此必須感謝Kaggle、阿里天池、DC、Kesci等平台給我們提供的這麼好鍛煉機會~在github能搜索相關冠軍源碼學習,kaggle分享為最。同時保證對簡歷上項目演算法細節非常了解,被問住了就有點呵呵了,甚至相關知識點能延伸去和主導與面試官聊天,平時還需多看相關paper和博客了解點目前機器學習前沿知識,深度學習與人工智慧等等,面試官還是很希望聽到內容,把面試官聊嗨聊爽了面試也就結束了。
  2. 機器學習演算法理解,面試官挺喜歡問聚類、LR、SVM、隨機森林、GDBT、xgboost、EM演算法、神經網路等等常規演算法,以及簡單演算法聚類、LR、隨機森林等hadoop分散式實現。有時也要求現場推導,常見的就是LR求導(必考,劃重點啦),SVM的最優化公式,優化方法BFGS推導等,李航的《統計學習方法》與周志華的西瓜書刷三遍准沒錯。擴展方面,比如自然語言的word2vec原理(word2vec 中的數學原理詳解(三)背景知識)與主題模型LDA(《LDA數學八卦》很贊),圖像方面可以聊聊alexnet(論文很贊)、vgg-net等,推薦系統(項亮《推薦系統》還是很值讀一讀的),計算廣告FFM演算法(參考美團深入FFM原理與實踐 -),AlphaGo原理。
  3. 數據結構演算法,畢竟碼農基本功,一般問題不會太難,仔細想沒什麼問題(適合國內公司bat,國外的公司貌似會比較難)。多練習點遞歸,哈希,動態規劃,廣搜和深搜圖論相關,多刷leetcode,多刷刷中級、高級就行了
  4. hr問題,什麼人生觀價值觀,職業規劃,個人優缺點,為什麼選擇我們公司等等,多刷知乎此類問題,客套話多練,別說的太老實,切忌輕浮囂張自滿情緒。阿里的hr面還是卡人的,得注意~~
  5. 反問問題,有的公司會給面試者反問機會,如果不反問面試也會很尷尬,多準備些問題反問有時還能繼續聊嗨。

以後有機會再補充吧,最後,也沒什麼多說的,愛一行干一行吧,祝大家新年後找工作順利!


推薦閱讀:

假如你在醫院是被一個實習醫生操作和接待,你會怎麼想?
為什麼有些大公司只招實習生?
職場中女性被調戲騷擾的界限在哪裡?
如何看待咪蒙的文章《咪蒙:我為什麼支持實習生休學?》?
上司讓實習生幫他買咖啡,錢應該實習生出嗎?

TAG:面試 | 數據挖掘 | 實習生 | 面試問題 |