深度腦殘的阿里面試記錄
一個項目一個比賽兩道編程題 7.10-8.33 。1小時20分鐘大概。趁記得晚上寫下來,也當是給大家試試水!
1 介紹了下自己做的項目 智能安防檢測
針對項目問了:
1 在性能上的優化做了哪些改進?
額,速度呀,召回率啊,對硬體的要求啊。。balablablab。。。
2 你使用的SSD 具體的網路改進方案 ,在tx2 實現了還是在gpu 上實現了?
balabalbalab。。。說了一大推
3 SSD中需要預測哪些量 和yolo 有什麼區別?
(分別從anchors數 ,SSD預測的offset和 yolo中的中心點位置 來回答)
4 yolo 中的anchor 和 faster -r cnn 的anchor怎麼實現的,如何得到預測框?
(這個可以結合代碼來解讀,yolo中的NMS 和 IOU 先後次序,faster-rcnn 中的9個anchor從剛開始的幾萬個如何到最後的2000個,注意這裡已經使用了一個boundingbox 回歸,faster-rcnn的兩次位置回歸是在不同層實現的)
5rpn具體的操作流程
(還是結合上述問題,根據VGG的baseline 從conv5開始講述,輸出的feature map 個數,每個點對應的9個anchors,每個anchors分為前景和背景,再加上4個偏移量,結構主要可以總結為 生成anchors-> 分類器softmax提取前景和背景->bbox的reg 回歸->生成的proppsal)
6resnet 中的網路為什麼可以這麼深
(主要的亮點 殘差連接和它的batch-normalization)
7bn層和殘差連接具體是怎麼防止梯度彌散的
(bn 層在前向傳播中起到的調整數據分布作用,以及殘差連接在後向傳播的concat)
二 阿里天池大賽 肺結節檢測
首先講解下比賽的演算法框架 介紹了比賽的思路和大致操作 之後問了:
1怎樣對數據預處理的
各種旋轉 偏移 啊,但這個在實際操作中不要太莽,小步慢跑。對數據集的擴充啊,甚至可以聊會gan網路
2 u- net 網路結構,分割網路的損失函數
(可以去看會論文,比賽考慮用的DICE 係數來構建損失函數。考慮的方面么 從 為什麼可以這樣,到為什麼選擇這個做分析 :
1 Dice 係數是一種集合相似度函數,用來評判兩個樣本之間的相似程度,兩個樣本相似度越好,Dice係數越大,相應的損失就越小,故可採用1-Dice作為損失。 2比傳統分割過程中使用的BCELoss有更好的效果。最後 跑完確實還不錯 所以就用了,畢竟比賽嘛 )
3分類網路中怎樣提高召回率
(具體從感受野和大小目標檢測的優化做了分析和討論)
4怎樣對小結節檢測的魯棒性優化
(繼續討論。。。)
5感受野的概念 你使用的inception -resnet 有何好處?
(深入討論。。。oh mygod 得虧看的代碼和論文也有幾篇)
6在模型融合中做了哪些工作 ?boosting 和bagging 的區別,gbdt 屬於哪類?(機器學習中比較常問的,大致答了下)
7 在提取到的特徵方面有沒有想過更好的融合方法?
好了 問完後直接給發了個在線郵件編程鏈接
兩道題
1 單鏈表的排序(快慢指針先找中點,然後再使用歸併排序,敲代碼期間面試官在喝茶。。別問我咋知道的)
2 敲出SGD代碼 給了x y還有mse 輸出w !(回憶了下以前復現的代碼,然後敲了大概20分鐘,期間有提示一次)
最後,面完!面試官說,面的時間有點長,我還遲到了會,抱歉了(之前約好7點的)。然後就問我有啥問題么?額 ,,,臉都紅了,頭都被你問炸了 ,我還有啥問題???問了下部門做的細化 圖片搜索推薦 有沒用到仿生學神經網路?然後答了一波後,就問了下 啥時候有通知balabala。。。 後面balabala。。
發帖,攢人品呀,有幫助你們一些我就很開心。畢竟大家好才是真的好!
推薦閱讀:
※來阿里巴巴一年有感(上)
※阿里巴巴的員工們,你們今晚幾點下班?
※記一次拿到阿里p7 offer, 又被取消的歷程
※如何看待阿里員工長文投訴公司:終於我被你們逼死了?
※有什麼武俠風的名字適合公司內部的花名?