BAT機器學習面試1000題(456~460題)
點擊上方
?
藍字關注七月在線實驗室BAT機器學習面試1000題(456~460題)
456題
如下表是用戶是否使用某產品的調查結果( )請計算年齡、地區、學歷、收入中對用戶是否使用調查產品信息增益最大的屬性。(
)
A、年齡
B、地區
C、學歷
D、收入
點擊下方空白區域查看答案▼
正確答案是:C
解析:
信息增益最大,也就是分類以後信息最少,熵最小。沒有劃分時,原始數據熵為
如果按照年齡進行劃分,劃分後的熵為
分別按照熵的方法計算出劃分以後的熵值,可以發現按照學歷劃分以後,熵為0,其他選項都大於0。因此,信息增益最大的屬性是學歷。
如果不進行計算,可以由觀察得出,按照學歷劃分以後,所有的用戶都能正確分類,此時熵最小,信息增益最大。如果按照其他屬性分類,都出現了錯分的情況,對應的熵大於0。
457題
在其它條件不變的前提下,以下哪種做法容易引起機器學習中的過擬合問題( )
A、增加訓練集數量
B、減少神經網路隱藏層節點數
C、刪除稀疏的特徵
D、SVM演算法中使用高斯核/RBF核代替
點擊下方空白區域查看答案 ▼
正確答案是:D
解析:
機器學習中發生過擬合的主要原因有:
(1)使用過於複雜的模型;
(2)數據雜訊較大;
(3)訓練數據少。
由此對應的降低過擬合的方法有:
(1)簡化模型假設,或者使用懲罰項限制模型複雜度;
(2)進行數據清洗,減少雜訊;
(3)收集更多訓練數據。
本題中,A對應於增加訓練數據,B為簡化模型假設,C為數據清洗。D選項中,高斯核的使用增加了模型複雜度,容易引起過擬合。選擇合適的核函數以及軟邊緣參數C就是訓練SVM的重要因素。一般來講,核函數越複雜,模型越偏向於過擬合;C越大模型越偏向於過擬合,反之則擬合不足。
458題
如果線性回歸模型中的隨機誤差存在異方差性,那麼參數的OLS估計量是( )
A、無偏的,有效的
B、無偏的,非有效的
C、有偏的,有效的
D、有偏的,非有效的
點擊下方空白區域查看答案▼
正確答案是:B
解析:
OLS即普通最小二乘法。由高斯—馬爾可夫定理,在給定經典線性回歸的假定下,最小二乘估計量是具有最小方差的線性無偏估計量。根據證明過程可知,隨機誤差中存在異方差性不會影響其無偏性,而有效性證明中涉及同方差性,即異方差會影響參數OLS估計量的有效性。
459題
一個二進位源X發出符號集為{-1,1},經過離散無記憶信道傳輸,由於信道中噪音的存在,接收端Y收到符號集為{-1,1,0}。已知P(x=-1)=1/4,P(x=1)=3/4,P(y=-1|x=-1)=4/5,P(y=0|x=-1)=1/5,P(y=1|x=1)=3/4,P(y=0|x=1)=1/4,求條件熵H(Y|X)( )
A、0.2375
B、0.3275
C、0.5273
D、0.5372
點擊下方空白區域查看答案▼
正確答案是:A
解析:
由H(Y|X)= -∑P(X,Y)logP(Y|X)= -∑P(Y|X)P(X)logP(Y|X),將(y=-1,x=-1), (y=0,x=-1), (y=1,x=1), (y=0,x=1)四種情況帶入公式求和,得到H(Y|X)≈-(-0.01938-0.03495-0.07028-0.11289)=0.2375。
460題
Fisher線性判別函數的求解過程是將M維特徵矢量投影在( )中進行求解。
A、M-1維空間
B、一維空間
C、三維空間
D、二維空間
點擊下方空白區域查看答案 ▼
正確答案是: B
解析:
Fisher線性判別函數是將多維空間中的特徵矢量投影到一條直線上,也就是把維數壓縮到一維。尋找這條最優直線的準則是Fisher準則:兩類樣本在一維空間的投影滿足類內儘可能密集,類間儘可能分開,也就是投影后兩類樣本均值之差儘可能大,類內部方差儘可能小。一般而言,對於數據分布近似高斯分布的情況,Fisher線性判別準則能夠得到很好的分類效果。
題目來源
:七月在線官網(https://www.julyedu.com/)——面試題庫——筆試練習——機器學習今日推薦
我們的
【
計算機視覺第二期
】正在火熱報名中
9月22日開課嘍
還有2天,2天,2天
還沒報名的小夥伴們
抓緊時間嘍
2人及2人以上組團
立減100元
想組團者可以添加客服:
julyedukefu_02
讓客服幫忙組團享受優惠喔
點擊下方「
閱讀原文
」可在線報名
更多資訊
請戳一戳
往期推薦
這10種深度學習方法,AI從業者必備!
乾貨 | 一圖掌握整個深度學習核心知識體系【高清下載】
為什麼程序員總喜歡在半夜寫代碼?
2019校招面試必備,15個CNN關鍵回答集錦【建議收藏】
年薪25萬的程序員都選擇轉行了,究竟是什麼行業這麼熱門?
點擊「閱讀原文」,立即報名
推薦閱讀:
※如果知乎是一本書。自製話題索引:52、面試
※這 17 道面試題因太難而被谷歌禁用
※Redis面試總結
※面試前必殺技,搞定你的每一個面試
※「幼升小」面試到底考誰:孩子考暈 家長糾結