BAT機器學習面試1000題(456~460題)

點擊上方  

?

   藍字關注七月在線實驗室

BAT機器學習面試1000題(456~460題)

456題

如下表是用戶是否使用某產品的調查結果( )請計算年齡、地區、學歷、收入中對用戶是否使用調查產品信息增益最大的屬性。(

A、年齡

B、地區

C、學歷

D、收入

點擊下方空白區域查看答案▼

正確答案是:C

解析:

信息增益最大,也就是分類以後信息最少,熵最小。沒有劃分時,原始數據熵為

如果按照年齡進行劃分,劃分後的熵為

分別按照熵的方法計算出劃分以後的熵值,可以發現按照學歷劃分以後,熵為0,其他選項都大於0。因此,信息增益最大的屬性是學歷。    

如果不進行計算,可以由觀察得出,按照學歷劃分以後,所有的用戶都能正確分類,此時熵最小,信息增益最大。如果按照其他屬性分類,都出現了錯分的情況,對應的熵大於0。

457題

在其它條件不變的前提下,以下哪種做法容易引起機器學習中的過擬合問題( )

A、增加訓練集數量

B、減少神經網路隱藏層節點數

C、刪除稀疏的特徵

D、SVM演算法中使用高斯核/RBF核代替

點擊下方空白區域查看答案 ▼

正確答案是:D

解析:

機器學習中發生過擬合的主要原因有: 

(1)使用過於複雜的模型; 

(2)數據雜訊較大; 

(3)訓練數據少。    

由此對應的降低過擬合的方法有: 

(1)簡化模型假設,或者使用懲罰項限制模型複雜度; 

(2)進行數據清洗,減少雜訊; 

(3)收集更多訓練數據。 

本題中,A對應於增加訓練數據,B為簡化模型假設,C為數據清洗。D選項中,高斯核的使用增加了模型複雜度,容易引起過擬合。選擇合適的核函數以及軟邊緣參數C就是訓練SVM的重要因素。一般來講,核函數越複雜,模型越偏向於過擬合;C越大模型越偏向於過擬合,反之則擬合不足。

458題

如果線性回歸模型中的隨機誤差存在異方差性,那麼參數的OLS估計量是( )

A、無偏的,有效的

B、無偏的,非有效的

C、有偏的,有效的

D、有偏的,非有效的

點擊下方空白區域查看答案▼

正確答案是:B

解析:

OLS即普通最小二乘法。由高斯—馬爾可夫定理,在給定經典線性回歸的假定下,最小二乘估計量是具有最小方差的線性無偏估計量。根據證明過程可知,隨機誤差中存在異方差性不會影響其無偏性,而有效性證明中涉及同方差性,即異方差會影響參數OLS估計量的有效性。

459題

一個二進位源X發出符號集為{-1,1},經過離散無記憶信道傳輸,由於信道中噪音的存在,接收端Y收到符號集為{-1,1,0}。已知P(x=-1)=1/4,P(x=1)=3/4,P(y=-1|x=-1)=4/5,P(y=0|x=-1)=1/5,P(y=1|x=1)=3/4,P(y=0|x=1)=1/4,求條件熵H(Y|X)( )

A、0.2375

B、0.3275

C、0.5273

D、0.5372

點擊下方空白區域查看答案▼

正確答案是:A

解析:

由H(Y|X)= -∑P(X,Y)logP(Y|X)= -∑P(Y|X)P(X)logP(Y|X),將(y=-1,x=-1), (y=0,x=-1), (y=1,x=1), (y=0,x=1)四種情況帶入公式求和,得到H(Y|X)≈-(-0.01938-0.03495-0.07028-0.11289)=0.2375。

460題

Fisher線性判別函數的求解過程是將M維特徵矢量投影在( )中進行求解。

A、M-1維空間

B、一維空間

C、三維空間

D、二維空間

點擊下方空白區域查看答案 ▼

正確答案是: B

解析:

 Fisher線性判別函數是將多維空間中的特徵矢量投影到一條直線上,也就是把維數壓縮到一維。尋找這條最優直線的準則是Fisher準則:兩類樣本在一維空間的投影滿足類內儘可能密集,類間儘可能分開,也就是投影后兩類樣本均值之差儘可能大,類內部方差儘可能小。一般而言,對於數據分布近似高斯分布的情況,Fisher線性判別準則能夠得到很好的分類效果。

題目來源

:七月在線官網(https://www.julyedu.com/)——面試題庫——筆試練習——機器學習

今日推薦

我們的

計算機視覺第二期

正在火熱報名中

9月22日開課嘍

還有2天,2天,2天

還沒報名的小夥伴們

抓緊時間嘍

2人及2人以上組團

立減100元

想組團者可以添加客服:

julyedukefu_02

讓客服幫忙組團享受優惠喔

點擊下方「

閱讀原文

可在線報名

 

更多資訊

 請戳一戳

往期推薦

這10種深度學習方法,AI從業者必備!

乾貨 | 一圖掌握整個深度學習核心知識體系【高清下載】

為什麼程序員總喜歡在半夜寫代碼?

2019校招面試必備,15個CNN關鍵回答集錦【建議收藏】

年薪25萬的程序員都選擇轉行了,究竟是什麼行業這麼熱門?

點擊「閱讀原文」,立即報名


推薦閱讀:

如果知乎是一本書。自製話題索引:52、面試
這 17 道面試題因太難而被谷歌禁用
Redis面試總結
面試前必殺技,搞定你的每一個面試
「幼升小」面試到底考誰:孩子考暈 家長糾結

TAG:學習 | 機器學習 | 面試 | 機器 |