BAT機器學習面試1000題(391~395題)

點擊上方藍字關注

BAT機器學習面試1000題(391~395題)

391題

特徵向量的歸一化方法有哪些?

點擊下方空白區域查看答案▼

解析:

線性函數轉換,表達式如下:

y=(x-MinValue)/(MaxValue-MinValue) 

對數函數轉換,表達式如下:

 y=log10 (x) 

反餘切函數轉換 ,表達式如下:y=arctan(x)*2/PI 

減去均值,除以方差:

 y=(x-means)/ variance

392題

RF與GBDT之間的區別與聯繫?

點擊下方空白區域查看答案 ▼

解析:

1)相同點:都是由多棵樹組成,最終的結果都是由多棵樹一起決定。 

2)不同點:

 a 組成隨機森林的樹可以分類樹也可以是回歸樹,而GBDT只由回歸樹組成 

b 組成隨機森林的樹可以並行生成,而GBDT是串列生成 

c 隨機森林的結果是多數表決表決的,而GBDT則是多棵樹累加之和 

d 隨機森林對異常值不敏感,而GBDT對異常值比較敏感 

e 隨機森林是減少模型的方差,而GBDT是減少模型的偏差

 f 隨機森林不需要進行特徵歸一化。而GBDT則需要進行特徵歸一化

393題

試證明樣本空間中任意點X到超平面(w, b)的距離為式(6.2).

點擊下方空白區域查看答案▼

解析:

從網上下載或自己編程實現一一個卷積神經網路,並在手寫字元識別數據 MNIST上進行實驗測試

http:/ /blog. csdn. net/ Snoopy_ Yuan

394題

請比較下EM演算法、HMM、CRF

點擊下方空白區域查看答案▼

解析:

這三個放在一起不是很恰當,但是有互相有關聯,所以就放在這裡一起說了。注意重點關注演算法的思想。 

 (1)EM演算法   

EM演算法是用於含有隱變數模型的極大似然估計或者極大後驗估計,有兩步組成:

E步,求期望(expectation);

M步,求極大(maxmization)。

本質上EM演算法還是一個迭代演算法,通過不斷用上一代參數對隱變數的估計來對當前變數進行計算,直到收斂。   

注意:EM演算法是對初值敏感的,而且EM是不斷求解下界的極大化逼近求解對數似然函數的極大化的演算法,也就是說EM演算法不能保證找到全局最優值。對於EM的導出方法也應該掌握。 (2)HMM演算法   

隱馬爾可夫模型是用於標註問題的生成模型。有幾個參數(π,A,B):初始狀態概率向量π,狀態轉移矩陣A,觀測概率矩陣B。稱為馬爾科夫模型的三要素。  

馬爾科夫三個基本問題:概率計算問題:給定模型和觀測序列,計算模型下觀測序列輸出的概率。–》前向後向演算法學習問題:已知觀測序列,估計模型參數,即用極大似然估計來估計參數。–》Baum-Welch(也就是EM演算法)和極大似然估計。預測問題:已知模型和觀測序列,求解對應的狀態序列。–》近似演算法(貪心演算法)和維比特演算法(動態規劃求最優路徑) 

(3)條件隨機場CRF  

 給定一組輸入隨機變數的條件下另一組輸出隨機變數的條件概率分布密度。條件隨機場假設輸出變數構成馬爾科夫隨機場,而我們平時看到的大多是線性鏈條隨機場,也就是由輸入對輸出進行預測的判別模型。求解方法為極大似然估計或正則化的極大似然估計。  

之所以總把HMM和CRF進行比較,主要是因為CRF和HMM都利用了圖的知識,但是CRF利用的是馬爾科夫隨機場(無向圖),而HMM的基礎是貝葉斯網路(有向圖)。而且CRF也有:概率計算問題、學習問題和預測問題。大致計算方法和HMM類似,只不過不需要EM演算法進行學習問題。 

(4)HMM和CRF對比   

其根本還是在於基本的理念不同,一個是生成模型,一個是判別模型,這也就導致了求解方式的不同。

395題

帶核的SVM為什麼能分類非線性問題?

點擊下方空白區域查看答案 ▼

解析:

核函數的本質是兩個函數的內積,通過核函數將其隱射到高維空間,在高維空間非線性問題轉化為線性問題, SVM得到超平面是高維空間的線性分類平面, 如圖:

其分類結果也視為低維空間的非線性分類結果, 因而帶核的SVM就能分類非線性問題。

題目來源

:七月在線官網(https://www.julyedu.com/)——面試題庫——面試大題——機器學習

分享一哈

分享完機器學習面試題

再和大家分享一哈

我們的

計算機視覺第二期

正在火熱報名中喔

還沒報名的小夥伴們

抓緊時間嘍

2人及2人以上組團

立減100元

想組團者可以添加客服:

julyedukefu_02

讓客服幫忙組團享受優惠喔

點擊下方「

閱讀原文

可在線報名

【徵稿】

昨天和大家分享了我們一學員做的筆記

小夥伴都反響覺得不錯喔

收穫很多,希望以後可以多分享

於是,小七想到了一點

為了提供更好的學習環境,更好的交流互動

投稿爆料

來嘍

不管是工作學習中的

經驗分享

還是工作學習中遇到好玩有趣的事兒

都可以來和我們一起分享

一經錄用

我們將贈送你

任意一門純在線課程

(不包括集訓營、就業班、18VIP)

投稿&爆料

請發郵件到

zhanpanpan@julyedu.cn

標題註明【投稿】或【爆料】

(ps:進入公眾號,點擊菜單:投稿爆料 

可查看投稿操作詳情)

 

更多資訊

 請戳一戳

往期推薦

一圖了解整個機器學習的核心知識體系(建議收藏)

kaggle大殺器之十大深度學習技巧,你了解多少?

數學不好,怎麼辦?這6大數學技能,AI 「必備」

深度學習難嗎?如果你連這25個概念都不知道,當然難!

這10道題會做,年薪百萬木問題

45萬AI面經 |  面試offer拿不停,人稱「offer收割機」

【乾貨合集】關於支持向量機(SVM)的原理,你了解多少?(萬字長文 速收)

點擊「閱讀原文」,可在線報名


推薦閱讀:

從零開始搭建tensorflow人工智慧開發環境(MAC版)
PaddleFluid與Kaggle 貓狗大戰
每周一個機器學習小項目004-RNN實現(草稿)
反對性騷擾,機器學習頂會NIPS考慮要改個名字
機器學習工程實踐之一、引言

TAG:學習 | 機器學習 | 面試 | 機器 |