BAT機器學習面試1000題(531~535題)
點擊上方
?
藍字關注七月在線實驗室BAT機器學習面試1000題(531~535題)
531題
在有監督學習中, 我們如何使用聚類方法?
1.我們可以先創建聚類類別, 然後在每個類別上用監督學習分別進行學習
2. 我們可以使用聚類「類別id」作為一個新的特徵項, 然後再用監督學習分別進行學習
3. 在進行監督學習之前, 我們不能新建聚類類別
4. 我們不可以使用聚類「類別id」作為一個新的特徵項, 然後再用監督學習分別進行學習
A、2 和 4
B、1 和 2
C、3 和 4
D、 1 和 3
點擊下方空白區域查看答案▼
正確答案是: B
解析:
答案: B我們可以為每個聚類構建不同的模型, 提高預測準確率。「類別id」作為一個特徵項去訓練, 可以有效地總結了數據特徵。所以B是正確的
532題
以下說法正確的是
1. 一個機器學習模型,如果有較高準確率,總是說明這個分類器是好的
2. 如果增加模型複雜度, 那麼模型的測試錯誤率總是會降低
3. 如果增加模型複雜度, 那麼模型的訓練錯誤率總是會降低
4. 我們不可以使用聚類「類別id」作為一個新的特徵項, 然後再用監督學習分別進行學習
A、1
B、2
C、3
D、2和3
E、都錯
點擊下方空白區域查看答案 ▼
正確答案是:E
解析:
答案:E1的模型中, 如果負樣本佔比非常大,也會有很高的準確率, 對正樣本的分類不一定很好;4的模型中, 「類別id」可以作為一個特徵項去訓練, 這樣會有效地總結了數據特徵。
533題
對應GradientBoosting tree演算法, 以下說法正確的是:
1.當增加最小樣本分裂個數,我們可以抵制過擬合
2. 當增加最小樣本分裂個數,會導致過擬合
3. 當我們減少訓練單個學習器的樣本個數,我們可以降低variance
4. 當我們減少訓練單個學習器的樣本個數,我們可以降低bias
A、2 和 4
B、2 和 3
C、1 和 3
D、1 和 4
點擊下方空白區域查看答案▼
正確答案是:C
解析:
答案: C最小樣本分裂個數是用來控制「過擬合」參數。太高的值會導致「欠擬合」,這個參數應該用交叉驗證來調節。
第二點是靠bias和variance概念的。
534題
以下哪個圖是KNN演算法的訓練邊界
A、B
B、A
C、D
D、C
E、都不是
點擊下方空白區域查看答案▼
正確答案是: B
解析:
答案: BKNN演算法肯定不是線性的邊界, 所以直的邊界就不用考慮了。另外這個演算法是看周圍最近的k個樣本的分類用以確定分類,所以邊界一定是坑坑窪窪的。
535題
如果一個訓練好的模型在測試集上有100%的準確率, 這是不是意味著在一個新的數據集上,也會有同樣好的表現?
A、是的,這說明這個模型的范化能力已經足以支持新的數據集合了
B、不對,依然後其他因素模型沒有考慮到,比如噪音數據
點擊下方空白區域查看答案 ▼
正確答案是: B
解析:
答案: B沒有一個模型是可以總是適應新數據的。我們不可能可到100%準確率。
題目來源
:七月在線官網(https://www.julyedu.com/)——面試題庫——筆試練習——機器學習七月在線也來找錦鯉啦
還沒參加的小夥伴們抓緊時間嘍~
我們將在
10月19日下午18:00(本周五)
抽出一隻錦鯉送出:
1024元現金紅包
或
價值2699元的【2018VIP】
錦鯉可以二選一哦
活動詳情戳下面查看:
??
我們準備了1024元現金
尋找一隻愛學習的錦鯉
今日學習推薦
我們的【
深度學習集訓營第二期
】火熱報名中。從TensorFlow起步實戰BAT工業項目。11月13日
起正式上課,為期一個多月,努力5周,挑戰年薪40萬,甚至更多薪!
這麼好的機會,還在等什麼,報名即送三門課程,
《機器學習工程師 第八期》、《深度學習 第三期》、《TensorFlow框架案例實戰》
,更好的助力您學習深度學習集訓營課程。且2人及2人以上組團報名,可各減500元
,想組團者請加微信客服:julyedukefu_02
挑戰高薪,從現在開始~
更多資訊
請戳一戳
往期推薦
我們準備了1024元現金,尋找一隻愛學習的錦鯉!
值得探索的 8 個機器學習 JavaScript 框架
傷不起的三十歲,干不動的程序員要何去何從?
【Github 6K星】BAT頭條滴滴小米等名企AI工程師筆經面經 + 演算法/機器學習/深度學習/NLP資源匯總
一圖概覽整個深度學習的核心知識體系(建議收藏)
點擊 「閱讀原文」,查看更多
↓↓↓推薦閱讀: