標籤:

BAT機器學習面試1000題系列(281-285)

281.在 k-均值演算法中,以下哪個選項可用於獲得全局最小?

A. 嘗試為不同的質心(centroid)初始化運行演算法

B. 調整迭代的次數

C. 找到集群的最佳數量

D. 以上所有

答案(D):所有都可以用來調試以找到全局最小。

282.你正在使用帶有 L1 正則化的 logistic 回歸做二分類,其中 C 是正則化參數,w1 和 w2 是 x1 和 x2 的係數。當你把 C 值從 0 增加至非常大的值時,下面哪個選項是正確的?

A. 第一個 w2 成了 0,接著 w1 也成了 0

B. 第一個 w1 成了 0,接著 w2 也成了 0

C. w1 和 w2 同時成了 0

D. 即使在 C 成為大值之後,w1 和 w2 都不能成 0

答案(B):通過觀察圖像我們發現,即使只使用 x2,我們也能高效執行分類。因此一開始 w1 將成 0;當正則化參數不斷增加時,w2 也會越來越接近 0。

283.假設你使用 log-loss 函數作為評估標準。下面這些選項,哪些是對作為評估標準的 log-loss 的正確解釋。

A.如果一個分類器對不正確的分類很自信,log-loss 會嚴重的批評它。

B.對一個特別的觀察而言,分類器為正確的類別分配非常小的概率,然後對 log-loss 的相應分布會非常大。

C.log-loss 越低,模型越好

D.以上都是

答案為(D)

284.下面哪個選項中哪一項屬於確定性演算法?

A.PCA

B.K-Means

C. 以上都不是

答案為(A):確定性演算法表明在不同運行中,演算法輸出並不會改變。如果我們再一次運行演算法,PCA 會得出相同的結果,而 k-means 不會。

285.特徵向量的歸一化方法有哪些?

  • 線性函數轉換,表達式如下:

y=(x-MinValue)/(MaxValue-MinValue)

  • 對數函數轉換,表達式如下:

y=log10 (x)

  • 反餘切函數轉換 ,表達式如下:

y=arctan(x)*2/PI

  • 減去均值,除以方差:

y=(x-means)/ variance


推薦閱讀:

萌新刷題(九)二叉查找樹迭代器
未來是屬於掌握演算法的公司
多邊形自交的處理?
成功人士從不刷Leetcode(2)

TAG:对数 | 算法 |