BAT機器學習面試1000題系列（281-285）

01-29

281.在 k-均值演算法中，以下哪個選項可用於獲得全局最小？

A. 嘗試為不同的質心（centroid）初始化運行演算法

B. 調整迭代的次數

C. 找到集群的最佳數量

D. 以上所有

答案（D）：所有都可以用來調試以找到全局最小。

282.你正在使用帶有 L1 正則化的 logistic 回歸做二分類，其中 C 是正則化參數，w1 和 w2 是 x1 和 x2 的係數。當你把 C 值從 0 增加至非常大的值時，下面哪個選項是正確的？

A. 第一個 w2 成了 0，接著 w1 也成了 0

B. 第一個 w1 成了 0，接著 w2 也成了 0

C. w1 和 w2 同時成了 0

D. 即使在 C 成為大值之後，w1 和 w2 都不能成 0

答案（B）：通過觀察圖像我們發現，即使只使用 x2，我們也能高效執行分類。因此一開始 w1 將成 0；當正則化參數不斷增加時，w2 也會越來越接近 0。

283.假設你使用 log-loss 函數作為評估標準。下面這些選項，哪些是對作為評估標準的 log-loss 的正確解釋。

A.如果一個分類器對不正確的分類很自信，log-loss 會嚴重的批評它。

B.對一個特別的觀察而言，分類器為正確的類別分配非常小的概率，然後對 log-loss 的相應分布會非常大。

C.log-loss 越低，模型越好

D.以上都是

答案為（D）

284.下面哪個選項中哪一項屬於確定性演算法？

A.PCA

B.K-Means

C. 以上都不是

答案為（A）：確定性演算法表明在不同運行中，演算法輸出並不會改變。如果我們再一次運行演算法，PCA 會得出相同的結果，而 k-means 不會。

285.特徵向量的歸一化方法有哪些？

y=(x-MinValue)/(MaxValue-MinValue)

y=log10 (x)

y=arctan(x)*2/PI

y=(x-means)/ variance