模型監控構建方案

03-06

模型監控是模型上線之後的最後一個環節，決定該項目是否圓滿成功。對於一個實際項目的模型監控來說，從以下兩個維度展開：

一、模型本身的指標

模型在線上持續運行，需要每隔一周、半月、一個月對模型本身的性能進行監控。模型性能本身的指標包括不限於以下：

1、AUC(binary)

2、KS(binary)

3、PSI

4、Optimal Cutoff

5、Precision

6、Recall

7、MSE(Regression)

8、Top-N Accuracy

有兩種方式進行持續化監控：

1、每個監控的時間間隔，取出最新的可以打標籤的預測結果，如果數據量太大可以進行抽樣（分層隨機抽樣還是全局隨機抽樣，取決於訓練時的方式），進行上述指標統計，將數據保存下來，作為本次例行的快照，並且和之前保存的指標進行對比；

2、每個監控的時間間隔，取出最新的、次新的、次次新的...可以打標籤的預測結果(一定要注意，打標籤一定要回到歷史，避免穿越情形！)，如果數據量太大可以進行抽樣（分層隨機抽樣還是全局隨機抽樣，取決於訓練時的方式），進行上述指標統計，直接比較最新的、次新的、次次新的對比。

模型產出需要交付給業務同學實地使用，所以需要了解業務同學使用模型的方式，這個比較定製化，以在金融科技風控場景下使用模型的方式舉例如下。

風控同學關注每天訂單的攔截率、召回率以及引入的M1/M3率，所以為了綜合這些信息，需要進行天級跟蹤，這一天為最新的可以打標籤的一天，取出這天的訂單，關聯出模型具體分數段信息。

比如今天是2017-08-21，那麼選取出2017-05-21的訂單評分數據，進行如下展示：