設備指紋技術優劣的評估標準?
很多技術公司都說自己家用設備指紋,但是有沒有什麼標準是可以讓我們這些用戶來辨別誰家好?
設備指紋就是通過在網站或者移動端嵌入前端JS腳本或SDK來採集終端用戶環境的非敏感設備特徵細信息,通過服務端的設備特徵匹配演算法而建立一套全球設備標識庫,相當於為每一位互聯網用戶的訪問設備分配了唯一的設備標識。通過設備指紋,可以更加精準的分析互聯網欺詐者的行為軌跡,從蛛絲馬跡中識別風險、預警風險,準確追蹤定位風險產生的用戶主體以及關聯的所有用戶。
設備指紋技術的優劣,還得F1測度說了算。
F1測度(F1 Measure),是統計學中用來衡量二分類模型精確度的一種指標。它同時兼顧了分類模型的精確率(P)和召回率(R)。F1分數可以看作是模型精確率(P)和召回率(R)的一種調和平均數,它的最大值是1,最小值是0。F1測度與精確率(P)、召回率(R)是正相關關係。
F1測度的數值範圍為0到1,當F1測度數值越接近1時,代表該設備指紋技術越優秀。
F1測度計算公式
設備指紋技術事實上就是在解決一個記錄關聯匹配的問題,將來自於同一個設備的事件請求打上相同的設備指紋關聯在一起。精確率(P)代表設備指紋技術判斷出正樣本的正確率,召回率(R)代表設備指紋技術識別正樣本的覆蓋率,都只是單一、片面地在評估設備指紋技術,而F1測度是精確率和召回率的綜合反映。
F1測度是對設備指紋技術最合理公正客觀的判斷,它既不會偏向精確率,又不會偏向召回率,有的設備指紋技術一味追求精確率(P)而忽略召回率(R),即使能夠做到精確100%,但是只能判斷出的正樣本寥寥無幾,漏判了大量的正樣本,沒有任何意義;當然,一味追求召回率(R),也沒有任何意義,這樣會導致誤判率上升。
以竹篩篩選綠豆為例,竹篩空隙大小影響能否準確地過濾出全部雜質;篩選之後,留在篩子的綠豆占竹篩中剩餘物質的比例對應於精確率(P),留在篩子的綠豆占所有綠豆的比例,對應於召回率(R);當竹篩空隙很大時,能夠篩出更多雜質,保證留下的物質基本上是綠豆,此時精確率(P)接近於1,但是召回率(R)會很小;當竹篩空隙很小時,能夠留下更多的綠豆,但是也會包含大部分的雜質,此時召回率(R)接近1,而精確率(P)很小。精確率和召回率是一對矛盾,精確率大時,召回率會很小,反之,召回率大時,精確率也會很小。而F1測度,平衡了精確率和召回率。
目前,F1測度已在國際上得到廣泛認可,被眾多擁有設備指紋技術的公司作為評判設備指紋技術優劣的重要指標,例如知名技術服務商Drawbridge、全球最大徵信機構Experian等。雖然國內市場上眾多公司聲稱擁有設備指紋技術,最終其技術的優劣還是體現在F1測度的數值上,國內僅有為數不多的幾家擁有被動式設備指紋技術的企業也在使用F1測度衡量標準。F1測度能在客戶面臨眾多設備指紋技術公司時,作為一項最公正客觀的指標衡量其優劣,篩除「流氓公司」。
推薦閱讀: