如何評價vocaloid周刊新的計分方式?
以及周刊的計分方式還有哪些不足和值得改善的地方?(對於防止工作刷分和篩選優質曲尤其是優質新曲等)
我曾經在初音吧發過兩篇舊演算法的帖子,現在更新了新的演算法,我就延續我當時的思路來分析一下。
首先,讓我們看一下周刊的舊演算法。
總分=再生+評論*補正值A+收藏*補正值B
補正值A=(再生+收藏)/(再生+評論+收藏)
補正值A在評論不變的情況下,再生收藏越高,值越小
補正值B=200(收藏/再生)
補正值B的值取決於收藏率
Limit:收藏的分數不得超過再生的5倍
下面設再生數為z,評論為c,收藏(mylist)數為m
1、首先看下比較佔比最大,最重要的再生和mylist
讓我們來看一下mylist數的計算公式
Mylist=200*m^2/z
把這個式子再加上再生
Pts=z+200*m^2/z
是個雙鉤函數,雙鉤函數是形狀比較奇特的函數,以再生為自變數畫出函數:
可以看到,這個函數最開始急劇下降,也就是說,當收藏不變的情況下,再生越高,分數越低!這個結論是與我們直觀相違背的。也就是說收藏和再生要同時增長,分數才能增長,若隨著再生的增長,收藏不增長,分數不會增長,以當時的數據來說(13.2.23)Jin與40mp。
Jin的周刊計入分 z=423479 m=21000
40mp 是 z=153621 m=20000 (c佔比重較低暫且不考慮)
可以看到,Jin的分數無論是再生還是收藏都要比40mp高,但
Pts(jin)= z+200*m^2/z =631753
Pts(40mp)= z+200*m^2/z=674383
40mp的各項雖都比jin低,但是他的分值卻大於jin。
一般來說,新曲的收藏率比較高,老曲收藏率較低,老曲以再生增長為主。因此,周刊的計分方式天生就對新曲有利,新曲獲得的排名靠前。周刊初衷就是希望看到更多的新曲。
2、接下來我們來看看評論。
評論的算分方式一眼看上去較為複雜,我們可以做一下變式。
評論總分=(1-c/z+c+m)*c
我們可以看到,式子是1減去評論數佔總數的百分比再乘上評論
下面來畫下函數
設m+z=100,在這兩個數據一定的情況下,畫出函數圖象。
F(x)=x-x^2/(100+x),與一次函數比較,增長速度明顯較低,而且斜率會逐漸減少,評論在計分的佔比中比重很低,並且在再生收藏都不變的情況下,增長速度會隨著評論的增加而變慢。
可以看到,評論對於周刊計分是不太重要的,周刊鼓勵一定的評論,但評論過多,不正常時,又會自動遏制評論增加對分數的影響(隨著評論增加,評論分增長速度下降)
可以看到,舊演算法其實是比較科學的,但舊演算法在演算法上對新曲老曲一視同仁(老曲和新曲在某一周的數據一樣,那麼他們的排名是一樣的),在新曲很多的情況下,這個是適用的,在如今新曲少,老曲占榜嚴重的情況下局限性就體現出來了。
說完老演算法,讓我們來看看新演算法作出了什麼改變
對收藏分的補正值B改變不多,改變主要在再生分和評論分。
1、首先是評論分。
評論分在原來的基礎上,補正值變成了十次方,補正值A必定是一個小於1的數,十次方後會變得比原來小。也就是說。
一首歌假如說再生5w,評論5000(當然實際不會這麼高),收藏1w。
Pts(舊演算法評論分) = 4615
Pts(新演算法評論分) = 2245
比起舊演算法,新演算法的評論分基本都要折半。因此減少了評論分的比重,評論分本來佔比就很低,這樣一來評論分佔比就更低了。一般來說,有人氣的P主(陽炎新曲)或者是一些門番老曲(比如千本或幽靈),評論會比較多,削弱評論分的意圖,我猜是想進一步給新曲和新P主一些展示的機會。(雖然說效果極其微弱)
2、其次是再生分。
提高了新曲的再生分數比重,並且從時間上對新曲和老曲進行了區分,雖說區分不算太大,只有最多0.4*再生的區別,但在30到15名的區間內能佔到挺大的優勢的,以537周刊為例,15與30的差距大概是9000分左右,平均下來600分相差一名,一般的新曲以1w再生,1.25補正值C算,那就是比老曲多2500分,直接提升4名!這個效果算是挺顯著的。
總結:新演算法與舊演算法實質相差不大,都是延續一貫的思路,只不過現在的V家新曲比起以前要少,老曲占榜嚴重,並且老曲排名還很高。舊演算法已經不適應時代了,需要從演算法上讓更多新曲進入榜單,讓新曲在與老曲競爭時能佔到更好的優勢。據我看來,效果應該還是挺不錯的。
至於題主說的刷分的問題,其他人的回答也說到了,演算法畢竟是死的,無法區分哪些收藏是正常的,因此刷分現象在演算法上只能盡量抑制,但難以阻止。這次的新演算法也只是繼續砍了容易刷分的評論的比重,但畢竟評論本來占的比重就低,抑制刷分的幫助不大。
數字只是結果,而問題出在過程上。沒有任何純粹的數字可以真正地完全合理地反映出我們認為是符合理性的且符合大多數人認知的結果,它的結果只是參考。當然換一個角度,也就是說我們經常賦予了分數統計與排名以過高的意義,而且明知道問題的本質並不在於演算法。演算法的確可以優化,但是這對問題的解決沒有什麼本質性的影響。人的喜愛與傾向究竟是不是可以量化的?點擊與觀看是否等於得到喜愛?出於禮貌投幣,出於鼓勵的投幣,真正喜愛的投幣,都在數字上得到了等質的反映,但是它們真的一樣么?
不分析演算法,只分析現象。從536、537兩期看來,演算法確實相對提高了新曲的得分,但也並沒有提高多少。單拿537期來看,上榜的新曲只有9首(幾天前看的,忘了,周末放學回家改答案)。而且,儘管確實新曲增多,但是留在周刊上的536期的新曲卻只剩下了三首(好像是)。也就是說,大部分新曲也就只能推最多七天(我想應該沒人特意去看上一期周刊吧,除非補周刊)。在我看來,只推七天也並沒有什麼用。要說改進,就應該為了在下一期保留新曲而保留一部分上一期的pts,這樣至少能留住半個月。能連續兩次周刊看到同一首歌,印象肯定比只看到一次深。
去年可謂工作元年,周刊可以說是成為了萌戰的一個好地方了...就連周刊本身都被工作了...新規則可以說是取得了一定的成效的,至少,從這期周刊的表現上是這樣的比如說,修正A十次方就讓某曲0.01修正A,導致大量工作打了水漂新規則下,上榜新曲顯著增加,也正是「推薦新曲」的周榜本意(?)然後呢...新規則成功導致了:周刊畫質判別器連續入榜被斷,挑戰千本失敗;光速傳說曲連續前十被斷,挑戰露露失敗;被工作的最長門番再次沒拿到第一,還就一個第一,真丟人(x)所以說,目前看來,的確達到了減弱工作的目的,但新規則也可能被工作的。———————————分割———————————(下面是不靠譜瞎**的建議)建議和中V那樣,懷疑是工作的曲子直接不予上榜(瞎**建議)
不請自來,匿了
就本周周刊來看,還是有效果的,雖然這周好像很多曲子都被工作了
推薦閱讀: