通俗易懂-數據分析學生是怎麼玩天天酷跑的

我從天天酷跑剛出來的時候就開始玩,中間有兩年間斷。到目前為止天天酷跑的坐騎從最初的衝刺400米沒有額外表現分的冰原狼,出到了最新的10倍踩怪得分,踩怪獲得臭鼬先生,吃到臭鼬先生獲得28888分並且和女警小兔有加成的正義摩托,角色也從一個只有三段跳的貓小萌到了四段跳可以召喚小狐狸的女警小兔,每一隻有表現分加成,出現三隻後還能衝刺的女警小兔。坐騎和角色的得分越來越無法通過描述來判斷,整個遊戲也成為了一個黑箱。提到黑箱,我們就應該來思考如何通過數據分析的方法了解各種搭配的得分能力。本文內容涉及到數據獲取,得分模型建立,角色坐騎分配和搭配建議。

1.數據獲取

作為一個被眾多人認知為在美國留學的應該坐在寶馬車裡被撞死的富二代留學生,我省吃儉用總共在遊戲中充值過200元人民幣,換算到遊戲中基本就是一個最新坐騎+一個過時角色的搭配。因此,想要通過自己的測試得到所有流行搭配的測評必然是不可能的。感謝只用看5秒廣告的YouTube,讓我可以找到各種測評視頻並且記錄各種得分。

需要說一句,本來我計劃用R語言自己編一個圖片文字識別系統的。但是,因為測評視頻有的是直接的截屏,有的是手機錄像,而且清晰度也不一樣,實在識別。因此我機智地選擇了手工紀錄的方法。我選擇的數據有以下幾個內容:ID,角色,坐騎,寵物,精靈,模式,900米,1050米,2500米,5000米,7000米,8000米,10000米,12500米的得分。因為手工紀錄,所以目前為止我只紀錄了20條紀錄,模型的準確率是肯定不能保證的,不過,隨著模型的優化,我們依然可以獲得一些結論。

2.得分模型

紀錄數據後我們遇到的第一個問題就是如何建立得分模型。按照我的遊戲體驗,我認為遊戲的得分應該是按照奔跑距離遞增的類似指數分布的分布。但是,一個合格的數據分析師最不應該的就是揣測數據,因為如果揣測數據,那麼數據分析師就沒有工作的意義。

所謂的得分模型其實不過是計算表現分和距離的回歸方程,為了保證準確率,我們保留截距。

我們分別建立線性模型和二次函數模型進行擬合計算,在計算之前,我們可以預見二次函數模型一定比線性模型要精確,因為二次模型為了追求最優化,可以選擇把二次項係數選擇為0,這樣就和線性模型相同。但是,這並不是說次數越多的模型越好,因為增高次數會帶來很多未來的cluster和SVM方法造成很多的難點,因此當二次模型的二次項係數很小,且R方值提升並不大的情況下我們可以認為線性模型的擬合最好。

根據結果,我們可以認為得分的能力為線性分布,不同的搭配獲得的成績差別非常大。

3.基本信息

經歷了以上的步驟,我們可以獲得一些簡單的得分信息。

第一個就是經典模式和極速模式的得分能力區別。根據遊戲經驗,經典模式的得分能力很明顯不如極速能力。因為數據的樣本量非常少,我們需要去掉一個最高值和一個最低值,只後得到的結果為經典模式得分能力為1:1802,極速模式的得分能力為1:2113.4,可以看到極速模式的得分能力在相同的距離下比經典模式多17%。

第二點,原本的得分中女警小兔+星空宗主的得分最高,第二名為女警小兔+小丑庫卡,我們可以發現女警小兔(全程240%得分能力)都存在,而她的技能也成為其站台能力的一個最強保證。

4.簡單的決策樹模型建立

下一步,我們使用decision tree模型,建立一個簡單的描述模型,希望找出什麼樣的搭配能夠獲得高分。在此步之前,我們需要更改並格式化數據。具體包括以下幾點。

4.1統一得分模型

根據前部分所說,我們的得分能力在經典模式和極速模式中很不一樣,我們可以把經典模式得分的1.17倍作為統一的得分結果。

另外,為了獲得更多的模型的信息,我們把角色和坐騎的信息分解為其上架時間和所提供的能力。對於角色,我們設定角色的特性能力為衝刺、加成、衝刺加成和舊角色改良,坐騎的能力分為超級獎勵、飛行加成、踩怪飛星和獎池坐騎。修改後的數據如下:

4.2使用decision tree獲取分類信息

因為數據太少,我建立了一個及其簡單的decision tree,我們試圖找到一些規律。需要提前說明的是,此研究得到到結果與你想像可能完全不同,這非常有可能,因為第一數據量非常少,很難得到公正到結果,第二數據分析的目的就是解決你腦子想不到和想錯的結果。通過上圖,我們可以看到如果角色是女警小兔或者齊天大聖的話,你有86%到概率可能拿到高分,另外在幾種寵物中,如果你不幸使用芙若菈的話,就必定是低分了。

下一步,我們建立random forest查看一下比較重要的對於得分影響的變數。

在random forest的importance結果中,我們可以看到坐騎,角色對於得分的影響非常大。另外,請注意坐騎類型也是一個很有影響力的屬性。還記得我們之前說過,坐騎分為飛行加成、踩怪飛星、超級獎勵和最重要的獎池坐騎。這四種哪種得分最高不用我再說了吧。因此,想獲得高分到話,買女警小兔/齊天大聖加上抽黃金獎池的坐騎絕對是最完美的選擇。

尾聲

一定有人會說,你用了這麼多文字和圖片最後得出一個放屁的結論,現在這個結論誰不知道。我想說的是,你說得很對。我們在初中學習的勻速直線運動在處理自行車速度的時候也是不如你的眼睛,但是與初中物理知識來自牛頓運動定律,而牛頓定律是相對論運動規律在低俗情況下的近似解,廣義相對論的預言可以看到引力波。沿著初中物理知識向上求索,你就可以學到引力波的知識,而計算自行車速度的方法只能延伸到計算汽車的速度。一個模型的完善和精確需要靠著幾代人的共同努力,我現在所建立的模型及其粗糙,但是隨著數據的增多,我就可以獲得一個越來越精確的結論。


推薦閱讀:

有哪些左右對稱的句子?
你有什麼惡趣味?
古代,近代,現代有哪些名人之間存在著千絲萬縷意想不到的關係?求指點?
如果dota裡面英雄技能你可以選擇一個用在你日常生活中,你會選擇什麼神技?
怎樣把會計學得有興趣?

TAG:遊戲 | 數據分析 | 趣味 |