純乾貨 —— 三隻海龜背後的演算法與邏輯
1.英國邏輯
先講講我們是怎麼匹配英國學校的。英國的邏輯比美國簡單一些,基本上是0和1的關係。怎麼理解呢,就是英國大學幾乎每個專業對中國不同排名的大學都有詳細的,確定的錄取要求,而且除了G4院校(牛津,劍橋,帝國理工,倫敦政經)以外,雅思成績是不影響你的錄取結果的。那英國大學是看什麼東西呢?簡單來說是三樣東西,出身,成績和文書,排名分先後。英國人很古板,你的高考成績依然影響著你申請英國碩士。給大家舉個例子,順便給大家分享一下留學行業最機密的文件。我們以曼徹斯特大學的錄取要求為例
(第一列是專業名,第二列是中國大學的分類(英國一般參考網大排名),第三列是成績要求。)
回到我們的產品,通過上面的例子我們看到有三個變數,他們分別是專業,中國大學的排名,成績。再結合不同的英國大學有不同的申請難度,所以英國選校一共有四個變數,它們分別是英國大學,中國大學,專業,成績。如何將這四個變數變成擇校的演算法呢?JW是這麼做的,首先,將英國大學分類,這個分類是依據人的經驗以及過往的案例,將英國錄取難度相近的大學分到同一類。接下來,我們將專業分類,因為同一個學校的不同專業錄取要求也是不同的。比如近幾年大熱的金融專業的錄取難度就要比其它專業難上許多。最後,我們將中國大學的網大排名錄入到我們的資料庫當中,最後成績這個變數也是我們最最核心,最最重要的數據,是依據多位有著資深的行業經驗的人以及上萬的過往案例總結出來的。根據這四個變數我們可以得到初步的一個表格
其中T3代表英國錄取難度為T3等級的這一類大學,T500代表中國網大排名前500的學校,A-E代表五類專業,G代表985&211院校,S代表雙非院校,數字就代表要求的平均分了,也就是成績。
再結合每個學校單獨的附加邏輯
再結合過往的案例(offer與拒信)10000+
通過機器學習中的監督學習,不斷優化規則
得出我們的結論 舉例:上海大學 均分84 人力資源專業
JW敢拍胸脯的承諾,我們在英國的擇校準確率達到了90%以上。我們在選校結果頁呈現的院校直接可以成為你英國申請的定校標準。
2.美國邏輯
英國的邏輯我們講完了,下面重點講講我們美國的邏輯。美國的邏輯也是我們的重點,在演算法的複雜程度上和英國根本不是一個數量級的。JW今天準備只講一下我們美國邏輯的大概,因為要完全詳細的闡述清楚的話,可能JW的鍵盤會被按碎。
總體而言,美國的邏輯是一個模擬人腦判斷的過程,我們的產品也正是全力的復原這個過程。對於一個申請者而言,他的情況可拆分為兩部分。硬實力和軟實力。
硬實力包括三維,GPA,G(GRE/GMAT),T(托福,雅思)。本科就是把G替換成S(SAT/ACT)。在USNEWS上以及美國大學的官網上我們可以得到幾個數據
(以賓夕法尼亞大學沃頓商學院MBA下Finance方向為例)
我們抽取出幾個有用的數據 Mean GPA Mean GMAT Mean TOEFL 以及平均的工作經驗。針對中國申請者我們調整一下這幾個數值(美國頂尖大學由於種族比例控制潛規則,對中國的申請者會有更高的錄取要求),一共得出(200所學校乘以平均每所學校65個專業)13000套數據。加上軟實力,以及不同數值的權重,每套數據大致包含90個數據項。
結合案例,經驗分析數據可得出GPA單一維度與錄取概率的函數關係(手繪舉例,並不準確)
同理可得出托福和GRE/GMAT的函數關係
接下來,給三個數值加上weight(權重)
結合軟實力(工作經驗,獎項,科研成果,經歷,交換)設計出通用邏輯
根據極端情況(GPA超低,有專利或牛逼論文)設計出額外補充邏輯
依據不同學校的不同專業設置各個數值的不同權重
比如商科比工科更看重工作經驗,所以在選擇商科專業之後,關於工作方面的數值的權重會增加。
結合過往案例,文中提到的函數以及權重採用機器學習,自我成長。
(因為案例的局限性,目前為監督學習,輸出錄取或拒絕。接下來我們會不斷完善產品的特徵工程
通用邏輯+補充邏輯+某院校某專業的單獨一套數值+機器學習=三隻海龜)
搜索小程序:留學不用等
留學生最愛的擇校神器
公眾號: threeturtles
推薦閱讀:
※專業到底怎麼選?讀什麼專業才更有價值?
※你了解美國人的愛情觀嗎
※MS和MEng有什麼區別 | Terminal Degree | 美國學位雜談
※世界各國是怎麼吃燕麥的?
※那些指望留學光環的人,最終也死在了所謂的光環下...