試題推薦系統如何建立?

大家好,

我是一個對機器學習領域很感興趣的學生。我有一個項目,希望您可以給予一點技術上的思路的指導。此系統是一個面向學生的試題推薦系統,目的讓學生有針對性的做題,找出容易出錯的知識點,不斷給予推薦試題,強化弱點,是題海戰術的效率最大化。

1:系統給每個人一個賬號,運用機器學習,學生做的試題越多,推薦越準確。

2:系統最終可形成針對每個用戶的個性推薦系統。

3:每道試題會具有很多標籤,比如答對答錯、難度、知識點、字數,甚至做題時間,用戶血型,年齡等;我的想法是使用機器學習,發現每個用戶哪些知識點容易錯,錯誤的原因是什麼,和這些屬性中哪些更有關係。

最後,感謝大家百忙中閱讀我的問題,希望大家可以給一個此系統實現的一個大致思路。感謝!


這是個挺好玩的問題。說一下自己的想法吧,看看能不能幫上忙。

首先,你在裡面大量提到了「運用機器學習」,給人感覺機器學習就好像是個萬能的東西,用一下就能解決問題似的,這個想法很可怕嘛。機器學習不是黑盒啊,很多東西都可以用演算法解釋的。從這點上建議你看看機器學習和推薦系統中常用的演算法。推薦看@項亮 的推薦系統實踐 (豆瓣)

你說到了針對性地做題,找不容易出錯的知識點,那麼好,請回答,什麼是知識點?顯然,你在第三點中說的那些標籤都不是知識點。類比一下,商品推薦的配對是 用戶-商品,新聞推薦的配對是讀者-新聞,那麼試題推薦的配對就是學生-試題。這樣看的話,你要找的知識點和就比價好找了。其實就是試題之間的共性,就好像物品之間的共性一樣(比如,紅色,圓形,都是諾基亞牌子的,之類的)。這樣就可以用成熟的系統了。

至於個性化,可以用分數來作為一種變相的評分,進行協同過濾

至於第一點

系統給每個人一個賬號,運用機器學習,學生做的試題越多,推薦越準確。

這是當然的,也是必須的

我給你的建議是你可以參照目前成熟的新聞推薦系統,然後加以改造,畢竟新聞和試題都是一段話,形式上比較類似。

暫時先想到這麼多


從思路上說,你完全可以換一種想法。

你原來的思路是 用戶—題海—數據分析。

我建議你用 用戶量—題目——數據分析。

一個人做多道題,找到自己的薄弱項目,和多用戶做同樣的題目,找到題目的標籤化共性,在數據分析結果上,可以更加準確的找到題目的數據特點。

舉個簡單的例子。

題目:1+1=2,每個用戶做完這道題以後,都可以對題目進行標籤化評價:

題目:1+1=2 標籤:加法 | 初級難度 | 垃圾 | 小學生 | 這都不會可以死了 |

系統也可以通過系統標籤對用戶進行引導,這裡的系統標籤,可以是知識點。

然後可以由用戶自己進行推薦,比如站內推薦,外鏈推薦等等。

然後是用戶黏度

利用成長和評價機制來提高用戶黏度。

簡單的說兩句,很多還要你自己摸索。


這個場景根本輪不到用戶的偏好相似....每個題目內容打tag,建立簡單的內容I2I,然後根據內容推薦即可啊....也可以建user-tag-item圖模型,找到相關性較強的item.....如果一定要尋找題目錯誤和年齡等的關係,可以用機器學習建立用戶屬性和題目對錯或時間的模型(感覺這個用來給用戶推薦新的類目的題目更適合一些(逃


你說的這個東西我做過,很多人都做過。

你所謂的「試題推薦系統」,在我們領域裡叫計算機自適應測驗(computerized adaptive
testing),上世紀70年代就有人研發一套系統,50年代思想便產生了,ETS、SHL早就商用了。

計算機自適應測驗依據的是項目反應理論(item response theory)。需要用到的演算法包括能力估計演算法、抽題演算法和試題曝光控制演算法。這些網上資料都有。

你說的那個找錯誤點,在我們領域內叫認知診斷。認知診斷模型很多,基於Q矩陣的是主流,這些網上資料也很多,目前尚沒有商用。

上面這些都是教育測量的東西,教育測量模型很多,幾百上千吧,參數的、非參數的、二級計分、多級計分、單維的、多維的、補償的、非補償的、混合的、分類的、帶時間參數的。能滿足你所提問題的所有需要。」


無非是關聯推薦或者協同推薦。這個應用場景用協同推薦會更好。但是早期的數據啟動需要解決一下。至少幾萬人用過了之後協同推薦才會有效果。


有針對性的做題?

這個需求不明確。題目做錯的原因有很多,比如算錯了,比如根本不懂,比如一知半解,在這些情況下,你是有針對性還是沒針對性出題?

其實最簡單的還是用試卷,只要題目不重複即可。


推薦閱讀:

獨立思考的能力對孩子很重要
《X的奇幻之旅》——欣賞數學的樂趣
日本YWCA(Young Women』s Christian Association)營地考察之旅

TAG:教育 | 機器學習 | 推薦系統 |