Hey,在 MOOC 上你該這樣學習 | 論文訪談間 #11

「論文訪談間」是由 PaperWeekly 和中國中文信息學會青工委聯合發起的論文報道欄目,旨在讓國內優質論文得到更多關注和認可。

論文作者 | 潘亮銘,李成江,李涓子,唐傑(清華大學)

特約記者 | 何偉棟(中國科學技術大學)

知識先後序關係是人們在學習、組織、應用和產生知識的過程中廣泛存在的知識間的認知依賴關係。本傑明·布盧姆(Benjamin Bloom)在 1968 年提出,學生必須在基礎知識上達到一定程度的掌握(例如,基礎知識的 90%),然後才能繼續學習後續的知識概念。從此, 知識概念之間的先後序關係成為學校和大學設計課程的基石。

在傳統的大學課程中,一般由老師或者助教以概念先後序關係組織知識結構,從而改進課程規劃,指導學生學習,提高教育質量。然而,在大規模在線開放課程(Massive Open Online Courses)的時代,面對成千上萬不同學習背景的學生和海量來自不同大學和機構的課程,傳統的通過人工構建概念先後序關係網路的方法變得越來越不可行。因此,探索從大型課程空間中自動挖掘知識概念之間先後序關係的方法,從而使不同背景的 MOOC 學習者可以更好地設計個性化學習的學習方案,顯得尤為重要。

然而,這個問題有著不小的挑戰:(1) 目前還沒有在 MOOC 情境下進行概念先後序關係學習的相關工作;(2) 已有的先後序關係學習方法大多使用了維基百科相關特徵,因此必須假設概念具有相應的維基頁面,而 MOOC 中許多課程概念在維基百科中並沒有詞條對應, 因此需要設計更加通用的特徵;(3) MOOC 中課程結構的複雜性使得其他相關方法中使用的簡單結構特徵難以奏效,需要設計新的結構特徵來學習 MOOC 廣泛存在的跨課程、跨學科概念間的先後序關係。

為了應對這些挑戰,來自清華大學的潘亮銘,李成江,李涓子老師和唐傑老師發表在 ACL2017 上的論文「Prerequisite Relation Learning for Concepts in MOOCs」首次研究了如何自動地挖掘出 MOOC 課程概念間存在的先後序關係,即概念間的學習依賴關係。

論文主要研究了 MOOC 中不同信息對於 MOOC 課程概念先後序關係發現的貢獻,並提出了一系列有效的特徵對 MOOC 課程中的概念先後序關係進行判斷。具體而言,論文提出的特徵可以被分為三類:

1. 語義特徵:利用大規模的維基百科知識庫作為輔助語料學習得到課程概念的語義嵌 入表示,利用課程概念在向量空間中的距離度量概念間的語義相關性;

2. 上下文特徵:利用課程概念在視頻上下文中相互引述的模式定義了三個層面的特徵, 包括視頻引用距離、句子引用距離和維基引用距離;

3. 課程結構特徵:利用 MOOC 課程的結構幫助先後序關係的判斷,文中定義了平均位置距離、分布不對稱距離和複雜度水平距離三個特徵。

最後,根據定義的特徵,將先後序關係學習問題形式化為二分類問題,即對給定課程概念對使用以上特徵判定其是否存在先後序關係。在 Coursera 平台上不同領域(計算機、數學、金融)的真實在線課程數據集上的實驗表明,論文所提出的方法無論在準確率還是召回率上都明顯超過了現有的概念先後序學習方法(包括上下位匹配方法、引用距離、監督關係識別方法)。

對話作者

關於本文的創新點,作者認為主要有如下三點:(1) 首次提出了 MOOC 中課程概念先後序關係學習問題,並提出了一種有效的基於多維度特徵的課程概念先後序學習方法,從語義特徵、上下文特徵和結構特徵三個層面首次有效識別了 MOOC 中的概念先後序關係;(2) 已有的先後序關係學習方法大多使用了維基相關特徵,因此必須假設概念具有相應的維基頁面,本文的特徵可以應用於任何概念,更加通用;(3) 構建了 MOOC 中課程先後序關係學習任務構建的評測數據集,有效彌補了 MOOC 研究在數據上的空白,為後續圍繞 MOOC 課程概念的相關研究做了良好的鋪墊。

關於本文的實際應用,作者認為在智能學習路徑規划上有不錯的前景。例如,一個對「條件隨機場」並不了解的學生想學習這個概念。她可能被淹沒在 MOOC 平台眾多相關的課程中,而不知道從何入手。通過課程概念圖中包含的概念先後序關係(下右圖),MOOC 平台可以為該學習提供一條連貫、合理的學習路徑(下左圖),即先在「概率統計」課程中學習 「極大似然估計」,接著在「概率圖模型」中學習「隱馬爾可夫模型」,最後在「機器學習」 課程中學習「條件隨機場」。

關於未來的工作,作者覺得可以加入 MOOC 中的動態交互信息來幫助學習課程概念先後序關係,例如課程論壇中的信息、用戶行為信息、教師與學生互動的信息、學生對課程試題的回答情況等。作者認為這些動態信息才是 MOOC 最獨具特色的信息。

歡迎點擊查看論文:

Prerequisite Relation Learning for Concepts in MOOCs

關於中國中文信息學會青工委

中國中文信息學會青年工作委員會是中國中文信息學會的下屬學術組織,專門面向全國中文信息處理領域的青年學者和學生開展工作。

關於PaperWeekly

PaperWeekly 是一個推薦、解讀、討論、報道人工智慧前沿論文成果的學術平台。如果你研究或從事 AI 領域,歡迎在公眾號後台點擊「交流群」,小助手將把你帶入 PaperWeekly 的交流群里。

微信公眾號:PaperWeekly

新浪微博:@PaperWeekly


推薦閱讀:

嘿,朋友,老夫掐指一算你就是「水軍」 | 論文訪談間 #13
評測時如何構造訓練數據分布與測試數據分布一致
多輪對話之對話管理(Dialog Management)
PaperWeekly 第37期 | 論文盤點:檢索式問答系統的語義匹配模型(神經網路篇)
詞向量

TAG:自然语言处理 |