Coursera.org 這樣的 MOOC 網站的數據挖掘前景在哪裡?


我來寫點我自己的想法。

首先,對於學習數據的挖掘,核心目的應該是在保持規模的前提下,為每個學習者提供儘可能的量身定製的學習體驗。我能想到以下這些方向或可有所作為。

  1. 幫助每個學習者了解自己的知識結構,按照興趣方向,推薦當前階段最合適的課程。這裡邊最重要的是:幫助學習者了解自己。現在各種MOOC課程非常多,有時候同樣名字的課程就有好幾門。這幾門課,有的或許長於理論,有的或許長於實踐,而且很可能深淺難度各不相同,先修內容迥異,常常讓人選擇的時候非常迷惑。如果要想達到較好的學習效率。個性化的推薦一定是非常重要的。而且一般人其實對自己的知識結構也沒有很清晰的認識。這裡演算法甚至有可能能比你自己更清晰的認識你。甚至我更嚮往能達到一定程度的對知識的量化,對學習效果的量化。當然這個目前看起來還挺難。
  2. 學習過程的優化,提高課程質量。這一點有很多平台已經在開始做了,這應該是最現實且最容易實現的目標。比如,如果有大量人反覆觀看某一段視頻,那很可能是這一段講解不清晰,這一段的質量有待提高。如果有大量人做作業的時候都犯了同一個錯誤,那麼這道題一定有或多或少的問題。或者說老師傳授的相關知識有問題。這些信息都有助於在下次課程中提高課程質量。
  3. 了解人類的學習模式。這可能會是前所未有的研究方向。認識人類自己,認識我們的學習。從而有針對性的提高我們的學習效率。試想我們每個人一生都要有20年甚至更多時間用來學習,這其中又能有多少時間真正被用在了高效學習上?如果能夠對人類的學習模式有更深入的了解,也許我們能夠大大減少需要投入學習的時間,更多的創造新的東西。

我覺得某種程度上說,MOOC只是起點。我們或許可以通過這種前所未有的教育大數據,來認清我們人類自己,認清我們每一個人,認清我們所創造的那些知識。


MOOC(大型在線開放課程),提供了一個公共學習的平台,給更多人可以接觸到不同風格,不同內容的教育,而數據挖掘技術的應用,可以提高學生學習的效率,給他們更多的指導,畢竟教育領域有很多與商業領域不同的地方,如課程之間的序列關聯性和時效性,用戶的知識水平和接受能力等,拋磚引玉,提兩個應用:1.課程序列挖掘:記得是CourseRank,在斯坦福大學,麻省等高校的選課中都有應用,挖掘課程的先後順序,比如學習&>之前,需要先學習一門編程語言,但在非正式教學環境中挖掘起來要更加複雜:2.個性化推薦,根據用戶的興趣愛好和需求,為用戶推薦個性化的課程推薦和學習資料(如博客,論文,試題等)推薦服務等.


學習是一個非常複雜與個性化的過程,分為兩個方面,一個是學生的角度,一個是從教師的角度。從學生的角度來看,目前傳統的教育模式的主要缺陷就是忽略了學習者自身能力和素質的差異性而提供了一個一致的教學過程,很難做到因材施教。同樣,從老師的角度來看,同樣課程由於施教者的不同而肯定具有各自的特點,由於地域的限制和資源的差異,無法在更宏觀的範圍做到施教者和學習者最理想的匹配。目前互聯網思維在傳統的教育領域不斷在滲透,MOOC的出現就是一個很好的方向與嘗試。基於MOOC平台的教學過程會產生大量的學習過程中的交互數據與信息反饋,對這些數據的挖掘與處理可以用來分析學習者在學習過程中的大量細節信息,綜合這些信息可以幫助MOOC平台完善自身體系的建設;幫助授課者改進教學過程,提高教學效果;能夠更好的評價學習者的學習效果,等等等等。總之,數據挖掘在MOOC應用中的前景非常廣闊。平台、數據和數據挖掘是保證MOOC健康良性發展必不可少的三個基本技術要素。至於前景,我覺成熟的數據挖掘技術的出現對MOOC的影響,類似於Yahoo和Google的出現對互聯網路發展的影響。


MOOC網站除了提供優質課程外,還是一個用戶導向性網站。

1.對於任何直接有網民參與發展壯大的網站來說,推薦系統是必須要重點關注的。必須能根據用戶的瀏覽點擊等動作推薦給用戶他最可能感興趣的內容,才能留住用戶。MOOC也不例外,通過學習者的課程搜索,瀏覽,點擊,參與等動作,推薦給他最可能感興趣的課程。

2.其次,雖然Coursera是以普及全世界最好的教育資源為己任,但是還是有相當MOOC平台希望能通過課程營利。這樣的話,除了留住用戶外,還必須對用戶願意為此支付的費用進行精確預測。同時通過用戶行為興趣分析,還能進行網頁廣告的精準投放。

3.除了上述兩點用戶導向性網站都會考慮的問題外,作為知識提供的平台,MOOC還應該加強老師與學生之間的互動。可是MOOC上的學生成百上千,對於一門課一個老師或者加幾個助教來說,一對一的互動不太現實。學生方面,智能回答、智能批改作業系統需要通過機器學習和數據挖掘來實現;老師方面,學生集中反饋的問題等也需要利用機器學習和數據挖掘。

4.最後,關於個性化施教方面。如果MOOC能夠根據單個學生的歷史學習數據進行智能學習規劃,智能作業習題產生,相信會比真實的學校學習效果更好。


謝謝邀請,雖然我對數據挖掘不熟,但是也知道數據是關鍵,mooc類網站的數據最值錢的就是用戶數據和課程數據。最後有這些數據可以進行一些喜好關聯挖掘之類的,或者是一些喜好的時間分析等。哈哈,我是外行。。


我覺得這個問題需要從宏觀上去看,大多數人學習還是為了解決問題(工作中與生活中的),所以從MOOC數據挖掘中,可以看出在大眾眼裡,那些問題是大眾當下最容易碰到的,有了痛點,就有機會做一個產品來去解決這個痛點,從而創造出直接解決問題的產品。


MOOC網站的數據挖掘可以對課程內容質量、課程難度、用戶喜好等方面的分析提供數據支撐,可以幫助改進課程內容,也有效推進教育信息化研究等工作的展開。


推薦閱讀:

數據分析中會常犯哪些錯誤,如何解決?

TAG:數據挖掘 | 網站 | 數據分析 | Coursera |