新智元 AI 技術峰會
演講人:栗浩洋(乂學教育創始人)
【新智元導讀】據艾瑞諮詢的報告,2018年中國在線教育市場規模達2727.1 億元,AI+教育是其中大有可為的領域。在 3 月 29 日新智元產業 · 躍遷 AI 技術峰會上,乂學教育創始人栗浩洋詳解了乂學在AI+教育的方向、方法和成績,栗浩洋說,乂學的終極夢想是讓每一個孩子身邊都有一個像蘇格拉底+達芬奇+愛因斯坦合體的AI老師,實現真正的教育公平。
栗浩洋:很高興能夠在新智元的平台和大家交流AI+教育這個話題。AI現在基本是被圖像識別和NLP壟斷,但在2014年我們開始做這一行的時候,不但人工智慧沒有火,很多人還對我們提出了很大的質疑:人工智慧是不是能夠代替特級教師進行教課?還是只是作為一個輔助老師?乂學教育從創立開始就立志All-In地用人工智慧教育系統代替老師。我們希望用AI顛覆這個一千年來沒有改變的行業,能夠代替資深的、幾十年經驗的高級教師甚至特級教師的工作,這個過程我也想和大家分享一下。
在中國1.6萬億的教育市場當中,K12業餘補習有5000億的規模,但是新東方和好未來都只佔1.4%,前十名加起來還不到5%的份額。在這個市場里有4萬+品牌、140多萬家學校提供著質量非常參差不齊,甚至慘不忍睹的服務。為什麼這個市場這麼鬆散?核心的原因是優秀教師資源的稀缺性。為什麼要砸700萬元買一個學區房?就是因為真正名校的優秀老師是幾乎被權勢、資金和關係壟斷的資源,以前是考得好就可以上名校,現在考得好都不行了,必須要有這個地方的房子。
如何用AI打破教育領域的壟斷?這是我們在做的事情。乂學教育採用智適應的在線教育系統進行教學,這樣的Adaptive Learning系統在美國已經應用到各種教學模式的幾千個學校當中,證明了它的效果好於優秀老師的教學水平。
我們是中國第一家開始這樣做的,去年10月份的時候有一場比較轟動性的,應該說是亞洲第一場的人機大戰。大家聽說過AI教育領域兩場人機大戰的其中一場是去年6月份學霸君的高考機器人和高考狀元對戰, 結果AI打敗了高考狀元,也是用NLP讀題,通過讀題匹配已有的題和答案。我們的難度可能要高十倍,因為我們面對的對手不是學生,而是十七年經驗的高級教師。
大家都知道十五年以上的經驗才有可能參評,一百個老師裡面才能有一個能夠評得上這個職稱。我們通過二十個小時的教學,教學機器人組的學生成績、提升分數要比對照組和高級教師組的高出九分。全程幾十家媒體見證和公證,我們也是全程直播,包括艾瑞和我們從頭到尾發布了聯合報告,教育局是作為第三方的出題人和改卷人。應該說這在中國是標誌性的事件,人工智慧未來真的可能代替幾百萬老師的工作。
當時人民日報、CNBC和NHK都對我們進行了廣泛報道,在說中國發生了這樣一件大事。乂學教育的學術論文也被整個人工智慧教育領域當中最頂級的三場大會一年之內先後引用,並且邀請我們去演講。我們剛剛被邀請參加ACM舉辦的全球Adatpive Learning大會進行演講。
人工智慧教育的技術層面我們已經是中國遙遙領先,而且在全球也是頂級的。我們的原理是什麼?如何用人工智慧模擬一個特級教師,對學生進行一對一的教學呢?我們主要是通過四個邏輯:
就像Alpha-Go通過棋譜+機器學習來判斷局勢一樣,我們是通過知識圖譜和資訊理論精準定位每個學生的知識點。以前每個學生什麼是沒有清晰用戶畫像的,我們只知道是五十分的學生或者九十五分的學霸,但並不知道真正的知識地圖的定位到底是怎樣的,現在我們有了演算法和技術解決這個問題。
我們要給不同的學生進行個性化推薦,就是我們講了一千年的因材施教。現在的課堂當中仍舊沒有辦法進行因材施教,不管是五十分的孩子還是九十分的孩子,全部都要聽老師按照一個速度進行教學,這種千人一面的教育就像過去騰訊新聞和新浪新聞一樣,如果我們想要像今日頭條那樣千人千面地進行分發,需要通過機器學習,包括採用遺傳演算法把學生的知識點相吻合的題目和內容,不斷地、越來越精準地推給學生,達到最高效的學習效果。
當然,我們還有更多的技術能夠帶來對過去傳統教育的顛覆,包括追根溯源,比如一個學生的知識有了問題,只有一個名師不斷地反問和挖掘才能知道到底是哪裡不會或者根子上有什麼問題,現在我們要通過系統解決這個問題,找到這個學生學習的問題根源到底在哪裡。
最後的戰略放棄也特別有趣,這是傳統教育當中完全沒有的,也是我們和AlphaGo最像的地方。我們在教學的過程當中不是一定要教完並且教會,在教學的過程中我們要放棄很多知識點。公立學校的初二數學或者初三物理的老師,不會只教部分知識點,而在我們這裡,如果我們覺得這個知識點教學的效率特別低,考試當中出現的分數和概率也不高,學習這個知識點又特別慢,那麼我們就會放棄一部分知識點的教學,而是讓學生學習相對吸收度最高的知識點和未來考試分數最好的知識點。有人可能會說我們這樣是惡性應試,但AI對所有數字的敏感度肯定是高於任何一個特級教師的,它對結果的保證度也是高於任何一個老師的判斷,從效果而言,過去三年半的研發和一年的教學實踐當中我們取得了非常好的學生分數提升的效果。
我們是通過這樣的AI智適應的學習引擎,不斷地通過學生的歷史數據和知識所有的分布,並通過學生實時學習的數據交互,動態地給到學生不同的學習內容和學習路徑,最終達到這樣一個教學效果。我們和海外10億美金獨角獸的同行、人工智慧教育最頂級的機構不一樣的地方就在於他們只做引擎不做應用層的開發,我們不但做自己的引擎和自主知識產權的開發,同時還做自己的教學內容的研發,所有的這些內容都是專門為了這個引擎設計的,達到的效果就會更好。同時我們還直接做教學服務,直接進行2C招生, 例如線上的51Talk等,學生直接在家裡電腦系統裡面跟著我們學習。我們在全國已經開了500多家線下學校,也被我們稱之為教育新零售,就是真正的無人教室。在我們的現在學校里,學生雖然到了這個場景,但並不是老師來教授,而是電腦系統的AI老師和學生進行實時的互動。
目前我們做到的除了納米級的知識點拆分、關聯地圖、知識圖譜的關係鏈,還有個性化學習路徑的推薦,這些都是全球領先的水平。但它的原理是如何實施的?並不是說教學機器人像一個老師一樣進行人機對話,其實我們有點像AlphaGo,就是進行策略邏輯的推斷,給學生推送不同的教學視頻、不同題目的解法講解,包括視頻、動畫、錄頻、Lecture Notes和各種各樣的練習。
我們首先要做的是知識點的掃描,就好像小的時候我是一個95分的孩子,真正測試以後不需要學習所有的100個知識點,到了業餘補習,只需要學習我不會的5%的知識點就可以了。通過這樣的學習,我們把過去傳統教育的學習效率提升了5-10倍。有些學生可能有24%的題目不會,那麼就要補這24%的內容,需要比我多花3倍的時間學習,但比100%全部都學也節省了4倍的時間和效率,有些孩子可能只有40分的水平,50%的知識點全部都不會,這個時候我們的戰略放棄就用到了,並不需要學習所有的知識點,只學習40分到50分的知識點,可以考到60分就可以了,放棄70分或者90分的知識點,提升十幾分達到及格水平。
Adaptive Learning為什麼會在全球取得非常好的效果,並且在國內試用的時候產生超過特級教師的教學效果?因為它對好學生來說是因人而異地高效學習不會的知識點,而對差的學生來說50分的孩子教的是51分的知識,很快就可以學會和掌握,然後再給52分和53分,非常容易輕鬆地進步。過去在課堂當中是完全聽不懂老師講課的,所以我們是從根子上顛覆了過去教育的情況。這對演算法的要求非常高,也就是對每一個學生的用戶畫像和知識水平的檢測要求非常高。
在全球來講,納米級的知識分拆其實是Adaptive Learning能夠實施的基礎。什麼是納米知識點的分拆?如果知識點拆得非常粗,比如一個形容詞的知識點可能要學習四個小時,如果形容詞分成了十幾個知識點,我們發現只是形容詞的位置出現了問題,或者是同義的辨析出現了問題,這個時候我們只要針對納米級知識點進行教學,測試測量就可以從過去的X光變成了核磁共振的CT,能夠更精準地知道你的知識點的缺陷,這個時候我們對整個的教學效率也會變得更優。
就和圖像識別一樣,如果只是過去人類高鼻子、濃眉毛、丹鳳眼,不是細到每個像素地解決這個問題,問題的解決效率就會變得非常的低。但是當我們用了納米級知識點的時候,我們也出現了很多的問題。過去初中數學可能是500個知識點,我們拆到了12000個,但要給學生的測試變成了12000道題,七天七夜,孩子根本不可能承受。我們如何通過貝葉斯網路、貝葉斯推斷以及知識追蹤理論,通過500道題測出10000個知識點,哪些會哪些不會,而且達到90%以上的精準度,甚至可能比高考的精準度要高出幾倍的效率?這是我們不斷研究並且取得非常好效果的地方。
去年我自己提出了一個理論, 並和AI科學家一起去做,同時今年準備申請IEEE論文獎。美國和歐美所有同行的知識地圖都是一個hierarchical結構,比如測了二元二次方程, 那麼先學的50個知識點是不用測的,比如一元一次方程、求根、加減乘除和方程移位一定都是先學習知識點。但是大量的知識點之間是沒有必然聯繫的,比如你會了一個形容詞,你的條件狀語從句是不是會呢?可能只會20%,如果會了條件狀語從句,定語從句是不是會呢?也許只會34%。當時我提出的這個理論在整個AI演算法上面加上了幾個點,也就是說所有的一萬多個知識點當中,任何兩個看似毫不關聯的知識點當中可能存在著一定學生認知程度的關聯度,這種關聯度不管概率是1%、35%、79%還是99%。我們可能都會放一個先驗值。通過大量的數據以及深度學習以後,我們可以越來越准地找到知識點之間的關聯度,甚至不同的學生同樣的知識地圖,不同的知識點之間的關聯都是不一樣的。後來我們算下來,覺得先驗值可以為任何數,我們都可以找到這種關聯性。在這種情況下,我們把整個教育的測試效率和學習效率又乘以5-10倍的提升。
過去三年的實踐當中我們越來越發現每一個學生在學習每一個知識點的時候狀態是多麼的不同,比如立方根的知識點, 學生看了一個視頻只是做了幾道題,用了260多秒就完成了知識的學習,但最慢的學生用了3900秒才完成了知識的學習,把所有的學生放在一個教室裡面學習是多麼恐怖的事情。而對不同的知識點來說,同樣的學生體現出了不同的學習時間,不是說一個學霸學習任何知識點都要四十五分鐘才能學會,有的是七十分鐘就可以學會,有的是九十分鐘才能學會,不能把同樣Level的學生放在基礎班或者尖子班。通過後台的數據我們發現,世界上沒有任何兩個學生應該放在一個班裡面進行學習,因為他們對每一個知識點的學習速度都是不一樣的,我們應該給到他們與眾不同的學習路徑和學習速度,這才是真正對學生的尊重。
案例中是我們針對同一個知識點的學習,這堂課當中總共有十幾個知識點,其中一個學霸只有三個知識點不會,所以只要學習三個知識點就OK,有的學中只有七個知識點不會,有的學苗十個知識點都沒有掌握。每個人的學習時間是不一樣的,但我們不會讓學苗一直學到學霸的水平,可能只會讓他學到六七十分的水平,所以給的難度係數只有1.86,學中是2.34,學霸就達到了2.8。所以每個學生不管學習時間、學習知識點、做題的數量、題目的難度全部都是與眾不同地對待,這在過去傳統的課堂當中是不可能實現的,但是今天我們通過AI實現了。
這個行業當中也有很多競爭對手,到現在為止已經有40多家中國的在線教育機構宣布自己是人工智慧智適應教育機構了,這裡我們和競爭對手最大的區別在於幾點:首先在這40多家當中有36家都沒有介入到教學過程,他們用AI是處在AI題庫、AI作業和AI測評,包括利用AI的演算法提升語音識別,不是學生從不會到會的教學過程。而我們最重要的教學過程,提升學生每個知識點的認知速度和認知敏感性的問題,而在這個方面全中國只有三四家公司全心地在做。這些公司當中所有知識點拆分的細膩度也是完全不同的,這是我們和競爭對手的對比,基本上我們的知識點拆分是競爭對手的10倍甚至20倍的細膩。當更細的知識點進行拆分以後,我們能夠做到的對每個學生用戶畫像的精準了解,而且各家的拆分方法都是很不相同的,我們已經做到了這個行業相對最優。
整個學習流程當中,有些是在課前測試當中使用了智適應演算法,有些是在作業流程當中使用了智適應性演算法,我們是在五個所有的流程當中全部使用了智適應演算法。可以發現我們每輪融資額相對比較大,去年天使輪就融了2.7億元,很多人說我們融了天使輪基金,有人把我們稱為「摩天輪」。想要在人工智慧尤其是教育行業當中作出建樹的話,對資金投入的要求確實是非常的大。
這個過程當中我們也做了一些前所未有的、全球同行都沒有做過的事情。除了演算法優化之外,我們對語文的拆分是行業當中聞所未聞的。AI科學家和我們語文組的組長一起談的時候,語文組說,語文沒法拆分,尤其是閱讀。讀不好就只能讀,最多稍微分級閱讀,沒有辦法點對點地進行用戶畫像,以及非常清晰地知道薄弱點到底在哪裡。經過了三年的努力,我帶著語文組按照智適應系統的要求進行了拆分,可以知道這個孩子是環境描寫的水平不行,或者是對人物線索和情感線索的區分做得不好。經過這樣的拆分以後,我們可以把一種玄學變成科學。以前我們說教育是一門藝術或者玄學,現在逐漸變成了科學。
不僅如此,我們把學習能力和學習方法進行了拆分。我們不希望只是一個高考的提分機構,雖然我們做這個事情速度特別快,肯定是比GPS打敗老司機速度更快地打敗特級教師,但我們希望我們是能夠對孩子終身成長有益的機構。怎樣教會孩子學習方法和學習能力是我們所關注的。而能力在過去又是一門玄學,怎麼講這個孩子能力強還是不強?我們找到了全球認知學和教育學的文獻都沒有找到方法論。後來在公司當中我們提出了三可原理,必須要把能力拆分成可定義,比如情商怎麼定義?沒法定義就沒法傳授;還要可測量和可傳授。現在我們已經可以非常自豪地說,我們可以對學生用AI教師進行學習方法和能力的學習。
最後我想說的是:乂學正在做的並且已經找到了方式、方法和方向的事情是:我們會在三年內做到的事情是不但培養小孩子知識點的掌握、考試高分的獲得,不但培養終身學習能力和學習方法的獲得,而且現在我們正在研究如何用AI老師培養、提升小孩子的創造力和想像力。我們的終極夢想是讓每一個孩子身邊都有一個像蘇格拉底+達芬奇+愛因斯坦合體的AI老師,一起來給孩子教學。未來在這個世界上不需要任何學區房,也不會只有那些太子能夠請到太子太傅這樣優秀的老師,我們可以用一個AI系統把一個最高智能的老師給到任何一個孩子,發揮孩子的潛能,並且做到教育真正的公平性。
TAG:教育 |