標籤:

建立中文分級閱讀標準,考拉閱讀的野心不止校內市場

調研 | 張揚 東起

撰寫 | 東起

2016年成立的享閱教育選擇了一條新賽道——中文分級閱讀。

中文分級閱讀賽道幾乎還沒有開啟,其中一個主要原因在於中文本身的複雜程度,使評測體系難於建立。享閱教育創始人趙梓淳介紹,中文分級閱讀的難點主要在於三點:一是漢字數量龐大,對於英語基礎組成的26個字母,中文常用漢字約有3500個;二是分詞,中文沒有天然的分詞界限,如何分詞影響詞頻,進而關係到難度的定義;三是句法,中文句法結構隨性,增加了分析難度。

考慮到使用傳統語言學加統計學的方法需要大量的時間、人力和物力,享閱教育通過機器學習的方式搭建中文閱讀分級標準。

解決這一技術難題,依賴於享閱教育一支極為「性感」的核心技術團隊,CTO任易博士畢業於北京大學,曾在IBM、搜狐大數據部門和微軟亞洲研究院工作,有多年數據挖掘經驗,首席數據科學家Jake Zhao,師從人工智慧「大牛」Yann LeCun教授。

目前,享閱教育已構建起自己的中文分級量化標準(ER Framework),從字詞句段篇五個維度,以及下面更細分的幾十維特徵,對中文文本進行分級。

基於底層技術,享閱教育目前有3款產品:閱讀能力測評、考拉閱讀和中文分級閱讀標準。目前,公司的商業模式主要是To B,為學校提供以上3款產品:閱讀能力測評面向學生,提供測評和結果分析報告;考拉閱讀包括學生端、家長端、教師端和校長端,教師可以通過軟體為學生布置個性化的閱讀任務,學生在線上或線下閱讀、通過軟體完成練習並留下學習數據;中文分級閱讀標準則是所有產品的基礎。目前,To B產品根據用戶數按年收費。建立起品牌背書後,公司也將向C端拓展。

相對於國內,美國分級閱讀市場已經十分成熟,其原因主要在於三點,一是社會對於閱讀的重視程度較高,二是技術積累,例如被廣泛使用的藍思分級標準已經有30年積累,三是英文的特點和語言學研究積累。據趙梓淳介紹,Renaissance,Newsela和Lightsail等公司都已經得到市場認可。

隨著用戶意識轉變,中文分級閱讀市場將逐漸走向成熟,而自主搭建了底層標準的考拉閱讀,已經在市場中佔得先機。

趙梓淳先後在芝加哥大學和哥倫比亞大學獲得碩士學位,是連續創業者。近日,趙梓淳和愛分析分享了對行業和公司商業模式的思考,現節選部分內容,供大家參考。

愛分析:創業之初,對市場如何判斷?

趙梓淳:閱讀在美國是特別大的產業,無論重視程度還是產業支持都很好,其中分級閱讀領域比較亮眼的公司有Renaissance,Newsela和Lightsail。

Renaissance1984年成立,曾拿到Google Capital的4000萬美金融資,2014年以10億美金被收購。公司產品線很豐富,有用於測評的Star Assessment,通過20-30分鐘的測試,將孩子的閱讀能力量化,判定問題所在,用數據驅動教育發展;有承接測評產品的Accelerated Reader,通過他們自己的一套分級體系測出文本閱讀難度,與之前測評的學生閱讀能力匹配,保證學生讀到最適合自己的文字。

Newsela做新聞分級閱讀,B輪是扎克伯格投資,累計融資2600萬美金。公司的底層標準是用藍思分級,核心技術點是有一部分機器輔助新聞改寫,同樣的主題以不同的閱讀難度提供給相應理解能力的孩子;產品大概已經覆蓋美國70%以上的公立學校,每所學校收取4000-7000美金。

Lightsail做iPad端的個性化圖書館,B輪是亞馬遜創始人Bezos投資,累計融資超過4000萬美金。它也是基於藍思分級,可以在線看書是跟其他機構最大的區別;在中國通常是跟相對高端的輔導班以及國際學校合作。

在美國,分級閱讀市場其實已經很成熟。相比來看,國內之前有公司在做分級閱讀,但是沒做起來,這條賽道基本上沒有開啟。

因為無論什麼樣的公司做,其實背後都要有底層標準做支撐,去評估、測量出文本閱讀難度。國內遲遲沒有開展,是因為缺乏中文閱讀評級標準。

愛分析:這個難點在哪?

趙梓淳:首先最大的問題是中文太複雜,傳統統計學加語言學的方法有些無能為力。

第一方面是漢字數量多,英語基礎組成是26個字母,但中文最常用漢字大概3500個,中華辭海收錄的漢字超過8萬個,這導致了複雜構成的稀缺性,使我們分析漢語的時候需要更龐大的語料庫。

第二方面是分詞,英語有天然的分詞界限,但中文其實是模糊的,如何分詞會極大影響最後對難度的理解。

第三方面是句法,英語句式有先行詞和嚴謹的句法結構,更便於分析語法樹和嵌套深度等,但中文其實很鬆散,結構很隨性,這都導致了更大的分析難度。

當時跟很多教授溝通,他們說如果用傳統統計學加語言學的方法做這件事情,大概需要10-20年。

愛分析:考拉閱讀是怎麼做的?

趙梓淳:我跟合伙人任易博士在做這件事的時候,也受到Google Translation的一些啟發,通過機器學習來實現。因為直接用深度學習的問題在於沒有那麼大量的數據,從語料庫到學生行為數據等,國內都是一片空白,其實整個都是我們在搭建。

首先,我們打造了大概幾百萬字的非平衡語料庫,主要取材於各種語文教材。語言學家洪明教授和來自人民日報的十幾個人組成的標註團隊,從字詞句段篇五個維度、幾十維特徵,給文本進行標註。

第二步,用機器學習方法去學習這個語料庫中專家打標籤的規則,其實這也得益於現在技術的發展,現在有大概處理了幾億次的一個平衡語料庫。

再下一步要得出分數,像英語主要考察詞頻和句長兩個特徵,它們用手寫規則就可以得出公式,但在中文裡這兩點其實都不太靠譜,所以我們最後需要幾十維特徵來表徵中文的閱讀難度,把大概將近五十維的特徵,擬合進AI系統,最後得出從200-1300ER的分值。

隨著產品層面的數據越來越多,可以反向校準這個標準,類似於AlphaGo,實現自我進化。

這也是我們這套系統相比於英文分級系統的一大優勢。

愛分析:K12領域做語文的比較少,是不是也是因為這個技術原因?

趙梓淳:對,K12主要做的就是數學和英語,因為語文無從抓起,沒有任何的抓手,傳統的話或者是線下培訓班,或者是為語文老師提供教案、視頻或微課等。但如何通過數據驅動語文教育,提升閱讀能力,其實是沒有先例的。

我們在做的,就是將本沒有被收集的海量語文學習數據進行捕捉、整合以及分析,把語文學習變成自適應學習的過程。

愛分析:現在考拉閱讀的分級系統進展如何?

趙梓淳:現在我們打造出了第一套中文分級量化標準,與Yann LeCun教授等行業內專家溝通過,大概可以達到93%的精度。

愛分析:給學校提供的產品包括哪些?

趙梓淳:首先就是考拉測評,從各個維度考察孩子的閱讀能力,生成測評報告提供給學校、班級和老師。

我們現在測評了將近十萬名學生,覆蓋一線城市到四線城市,得到了中國學生閱讀能力第一份量表。我們不但能測出學生的閱讀能力水平,還能測出背後哪個技能點有欠缺。

愛分析:對孩子的測評結果如何與文本分級標準對應?

趙梓淳:需要用數學模型,將兩者擬合進一個體系,使測評分值和ER值對應。同時,還需要大量的實證性研究。

這部分驗證研究是測量心理學專業的李國超博士負責。學界做分級閱讀主要是認知心理學和語言學專業的人,認知心理學其實一直在做這件事情,之前主要研究方向是測孩子的閱讀認知障礙,以及對其的干預,設計各種實驗測量信度、效度等。

愛分析:進校產品在測評之外還有?

趙梓淳:考拉閱讀,包括學生端、教師端、家長端和校長端四個埠。

通過老師端,老師可以根據每個人的最適發展趨勢一鍵布置閱讀任務。目前考拉閱讀有幾千本課外書,每本書後面有30-100道題目,驗證學生是否讀懂。另外還有朗讀任務,幫孩子糾正讀音。

公司的人工智慧主要應用在三個層面,一是打造底層分級標準,二是自適應學習系統,就是學生端的自學功能,根據閱讀能力推薦相應內容,三是智能語音,在老師和家長沒那麼多時間的情況下,幫助孩子解決讀音問題。

愛分析:基於現在的產品體系,對於商業模式有哪些規劃?

趙梓淳:首先是To B,通過To B建立品牌背書;To B站穩後,這條賽道基本就關閉了。

第二步是2C,我們其實是天然適合2C的,閱讀產品並不像背單詞和學數學,孩子每天晚上要聽睡前故事,是客觀存在的場景。如何讓閱讀變得更有樂趣,讓孩子讀到他們能讀懂的東西,獲得成就感,從而建立激勵體系,這是我們要做的事情。


推薦閱讀:

TAG:教育 |