建立中文分級閱讀標準，考拉閱讀的野心不止校內市場

01-31

調研 | 張揚東起

撰寫 | 東起

2016年成立的享閱教育選擇了一條新賽道——中文分級閱讀。

中文分級閱讀賽道幾乎還沒有開啟，其中一個主要原因在於中文本身的複雜程度，使評測體系難於建立。享閱教育創始人趙梓淳介紹，中文分級閱讀的難點主要在於三點：一是漢字數量龐大，對於英語基礎組成的26個字母，中文常用漢字約有3500個；二是分詞，中文沒有天然的分詞界限，如何分詞影響詞頻，進而關係到難度的定義；三是句法，中文句法結構隨性，增加了分析難度。

考慮到使用傳統語言學加統計學的方法需要大量的時間、人力和物力，享閱教育通過機器學習的方式搭建中文閱讀分級標準。

解決這一技術難題，依賴於享閱教育一支極為「性感」的核心技術團隊，CTO任易博士畢業於北京大學，曾在IBM、搜狐大數據部門和微軟亞洲研究院工作，有多年數據挖掘經驗，首席數據科學家Jake Zhao，師從人工智慧「大牛」Yann LeCun教授。

目前，享閱教育已構建起自己的中文分級量化標準（ER Framework），從字詞句段篇五個維度，以及下面更細分的幾十維特徵，對中文文本進行分級。

基於底層技術，享閱教育目前有3款產品：閱讀能力測評、考拉閱讀和中文分級閱讀標準。目前，公司的商業模式主要是To B，為學校提供以上3款產品：閱讀能力測評面向學生，提供測評和結果分析報告；考拉閱讀包括學生端、家長端、教師端和校長端，教師可以通過軟體為學生布置個性化的閱讀任務，學生在線上或線下閱讀、通過軟體完成練習並留下學習數據；中文分級閱讀標準則是所有產品的基礎。目前，To B產品根據用戶數按年收費。建立起品牌背書後，公司也將向C端拓展。

相對於國內，美國分級閱讀市場已經十分成熟，其原因主要在於三點，一是社會對於閱讀的重視程度較高，二是技術積累，例如被廣泛使用的藍思分級標準已經有30年積累，三是英文的特點和語言學研究積累。據趙梓淳介紹，Renaissance，Newsela和Lightsail等公司都已經得到市場認可。

隨著用戶意識轉變，中文分級閱讀市場將逐漸走向成熟，而自主搭建了底層標準的考拉閱讀，已經在市場中佔得先機。

趙梓淳先後在芝加哥大學和哥倫比亞大學獲得碩士學位，是連續創業者。近日，趙梓淳和愛分析分享了對行業和公司商業模式的思考，現節選部分內容，供大家參考。

愛分析：創業之初，對市場如何判斷？

趙梓淳：閱讀在美國是特別大的產業，無論重視程度還是產業支持都很好，其中分級閱讀領域比較亮眼的公司有Renaissance，Newsela和Lightsail。

Renaissance1984年成立，曾拿到Google Capital的4000萬美金融資，2014年以10億美金被收購。公司產品線很豐富，有用於測評的Star Assessment，通過20-30分鐘的測試，將孩子的閱讀能力量化，判定問題所在，用數據驅動教育發展；有承接測評產品的Accelerated Reader，通過他們自己的一套分級體系測出文本閱讀難度，與之前測評的學生閱讀能力匹配，保證學生讀到最適合自己的文字。

Newsela做新聞分級閱讀，B輪是扎克伯格投資，累計融資2600萬美金。公司的底層標準是用藍思分級，核心技術點是有一部分機器輔助新聞改寫，同樣的主題以不同的閱讀難度提供給相應理解能力的孩子；產品大概已經覆蓋美國70%以上的公立學校，每所學校收取4000-7000美金。

Lightsail做iPad端的個性化圖書館，B輪是亞馬遜創始人Bezos投資，累計融資超過4000萬美金。它也是基於藍思分級，可以在線看書是跟其他機構最大的區別；在中國通常是跟相對高端的輔導班以及國際學校合作。

在美國，分級閱讀市場其實已經很成熟。相比來看，國內之前有公司在做分級閱讀，但是沒做起來，這條賽道基本上沒有開啟。

因為無論什麼樣的公司做，其實背後都要有底層標準做支撐，去評估、測量出文本閱讀難度。國內遲遲沒有開展，是因為缺乏中文閱讀評級標準。

愛分析：這個難點在哪？

趙梓淳：首先最大的問題是中文太複雜，傳統統計學加語言學的方法有些無能為力。

第一方面是漢字數量多，英語基礎組成是26個字母，但中文最常用漢字大概3500個，中華辭海收錄的漢字超過8萬個，這導致了複雜構成的稀缺性，使我們分析漢語的時候需要更龐大的語料庫。

第二方面是分詞，英語有天然的分詞界限，但中文其實是模糊的，如何分詞會極大影響最後對難度的理解。

第三方面是句法，英語句式有先行詞和嚴謹的句法結構，更便於分析語法樹和嵌套深度等，但中文其實很鬆散，結構很隨性，這都導致了更大的分析難度。

當時跟很多教授溝通，他們說如果用傳統統計學加語言學的方法做這件事情，大概需要10-20年。

愛分析：考拉閱讀是怎麼做的？

趙梓淳：我跟合伙人任易博士在做這件事的時候，也受到Google Translation的一些啟發，通過機器學習來實現。因為直接用深度學習的問題在於沒有那麼大量的數據，從語料庫到學生行為數據等，國內都是一片空白，其實整個都是我們在搭建。

首先，我們打造了大概幾百萬字的非平衡語料庫，主要取材於各種語文教材。語言學家洪明教授和來自人民日報的十幾個人組成的標註團隊，從字詞句段篇五個維度、幾十維特徵，給文本進行標註。

第二步，用機器學習方法去學習這個語料庫中專家打標籤的規則，其實這也得益於現在技術的發展，現在有大概處理了幾億次的一個平衡語料庫。

再下一步要得出分數，像英語主要考察詞頻和句長兩個特徵，它們用手寫規則就可以得出公式，但在中文裡這兩點其實都不太靠譜，所以我們最後需要幾十維特徵來表徵中文的閱讀難度，把大概將近五十維的特徵，擬合進AI系統，最後得出從200-1300ER的分值。

隨著產品層面的數據越來越多，可以反向校準這個標準，類似於AlphaGo，實現自我進化。

這也是我們這套系統相比於英文分級系統的一大優勢。

愛分析：K12領域做語文的比較少，是不是也是因為這個技術原因？

趙梓淳：對，K12主要做的就是數學和英語，因為語文無從抓起，沒有任何的抓手，傳統的話或者是線下培訓班，或者是為語文老師提供教案、視頻或微課等。但如何通過數據驅動語文教育，提升閱讀能力，其實是沒有先例的。

我們在做的，就是將本沒有被收集的海量語文學習數據進行捕捉、整合以及分析，把語文學習變成自適應學習的過程。

愛分析：現在考拉閱讀的分級系統進展如何？

趙梓淳：現在我們打造出了第一套中文分級量化標準，與Yann LeCun教授等行業內專家溝通過，大概可以達到93%的精度。

愛分析：給學校提供的產品包括哪些？

趙梓淳：首先就是考拉測評，從各個維度考察孩子的閱讀能力，生成測評報告提供給學校、班級和老師。

我們現在測評了將近十萬名學生，覆蓋一線城市到四線城市，得到了中國學生閱讀能力第一份量表。我們不但能測出學生的閱讀能力水平，還能測出背後哪個技能點有欠缺。

愛分析：對孩子的測評結果如何與文本分級標準對應？

趙梓淳：需要用數學模型，將兩者擬合進一個體系，使測評分值和ER值對應。同時，還需要大量的實證性研究。

這部分驗證研究是測量心理學專業的李國超博士負責。學界做分級閱讀主要是認知心理學和語言學專業的人，認知心理學其實一直在做這件事情，之前主要研究方向是測孩子的閱讀認知障礙，以及對其的干預，設計各種實驗測量信度、效度等。

愛分析：進校產品在測評之外還有？

趙梓淳：考拉閱讀，包括學生端、教師端、家長端和校長端四個埠。

通過老師端，老師可以根據每個人的最適發展趨勢一鍵布置閱讀任務。目前考拉閱讀有幾千本課外書，每本書後面有30-100道題目，驗證學生是否讀懂。另外還有朗讀任務，幫孩子糾正讀音。

公司的人工智慧主要應用在三個層面，一是打造底層分級標準，二是自適應學習系統，就是學生端的自學功能，根據閱讀能力推薦相應內容，三是智能語音，在老師和家長沒那麼多時間的情況下，幫助孩子解決讀音問題。

愛分析：基於現在的產品體系，對於商業模式有哪些規劃？

趙梓淳：首先是To B，通過To B建立品牌背書；To B站穩後，這條賽道基本就關閉了。

第二步是2C，我們其實是天然適合2C的，閱讀產品並不像背單詞和學數學，孩子每天晚上要聽睡前故事，是客觀存在的場景。如何讓閱讀變得更有樂趣，讓孩子讀到他們能讀懂的東西，獲得成就感，從而建立激勵體系，這是我們要做的事情。