標籤:

Scalers:基於數據驅動的英語學習思路

今天藉助計算機領域裡的一些概念,總結一種基於數據驅動的英語學習思路。

傳統上,我們在學英語的時候,老師都是給你講語法結構,從主謂賓開始然後以此展開加上定狀補。於是他們會告訴你,這個單項選擇,應該要有一個狀語,所以選擇C;然後下次你要使用英語的時候,於是你想要先有個主語再有個謂語,然後我要填一個定語……當然要用英語吵架的時候你就蒙了,因為不知道要用什麼時態。

這樣做其實也沒有問題,有許多人通過這個方式也學好了英語。但是按照計算機視角的理解而言,這是一種基於規則的驅動。也就是老師告訴你一組規則,然後你通過這些規則來引導你的學習,於是你需要在學習時想到這裡有什麼規則,然後針對你要用的詞,來適配這條規則。

但是我個人卻認為,自然語言的演化發展,來自於語言使用者的集體演進,而這是一個複雜的過程。而正因為其複雜,其中的很多規則,其實是後驗歸納的。

什麼叫後驗歸納?就是在看到現象以後去總結原因。比如許多混跡在互聯網上的講師就是後驗式的,他們看哪家公司成功了,就去以哪家公司的名義,開發一系列課程,並且美其名創業成功的XXX條鐵律……但是這不妨礙他們仍然只是一家培訓公司……

後驗的一個問題就是,歸納的規則有時候不是很完備,於是你就會看到一條規則下面有123456條特例。其實英語語法就是這樣的,這大概是為什麼你一直看不下去的原因。因為當特例足夠多的時候,規則的價值,就沒有想像的那麼大了。

今天說的是基於數據驅動的學習思路。規則其實是一種抽象,而要能理解抽象,就必須要有具象的積累和基礎。

而計算機里,數據驅動的意思是,在模型建立起來之前,我先積累到足夠多的樣本案例,然後基於這些樣本案例的學習,自行產生規則。通過這些規則,再對新的數據進行判定處理,再基於這些反饋,進一步優化規則。

有一點抽象。換成通俗地話就是,學習英語就是把大量的正確使用的數據輸入分析即可。什麼叫大量正確使用的數據?就是通過持續地練習,接觸到足夠多的樣本,做足夠深度的分析,確保足夠充分的吸收。

我覺得如果一位學習者,能做到這一點,扎紮實實地推進自己的學習,英語的進步其實是很快的事情。而且像所謂的語法,辭彙的問題,也從來不會是問題。

我就問你一個問題,英語是先有上帝設計了幾條規則然後再產生了這門語言,還是一堆人用用用到最後大家都知道這些詞是什麼意思,於是有人總結下來形成了語言現象?

先定規則再生產語言的事情,計算機科學家不是沒有做,只是現在做的還是不夠好。不然哪一天我的公眾號的文章也是用代碼生成的話,那其實我倒可以省事很多……

當我們輸入的數據量足夠大的時候,我們的大腦還是會發揮一些作用的,而這個時候,你的語感什麼的都來了。於是你再用語言的時候,你可以很輕鬆搞出正確的話來,因為你有積累過。

那,既然如此,為什麼老師會傾向於從語法講起呢?因為這樣講明確、簡單、樸素、省事啊……

我就舉一個例子。垃圾郵件的識別,在以前會手工加規則,如果標題含有「廣告」判垃圾;如果含有XXX,就通過……這些規則都太笨,後面人們用統計模型的方式,收集了一堆的垃圾郵件做分詞,然後通過貝葉斯來算概率,而到這個時候,你根本不需要知道是哪個因為所以,因為通過數據,有了模型出來,而這大概就是英語裡面說的語感。

但是這必須要是你自己的語感,不是別人的語感……

相關閱讀:

Scalers:能用思路解決的問題,不要用技巧

Scalers:我沒有什麼技巧可以給你,持續行動就是最大的技巧

Scalers:不做方法控:給英語學習拖延者的信

Scalers:學習的本質是心理問題

推薦閱讀:

10天時間如何準備英語六級考試?
不想再被貧窮限制想像力該怎麼破?!
如何快速通過自考英語二考試,建議收藏
如何優雅地給自己取一個英文名

TAG:英语 | 数据 |