建立你自己的專屬英語語料庫,媽媽再也不擔心你的寫作啦
- 我可不可以說「get on a car」?
- 我是應該用「a」還是「the」,還是都不用?
- 別人如何提出觀點?
- and,but這種詞到底能不能用在句首?
- look forward to/dedicated to等短語後面的動詞應該是用do還是doing形式?
- 對於我感興趣的某一個話題,作者是如何展開討論的?
- 我該用哪一個介詞,比如是discussion on還是in?
- 某個詞最常見的搭配是什麼?
不過,還好你們有我,我現在來告訴你如何建立自己的專屬英語語料庫。再遇到上面的問題自己一個人完全搞定。
1,什麼是專屬語料庫?
我強調專屬語料庫,是因為你可以根據你此刻的需要來建立專門的語料庫。例如,你是數學專業,正在寫英文畢業論文,那麼你可以圍繞「數學」建立語料庫,這樣不但可以知道專業術語的慣用法,也可以從搜索結果中學習到本領域最優秀的學術著作是如何論述一個問題的。對於專屬語料庫,大致歸為以下幾類:n- 考試類學術寫作:四六級,考研,雅思,托福,GRE等等
- 論文寫作
- 非學術類寫作
- 將自己的英文寫作作文建立成一個語料庫。
你可以用這個語料庫不斷地檢查自己的錯誤,從而有意識地提高寫作水平。n
2,如何建立?
語料庫的建立靠軟體:AntConc,這是一個開源軟體,提供Windows,MacOS和Linux版本,你可以點我到官網下載Laurence Anthonys AntConc,如果外網打開速度太慢,你可以關注我的公眾號「賽門喵Simon」n在後台回復「antconc」獲得下載鏈接。下載完後安裝軟體。n1),啟動軟體後如下圖2),導入語料庫。n- 首先,將你準備好的語料庫轉換成TXT格式。一般原材料會是word,pdf,mobi,html等格式,mobi格式可以用calibre批量轉換,其餘格式轉換完全沒有技術含量,請自己動手解決。另外,為了日後檢索,將所有的txt文檔規律命名,比如可以按照「作者名+發表日期」或者「文章名+日期」等,具體按照自己的需求決定。以2016年全年《經濟學人》為例,我將文檔按照時間命名,一共52期,它們全被放置在同一個文件夾下方。
- 將文檔全部導入AntConc,這可以通過「文件夾」導入。
3, 發揮語料庫的強大功能。n
把準備的語料庫導入軟體後,你就可以發揮出它的威力了。我們以單詞「discussion」為例,假設我在想用這個詞的時候有幾個疑問:n帶著這些疑問,我們來進行搜索:n1),在搜索框中輸入「discussion」,點擊「start」。在「Concordance」書籤頁面中,出現了2016年全年《經濟學人》出現discussion的句子,「Concordance Hits」表明一共有92個例句,並不是很多。n2),到這一步,上面那三個問題的答案就已經蘊含在這些例句中了。不過設想一下,如果例句非常多,那麼這種毫無規律的顯示結果是很難讓人理解的。所以,為了更清晰的得到我們的答案,我們需要將結果以排序的形式顯示出來。這也是AntConc最強大的功能,也是我們要學習的重點。排序可以幫助我們了解一個單詞在英語中的慣用法。AntConc同時提供了三層排序,分別對應上表的Level 1,Level 2和Level 3。例如,如果我們想要了解「discussion」後面最常用的的介詞,我們可以按照「discussion」右邊的第一個詞排序,也就是上圖中的Level 1R(R是指right,就是discussion的右邊,1表示右邊第一位)。這樣,結果就會以「discussion」後面第一個詞的重複數量多少來排序。相反,如果我們想看「discussion」前面的冠詞用法,我們可以按照Level 1L的方式排序。n在下圖Kwic Sort中做如上的排序設置,結果如圖。你可以看到discussion前面的冠詞包括「a」和「the」,說明這需要根據具體的語境選擇。對於之後的介詞,大量重複的 of 和 on 說明她們是比較固定的搭配,其實 about 數量也很多,只是沒有在圖片中展現出來,結合例句的語境,你自然可以判斷出來不同的介詞在意思上有何偏差,那麼自然也就能夠選出最適合自己寫作的那一個。n
- 要不要在前面用冠詞 a 或者 the,或者不用?
- 和discussion最常用的介詞是什麼呢?
- 這個詞最常用的搭配是什麼呢?
4,優化搜索,發揮語料庫強大功能。n
掌握一些簡單的通配符,可以將語料庫強大的搜索功能發揮到極致,也就可以幫你解決一個更為具體的疑問。n1),大小寫區分n一開始我提出了一個疑問,「and能不能用在句首」,由於AntConc默認的搜索不區分大小寫,所以這個問題很難回答。但是不必擔心,AntConc是支持大小寫區分搜索的,做法很簡單,只要在點擊「Start」之前勾選上面的「Case」。可以看到,And 確實是可以用在一句話的開頭的,你同時可以借鑒這些例句。n2),通配符搜索n通配符「*」可以代表一個單詞,或者一個單詞中的一部分。舉例如下:n提示:假設你想要搜索所有關於woman的詞條,考慮到複數形式women,你可能需要使用另一個通配符「?」,而不是「*」。AntConc支持正則表達式,你可以在手冊中找到,非常容易上手。n
- 如果搜索「*able」,那麼結果包括所有以「able」結尾的單詞,例如:unable,able,capable等等;
- 如果搜索「they * that」,結果包括 they argued that,they concluded that,they discussed that,they find that 等等,考雅思托福的同學一定會發現這個功能很有用;
- 如果搜索「they * * that」,結果可能包括 they strongly argued that,they also report that等等。
5,一些受用的搜索技巧n
1),我可不可以說「get on a car」?n
你可以搜索「get * a car」看看結果,結果多半是不可以的,但是你也知道了正確的用法是什麼。n2),除了用這個動詞,我還可以用別的嗎?n搜索方法同1)。n3),我應該用哪個介詞?n輸入搜索詞,然後按照Level 1R排序,根據出現最多的結果來判斷。n4),正確的用法應該是 as follows 還是 as following?n搜索「follow*」,然後按照Level 1L排序就能得到你的結果。n
5),應該用哪個冠詞,a還是the,還是不用?n輸入搜索詞,按照Level 1L排序。n6),在我所在的領域,用 for instance 還是 for example 較為普遍?n同時搜索 for instance 和 for example,然後按照Level 1R排序。至於如何同時搜索,你可以自己研究一下,很簡單。n
6,語料庫下載
我正在準備雅思,托福,《經濟學人》和《紐約時報》的語料庫,並在近期放出,想要的朋友可以掃描下方二維碼關注我的公眾號「賽門喵Simon」(ID:nowenglish)。n
--- THE END ---Simon的往期文章:
中式思維
你的「中式英語」是不是這樣造成的? | 這樣才能避免「中式英語」| 這可能是你「中式英語」的罪魁禍首
語法
語法到底是什麼?| 換一種方式理解時態| 如果你認為would僅僅是will的過去式,那就大錯特錯啦 | 用心花10分鐘,了解一個as的用法 | 為什麼是go to bed,而不是go to the bed | 為什麼look forward to後面是doing,而不是do
英語學習資料 & 方法論
英文原版閱讀有哪些入門書籍推薦?| 英美國家出過哪些英語視頻教程? | 在英語學習過程中,有哪些書籍讓你醍醐灌頂? | 怎麼練好英語口語?| 每天堅持英語學習為什麼還是學不好? | 有哪些值得推薦的關於英文詞根的好書?| 如何提高英文寫作水平?如何提高英文寫作用詞準確度?| 有哪些提高英語聽力的經驗和訣竅?
乾貨雞湯 & 學習經歷
社會上有哪些讓你細思恐極的細節? | 每天都讀英文原版書,我這樣堅持了2年 | 試過無數次後,才知道什麼是正確學英語的方法…… | 如何看待我身邊 25 歲左右的女生已經鮮有努力勤奮向上的現象?
推薦閱讀:
※讀英文書——《小王子》第二章
※深扒《老友記》——史上最全老友記學習筆記S02E21
※跟著《肖申克的救贖》學英語-(005)-瑞德因杜弗雷參賭。。。
※深扒《老友記》——史上最全老友記學習筆記S01E16