標籤:

使用Kindle閱讀英文原版書,使用Python小工具抓取網易詞典釋義並自動關聯語句輸出為Markdown格式文件

更新小工具,將Kindle閱讀器上標記的單詞與語句自動關聯,自動到網易有道詞典查詢釋義,爬取最終結果,輸出markdown格式文件,便於學習、複習與總結

相信很多人都開始在真正使用英語了,包括閱讀訓練有聲讀物聽力與英文原版書籍閱讀。電子產品的出現使得我們的學習應用越來越方便快捷,下載一個audible基本能聽便所有的原版英文音頻,買一個Kindle閱讀器基本可以閱讀所有的原版英文書籍。

以前我們好不容易買了一本原版英文書,硬著頭皮看下去,幾分鐘後就昏昏欲睡,因為太多單詞不認識,看幾頁後就沒辦法進入狀態。Kindle內置詞典,可以很方便地就可以查出單詞釋義了。當然並不推薦每遇到不認識的單詞就查,這樣也及其容易疲勞,之前看過奶爸的《把你的英語用起來》裡面提到的透析法,其閱讀原著技巧總結起來就是:每天閱讀定量(如20頁)的原版書籍,閱讀一頁查閱2個單詞左右,每天積累一定的單詞並且重複學習,這樣避免一直在記單詞的梗中,又能體會閱讀原著的樂趣,確實是一個很好的辦法。

但是這樣也有一個弊端,每天需要花費大量的時間整理Kindle上的標記的單詞與例句,用於後續學習與複習。去年在聽讀Harry Potter的時候就遇到這種情況,如果我花費1小時練習聽音頻,會花費1.5小時閱讀,然後至少需要花費2小時查詢單詞,整理單詞、語句與輸出總結。

所以最終在經過探索使用Python寫出了這個小工具,經過最新更新基本實現了如下幾點功能:

  1. 將在Kindle閱讀器上標記的單詞與語句輸出為Markdown表格文件。
  2. 單詞自動查詢釋義,將從網易有道詞典網站查獲的結果保存存於表格中。
  3. 將Kindle中標記的單詞與語句自動關聯,整理輸出最終表格。

使用示例:

1. 準備工作

  1. 在Kindle上閱讀Harry Potter原著,對不認識的單詞與語句進行標記,最終會在Kindle的根目錄下生成My Clippings.txt文件。
  2. 將該文件導出到電腦,重新命名為My_Clippings.txt,主要是為了去掉文件名的空格

2. 運行程序

python3 main.py --prefix=static -t 2017-2-25 -i My_Clippings.txt -o words_chapters_9.md

參數說明:

  • —prefix為指定源目錄為static,當然也可以指定別的目錄,但是需要將My_Clippings.txt文件將其移動到相應目錄里,
  • -t 為選擇時間
  • -i 為指定輸入源文件,即目錄中的txt文件
  • -o 為指定輸出源文件,即輸出的markdown文件

源碼開源在github.com/wowmarcomei/,歡迎star。


推薦閱讀:

大神整理了這16個好用的英語學習網站,趕快用起來吧!
好用的英語軟體推薦
他只用一個字形容特朗普的第一次國情咨文
記不住英語單詞是智商問題嗎?
如何消除閱讀中的內語?

TAG:英語學習 |