有沒有從文本中提取單詞的軟體?

有沒有能夠從電子書(.mobi;.txt;.epub等格式)中提取英語單詞並按詞頻生成文件(.xls;.doc等等),文件中含有中文解釋的軟體?


我錯了,下次不打包票說更新了,關於洛克生詞本和愛英閱之後我會在專欄更新詳細說明,再之後才會更新這個答案。【具體什麼時候就不知道了……】

Anki——近乎完美的神器 - 知乎專欄

---------------------------------------------------------------------------------------------------------

答案是有的,而且剛好符合你所說的要求。

洛克生詞本(作者:洛克街上
)

愛英閱iyingyue(作者:樂不思學)

-------------------------一、洛克生詞本和愛英閱軟體功能介紹-------------------

我先說兩者軟體的共同點:都可以對文章或書按照一定規則進行生詞析出。這一點很重要,也就是說,你如果先把一本書用軟體給析出之後,相當於有人用這些單詞給你寫了一本書(至於是什麼書,小黃書、小說、社科...) 有人說一本書單詞那麼多,我哪裡背的過來...你難道不會先析出一個章節的單詞這樣不就輕鬆了? =,=

愛英閱iyingyue(作者: @樂不思學 作者網站:http://www.sixue.info/iyingyue/)

功能如下

  • 對原著進行難度分析:有多少不認識的單詞,佔比多少辭彙生僻度,單詞總量等。
  • 提取原著中的生詞,導出為生詞本,從而利用流行的記單詞軟體(有道,金山生詞本等)隨時隨地記單詞。
  • 支持對txt,epbu,mobi三種格式的電子書進行分析。
  • 導出kindle paperwhite電子書中的生詞本。
  • 建立自己的辭彙庫,在使用過程中逐步充實詞庫。越接近自己真實的辭彙量,原著分析提取到的生詞就越精準。

為了更好的說明,截圖以證明軟體有多棒!

第一步,你需要建立一個詞庫。因為一開始的軟體是默認都是生詞的,包括最熟悉的a the is這些。不然的話就如上圖所示會出現一些很簡單的詞例如:was were men這些。還好,作者已經給了我們最常見的幾千詞,我們所需要的只是導入即可。

第二步就進入重頭戲了。選擇你需要解析的書,然後導入,軟體自動會幫你析出如下功能。

單詞以及單詞原型、生僻度、出現次數、所在位置、釋義。 右鍵可以查看單詞所在上下文!!

我特別喜歡作者添加的我的詞庫。當中包含了你學會的單詞,你看到數字不斷往上增長的時候,會有很大的成就感的,背單詞也會上癮的!

另外,kindle的生詞本也可以載入哦~

2.0版已出,待更新

--------------------------------------------------------------------------------------------------------------------------

第二個軟體是 洛克生詞本(作者:洛克街上。新浪微博 豆瓣ID都是。)

這個軟體也非常強大,我也很喜歡用(可能是第一個接觸這個,其次才是愛英閱軟體吧)

他的功能有

1三檔——入門、進階、高級來析出生詞,好像是作者調用有道網頁翻譯的吧?不記得了,因為這三個檔次和有道的差不多。

2配合作者開發的其他軟體和功能使得洛克生詞本更強大

例如AudioDownloader軟體可以下載單詞的發音(輸入到手機或者ANKI簡直炸裂!)

MyVocab可以增添自己已經會的單詞(和愛英閱一樣,輸入已掌握單詞到文本內,下次就不會有該單詞出現)

dict_logging則包含單詞原型以及 單詞在原文中的形態(單複數、時態變化!)

sentences_logging可以得到單詞所在的句子 就如洛克大神所說 語境背單詞!

3生詞在上下文當中,語境背單詞。雖然愛英閱也是有上下文,但是它要右鍵點擊才能看,而洛克生詞本則是自動包含,這一點方便不少。

4良好的導出功能,配合ANKI簡直無敵! ANKI是一個記憶軟體(之後會介紹到)。你可以導入到有道、金山詞霸、ANKI。 因為洛克生詞本是用tab分隔的txt文件,格式很規律,所以你可以導入到喜歡的軟體當中,不行的話你改一下格式咯...

-----------------2015 6 22更新--------------二、神器+神器=??????-----

這一次來介紹一下另外一個神器——ANKI

可能是ANKI太過小眾? 知乎上知道了解的人都非常少,或者說是因為有一個更老牌的supermemo壓著?我不懂...

目錄

一、ANKI簡單介紹

二、洛克生詞本配合ANKI使用

****************************************************************************

什麼是ANKI?

簡單說就是一個記憶軟體。,最基本的是就像一個卡片,正面是問題,反面是答案。

我來組成頭部(正面)

我來組成尾部(反面)

記憶原理你懂得,爛大街了不多說。但是秒殺什麼有道、金山單詞本背單詞這些,因為它是動態評估! 不是死硬的套用

上方圖片有四個按鈕:

生疏/錯誤 困難/模糊 猶豫/想起 順利/正確

什麼意思你們都懂,就是對這張卡片記憶程度的描述,你覺得自己屬於哪個範疇就按哪個按鈕

按鈕上方的時間就是?天之後這張卡片出現的時間,比方說我選擇第四個按鈕:順利 正確 則1.2個月之後才會再出現這張卡片

  • Again 標誌著你的答案是不正確的,並要求Anki在未來更頻繁地展示這張卡。

  • Hard 顯示卡稍長的延遲比上一次,並告訴Anki調度卡在未來的時候要更加保守.

  • Good 告訴Anki,上次設定的延誤剛剛好,並且卡容易程度需要進行向上或向下調整。(在默認情況下啟動容易,該卡將再次顯示約2.5倍延遲時,比以前的時間 更長 - 所以,如果你已經等了10天,看到卡之前,接下來的延遲是25天左右.)

  • Easy 告訴Anki你發現延遲太短。該卡在未來的延遲將進一步加大。(因為「easy」迅速增加的延遲,這是最好只是留給最簡單的卡。通常你應該發現自己回答 「good」更好。就像學習新卡那樣,可以使用鍵盤上的1-4鍵作為快捷鍵選擇一個答案。按空格鍵將選擇 「good」)

這是ANKI官方手冊上的說明。加了()的是你用了ANKI後就能明白它說什麼意思的

給你們看看ANKI的統計數據

****************************洛克生詞本配合ANKI使用方法 2015 6.23*****************************

第一步、你需要一個TXT文本。

因為洛克生詞本只支持TXT。所以你懂得.... 如果是MOBI、EPUB AZW3的得轉一下格式才行,軟體搜索都有。

第二步、導入進去選擇生詞檔次

根據自身水平選擇。然後得到生詞本

注意:

1是洛克生詞本只支持TXT,請留心。

2洛克生詞本所在的目錄,完整路徑中不能含有中文。

3軟體運行時間可能較久。如果是1M的大文件可能要好幾分鐘吧。幾百K的話也要有幾分鐘....

4隻能選擇三個檔次的一個,不能自行更改 這是程序設定成這樣...

5單擊「生成記憶庫」,之後會在原始文本所在目錄下生成類似*_output.txt的文本文件

得到生詞本後,我們就可以導入了。

具體操作請看這兒,根據流程走就可以得到了:Anki如何批量導入or新建卡片?http://www.douban.com/group/topic/80201451/


當然是有的。

推薦我現在在用的單詞軟體:墨墨

題主想要的文本提取

還可以根據你的學習進度進行規劃和統計

每個單詞三個例句,總之感覺用起來很順手,良心軟體。

缺點是有時候感覺詞義不全,不知道是不是我選擇詞書的問題,還有單詞發音,完全沒法和不背單詞比,但是不背例句太少單純羅列中義也沒什麼意思。


20171023更: 我推薦 @DevilPaean 的答案

墨墨背單詞 看起來就超好用的樣子,可我買不起 iPhone啊!!(更:Android現在也有了!)

沒關係,我幫題主找到了這個軟體:

愛英閱 (iYingYue) 能夠從網頁、文本、和多種檔案中提取、分析、導出生詞。

(支持 win xp, win7 , win8, and win10 技術預覽版)

下面簡介下使用方法

1. 首次打開軟體,挑詞建立個人詞庫,詞庫內存放熟詞。這個步奏比較麻煩,我個人加到一頁約有1/4生詞就沒繼續了,以後可以再慢慢添加。

2. 點擊「打開文件」,載入檔案、網址、或文本,支持epbu, mobi, txt, lrc, srt 等檔案格式

3. 畫面將列出文檔內去除熟詞後的所有單詞,並在上方顯示生詞數量和比例。你可以視個人需求依開頭字母、生僻度、出現次數、和出現順序做排序

4. 選取單詞後就能進行各種操作啦,自己看吧。

導出含釋義的單詞長這個樣子:

5. 導出純單詞上傳到知米英語,用力背吧!


我用的AntConc,鏈接里有軟體本體和單詞原型表,就是每次用的時候都要重新載入原型表比較麻煩

鏈接: http://pan.baidu.com/s/1qYpj5Xq 密碼: 66b4

到期了的話自己去官網下吧

Laurence Anthony"s AntConc

我主要是為了要知米的詞根功能,如果不需要的可以參考高票答案,那個感覺更好一些

另外詞根的話有個軟體叫詞根詞綴記憶詞典,如果之前沒用過其他軟體的話可以考慮用這個試試


用墨墨,只需兩步!

1. 選中文本,點分享

2. 點墨墨,對!就是那個超萌的貓頭鷹

然後就可以看到裡面的單詞啦,還可以隨時加入學習。

滑動切換下一個單詞

當然可以按照詞頻排序~ 但是不能導出,而且僅限墨墨詞庫里有的單詞

截圖都看完了還不趕快安裝?PS. 還可以讀取文本文件內容來提取單詞!


kindle mate,在豆瓣小組裡很流行,可以將kindle里的生詞導出。


墨墨背單詞


完美規劃,目前用過比較好的背單詞軟體,不過得花錢買單詞量


Biscuit


扇貝新聞這種??


推薦閱讀:

為什麼 iPad 扇貝上的柯林斯詞典和智慧詞根不能一次性買斷,而只能在有限時間內使用?
背的單詞越多越容易弄混怎麼辦?
使用背單詞的應用,真的能背下來單詞嗎?
背單詞到底是在背什麼?
背單詞軟體能否替代單詞書?

TAG:英語學習 | 背單詞 | 學習方法 | 英文原著 |