如何高效搜集、整理、存儲資料(持續更新……)

內容主要來自於知乎上一篇高票貼:

如何有效地進行資料整理?

zhihu.com/question/2192

(因為來源太多,沒來得及一一向原作者要授權,所以如果侵權或需要在文中註明出處等的請聯繫我~)

根據自己的理解將帖子里的內容重新整理,內容包括回答及其下面的評論。

正文如下:

關於知識整理最重要的一點:整理是為了使用方便,而不是見了東西就想收起來的習慣性囤積。

判斷信息(如網頁信息)對自己是否有用的方法:

1.日常瀏覽收集在一個當日的收藏夾里,不分類。每天抽出5-10分鐘整理,將一些進行捨棄。需要的多次閱讀的進行大類區分,給自己設定一個閱讀期限,如果在期限內你沒有進行閱讀的話,就將這些文件刪掉,因為如果你設定了一個期限也不足以敦促你閱讀的話,那麼可能這些知識對你的的價值是非常有限的。

2. 沒必要把類別分的特別詳細。先分大類,當一個類別積累到大概50-100條左右的時候,在進行整理細分。

1. 搜索

1.1網路搜索

1.1.1關鍵詞

1.1.1.1訂閱

主動獲取信息:使用各種訂閱、集成工具更有目標,用這些詞訂閱,讓信息主動找你。

1.1.1.2關鍵詞要多種語言

關鍵詞要多種語言,不漏掉信息。(比如關鍵詞都做成中英雙語。比如像收納學這類的東西是日本傳過來的,中文只能搜出些是似而非的東西,而用日語就可以搜出乾貨)。

1.1.2除文字搜索外,可以嘗試其他形式

比如圖片,再通過圖片鏈接到有價值的網站等。

尤其是文件搜索,更加系統(以搜pdf文檔為例):

Google:inurl:pdf

百度:filetype:pdf(all可以搜全部類型)

1.1.3專業網站

MBA智庫——專註於經管領域的資料庫。你可以在這裡搜到很多經管領域的各種術語解釋,文檔等。

維基百科

1.1.4書籍

書名

作者名

1.2本機搜索

1.2.1軟體

搜索準確度之外,還要考慮搜索的速度,是否繁簡字體混搜(如果有必要的話)等問題。

使用收藏夾,對我來說有幾個問題:

1.每個瀏覽器要分別登錄,記好幾套賬號密碼,每次輸入,不方便;

2.據別人統計每年會損壞大概10-20%的鏈接(我之前的收藏長時間不用全部失效,需要重新輸入網址才能跳轉);

3.網頁被刪除、被人刪除問答等,收藏的內容也就看不到了;

1.2.2.1everything

秒搜整個分區的內容。只能搜檔名,搜不了內容。

1.2.2.2 spotlight 或者 Alfred

os x (蘋果系統)用戶。可以實現本機搜索功能,比如適當安排目錄和索引,以提高檢索效率。

1.2.2.3Directory Opus 10+Listary Pro+FileLocator Pro

組合精確定位到每個字,十分方便。

FileLocator Pro 號稱免索引

1.2.2.5有道雲筆記

有道雲筆記網頁剪報怎麼使用?-百度經驗

jingyan.baidu.com/artic

2. 存儲

有些方式需要聯網才能使用,而存儲在本地或移動硬碟等的需要隨身攜帶,而且可能載體一旦毀壞文件就沒了。更重要的是,隨著信息日益增多,查找的時候甚至不如直接在網上搜索方便,整理的難度越來越大,定期要清理。

2.1雲盤

2.1.1類型

各種雲盤都要利用上,盡量使用各種免費空間,但要注意安全問題。

百度:既支持自動備份又支持自動同步。可搜集資料,保存學習視頻和軟體安裝包等占空間比較大的資源。但安全性不高,哪怕一丁點有隱私的資料都不要存。

360:客戶端不支持自動備份某目錄同步盤,共享文件夾做得不好。

Dropbox:原創類的文件、需要版權保護的文件不要放在雲盤裡,泄密的可能性很大,可以試試

dropbox。不過有被國內封掉的不便。

堅果云:①存放個人重要的信息資料和密碼;②近期多台設備需要頻繁同步的資料,比如在公司沒寫完的文檔放到堅果雲同步之後,回家可以接著寫;③近期需要閱讀的電子書。

2.1.2利用「一體化」

比如微軟賬戶可以登錄微軟的所有應用;蘋果的可以登蘋果的。

2.2同步盤

2..2.1Onedrive

被封了……

2.2.1百度雲同步盤

使電腦某些文件夾和雲盤的某些文件夾實時同步保持一致,不需要再去手動上傳了。但要注意隱私與安全,不要放錯東西導致將不必要的東西錯傳。

2.3頁面

不需下載,隨時歸檔、分類。可加標籤、關鍵詞、全文檢索。雲端、客戶端同步。

2.3.1圖片

國內可以考慮花瓣網,國外的Pinterest等。

2.3.2非圖片

2.3.2.1Evernote

Evernote提供剪輯工具可以添加到chrome瀏覽器的應用,從而閱讀網頁時可以隨時調用歸檔待讀資料。

evernote可以添加到outlook插件,幫你在閱讀郵件時收藏重要郵件

evernot可以歸檔重要的文檔,如PPT,pdf等。因為文檔體積往往會比較大,作為evernote的免費用戶也許會吃不消。若無意升級,你也可以建立一個「待讀」文件夾,將需要後續閱讀的文檔歸類到此文件夾下,也就形成了一項待辦任務了,同時你在本地的電腦文件夾里也存儲一份。Evernote里的文檔則可以閱讀一份刪除一份,只將有用的信息摘錄出來。 Evernote的搜索功能也比較強大,能夠進行PDF的全文檢索。

2.3.2.2OneNote

可用來存儲教程。

2.3.2.3truelaunchbar

桌面快捷方式整理,任務欄分類快捷方式,不太占系統資源,和系統結合好。

2.3.1圖片

2.4本地

按照邏輯分類建立計算機存儲文件夾。比如D盤為Work,E盤為Life,下面再設一些分文件夾。文件夾分類要做到不重疊又能保證任意一個文件都能找到其歸屬文件夾。

3. 整理

存放在電腦上的東西,每個月更新備份一次外置硬碟,雲盤定時上傳。

整理意味著:

檢查並調整歸類

刪除不需要的文檔

添加可便搜索的標籤或關鍵詞

……

3.1軟體

3.1.1total commander

看圖感覺功能強大,可以探索。但不知道是否支持win10,國內是漢化版。

3.2Tem筆記本

Tem(Temporary的簡寫)筆記本很重要!放置匆忙之中無法分類的資料,以及讀完、整理完就刪的資料。

TEM可以考慮以日期的原則建立子目錄。

3.3文件夾的設立原則和方法

3.1.1原則

1每級目錄盡量控制在7個文件夾左右,尤其是根目錄不宜太多。

2假想中的任何文件都能夠找到歸屬。比如家庭成員突然發過來一些合影照,你應該放到那裡。

3TEM文件夾的作用在於臨時,你自然可以將這些文檔堆到TEM文件夾里,但是TEM其實相當於臨時收容所,不等於固定的住所。我習慣是在E盤增加Personal的文件夾,將私人的文檔,文章,圖片在這個文件夾里建立相應的分類。每個文件夾下都預留一個臨時文件夾,以防當新接收到的文件因為不知道如何歸類而導致根目錄無限擴張。

4序號能夠讓排序查找更為輕鬆。為何要在文件夾前加上序號呢?其實就是在瀏覽文件夾的時候,能夠出現優先順序的順序。

3.1.1方法

1不管你用什麼機制(包括各種免費、付費軟體)去進行「本機搜尋」,一定不能只搜檔名,那個沒用,定要能搜索到「文件的內容」才有意義。

2在電腦的「控制台」中(繁體電腦的叫法),有一個「索引選項」,一定要把你搜集整理好的數據資料,放在一個固定的地方,強迫電腦一定要監視這個文件匣,隨時更新索引檔案。

3給文檔取怪名字,其他人不會用,就不會搜到別的檔案。比如把搜集的「論語」資料取名「論庫」。

4建立檔案庫的目的,在於要解決「人工查找資料」的痛苦,所以,建的愈細愈好。

以保證未來,不再需要「人工查找」。

檔案名上,都有一個「論庫」,可以保證搜索時,是在這個「論庫」的範圍內。

然後,不厭其煩地,把論語所有的段落拆分開來,建成一個一個分開的文件。

【我覺得這個過於麻煩,作為備用吧】

5文件內容,要作整理,以供電腦搜索之用例如我寫本子,需要用到時,想搜索一個「孔子罵人的話」,那麼,我在建立文件時,就要預留未來的「搜索空間」。所以,論語的「原文」外,我得把「白話翻譯」加上,最好再加上關鍵字,比如「容忍」。所以,最後形成的文件會變成這個樣子:

比如我要搜尋孔子罵人,打上「論庫 容忍 孔子」,這份文件就會出現在搜索結果中了。

6 各種雲筆記

以Evernote為例。Evernote會按字母順序排序,所以,字母+數字可以排出無數組合。

如:A代表原創,B代表摘錄,C代表事務。每類再細分,配合數字,如圖:

這個文件夾體系,可以任意拓展其中一個分類,而不會影響其他。

3.4桌面的利用

3.4.1快捷方式

放我們常用的文檔和軟體快捷方式,便於你直接找到它們。一級的臨時文件夾。

存放不超過10個常用工具的快捷方式。

D盤、E盤等處常用的文件都可以在桌面建立快捷方式。

3.4.2桌面放置臨時文檔

比如別人發過來的文檔,你暫時沒時間讀,也不知道如何歸類。如果你接收了放到D盤或者E盤任何一個文件夾里的TEM,都有可能導致你開完會後就忘記了。可以存放到桌面,開機的時候可能會看到它。

建立TEM文件夾,不然很快就會被各種文件佔滿。

4附:信息來源

4.1軟體

4.1.1紙質轉數字化

全能掃描王:紙質筆記寫完後掃描,然後把紙質筆記扔掉。因為紙質資料檢索慢,保存成本高,無紙化是大勢所趨。

4.2快捷鍵

1新建文件夾:

shift+ctrl+N。

2 文件或文件夾重命名 鍵盤F2

3 返回上一級文件夾

backspace

4 文檔/盤搜索F3


推薦閱讀:

從開工到竣工,一個工程需要哪些資料?

TAG:資料搜集 | 資料整理 | 數據存儲技術 |