信息時代的智慧

有幸於 2012 年 7 月 14 日參加了科學公園組織的第一屆「科學與無神論者聚會」,討論 的主題是「無神的未來」。與會中認識了一些朋友,聽了幾個講座,有頗多感受。當時,我 正在思考一個問題:如何組織自己的知識,使之使用更合理高效?近來得閑,把一些個人認 識及與會中關於科普的思考寫出來,希望能夠拋磚引玉,也算是聚會的個人總結報告。

從神話到科學:世界觀的變遷

自古以來,無數先賢凡人都問過同樣的問題:「我是誰?生命是什麼?我們要到哪裡去?」 仰望星空並開始審視世界,發出類似這樣的疑問,這表明了自我意識的一種覺醒。意識的第 一個標誌,就是將自己與周圍的世界區別開來,就如兒童第一次意識到:他是他,爸爸是爸 爸,媽媽是媽媽。意識獨立之後,人類就開始了對周圍環境的探索,進而開始思考更深的問 題,比如前面那些,而這些思考的結果則不盡相同。

在古羅馬,人們認為混沌神造出了日與夜倆兄妹,他們結合後生出了十二泰坦,然後泰坦間 的彼此結合又生出了天庭諸神,之後就是天神創造了人界。在中國漢族,我們有盤古開天、 女媧造人,其他各民族也都有類似的兄妹結合併成為民族起源的傳說。這些神話無論多麼荒 謬,數千年來,人們仍口口相傳並信以為真。人們將自己的日常生活與這些神話結合起來, 並於其上建立了諸多的習俗。然後又不斷加入新的想像,使得那個神話的世界也越來越完 整,越來越像人類的世界,比如漢族的玉皇大帝就活脫脫是人間皇帝的翻版。

以神話為基礎的對世界的認知,最基本的思維模式就是模仿與想像,這種認知的進一步發展 就是宗教以及類似於宗教的各種學說,比如三大宗教、中國的陰陽五行與「周易」玄學。這 類認知的特點是以與現實世界的相似性為基礎的,而不是真實性,它們也並不追求真實性, 結果就與真實世界相去甚遠。這些認識對於簡單事物的描述則沒什麼問題,但對稍微複雜一 些的,則往往荒謬不堪,對於那些行不通的說法,則變成了禁忌。這種認知模式最常見的思 考方法有猜測、頓悟、感受等,然後就把這樣得來的結果當成真理,頂多在其中再多加一點 似是而非的邏輯。比如以陰陽五行為理論基礎的中國傳統醫學,在其中就有許多食物相剋之 類的禁忌;在舊醫入葯上,因為人蔘長得奇怪,有點像人形,就變成了大補之物,非常奇怪。

好在人類的思維模式不止是模仿與想像,還有歸納、綜合、邏輯推導,等等。自古希臘始, 在實證與邏輯的基礎上,人類發現了科學,人類的認知自此不同。

在神話、宗教及一些宗教似的學說里,關於對世界的認知,你只需要相信結果,而不管它是 否與周圍的世界相符。如果有牧師說是上帝安排猶大出賣了耶穌,你想質疑「那麼,就是上 帝擺了猶大一道嘍?」這樣則是萬萬不可的。但在科學中,你可以質疑一切,只要你有證據 與邏輯,即可反駁一切現有的認識。而在科學中,通過這樣不斷地質疑與實證,我們對世界 的認識也越來越接近真實。

什麼是世界觀?就是人對周圍世界的認識。這個「人」可以是個體,也可以是一群人,乃至 整個人類。這樣,就有了兩種類型的世界觀:個體的及群體的。群體的世界觀則指的是某個 群體對周圍世界的共識,這兒只考慮數量上佔優的那些共識。

脫胎於神話與想像的宗教世界觀是人類認知的初級階段,因為它們只利用了人類一部分思維 能力,即猜測、想像與類比,玄學與哲學比它們又多加了一點點邏輯。因此,宗教的、玄學 的及哲學的世界觀,彼此是類似的,它們都缺乏實證,不妨把這些統稱為「宗教世界觀」。 歷經實證與邏輯檢驗的科學世界觀則是人類智慧的最優美的結晶。就整個人類而言,全球七 十億人中大部分仍然被形形色色的宗教控制著,宗教勢力仍然佔據主流,因此,目前人類的 世界觀並非統一的,大致上分成兩類:宗教的(包括玄學的、哲學的)與科學的。

這個世界最奇妙的就是,人類可以發現科學並且藉助其正確地認知世界。

個人的世界與真實的世界——淺談人的認知

現實生活中,道德是道美麗的籬笆,而真正起到防護作用的是那堵法律的圍牆,但無論道德 還是法律,都建立在人們對世界的共識之上,或者說,建立在人們的共同世界觀之上。世界 觀的建立過程也就是人類的認知過程。而人類的認知是一個科學的專業領域,其研究內容與 方法都很複雜。人工智慧(AI) 是認知科學與計算機科學的交叉領域,它希望通過計算機來 模擬人類的智能,這個要建立在人們對自己的智能有充分認識的基礎之上,其中涉及到的內 容非常廣泛,如基於神經元的生理構造、神經元的工作模式、思維本身的特點及方式,等等。 人們曾經對認知科學持非常樂觀的態度,早在 1958 年有人工智慧學者認為「十年之內,數 字計算機將成為國際象棋世界冠軍」。而這一目標直到 1997 年 5月 11 日才實現,比預期 推遲了約三十年。儘管認知科學非常複雜,進展沒有預期的神速,但奇妙的是,人類可以認 知到自己的思維,不是嗎?

這兒僅就人的認知做一點粗淺的展開介紹。

人的認知過程就是一個信息處理過程,這其中記憶尤為關鍵。現代的信息處理理論將人的 記憶分成三類:感觀記憶、短期記憶和長期記憶,而長期記憶則還可進一步劃分為顯性的與 隱性的,等等。借用一幅來自網站The Human Memory的圖片(我加入了漢語譯文)如下:

個人對世界的認知過程,就是通過自身的感官構造出一個世界的記憶副本的過程。每個人所 感覺到的、接受到的、構造成的不盡相同,則個體的認知世界也不一樣。因此,可以說,每 個人的大腦有一個獨立的認知世界,不妨把這個獨立的個體認知世界稱為「意識世界」 (mental world)。

個體的意識世界存在極大的差異,但相互之間存在重疊,這種重疊就是大家的「共識」。如 果了解一點數學中的集合論,你不妨將共識想像成許許多多的個體意識世界的交集。共識反 映在記憶上通常是「語義性的記憶」,最基本的就是概念與重大的史實。

科學的認知過程則是許多人採用相同的實證與邏輯的方法與世界反覆交互的過程,參見科學公園中的證據、理論與真理一文。

在前一節中談到兩種類型的世界觀,宗教的與科學的。基於神話、猜想或胡亂的類比所構造 的意識世界,包括那些基於玄學或某些哲學假說所構造的意識世界,這些都是宗教的精神世 界,亦即宗教世界觀。而基於科學得來的共識就是科學世界觀,這也就是人類通過科學所獲 得的在頭腦中的世界映象,這個映象也是人類各種各樣的意識世界中與真實最為接近的。

什麼是知識?

什麼是知識?漢語中收錄辭彙最全當屬《辭海》,它對「知識」給出的解釋如下:

①人類的認識成果。來自社會實踐。其初級形態是經驗知識,高級形態是系統科學理論。按 其獲得方式可區分為直接知識和間接知識。按其內容可分為自然科學知識、社會科學知識和 思維科學知識。哲學知識是關於自然、社會和思維知識的概括和總結。知識的總體在社會實 踐的世代延續中不斷積累和發展。②有關學術文化的:知識界|知識分子。③相識;朋友: 朝廷大臣多有知識的。

上述解釋中的第一條與本文所談的內容最為接近,但過於簡略。實際上,我們很難給知識下 一個準確的定義。維基百科的英文詞條Knowledge及中文詞條知識中也只給出了描述性解 釋,大致如下:

知識是對個體或事物的認識,它包括事實、信息、描述,或者通過經驗與教育獲得的技巧。

不過,如果利用對計算機的認識,再結合一些相關的概念一起類比地理解,可能會稍微清楚 些。這兒引用一下 PpcSoft 公司在個人知識管理的介紹中對「知識」的解釋:

  • 數據:未經組織與處理的事實。
  • 信息:處理後的數據,包含有特定的含義(什麼,誰,何時,何地)。
  • 知識:人們通過學習與思考而獲得的對信息的理解(怎麼樣)。
  • 智慧:歷經實踐考驗的知識(為什麼)。
  • 同「科學」的概念一樣,儘管「知識」的定義很難下,但可以羅列出它的一些特性。 Sveiby1給出的一些特性如下:

  • 知識是源源不斷的——你永遠有用不完的原始材料;
  • 知識通過分享可以壯大(經常傳授知識的人通過這個過程會變得更加有知識);
  • 交流與人際關係在知識獲取過程中很關鍵。
  • Nonaka 和 Takeuchi2認為有兩種類型的知識:隱式的(主觀的)和顯式的(客觀 的)。隱式的知識 (tacit knowledge) 建立在經驗基礎之上。它包括洞察力、直覺、預感 等,這些都不太容易看見與表達。這些都非常個人化的,沒什麼特定形式,也不容易分享。 顯式的知識 (explicit knowledge) 則是規範化與系統化的,可以用辭彙與數字輕鬆地表達 出來。它是理性的知識,可以很容易通過數據、公式、固定的程序或通用的原則來交流與分 享。下圖是由這二位所提出來的「知識的螺旋」。

    人們認知活動的目的是獲得「知識」與「智慧」。通過上述的解釋,人類認知的過程,實際 上就是不斷地處理信息的過程。處理信息,實際上就是不停地把接觸到的事實貼上 5W3的標籤: 是什麼 (What), 誰 (Who), 什麼時候 (When), 哪兒 (Where), 怎樣做 的 (How)。我們想得到的是最後一個W, 就是Why, 也就是「智慧」。

    所以,當孩子不停地問你「為什麼」時,千萬不要煩,幫助他們認識世界吧!

    正如 Sveiby 所羅列的那樣,知識的原料是無窮無盡的。事實上,你每天接觸的任何一樣東 西、任何一個人都可以挖掘出無盡的知識出來。比如影響極大的韓寒代筆案件,得出他有代 筆這個結論需要很豐富的知識,只不過,這些知識對於方舟子等人是直覺反應,對於一些韓 粉,則可能由於認知缺陷而永遠也無法理解。諸多網民參與的分析求證過程中,挖掘出越來 越多素材,也涉及了越來越多的知識,如文本分析、語音分析、筆跡分析、經驗邏輯分析, 等等,由此可見知識的無窮盡。當然,韓仁均等人將一個有學習障礙的人推成「公知」、 「天才作家」,這也需要豐富的知識。不過,絕大部分知識對於個人或群體則未必有用,或 者在當下未必有用。這就引出了一個問題:我們需要什麼樣的知識?

    當然,我們需要有用的知識。屠龍之技華麗,修仙之法艱深,人鬼交流之道神秘,這些也 是知識,只不過,它們象把韓寒推為「天才」的知識一樣,只有在存心行騙時才有用,而這 類用途對群體的發展是有害的。我們需要的有用的知識是指對絕大部分以及全人類都有益的 那些。而對全人類有用的知識也只有科學知識了。科學的有用性顯爾易見,即便是與科 學格格不入的教皇也需要乘坐安裝有防彈玻璃的高級汽車(因為它比上帝更實用),街頭的 算命師甚至也搞起了電腦算命。

    由於知識的範圍太廣,本文默認所指的「知識」只限於科學知識。

    知識的載體

    語言是知識的天然載體,也是人類共同的意識世界的載體。實際上,一個人的語言能力往往 也反映了他的認知能力。人類語言的發展過程,也是人類認知逐漸豐富的過程。原始部落及 發展落後的人群,辭彙往往很簡單,比如東巴文中「萬」以上的數字是沒有的,而「萬」就 表示了「無窮」的意思。方舟子寫過一篇很有意思的科普文章《從鸚鵡學舌和猩猩學電腦看 智力開發》,其中談到,即便是動物在掌握了少許語言之後,也能夠表現出一些邏輯思維能 力。

    語言承載知識的最直接方式就是概念。概念通常表現為新名詞或新辭彙,或者是舊詞新解。 當然,並非所有的新詞都有用,這與並非所有的知識都有用一樣。不過,一種語言的辭彙量 還是可以較直觀地反映出它承載的知識量。比如,《漢語大詞典》是中國大型的漢語詞典, 最新的 2.0 光碟版共收入漢字 20902 個,複詞 343307 條,成語 23649 條,釋義 515524 項。一直引為權威的牛津英語詞典在線版目前收錄單詞超過六十萬個,這個可與漢語詞典 中的三十四萬多個複詞相比較,可見,英文中的概念還是比漢語相對多一些。當然,這樣的 比較非常粗糙。

    語言的演化,最直接的表現就是辭彙量越來越大,語法也越來越規範。辭彙量的擴大表明了 人類認知範圍的擴大,而語法越來越規範則是因為人們需要語言工具本身更加方便高效。比 如德語從 1876 年至今就進行過多次正字運動;百年以來,漢語的白話運動、羅馬化及簡化 運動也持續進行著;其它流行的語言也都經歷過類似的正字或規範化運動。為了促進全人類 都能夠高效地進行交流,從早期的沃拉普克語 (Volapük)、世界語 (Esperanto),再到後來 的伊多語 (Ido)、國際語 (Interlingua),以及 2002 年發布的大同語 (Mondlango) 等,有 幾十種較為流行的人工設計語4正在努力成為國際輔助語,國際語運動方興未艾。為 了研究需要,其它人造語言也頻頻現身,並且廣為傳播,比如大家熟知的《指環王》中的精 靈語、《星際迷航》中的克林崗語等。為了證明薩丕爾-沃夫假說, 詹姆士·庫克·布朗還依 照謂詞邏輯設計出了邏輯語5, 它的目標是讓計算機能夠直接聽懂人的話。至於未來 哪一種語言會成為人類的普通話,就由這些語言去相互競爭吧。但我相信,就象民族語言的 正字運動一樣,人類需要一種語言來承擔共同交流的任務,因此,人類需要一種規範的、高 效的國際輔助語或通用語,不妨把通用語的形成與確定當成全人類的「正字運動」。

    不同的語言會影響人們的思維方式嗎?同樣的知識用不同語言表示會完全一樣嗎?會不會有 一種超級語言,簡單、強大、承載全部的人類知識,並且能夠適用於所有的人?這些問題很 有意思,不是嗎?不妨把這些問題留給語言學家與科學家吧。

    語言承載知識,除了口頭交流、演講外,最規範的形式就是正式文本與圖書。並且,除了可 以發聲能夠口頭交流的語言外,還有其它形式的語言,如身勢語、旗語、信號燈、盲文、啞 語等等,不妨將它們稱為廣義的語言,這些都是重要的輔助。

    除了語言之外,人類的知識還以其它的形式承載,比如藝術品、建築、設計圖紙、工業產品 等。隨著計算機技術的發展,知識的載體又進一步擴大,影像、聲音能夠得以長期保存,這 又使得知識的傳承形式更加豐富,數量也呈現出爆炸式增加。而計算機程序本身不僅是知識 的載體,也變成了一種新的知識。

    為減少討論內容,本文將知識的載體局限在圖書、正式的文本及電子化的資源上。

    信息時代的數據與知識——淺談「知識圖譜」

    如前所述,知識是無限的。而人類的記憶卻是有限的。譬如,你的英文辭彙量達到三萬已經 非常了不起了,但《牛津英語詞典》中有六十多萬呢。當科學的發展程度越來越高時,所獲 得的有用知識也越來越多,即便拋開宗教的、習俗的知識,只記憶那些有用的,你的大腦也 不夠用。而且,儘管大部分知識現在你可能用不上,但你無法知道未來的某個時候是否會用 到。你不可能學習全部的科學知識,又不知道哪些會在什麼時候用到,怎麼辦呢?

    四萬年前的澳大利亞土著會用歌聲來記憶地圖,一旦記憶出錯,地圖也就錯了,把原來有蜂 巢的危險樹洞當成安全的,這就很糟糕了。公元前 2300 年巴比倫人用泥板繪製廣場地圖, 這就安全和實用多了。如果不是托爾·海爾達爾,波利尼西亞群島上的康·提基神也不會被留 意,就沒有文字的記錄,也不會有後人知道那一千多年前群筏過重洋的壯舉。你看,人們的 記憶是有限的、易出錯的,而只有藉助了外在的工具才能夠讓思考完整。並且,隨著時代的 發展,絕大部分人必須藉助外部工具才能進行高效的思考。

    我們需要的思考工具,除了詞典,還有各種資料庫、圖表,等等。聽朋友說,當初電報很流 行時,他的一位親屬作為發報員硬是把幾千個漢字的數字編碼背了下來,可以迅速地在摩爾 斯電碼與漢字之間形成轉換。這樣的技能作為職業可能需要,但絕大部分人一生都沒必要去 記一行編碼的,頂多在高考填卡時去查一下自己的姓名所對應的數字。若非職業需要,記憶 編碼表這樣的任務,不僅低效,而且極易出錯;但藉助外物查詢則容易得多了。

    信息時代的特點是:信息的獲取與分享,隨時隨地,方便、高效。越來越多的信息都開始電 子化,各種各樣的信息分散在世界各地各式各樣的設備中,如智能手機、平板電腦、磁碟陣 列、各類伺服器、筆記本、車載智能終端、電視機頂盒、網路存儲設備、GPS, 等等。網路連 接變成了信息的高速公路,信息的發布變得無比快捷,信息檢索甚至比你從記憶中搜索還要 方便、詳實與準確。我們也越來越習慣於藉助這些信息終端。信息高速公路也越來越變成一 項公共事業,互聯網公司的關鍵是服務,搜索引擎等公司則相當於公路的服務站一樣普遍。

    這兒借用一下傳統微型計算機的架構做個類比:如果把大腦當作中央處理器,可以把感官記 憶與短期記憶當作中央處理器的一級緩存,長期記憶與潛意識當成二級與三級緩存,則你手 頭可用的詞典、筆記、包括電腦內的資料就相當於內存,位於圖書館、檔案室、書店、互聯 網或其他人的私人藏書中的資料則相當於外部存儲了,不妨把這些大腦之外的介質統稱為人 腦的「外存」。

    那麼,我們看看互聯網「外存」中有哪些內容可用:

  • 物理學基礎知識,推薦HyperPhysics. 如果你對核物理與粒子物理感興趣,推薦在線的核素圖及Particle Data Group (PDG)。
  • 化學的基礎概念,推薦 IUPAC 的「金書」 –http://goldbook.iupac.org/
  • 數學,推薦 Wolfram 的 MathWorld –http://mathworld.wolfram.com/
  • 實際上,每個專業都有自己的專業網站可用,比如生物醫學的PubMed. 相關領域的人士 自行搜索即可。
  • IMSLP, Petrucci 音樂圖書館, 目前提供了二十多萬份樂譜可供下載。
  • 對於一般性了解的,則推薦一些百科類的網站,比如維基百科,HowStuffWorks,British Encyclopaedia,WikiHow,世界數字圖書館, 等等。
  • 語言資料更不必說了。漢語推薦漢典、中國哲學書電子化計劃及漢字字源網站。英語 推薦Merriam-Webseter及普林斯頓大學的WordNet.
  • 只要有時間,通過 Google 你可以找到許許多多類似這樣的資料性網站。如果把這些內容都 保存下來,其數據量會超乎你的想像,並且這些內容每天都在增加著。有許多有意思的研究 也在產生越來越多的數據,比如已經完結的人類基因組計劃 (ENCODE), 比如奧巴馬所批准 的投資 30 億美元的人腦地圖計劃, 等等。這些科研不僅會產生海量數據,實際上更酷的 是,任何人均可通過互聯網分享這些成果。整個互聯網都是你大腦的外存,你不需要專門記 憶,只需在用到時簡單搜索即可,很欣喜嗎?你是否感覺到自己抱著一個寶藏呢?是的,這 也是全人類的寶藏。這樣說來,互聯網隔絕就相當於把人的記憶硬生生割掉一部分一樣,是 很不人道的。

    然而,新的問題來了,面對這些近乎無窮盡的資料,你有沒有感到不知所措?甚至,你都不 知道自己的外存有多大。很多時候,這些資料庫並不能直接被你利用,你仍然需要各種幫助 才能夠找到對自己有用的東西,因為你可能不會使用,或者對檢索到的信息無法理解。擁有 寶藏卻無法使用,這是為什麼呢?

    信息不等於知識。在「什麼是知識」一節中把幾個概念一塊介紹了,就是數據、信息、知識 與智慧。數據轉化成信息需要附加一些 5W3的內容,信息轉換成知識則需要進一步 整理出相互的聯繫,而最終把知識形成一整套的體系結構,找出其中的因果,那就是智慧了。 無論信息還是知識,都是一種特殊類型的數據。我們的目標是知識與智慧。

    保存在大腦外存中的那些數據與信息,可能是仔細整理過的,比如《辭海》和《大英百科全 書》;更多的則可能僅僅是信息的羅列,比如一個城市的電話號碼簿。仔細整理後的信息, 已經是知識了,但在你理解之前,那還只是某個群體的共識,是他們的意識世界的交集。只 有理解了這些知識,在你自己的意識世界中形成了一個映象,那才變成了你的。

    這樣看來,互聯網這個大腦「外存」擁有三種類型的數據:

    1. 未經分析與整理的原始數據;
    2. 整理後的信息;
    3. 以及整理後的知識。

    儘管互聯網數據量非常之大,但這個大腦外存中的知識量卻相對較小。即便如此,仍然可觀, 比如前面所羅列的那些網址資料,這些知識個人仍然不可能完全掌握,知識量仍然非常龐大。

    那麼,如何高效地利用這些數量龐大的知識呢?

    事實上,有許多人正在朝這個方向努力著,並於二十世紀九十年代中期開始形成一個概念——知識管理(Knowledge Management)。不過,這個概念最初局限於商業領域。一般企業的知識 管理是從認知科學的基本思想出發,比如「知識螺旋」、記憶結構等,開發出一系列技術與 工具,使得企業的知識獲取、記憶、組織與積累更加合理高效。而本文則希望能夠將其中的 基本思想推廣到全人類所有的知識當中。

    知識雖然量非常龐大,但其本身是有規律的。知識管理要處理的主要內容包括:

  • 知識的結構, 這是相對靜態的;
  • 知識的獲取與演化, 參見前面知識的螺旋,這是一個動態的過程;
  • 知識的存儲、檢索、表示與分享等。
  • 知識的獲取與演化是需要人參與的一個動態過程,而知識的結構、存儲、檢索、展示、分享 等則是對這個過程的重要幫助,這些是可以寄存在大腦「外存」之中的。知識管理的最基礎 內容就是如何去組織知識,而知識的組織又與後續的存儲、檢索和展示形式密不可分,通常 把知識展示與組織當成一個整體來討論,這就是知識表示, (Knowledge Representation, KR).

    知識表示是認知科學與人工智慧兩個領域的交叉點,通常藉助本體語言(Ontology Language) 對知識點進行描述,從而構造出龐大的知識庫。這兒的本體(Ontology) 不同於 哲學中的「本體」(或「實在」),是指信息科學中對要共享的概念體系一種形式化的、明 確而又詳細的說明。資訊理論中的「本體」實質上就是概念之間的關聯體系。下圖取自維基百 科,這是一個簡單的使用本體表示的示例:

    知識表示的底層技術相對複雜,但展現在人們面前的通常是相對簡單的關係圖,比如TheMain的腦圖, FreeMind 或Xmind中的層級結構圖,Visual Understanding Environment(VUE) 及CmapTools所展示的概念圖,等等。不管具體的形式有多大差異,這 些工具都表明這個領域正在蓬勃發展之中。

    知識表示的努力結果之一就是各種各樣的知識庫,與傳統的百科全書、維基百科類網站均不 相同,它們更專註於知識點(對應於傳統的詞條)之間的聯繫。大腦的互聯網外存中有許多 知識庫,其中比較知名的有:

  • FreeBase(FB), 於 2007 年建站。 FB 的基本單位為「條目」 (entity), 可以是人、 地點或任何事物,而 FB 則專註於這些條目之間的聯接。 FB 旨在提供對人類全部知識 的圖示。它採用專門的查詢語言 MQL, 你可以通過公開的 API 構造自己的應用程序,從 而只專註於某一個特定領域的知識,例如,你可以利用 FreeBase API 構建一個類似於 IMDB 的網站。
  • Knowledge Atlas(KA), 一個基於網頁的學習工具,提供知識點之間的關係,有多種展 示形式,包括樹狀圖與敘事圖 (Storyline). 其中很有意思的是它的敘事圖,你可以將 一些關聯的概念按時間線組織成一篇研究文章、一篇博客、甚至一本書。
  • Exploring Data, 這個網站主要是展示一些數據挖掘的技術,其展示效果令人印象深刻, 比如這個人類疾病網路圖 –Human Disease Network. 該網站的程序源代碼都託管在GitHub上,感興趣的人可自行研究。
  • 知識管理是在知識表示的基礎上,綜合知識存儲、檢索、分享等技術,對知識獲取與演化過 程提供重要輔助,以達到獲取有用知識與智慧的目的。有人提出的「數據挖掘」概念,其實 也屬於知識管理的一部分。

    網站 KA 提出一個知識管理工具的概念,即 Knowledge Atlas, 我翻譯成「知識圖譜」,這 是他們對自己知識管理方法的一個統稱。特定領域的知識,概念之間的關係很清晰,不妨將 這些概念及它們之間的聯繫所構成的一張概念之網稱之為這個領域的知識地圖。例如物理學,HyperPhysics給出了一個很好的嘗試,不妨將之看成物理學這個領域的知識地圖。當多個領 域的知識累積起來時,會形成一系列的知識地圖,而這些知識地圖之間又存在緊密的聯繫: 比如元素周期表不僅關聯著化學,也關聯著物理學;醫學更是與分子生物學、病毒學、化學 等等領域交叉頻繁、密不可分。那麼,不妨將網站 KA 的知識圖譜概念從工具本身做一 個推廣,將之視為全人類知識結構的一個綜合體,從而能夠將特定領域的知識地圖、各個領 域知識地圖之間的聯繫都包含在內。知識圖譜,可以視為人類全部認識的骨架. 為輔助理 解,你不妨簡單將之視為在詞典與百科全書中添加上條目(或概念)之間的關係結構。

    這樣,在信息時代,我們大腦的互聯網外存就形成了這樣的結構:

  • 各種各樣的原始數據與信息,如監控錄像、照片、短消息、論壇討論貼子,等等;
  • 結構化的知識體系,如專業性很強的核素圖和通用型的知識庫FreeBase等;
  • 全人類知識的整體結構,那就是「知識圖譜」。這個結構目前還沒有完整可用的工具, 網站 KA 提供了一個雛形,至於它能否完全承擔起這樣的任務,則視其發展而定。不過 有一點可以肯定,這樣的「知識圖譜」型的工具必然會與維基百科類似,是集體合作的 結晶。
  • 知識圖譜包含著科學、社會、歷史、甚至宗教等每一個領域的知識地圖;沿著特定領域的知 識地圖可尋找到特定的知識點;再將知識點關聯到特定的信息與數據上。這樣,知識與數據 就構成了我們對外在世界的一張完整的認知之網, 這張網不僅包括科學的世界觀,也包括 宗教的世界觀,它是人類認識的意識世界的合集。人類各式各樣的認知活動,最終都是在編 織著這張認知之網,並試圖用它來覆蓋住整個世界。

    知識圖譜中科學認知的框架部分不妨稱之為科學知識圖譜. 以這個科學知識圖譜為骨架, 填充進具體的科學知識與信息,這就形成了人類對世界的一張科學認知之網, 它是人類對 世界認知的最真實的合集。

    信息時代的智慧:構建你自己的「知識圖譜」

    人們需要知識與智慧的原因如下:

  • 滿足對世界本身的好奇;
  • 利用這些知識和智慧去預測未來可能發生的事情,從而避開危害,給自己的生活帶來便 利,從而更好地享受生活。
  • 前一節中談到了信息時代的特點。不能夠充分利用信息時代特點的人,不妨稱之為信息時代 的低能兒,他們大致有這樣的表現:

    1. 不會檢索信息,這個不必多言。
    2. 不會獲得正確的信息。儘管獲得信息很方便,但你有非常大的機會獲得虛假的、錯誤的、 充滿欺騙的信息。因此,甄別信息的真偽非常關鍵。多種信息擺在面前時,不會分析與 分辨真偽,這是一種低能的表現。
    3. 更低能的,就是試圖以欺騙自己的方式來欺騙他人。信息的公開、發布、檢索的便捷則 意味著試圖通過隱瞞、篡改信息達到欺騙目的變得越來越困難,這種情況下仍然把他人 當作瞎子來愚弄的人,自己會很容易變成被愚弄的對象。

    如何適應信息時代,擺脫低能,擁有信息時代的智慧呢?個人認為,你需要充分利用大腦外 存中的海量信息,建立一個自己的個人知識圖譜, 將你自己的知識與全人類的知識之間建 立起聯繫,從而擁有自己的知識與智慧。

    什麼是個人知識圖譜呢?這是我對前一節「知識圖譜」概念的一個推廣。它是一個抽象 的概念,指的是個人對世界認知的骨架結構。英文可為 Personal Knowledge Atlas, 為後文 敘述方便,簡寫為 PKA. 實質上, PKA 也可理解為個人的知識結構、知識框架等。之所以采 用這個名詞,因為我覺得,它的內涵又不同於單純的知識結構,它應該成為一個個人的內在 的認知工具。

    全人類知識圖譜內容甚巨,甚至彼此矛盾,比如同時包含有科學與宗教的知識,其中的大部 分內容對個人可能無用。比如,除非興趣或研究需要,你沒有必要知道二千年前消亡的蘇美 爾語與阿卡德語之間相互影響的歷史。那麼,對個人而言,有哪些知識有用呢?至少應該包 括這些內容:

  • 知識圖譜本身。比如一些信息學中基礎的「本體」概念,如人、實物、一些抽象概念等。
  • 科學的框架結構。你至少應該了解有哪些基本的科學門類,如物理、化學、數學、生物 學、醫學,等等;對於常見的科學,你應該了解它的基本結構,比如物理學是研究物質 結構與運動的學科,可分為力學、熱學、光學、原子物理、粒子物理與核物理等。
  • 與你自身環境密切相關的知識,比如你所處的國家、地理位置、社會階層、民族習性等。
  • 與你工作密切相關的知識。
  • 根據上述的有用知識,個人知識圖譜 (PKA) 可以用科學知識地圖為藍本,結合與個人密切相 關的環境,進行構造與完善。因此,每個人的 PKA 會彼此不同。

    PKA 是你頭腦中一個認知的框架,它越合理與完善,你能夠恰當、準確處理的信息也越豐富、 準確。繼續借用傳統微機架構進行類比,若把全世界的信息看成一個寵大的網路,把每個人 當作是一個信息處理終端,則個人的大腦相當於信息處理終端的主要運算晶元,而 PKA 則相 當於這款晶元的「指令體系」。基於宗教的 PKA 與基於科學的 PKA 相比,同樣的信息很難 得出一樣的結果,因為彼此的「指令體系」不同。目前,最準確、高效的「指令體系」只有 基於科學的 PKA.

    信息時代,最快捷的是信息,而信息仍然需要一個過程才能夠轉化成個人的知識,進而轉化 成智慧。 PKA 可以幫助你將接觸到的信息迅速定位,從而參與到個人決策中去。比如一條微 博消息稱《武漢協和醫院發生嚴重放射事故造成多名女教授集體患癌》,由於我的核物理背 景,第一反應就是儀器設備屏蔽不合格或操作不遵守程序,接著,大腦就自動把電離輻射導 致生物體損傷相關的內容與之關聯起來,將消息定位為技術使用不當的一類內容;而有人的 第一反應,可能是「天哪,當醫生怎麼這麼不安全」,或者是「我們禁核吧」,然後把這條 消息定位為一起醜聞了事;這就是個人知識圖譜對信息定位的一個典型示例。

    除了能夠將信息快速定位, PKA 應該是你個人那條知識螺旋的旋轉軸線,你的個人知識將沿 著它進行累積、演化與壯大,進而獲得更多有用的知識,從而將個人的學習與經驗轉化成智 慧。

    信息時代的智慧,主要體現在如何利用時代的特點進行信息的管理與知識的獲取。對於這個 問題的思考,目前有兩方面的內容,即個人信息管理(Personal Information Manage, PIM) 與個人知識管理(Personal Knowledge Manage, PKM), 彼此間有諸多交叉。那麼, 把 PIM 與 PKM 的方法與你的 PKA 結合起來,你在信息時代的智慧則體現在:

  • 具備快捷、高效、準確的信息檢索技巧;
  • 具備識別大部分信息真偽的能力;
  • 具備將信息迅速分類、組織,並進一步推理出新內容的能力;
  • 具備在知識間建立因果關聯從而進行決策的能力。
  • 實際上,上述這些智慧中最主要最關鍵是最後一條:高效、準確的決策能力。

    如何獲得在信息時代的高效、準確的決策能力?或者說,如何獲得信息時代的智慧?個人以 為,你需要經歷這樣的過程:

    1. 構建自己的 PKA.
    2. 通過學習擁有基本的信息獲取、檢索、發布的技能。
    3. 通過練習,將 PKA 與大腦外存中的海量信息建立聯繫,尤其是對你的工作與生活密切 相關的信息,你可以迅速、準確地進行定位、歸類、分析與判斷。這個練習的過程可能 需要一定的時間。

    PKA 的構建,需要一個正規的、系統的學習過程。如果你系統地完成了中學教育,然後又認 真修習完一套專業課程,實際上你的 PKA 已經基本建立。如果你再能夠完成碩士或者博士的 教育過程,則你的 PKA 相對完善了。如果你沒有完成基本的中學教育,不妨尋找幫助,藉助 互聯網這個大腦外存完成一下系統的教育(這個現在真的可以做到嗎?)。而 PKA 的進一步 完善則可以耗費你全部的餘生,因為人類的認知是無止境的。而如何在完成系統教育之後繼 續完善你的 PKA, 這且留給我們共同去思考。

    在遠古時期,為存儲一點信息,我們需要編製歌曲、製作泥板或刀刻木片,思考本身反而不 如製作工具麻煩。就在不久之前,我們的信息處理仍然以紙與筆為主,有人戲稱為 PPP, 即 Paper + Pencil + Patience, 因為記錄與檢索信息仍然需要很大的耐心。在前信息時代,尤 其是在古代,擁有信息都可被視為是智能。而在我們這個時代,信息就象深空中的星雲一樣 浩瀚,信息的存儲、檢索等已經成為最簡單的事情,大部分人不需要去記憶編碼、不需要去 背地址或郵編、不需要記住地形,大部分人已經從記錄、傳播信息的繁瑣勞動中解放出來, 大腦已經不再是信息的主要存儲場所,甚至不再是大部分知識的存儲場所。當信息的存儲、 檢索已經主要依靠大腦的外存時,大腦就獲得了解放。除了享受之外,解放了的大腦的主要 任務就變成了獲取知識與智慧,從而更加專註於智能本身。那麼,我們不妨把這個時代的信 息處理稱為 III, 即 Internet + Information + Inteligence.

    如果將全部世界的信息與知識類比成銀河系,我們人類的大腦是一艘星際飛船,則 PKA 就是 這艘飛船的星圖與導航系統,我們智慧就是能夠在這個浩瀚的星系間給自己的心靈尋找一片 舒適的空間。

    讓我們的大腦在信息高速公路上好好地展現其智能吧!

    淺論信息時代的教育與科普

    如果把所有的科學認知構造成一張科學的認知之網, 那麼科學家就是那些辛勤織網的人。 他們用自己的智慧構造這張網的骨架,那就是一個個科學概念與一條條概念之間的聯絡。然 後,這張網覆蓋到整個世界之上時,我們每個人都在檢查這張網是否與現實吻合、是否存在 漏洞、是否留有空白,然後用我們自己的信息與知識進一步去完善這張網。實際上,任何人 只要有能力去修建與彌補這張網的骨架,你就是科學家。原來局限在象牙塔中的科學研究活 動實際上已經成為日常生活中很普通的活動,只要有能力,每個人都能成為織網的人。如果 把給網中填充信息也當作織網的話,每個人都是織網的人。

    這張科學的認知之網如何變成每個人的智慧?這就需要教育與科學普及。

    首先談談教育。

    個人認為,在信息時代,教育概念的內涵與外延已經與前大大不同。中國古代的教育,是為 了普及「聖人」的智慧,或者說「聖人」的認知,其目的是訓化良民,讓百姓們知道哪些是 「聖人」想讓他們做的,哪些是禁忌。近代,教育的目的已經多樣化了,如宗教的教育與中 國古代類似是為了馴化教民,職業的教育是為了培養技工,等等。各類教育中,應該只有科 學的教育目的最為特別,為了培養人們獲得智慧的能力。個人認為,信息時代的科學教育, 應該以獲得信息時代的智慧為目的而進行。因此,這樣的教育應該包括:

    1. 系統的、基礎的認知能力訓練,其目的是讓受教育者的知識螺旋旋轉起來。這些認知能 力包括感知、記憶、分類、排序、比較,等等,參見皮亞傑的《發生認識論》。
    2. 具體知識的傳授,在受教育者大腦內形成一套科學的個人知識圖譜 (PKA).
    3. 特定的信息處理能力訓練,包括信息獲取、分類、分析與綜合等。

    由於信息時代的特點,需要單獨談談基礎認知能力訓練中的記憶力訓練。當然,記憶力訓練 仍然重要,但目的已經與以前大不相同。記憶力已經不再是單純為了記住更多的信息,因為 你有更龐大的外存,甚至,在知識螺旋的旋轉過程中獲得的新知識也沒有必要專門記憶,你 完全可以保存在外部介質中。若把記憶力類比成中央處理器的緩存,緩存越大,能夠一次性 處理的信息量也越大,這樣,記憶力的訓練,它的目的就變成了提高你的大腦一次性處理信 息的量。

    再次,談談科普。

    什麼是科學普及,或者科普呢?科普有什麼作用?

    個人以為,科普的本質,就是將人類的科學共識(包括科學方法與知識)普及到更多的人, 讓他們的意識世界與真實的世界更加接近。

    為什麼要科普?

    個人以為有三方面的原因:

    1. 為了文明的傳承。科學認知是人類最偉大的成果,也是人類文明最精華所在。科普,是 為了傳承這個文明精華。
    2. 科學的認知之網是與真實最接近的認知,也是最實用的認知。好東西的分享不帶來損 失,反而有好處,為什麼不分享給更多的人呢?
    3. 儘管科學的認知之網已經幾乎覆蓋了人類周圍全部的世界,但全球大部分人仍然被宗教 的認知之網控制著,這張科學的認知之網還沒有被覆蓋到足夠人群的意識世界。儘管科 學認知已經取得非常驚人的成就,但外部真實的世界仍然有許多未知的東西,科學的認 知之網仍然沒有覆蓋住全部的世界,這張網仍然存在漏洞或破綻。科學的認知之網需要 許多的織網人,除了人力,織網還需要許多的資源。只有這張科學的知識之網鋪展到足 夠的人群,才會有足夠的織網人,才會獲得足夠的織網資源。因此,科普也是科學與宗 教進行人力與資源之爭的主要手段之一。

    怎樣科普?這個問題至少涉及到兩個方面:一是科普的內容,二是科普的方法與手段。

    實際上,如果把傳播知識、培養技能當成廣義的教育,科普則屬於系統教育的擴展,它是對 系統教育的補充與更新。科普與系統的科學教育在內容上有重疊,同樣包括科學方法、思想 與具體的科學知識。但與科學教育不同的是,科普儘可能把最新的內容補充進來,以彌補教 育中的不足。對於未能得到科學系統訓練的人,科普可以吸引他們對科學的關注,從而激發 興趣,讓他們自行去彌補知識結構的不足,完善其個人知識圖譜。這樣,科普在內容上就有 如下的特點:

  • 科普內容會顯得相對零散,不一定如科學教育一樣系統。比如物理學的科普作品,它不 可能如朗道十卷本的理論物理系列教程那樣完備。但作為科普作家,則必須具備完整的 個人知識圖譜,然後,他才能夠從這個圖譜中摘取一點形成作品,擺放到公眾面前。
  • 面向的對象不一定具備完整的個人知識圖譜,因此要儘可能兼顧知識層次較低的人群, 內容的組織上應該有「就低不就高」的原則。
  • 內容與新聞一樣,具有一定的時效性。當日本福島核電站被地震撕毀時,公共陷入恐慌 之中,此時傳播核電站與放射性危害的科學知識比平時會有更佳的效果。那麼,所謂的 時效性,就是人們在不同的時間對具體科學知識的需求不同,科普應該及時去滿足公眾 的這種需求。
  • 科普的方法與手段指的是針對其內容特點所採用的技術,以達到受眾更廣、接受程度更高的 目的。方玄昌在第一屆「科學與無神論者大會」上的講話中曾提到用做新聞的方法來做科 普,由於科普與新聞在時效性與傳播受眾上有相似性,這個想法是非常好的,也是很自然 的,值得推廣。

    科普的手段以前以科普文章為主,但在信息時代,科普的手段則愈加豐富:

  • 綜合文字、圖片、視頻的「富媒體」,比如瀏覽器和網路世界20大須知, 比如 YouTube 上有許多一分鐘物理學的視頻,等等。
  • 遊戲形式的科普。比如將力學規律的認知歷史做成角色扮演型遊戲,你願意扮演牛頓, 還是第谷呢?這個是個人借鑒自 RPG 遊戲的一個構思,我不知道有沒有具體的作品。
  • 計算機程序形式的科普,尤其是面向 iPad 等平板設備的教育型的程序。「每個孩子一 台筆記本」 (OLPC) 的計劃導致了「糖果操作系統」 (Sugar OS) 的誕生,個人以為, 在這樣的教育平台上開發科普性質的應用程序應該很不錯。
  • 在微博、論壇等互動媒體上的科普。
  • 更多新奇的想法等待著你來展示。
  • 如果把科學認知之網當成風景優美、趣味橫生的迪斯尼樂園,科技論文則相當於樂園中具體 設施的技術資料,科學領域的系統教材(如朗道十卷本的理論物理系列教程)和綜述性文章 則相關於具體設施的詳細使用手冊,而科普作品,則相當於樂園的宣傳手冊。科普,是引領 遊客抵達快樂的嚮導。如果你是名科學認知之網的織網人,那麼,寫一篇宣傳手冊吧,把你 的編織樂趣與所織就的成果傳達給更多的人;如果你見識了很漂亮的風景,那麼,寫一篇宣 傳手冊吧,把美麗傳達給更多的人。

    後記

    本文中有一些自創的概念或者對概念的引申,如知識圖譜,個人知識圖譜,知識地圖,認知之網. 之所以自創或引申概念,是因為覺得這樣更能準確表達我的思想。但這些概念的 由來,除了文中的許多網址鏈接外,主要受如下內容的啟發:

  • Frand, J. & Hixon, C. (1999). Personal Knowledge Management : Who, What, Why, When, Where, How?. Los Angeles: UCLA. Retrieved July 28, 2011 fromhttp://www.anderson.ucla.edu/faculty/jason.frand/researcher/speeches/PKM.htm
  • Knowledge Atlas –http://knowledgeatlas.coop/
  • 知識製圖學 (Knowledge Cartography) –http://knowledgecartography.org/
  • 讀了不少作品,把自己關於知識圖譜、知識管理與科普的一點粗淺想法寫出來之後,發覺其 實仍然比較凌亂。但傳播想法是知識壯大的有效途徑,因為覺得這點想法是有意思的,敝帚 自珍吧,希望傳播出來後能夠得到更多的回饋,令它更完善。

    Footnotes
    1. Karl Erik Sveiby,The New organizational wealth: managing & measuring knowledge-based assets, San Francisco: Berrett-Koehler Publishers, Inc., 1997, p.29
    2. Nonaka and Takeuchi,The Knowledge-Creating Company, 1995, p.71
    3. 4W很好理解,就是: What, Who, When, Where; 而How可以取首字母H, 也可以取尾字母W, 因此有 5W 或 4W1H 的說法。相應地,把Why加進來,則 有5W1H或6W的說法。但用Five Ws的說法多一些。5W恰當地反映了人類對世界 的認識過程。比如拉雅德·吉普林的小詩:I keep six honest serving-men:(They taught me all I knew);Their names are What and Why and WhenAnd How and Where and Who.
    4. 人工設計語言,英文中叫Constructed Language, 簡寫為 conlang, 是指其發音 體系、語法、辭彙等均由個人或群體從頭開始設計的語言。許多人工設計語言的最初目標是 成為國際輔助語(International Auxiliary Language, 簡寫為 IAL, 或 auxlang), 但也 包括一些研究性的語言。國際輔助語的目標不是取代人類現有的民族語言,而是成為不同民 族、不同文化之間交流的橋樑,它與民族語言之間的關係就象漢語的普通話與方言的關係一 樣。
    5. 邏輯語最初於 1955 年發表在《科學美國人》上,當時叫 Logban. 自 1987 年 始,由邏輯語言組織 (Logical Language Group, LLG) 接管其開發,其名稱規範化為 lojban [?lo?ban]. 其特點是:言文一致、形意一致、文化中立。它的語法源自謂詞邏輯, 它沒有標點符號,其文本甚至可以直接用 YACC 類似的程序進行解析。邏輯語的全部語法都 在The Lojban Reference Grammer這本書中,該書用 DocBook 格式開發並託管在GitHub上。邏輯語的主頁參見 –http://www.lojban.org/tiki/Lojban

    6
    推薦閱讀:

    《無問西東》:當今時代,清北應該培養出怎樣的學生?
    快時代,慢婚姻
    凝心聚力書寫偉大時代
    梁軍儒:「慢熊」時代如何投資?
    工業互聯 | 華為:開啟製造業全聯接時代!

    TAG:智慧 | 信息 | 時代 | 信息時代 |