美國在冷戰時期的秘密任務:打造世界上第一台中文輸入計算機

1959年夏,美國亟需在冷戰中取得一場勝利。1957年,蘇聯發射了人類歷史上首顆人造衛星Sputnik 1,在技術上獲得重大勝利。次年,中國開始了轟轟烈烈的「大躍進」運動。1959年春,古巴革命領袖菲德爾·卡斯特羅的游擊隊迫使總統富爾亨西奧·巴蒂斯塔流亡海外。美國需要重振旗鼓,證明自己仍然是全球事務的掌舵人。美國的計劃是:總統德懷特·艾森豪威爾要求美國科學家造出世界上第一台中文輸入計算機。第一台中文輸入計算機的發明會是一場重大勝利,是資本主義饋贈給中國人民的一份「禮物」。「自由世界」將藉此取得一場技術和文化勝利,同時,憑藉這種新設備,中文材料將得到翻譯,並能夠在全球範圍內傳播。誰擁有了這種設備,誰就能夠以前所未有的速度,用漢字「席捲」世界,這也許是一種龐大的輿論宣傳優勢。而且,對於中文和10多億以中文為母語的人來說,這會開啟信息技術的新紀元,很多人曾以為,只有字母文字才可能迎來這樣的新時代。這場地緣政治戲碼圍繞著Sinotype展開,這部機器由「計算機中文輸入之父」薩繆爾·霍克斯·考德威爾(Samuel Hawks Caldwell)發明。

薩繆爾·霍克斯·考德威爾考德威爾是個多才多藝的人,他1904年出生於美國馬薩諸塞州,就讀於麻省理工學院,師從著名的模擬計算機設計者范內瓦·布希(Vannevar Bush)。後來,考德威爾又成為邏輯電路領域的先驅。他平時喜歡彈風琴,偶爾還會在波士頓管弦樂團中客串演出。但考德威爾不會說中文,也不識漢字。他頭一次接觸漢語是在和麻省理工的中國留學生閑聊時。用他後來的話說,他沒想到「漢字竟然也有『拼法』。」考德威爾原以為漢字沒有拼寫規律,但他很快發現事實恰恰相反:「說來也怪,(中國學生)學寫表意文字的方式與西方人學寫單詞的方式非常相像,每個中國人在學寫漢字的時候,筆畫的順序都是相同的。」作為邏輯電路設計專家,漢字「拼寫」的規律性勾起了考德威爾的好奇心:如果每個漢字都是以相同的方式構成,那麼是否有可能設計出一種邏輯電路,把漢字筆畫當成輸入數據,然後輸出漢字?儘管漢語是非字母語言,但如果它具有自己的「拼法」,那麼是否有可能設計出一台中文輸入計算機,來解決工程師多年來的疑惑?考德威爾向哈佛大學遠東語言教授楊聯陛尋求幫助。他們對漢字的結構進行詳細分析,並弄清楚大約2,000個常用漢字的筆畫「拼寫」,最後總共確定了22種筆畫。這是一個理想的數字,每種筆畫都可以在西方標準打字機鍵盤的按鍵上找到自己的位置。考德威爾沒有採用QWERTY標準鍵盤的布局,而是讓Sinotype的鍵位與漢字的筆畫對應,打字員用這些筆畫來構成(更準確地說是描述和檢索)漢字。考德威爾說,他的目標是「提供交換電路所需的輸入和輸出數據,交換電路會把一個漢字的拼寫轉換成這個字在影像存儲矩陣中的位置坐標」。在研究過程中,考德威爾又有了一個意外發現。漢字不僅有拼法,而且「漢字的拼法具有高度冗餘性」。考德威爾基本上用不著輸完一個漢字的所有筆畫,Sinotype就能檢索到這個漢字。例如,一個15畫的漢字,打字員可能只需要輸入前五六畫,Sinotype就能找出那個漢字。

英語也是如此。

比如「xylophone」和「crocodile」的拼寫,前五個字母就足以與完整的單詞形成匹配。因此,包含九個字母的單詞可能只需要五個字母就能「找到」。考德威爾分別稱之為「完整拼寫」和「最小拼寫」,二者之間的差異常常是很大的。在他的測試樣本中,某些漢字有11畫,但只需要五畫就能「找到」,他認為,通過利用這些因素,有可能「設計出一種機器,在它的鍵盤上,輸入漢字的速度至少會像輸入英語單詞那麼快」。考德威爾不僅發明了世界上第一台中文輸入計算機,還在不經意間發明了我們現在所說的「自動補全」輸入法。Sinotype項目獲得了卡耐基基金會、美國陸軍和美國空軍的資金支持,他們都希望利用Sinotype來提高漢語宣傳單的產量,從而使這種大有可為的新設備成為一種「武器」。依靠Sinotype,大規模製作和印刷中文宣傳材料成為了現實。

sinotype輸入法中以字母D、P、B為開頭的漢字但考德威爾並不是用冷戰思維來看待他的發明。「很多人會問,為什麼要做這個東西?軍方為什麼會投入大量資金和精力?」他後來寫道,「答案簡單明了,我把這個想法介紹給軍方,真正目的只有一個……漢字輸入機器會加強人與人之間的溝通,而溝通的加強絕不會損害和平事業。」在他看來,Sinotype是實現和平的一種方式。1959年5月,美國政府擔心中國科學家可能快要在計算機中文輸入方面取得突破,害怕被中國人搶先,如果中國人實現突破,將會嚴重削弱Sinotype帶來的精神勝利。政府顧問敦促「總統儘快公布這部機器」,因為「美國致力於通過加強溝通來增進世界各國人民之間的相互了解,在這個漫長而持續的過程中,這部機器會被譽為美國做出的一次重大突破」。但那個夏天悄然而過。艾森豪威爾沒有公布這台中文輸入計算機,Sinotype也沒有公開露面。至於該設備是否準備就緒,是否經得起國際社會和軍事分析家的檢驗,在這些問題上,質疑始終存在。它對漢字用戶來說好用嗎?它是否真像設計者認為的那樣意義重大?過早公布Sinotype的風險實在太大,最終,當局決定推遲發布。第二年,Sinotype項目遭受了最沉重的打擊:考德威爾去世了,沒有了這位先驅的領導,軍方的熱情迅速降溫。然而,Sinotype的生命並未終結,曲曲折折又延續了幾十年,期間美國軍界、商界和學界都曾參與該項目,包括中情局、蘭德公司、IBM、ITEK、麻省理工、美國無線電公司等等。在這個過程中,Sinotype更換了幾次名字,先是Sinowriter,接著是Chi-coder,然後是Ideographic Encoder。到了上世紀80年代,考德威爾團隊制定的概念和技術框架仍然是計算機中文輸入的基礎。後來,該項目以Sinotype II的面目重生,從考德威爾最初基於筆畫的鍵盤輸入,向日益流行的中文拼音輸入轉變。雖然經歷了種種變化,但考德威爾的核心設計原則得到保留——自動補全仍然是60年來計算機中文輸入的核心組成部分。所以,當你下一次因為不可避免的英語單詞自動補全錯誤而頻繁吐槽的時候,不妨想想:如果字母輸入的自動補全功能與中文輸入的自動補全功能同時起步,那麼字母輸入也許會比現在發展得更好。翻譯:于波

來源:TheAtlantic


推薦閱讀:

下個學期去台灣東海大學交流一學期(2016年2月~6月份)有要叮囑我的嗎 或者有什麼遊玩計劃嗎?
《李炳南居士與台中佛教蓮社》
台灣自駕一日游_漫步南投縣小半天生態景區、海吃台中最夯美食街
山東煙台中醫藥專修學院
秋季學期去台中交換,誰能介紹一下台中大概那半年穿什麼呀?

TAG:計算機 | 美國 | 世界 | 計算 | 台中 | 秘密 | 任務 | 輸入 | 中文 |