剛開始編寫漢字輸入法時為什麼不用拼音?

就一開始電腦無法實現漢字輸入,那時候為什麼不用拼音輸入法呢?是因為當時的打字機無法實現嘛?


中國首條出現電報線路是1871年。1880年,李鴻章奏准開辦電報總局,由盛宣懷任總辦。並在1881年12月開通天津至上海的電報服務。

威妥瑪拼音出現於1892年。

現在的漢語拼音發布與1958年。

你說呢。


不說電報,咱們來說電腦。至少在電腦上拼音就是最早出現的輸入法。

x86 PC其實早在88年左右就通過各種途徑進入了中國普通民眾手中(更早其實就在很多機構啟用)。彼時Windows 3.1還沒出世,就windows 2.0的素質根本只是個沒啥意義的玩具。國內PC的操作系統主流還只是MS DOS/IBM DOS。但那時已經可以處理中文了,且不說四通利方中文平台,現在造《征途》的史玉柱大爺當時一人之力就搗鼓出了漢卡……那就已經可以顯示中文了,在286孱弱的性能情況下用硬體的方式就提供了3000餘個漢字的點陣顯示。畢竟當時電腦在國內的主要應用其實就是中文排版。

當時的輸入法那才叫百花齊放,除了現在主流的拼音五筆,還有二筆、鄭碼等各種輸入法……然而最早出現的就是拼音了,比五筆什麼的都早。然而有兩個大阻礙使得普及率不高。一方面當時普通話以及拼音並不夠普及,甚至很多當時受過高等教育的人都不熟悉拼音(50-60年代生人),另外一方面電腦貴啊……少啊……而彼時的拼音對詞頻排序、自建片語什麼的做得都不夠好(主要是思路受限,另外空間受限存不下啥詞庫),五筆的不依賴發音、不依賴詞庫和低重碼高速度開始嶄露頭角。

再後來,民眾擁有的計算機數量逐漸增多,隨著WPS(命令行下的WPS)和UCDOS的普及,輸入法逐漸集中到了拼音、簡拼、雙拼、五筆、鄭碼這幾種輸入法上,並且固定片語和聯想功能逐步普及。但此時拼音的唯一優勢只不過在於它是唯一留下來的聲碼。

Windows95的出現很大程度上推動了計算機在全人類範圍的普及,而此時第一次出現的智能ABC輸入法才是讓中國人看到了拼音輸入法的曙光:它是第一款帶自造片語和詞頻調整的輸入法。有人說智能ABC不帶詞頻和組詞,我想他提及的是當時windows自帶的「拼音」而不是智能ABC。

智能ABC很大程度上幫助了拼音的普及。但是它設計並不夠好,一方面空格後開始分詞的設計有些累贅,另一方面初始詞庫小而詞頻調整原則比較詭異……後續有很多產品針對這兩點做出了更好的改進,比較有名的有紫光拼音和拼音加加。自那之後,拼音輸入的速度才真正到了可以讓人接受的地步。這個時間點上普通話和拼音的普及率隨著義務教育的推進大幅度提高,曾經的重要障礙一一被掃除,拼音輸入法開始碾壓包括五筆在內的其它輸入法。

期間,有一款叫拼音之星(或許是智能狂拼?)(2002年左右?具體時間不記得)的輸入法做出了很多在當時來看非常具有創新性的舉動:超大詞庫、整句輸入、額外的提示欄。在當時硬碟都只有20-60GB的時代,一個輸入法要佔用500MB+的空間簡直是人們沒法想像的事情;即使今天,估計也不是所有人都能接受。它確實非常超前,甚至比當時的微軟拼音更早提供了整句輸入,而詞庫更是包含了諸如唐詩宋詞等各方面的整句片語,對文章的輸入速度也首次逼近甚至超過五筆。然而還是步子邁太大:一方面大詞庫使得輸入法載入慢查詢詞庫慢,另一方面,它是收費的,而同時代的紫光拼音、拼音加加都是免費的。

後來拼音加加開始引入分詞庫概念,可以通過添加詞庫文件來載入額外的詞庫,一時成為霸主;同期的微軟拼音因為水土不服以及一些設計問題不合習慣而變得不慍不火。

再隨後,寬頻普及,互聯網接入成本下降,速度大幅度提高,搜狐第一個站出來,用類似紫光和拼音加加的小詞庫為初始,同時又引入了軟體內直接詞庫同步和載入分詞庫(細胞詞庫、雲詞庫)構成了搜狗拼音,並且加入了皮膚。其它輸入法紛紛效仿,然而敵不過搜狗有搜狐這個當時熱門門戶網站的流量引導。再往後才是各大網路品牌的輸入法混戰。

說白了,拼音本就是最早的中文輸入法,只是初期太弱和環境因素導致被五筆碾壓;人們一直致力於解決拼音輸入法的不足,才使得拼音足夠強大;最後藉由拼音本身的普及率夠高,才坐上現在的王座。

————————————

有人說五筆出現更早。五筆第一版在83年,此時GB2312標準已經實行了3年,區位碼和拼音早就有了,因為GB2312標準里一級編碼3000多個高頻字本身就是拼音排序的,當時81年推廣GB2312時,就是利用了通過拼音查內碼錶的方式提供了拼音輸入法,當然那時連個候選詞都沒有,拼音+偏移量才能輸入漢字,是得要背編碼表的……


因為當時還解決不了拼音輸入法重碼率過高的問題。

我想很多人的啟蒙拼音輸入法是 Win98/WinXP 自帶的智能 ABC 輸入法。這個輸入法太原始了,似乎連動態詞頻調整也沒有,可想而知用它來輸入該是多麼痛苦的事情。

2006 年發布的搜狗拼音輸入法是一個里程碑。搜狗取得這種突破應該是大量使用了開發搜狗搜索時積累下來的中文自然語言處理技術以及後期根據用戶的搜索行為不斷更新的巨大詞庫。

當然,搜狗的工作也是在前人的基礎上繼續推進的。微軟聯合哈工大推出的微軟拼音輸入法和清華的紫光拼音輸入法應該是它主要的參考目標。

2007 年,被很多人推崇的谷歌拼音輸入法推出了,然而它未經許可使用了搜狗輸入法的詞庫,這應該算是谷歌中國的一個醜聞。

今天,搜狗輸入法應該是搜狐最有價值的資產之一了,要不然騰訊也不會把 QQ 輸入法直接注入到搜狗公司了。就如同它對京東的投資一樣。

現在中文互聯網流行的 PC 輸入法都是旗下有搜索引擎業務的公司推出的,這不是偶然的。


漢字本身是表意文字,同音字太多,導致拼音輸入的重碼率過高。現在很多人可能沒有用過比較早的拼音輸入法,比如很多人提到的智能ABC,每輸入一個拼音都要在幾頁同音候選字中尋找自己需要的那個字,輸入每個字的擊鍵次數平均可能要四到五次甚至更多,相對的,同期的五筆字型大概只需要兩三次,效率高得多。實際上智能ABC已經具備自造詞和詞頻調整的功能,比更原始的全拼效率還是高一點的。

大概在96年左右,隨著win97,微軟發布了支持整句輸入的微軟拼音,算是拼音輸入法的革命性的進步,現在的各類拼音輸入法的輸入模式都是由此而來的。整句輸入的關鍵在於「預測」,而預測的依據則是大量的統計數據(詞庫)和處理能力(實時斷字和調整候選字)。

那麼答案就很簡單了,早期計算機不具備這樣的處理能力和存儲空間,因此傳統的拼音輸入法效率太低,不適合用於輸入。

補充一句,現在我們用的漢語拼音是五十年代出現的,而它和普通話在全國範圍內的真正普及是近二十年的事情,所以其實最早一批計算機工作者大多數不會拼音,或者沒法正確打出拼音來……


我們熟悉的漢字輸入法 有拼音輸入法,五筆輸入法 此外海峽對岸還有 倉頡和注音輸入法。可能日本那邊也有漢字編碼的方式。有一次開大會,我還見到速記員拿出特製的鍵盤,啪啪啪的飛快輸入一句話。(感興趣的同學可以自行搜速記鍵盤 爪機就不貼圖了)

我不清楚具體發明時間誰先誰後。95年我是先接觸五筆的,一度還有打字培訓這一熱門出現。後來接觸的拼音輸入法。最後因為記不住字根和拆字方法,拼音用習慣了也很順溜啊~ 於是就這樣了。

相比起拼音輸入法來說 五筆有許多優勢,誤碼率低,平均碼數小,也就是輸入快,錯誤率低。缺點也是有的,就是學習成本高。拼音輸入法只要上過小學上手就無難度。五筆還要記字根和怎麼拆字。當然比起來 速記輸入法比五筆更快 也更難學。

現實的結果是 五筆輸入法最終沒有拼音輸入法普及。而且隨著聯想功能等輔助輸入的發展,拼音輸入法已經比智能ABC快不知道哪裡去了!

可能會有同學說 這是劣幣驅逐良幣啊!

其實不是,民用設備領域,始終方便易用才是第一位的。

這也提醒各位做產品的同學,產品功能只有在易用性符合目標用戶要求之下才能談功能。


首先呢,最先出現的輸入法是什麼我不知道,但是呢,同期拼音類的注音類的輸入法肯定是有的,但是重碼率高,輸入效率低。而且記得曾經還出現過專用鍵盤-。-

且80年代,電腦不是家電,那時候還叫微機(微型計算機),而不是(個人)電腦。直到90年代中期(94/95年左右,386,486以及剛出現的586),家有電腦都是很稀奇的。微機的作用主要是用來工作,而不是像現在這樣在網上扯淡聊天。本身來說,對微機的操作就是有門檻的,同時為了提高工作/輸入效率,專門研究高效的漢字輸入方式就很必要。在那個年代,甚至有專門的漢子輸入設備,四通打字機。黑白點陣液晶長條屏幕~在上面上翻下翻漢字真是瞎眼啊~~雖然人家確實也是可以拼音輸入的。

現代的拼音輸入法的普及,一來是對於上過小學的人來說,無門檻,且計算機性能和存儲能力的提高,使得拼音輸入越來越高效,從最初的模糊音,聯想輸入,到詞語輸入,整句輸入,專業詞庫,智能糾錯 等等功能的加入,現在的拼音輸入對於非專業領域也已經足夠高效了。


智能狂拼我現在就在用,系統是U盤WIN 7無硬碟


漢字輸入法最早的大概是電報碼。時至今日這種電報碼依舊在使用。那個時候拼音還沒出現。

好吧,補充一下。

單單以漢字輸入法而論,我們現在用的輸入法都基於信息交換用漢字編碼字符集基本集,始於1981年。該集用區位碼為當時字集中所有漢字註明了編碼。

83年王碼推出,也就是我們所說的五筆。但五筆之前,鄭碼已經著手對漢字進行通用編碼。

而智能ABC是1991年推出的,可能很多人覺著該輸入法很古老,但該輸入法雖對初級輸入法有革命性的優化,幾乎是劃時代的產品,但它真的不是剛開始的輸入法。

圖1

因為漢字輸入法在dos時代之前就已經開始。到了90年代,才出現萬碼奔騰時代,連王小波都自己寫過輸入法。

講道理,拼音1958就已經出現,但就算現在,不會拼音的人依然存在,遑論識字率極低,多數人不知道字母為何物的50年代?啊喔額這樣的聲母韻母直到80年代依然未被民眾普遍熟知。

為毛?教育發展階段的問題。彼時個人PC尚未普及,70年代文盲佔比依然居高不下,雖然掃盲左右成效功在千秋,但當時真沒幾個人能看懂ABC。

圖2, 70年代掃盲

而根據漢字結構來編寫的形碼輸入法,如鄭碼、五筆等更符合當時國人對漢字的理解。且當時打字員,特別是90年代的打字員更是專業型技術人員,當時很多地方印發文件或者出版圖書還得靠刻鋼板,按字模,壓油墨來完成。

圖3 80年代刻鋼板出文件

回到問題本身,漢字剛開始是拼音輸入法么?不是。最早是電報碼,軍用需求。其次是區位碼,資料庫需求。70年代有漢字見字識碼,為最早的形碼雛形,然後拼音和形碼呈現齊頭並進的趨勢。

當時打字員是一個蠻重要的職業,打字還是一項職業技能,打字的精準及速度是工作考核重點,自然沒有多少人選用拼音來打字。彼時全國農業人員培訓電腦技能,教的主要還是文檔處理相關的,輸入法則是音形碼中的自然碼,以及五筆等輸入法,拼音當時根本不夠用。

直到2000年後個人PC大量普及,打字成了日常技能,大眾市場對速度要求不高,對上手的難易程度很挑剔,形碼逐漸萎靡。

所以,字形類輸入法在當時的條件下,比拼音類輸入法更容易推廣。不僅是因為高效,準確度更快(可以試試DOS界面下的拼音那個查找難度帶來的低效),也因為拼音本身的普及程度(想想祖父輩父輩用手機打字時手寫、筆畫等方式相比拼音哪個應用更多更廣)造成的。

題外話,教育普及讓很多人免於文盲的悲哀,但純拼音錄入包括今日的搜狗百度QQ紫光加加等默認的拼音輸入法來說,拼音都是一款很低效的錄入工具,在80年代落後,在90年代被打字員唾棄,在00年代隨著個人PC普及而大量裝機,但還是改變不了拼音本身錄入效率上的低能。

很難考證到底除了電報碼區位碼外第一款真正意義上用之於民的漢字輸入法是什麼,時至今日對多數人來說也不必在意。但倘若您真的在意輸入效率,還是關注一下在小白時代中以劣逐良還能留存至今的那些多種多樣的輸入方式。


更正:查了一些中國知網上1980年左右的文章,可以確定在1983年初代五筆輸入法之前是存在拼音輸入法的。所以以下的原答案不準確。

有限的歷史資料表明,中國大陸第一個26鍵輸入法就是五筆(83版,不同於現在普及的86版)。這可能是受幾年前出現的台灣第一個輸入法倉頡的影響吧。台灣第一個輸入法是倉頡,是因為當時漢字計算機處理剛剛開始,朱邦復還想著用倉頡碼除輸入外還實現內碼排序功能。所以就必須用沒有重碼的形碼。

而且當時打字的概念和現在不一樣,一般是有人手寫好了之後再交給打字員去打,這種情況下,打字員是要不看屏幕盲打的。這個要求連現在的智能化拼音輸入法都做不到,只有五筆這種重碼率極低的可以做到。


輸入漢字是個挺複雜的問題,剛開始常見的輸入法是拼音、區位碼、四角號碼輸入法,但拼音的缺點有幾點:一是編碼較長,比如zhuang之類的拼音太長;二是重碼太多,因為有同音字的問題;三是當時大多數人拼音很差,很難拼對,即使是現在,分不起前後鼻音,平翹舌間的也大有人在;四是不認識的字沒法打。區位碼碼長短,4個數字一個漢字,但是記憶量太大,每個漢字你都得記編碼,而且規律還不好找。四角號碼是從字典里學過來的,類似五筆的形碼,把漢字分為四塊,用數字編碼實現,優點是不認識的字也會打,但這個一般人也不會,我這麼多年只見過一個同學會。四角和區位共同的缺點是只能用數字輸入,只能單手輸入,大好的字母鍵盤浪費了,輸入效率也不高。

為了解決漢字的輸入,當時可以說是」萬碼奔騰「,但分類不外乎三種:音碼,以拼音為主,會讀就會打;一種是形碼,會拆就會打;一種是音形碼,結合兩者的優點,減少了重碼,但也有兩者的缺點,不認識不會打,不會拆不會打(音形碼大多數是筆畫,其實好拆)。音碼的代表是雙拼,拼音不是編碼長嗎?那我用新的編碼方式代替拼音,比如dd代表duan,這樣碼長就減少了很多。重碼多那就輸入詞語吧。不過另外兩個缺點解決不了,拼音差、不認識沒法打。形碼的代表是五筆,五筆的設計在當時的形碼中算很優秀的,有幾個優點:一是字根相對較少(在當時算少的了),編碼短;二是有容錯碼,這個設計不錯,後來拼音也學會了這招;三是充分利用雙手,設計拼音時肯定沒有考慮電腦鍵盤,而五筆的設計將常用的字根都放在容易按的鍵位,而且利於雙手配合打字。四是有萬能碼,不會拆的可以用萬能碼代替。五是使用一二級簡碼,常用漢字用一到二個鍵就可以打出來。六是字詞同時輸入,見字打字,見詞打詞。這六點在當時算非常優秀的,而且當時的打字員都是專職的,單獨背一套編碼還是可以接受的,學形碼比學音碼有很大的優勢,當時都是照著紙上寫的打,看到字就能拆能打,而音碼就不行了,看到個福字該用fu還是hu,好多人分不清,因此五筆得到了極大的普及。當然五筆也有缺點:一是字根設計不科學,為了輸入效率有很多奇怪的拆字方式;二是二級簡碼有的設計不科學,比如fc是支,而不是去,後者用的更多;三是有的字沒法拆,比如凹凸我現在也不會拆。不過瑕不掩瑜,當時還是很成功的,以至於他的發明者王永明後來自己重新設計字根後(98版五筆),仍然競爭不過原版86版五筆。

而拼音也有不少進步:

1、聯想的倪光南發明了聯想輸入方式,打個新,就會出現聞、年之類的字,在當時算很優秀的了,不過後來由於影響連續輸入,很少人用了,只有手機上用得不少。

2、想修改編碼是很難了,因為用拼音的都不想學新編碼方式 ,想學新編碼的人當時都學了五筆,因此雙拼不怎麼成功。但有人發明了簡寫,用首字母,比如nh代表你好。

3、以詞語輸入為主,代表作品前期是智能ABC,後期是紫光。智能ABC可以智能組詞,也可以用首字母,還可以調整詞序,但是做得都不好。智能組詞和調整順序都是三次以上都會記住,大家都知道拼音重碼太多,好不容易組一個詞(比如人名、股票名),下次還得組,再下次還得組一次才行,太累,而且原始詞庫設計不好,很多常見的詞沒有,而且順序也不好,比如shanxi,第一個是山系,我覺得第一個是山西還是陝西都比山系科學。紫光拼音這一點就很好,一是常見詞基本都有,而且它的詞並不一定是字典上的詞,比如woshi輸出我是,我是並不是詞語,但非常常用;二是默認順序基本沒錯,而且一次選擇就能調序;三是有一些很貼心的小功能,比如以詞定字;四是支持模糊音。但紫光的缺點是經常崩潰。

4、以整句輸入為主,代表作品微軟輸入法,寫長篇論文比較合適。缺點一是不適合網路聊天,二是寫一長串後發現中間輸錯了很難改。

當時紫光已經算最優秀的拼音輸入法了,但是一來經常崩潰,技術力量不夠;二來宣傳不足,因為那家公司是做電子政務的,不是互聯網公司,在這方面宣傳不夠。因此用的人不多。

這個時候,出來一個馬占凱,小馬發現現在的拼音輸入法都不好用,為啥呢?一、新詞太少,大多詞庫還是翻字典得到的。二、打人名難。三、打不認識的字難。他發現所有的輸入法都不如百度,是不如百度,不是不如百度輸入法,因為當時還沒百度輸入法。為啥呢?你在百度里輸入liyuchun,就會出來李宇春,在智能ABC里會出來利於春,在紫光里會出來里愚蠢。他就想,為啥不能把搜索的這個優點用在輸入法上呢?不過想歸想,他是學機械的,沒能力編程,於是給百度提建議,百度不搭理他,又給搜狗提建議,王小川一看不錯,於是就把他招到搜狗當產品經理,搜狗輸入法就這樣誕生了。

和紫光比起來,搜狗有幾大優點:一、詞庫及時更新,因此流行的詞都能一次打出來,極大地提高了輸入效率。二是穩定,搜狗拼音很少崩潰,王小川派人在很多bbs上盯著,有bug就及時修改,穩定性還是相當不錯的。三是宣傳到位,因為搜狗一直沒有啥突破產品,所以把拼音作為宣傳重點。搜狗拼音出現之後,拼音相對五筆的優勢變成壓倒性了。當然這和歷史背景有關,電腦越來越普及,上網的越來越多,大家普通話越來越好,會拼音的越來越多,打字從原來的謀生技能變為生活必備技能。

搜狗拼音大紅之後才有的谷歌抄襲搜狗,qq拼音,百度拼音之流,這就是後話了。


那時候個人電腦還是貴重設備,進機房要換鞋。操作也是專人操作而非人人都能上機。漢字輸入法首先是面對專業輸入人員,對輸入速度要求高,重碼率低。

順便說一句。我見過最早最好的拼音輸入法是自然碼了。當時天匯+自然碼+CCED 是神一樣的存在。


我以前一直是智能ABC

後來學了五筆,但不是很熟。打過一段時間的五筆。 再後來覺得反正以後五筆會是一個被淘汰的東西,現在的智能拼音輸入法太智能了。於是放棄五筆了!


其實,最早的漢語輸入法究竟是什麼這是一個問題。。

我搜了一下,能查到的最早的是台灣的倉頡輸入法,1976年就創製了,比大陸的五筆要早。有更早的請告知。

至於台灣人為什麼沒有用拼音,可能是重碼率高、拼音不普及、國語說不標準等等各種各樣的原因,台灣當時即使用拼音,拼音方案也有好幾種,不那麼好統一。


推薦閱讀:

如果中文排版有半形漢字或?角漢字,會帶來哪些好處?
目前網上使用的中文破折號普遍存在「中間斷開」的問題,應該如何解決?
訊飛輸入法,華為輸入法,搜狗輸入法,安卓輸入法各有什麼優缺點?
哪個手機輸入法好用?
有類似小狼毫的簡體輸入法嗎?

TAG:輸入法 | 編程 | 計算機 | 冷知識 |