世界上都有什麼語言?
<Part1> 總的來說,語言學能夠指出兩種語言有多麼相似,但是認定是否同種語言的問題,更多地是依賴於國家、民族、政治、歷史等多種因素。比如克羅埃西亞語(Croatian)和塞爾維亞語(Serbian)其實完全是一種語言(統稱塞爾維亞-克羅埃西亞語,Serbo-Croatian),只是前者採用了羅馬字母,而後者採用的是西里爾字母(Cyrillic,就是俄語所用的字母),這與兩個民族的歷史文化有關。與此類似,捷克語和斯洛伐克語之間可以毫不費力地聽懂對方,就象兩種方言一樣,但是人們傳統上還是把它們看作兩種不同的語言。 一種語言可以由兩種書寫符號(字母)表示,同樣地兩種語言也可以共用一套書寫符號。如藏語,就是由於公元七世紀一個西藏喇嘛到克什米爾進修後引入了梵語字母(Sanskrit,即印地語的前身)這使它們看上去有些相似,然而這兩種語言之間毫無聯繫:藏語屬於漢藏語系而印地語屬於印歐語系。 我們熟悉的漢語、日語和朝鮮語,由於後兩者在中世紀時大量借用了漢字,人們一直懷疑它們之間有某種聯繫,然而至今為止尚未發現任何令人信服的證據證明它們之間有聯繫,實際上日語和朝鮮語與當今世界上任何已知的語言,無論是「活著的」還是「死了的」語言,都沒有發現任何肯定的聯繫。 <Part2> 在研究了世界上一些主要語言以後,語言學家也象生物學家那樣,把世界上的語言按相似程度分為語系、語族、語支和語種。世界上主要的大語系有: 語系 代表語種 佔世界總人口比例(約) 印-歐 英語、法語、俄語、印地語、波斯語 48% 漢-藏 漢語、藏語、泰語、緬甸語 24% 尼日-剛果 斯瓦希里語 6% 亞-非 阿拉伯語、希伯來語 5% 馬來亞-玻利尼西亞 印度尼西亞語、馬來西亞語 5% 德拉維達 泰米爾語 3% 阿爾泰 土爾其語、蒙古語、哈薩克語 2%
除了上面這些「可以歸類的」語言以外,還有幾種所謂的「獨立語言」: 日語(2%),朝鮮語(1%)和越南語(1%)。這些獨立語言與所有現存的語言沒有明顯的聯繫,這當然也和它們研究得不夠有一定關係。比如日語與朝鮮語可能有一些關係。具有諷刺意味的是,儘管它們都不同程度地採用了漢字作為書寫語言的一部分,它們與漢語都沒有聯繫。 當然談到「世界的語言」,還應當包括幾種「人造語言」,如世界語——Esperanto。儘管還沒有人以它們作母語。 印歐語系是世界上最大的語系,覆蓋了幾乎所有的歐洲、美洲,和亞洲、澳洲的很大一部分。它包括兩種偉大的古典語言:古希臘語和拉丁語;包括象英語德語,菏蘭語(在比利時也叫佛蘭芒語,Flemish)和瑞典語一類的日耳曼語族;包括象法語,義大利語和西班牙語一類的羅曼語族;包括象俄語,波蘭語,捷克語和塞爾維亞-克羅埃西亞語一類的斯拉夫語族;包括象威爾士語和蓋爾語(Gaelic,在蘇格蘭和愛爾蘭)這樣的塞爾特(Celtic)語族;包括巴爾的(Baltic)諸語言;包括伊朗的國語波斯語;包括諸如印地語、孟加拉語一類的印地語言;等等。 接下來我們可能會問:原始的印歐人生活在什麼年代?是從何處「發跡」的? 現在找不到原始印歐人留下的任何「書面材料」,因為人類使用語言的歷史遠比使用文字的歷史久遠。所以,最好的辦法就是分析他們的語言。我們可以假定如果一個詞在大多數印歐語言中都很相似,那就是一個他們已有的概念;反之就可以認為那是一個後來才知道的概念:這就是語言學重現「化石語言」所用的方法。 通過重建古代印歐人的語言,我們大約可以了解到:原始的印歐人生活在寒冷的北方森林中一個不靠近水的地方,他們飼養的家畜有馬,牛,羊和狗,他們知道的野生動物有狼和熊,他們知道的金屬可能只有銅。許多人認為馬和戰車使他們在征戰中能取得很大優勢從而擴展到後來的遼闊地域。(玩過civilization的朋友們知道horse和chariot在古代戰爭中的作用:-) 一般認為原始印歐文明起自於公元前三千年,也就是五千年以前的東歐某地,大約在公元前二千五百年它分裂了,人們離開故鄉分好幾路向四面八方遷移。其中一路到了希臘,另一路到了義大利(這兩路分別是古希臘和古羅馬文化的起源)。另一路穿過中歐一直到達不列顛諸島(他們是蘇格蘭人,愛爾蘭人和威爾士人的祖先)。還有一路北上到了俄國,同時又有一路跨過伊朗,阿富汗最終到了印度。他們每到一處,就征服或同化當地的土著,把自己的語言傳播到那裡。應該說他們是一個出色的民族。 <Part3> 許多語言可能是從一個祖先那兒演變出來的,這想法最早是在1786年提出來的,儘管早在十六世紀有人就注意到了梵語和義大利語之間的相似性。到了1818年,有五十多種語言歸到了印歐語系中,然後在1854年,人們把獨特的阿爾巴尼亞語也歸了進來,1875年又加上了亞美尼亞語。如今在歐洲,只有芬蘭語、匈牙利語、土耳其語、巴斯克語(在西班牙和法國交界處) 和前蘇聯境內的幾種語言不屬於印歐語系。 在亞洲,印歐語言出現在伊朗、阿富汗、巴基斯坦、印度和孟加拉等國家。值得注意的是,雖然在印度,印地語(Hindi)是最大的語言,但是操非印地語的當地原住民勢力也很強大。印度有一百五十多種語言,但講任何一種語言的人都不超過百分之三十。所以它在1947年獨立時不得不同時採用印地語和英語作為官方語言——一半以上的印度人根本就不懂印地語嘛。在大約公元前一千年印歐人入侵以前,當地原住民所操的德拉維達語系(如泰米爾語) 和蒙達語系,如今在印度中、南部人口中仍占很大的比例。在巴基斯坦和孟加拉國大部分人講印歐語言。他們都能在一定程度上聽懂印地語,但互相之間卻很難聽懂。一個學法律的孟加拉朋友告訴我,他認為二十年前巴、孟分裂成兩國,除了地理上的隔閡外,語言上的隔閡也是一個重要因素。 印歐語言之間究竟有多象?印歐語言與非印歐語言的差別有多大?看看幾個「基本辭彙」之間的比較: 英語month mother new nose three 威爾士語mis mam newydd nos tri 德語Monat Mutter neu Nase drei 瑞典語ma^nad moder ny na"sa tre 法語mois me`re nouveau nez trois 西班牙語mes madre nuevo nariz tres 義大利語mese madre nuovo notte tre 俄語mesyats mat" novy nos tri 希臘語men meter neos rhis treis_ _ 波斯語mah madar nau bini se_ _ 梵語mas matar nava nas trayas 芬蘭語kuukausi a"iti uusi nena" kolme 匈牙利語ho"nap anya u"j orr ha"rom 土耳其語ay anne yeni burun u"c, (記得去年網上有不少人與鍾先生爭論說世界語(Esperanto)不是世界語而僅僅是歐洲語言的代表,我們也可以看看它與印歐語言的聯繫究竟有多強。:-)) <Part4> 英語,作為當今世界事實上的國際社交語言,它取得的成功是史無前例的。從使用它的人口來說,以英語為母語的人數僅次於漢語而居世界第二位,大約有四億多人。然而以英語作為第二語言、或者在一定程度上使用英語的人數,要遠比這多得多,可以說分布在世界的各個角落、各個民族,在這一點上漢語是望塵莫及的。它是怎樣發展起來的? 英倫三島的第一批印歐居民是塞爾特人。原先島上可能還有更早的居民,但是人煙稀少,所以沒有留下多少遺迹。前文提到,塞爾特人是古印歐人的一支,大約在四千五百年前離開他們在東歐的故鄉向西遷移,在公元前一千年時(相當於我國商朝末年、西周初年),他們成了德國南部、阿爾卑斯山北麓的一個強大民族。在公元前五百年左右(相當於我國春秋時期),他們開始向西遷移,後來到了英倫諸島。這就是印歐人的第一次「入侵」。 印歐人的第二次入侵是在公元五世紀中葉,當時生活在現在的德國和丹麥交界處有兩個部落,一個是石勒蘇益格(Schleswig)的盎格魯(Angles),另一個是霍爾施坦因(Holstein)的薩克森(Saxon)。石勒蘇益格/霍爾施坦因現在是德國最北面的兩個州,是第一次世界大戰時德國從丹麥那裡「取得」的。這兩個部落從那裡跨過北海,佔據了英格蘭,原來的塞爾特人很快地後退到威爾士、愛爾蘭和蘇格蘭高地。English一詞就出自Angles,原意為「角落」,意即他們來自歐洲大陸的一角。在古英語中Angle寫作Engle,他們的語言叫做Englisc(在古英語中「sc」讀如「sh」,如「sceap」—— 「sheep」)。順便說一句,「塞爾特」(Celt)中的c可以讀如s或k,所以也叫「凱爾特」,美國人中有許多來自蘇格蘭和愛爾蘭,所謂的「美國腔」可能是凱爾特口音。波士頓不是有個著名的球隊叫「凱爾特人隊」嘛。 古英語一直發展到公元1066年法國的諾曼人入侵。在此以前,由於受北歐人和羅馬人的影響,許多斯堪地那維亞辭彙和拉丁辭彙溶了進來。前者如egg,cake,skin,leg,window,husband,sky,fellow,skill,anger,flat,ugly,odd,get,give,take,raise,call,die,they,their,them;後者如street,kitchen,kettle,cup,cheese,wine。塞爾特語的遺迹大多留在地名中,如Thames,Kent,Dover。 諾曼人的入侵為英語帶來了大量的法語辭彙,這使得現代英語中存現大量的同義/近義詞:shut/close,answer/reply,smell/odor,yearly/annual,ask/demand,room/chamber,wish/desire,might/power(英語詞/法語詞)。有一個有趣的現象是產肉的動物多是英語詞,如ox,cow,calf,sheep,swine,deer,而它們的肉則是法語詞,如beef,veal,mutton,pork,bacon,venison。大概持法語的多為貴族統治者,只注意他們餐桌上的肉,並不在意牲畜們叫什麼。 另外在已有的英語/斯堪地那維亞語同義詞基礎上,如英語的wrath和斯堪地那維亞語的anger之外,法語又加了個ire。連我們漢語也貢獻了幾個詞:kowtow(叩頭),typhoon(颱風),sampan(舢板),kaolin(高嶺土),tea(閩方言),shanghai(不是地名:-))。 這些外來語使英語成為一個表達力豐富的語言。儘管溶入了如此眾多的「外來語」,古英語仍然構成了它的核心——不到五千的古英語單詞一直保持到了今天。在此期間英語逐漸向高層發展,1399年繼承王位的亨利四世是第一個以英語為母語的英國國王。在十四世紀快要結束的時候,喬叟(Chaucer)完成了『坎特伯雷的傳說』(Canterbury Tales),以倫敦方言為代表的現代英語終於開始出現:一個來自當年「角落」的語言。 <Part5> 在結束討論印歐語言時,再順便舉個例子說明語言學研究對於其它學科的幫助,如史學和民族學。歐洲有個民族叫吉卜賽,他們是什麼人?從哪兒來?這問題長期沒有答案,好象他們自己也說不清楚,因為直到不久前他們中的大多數還是文盲,沒有文字記載的歷史。以前有人根據英語「吉卜賽」(Gypsy) 一詞認為他們來自埃及(Egypt)。後來通過對他們語言的仔細研究發現他們來自印度——從他們的語言(叫做Romany)與梵語及後來的印地語的共同特徵中得不出任何別的結論。吉卜賽人從公元(後)一千年左右開始向西遷移,途經的波斯、亞美尼亞和希臘都在他們的語言中留下了不同時期的痕迹。現在聽到一些老美愛說「pal」,這詞就來自吉卜賽語phral,意為「兄弟」。 好,終於輪到漢-藏語系的故事了。漢藏語系裡有一個「大傢伙」,不用猜就知道。它占漢藏語系總人口的85%以上。不過,對於非印歐語言的語言學研究都不如印歐語系那樣深入,它的起源、發展、演變等都有許多問題有待解決。 有一個笑話說,從前有個人認字只看個大概,一次有個不識字的問他路邊一家鋪子叫什麼字型大小,那店鋪上書:「天義齋」(用大五碼看「天義齋」)。他看了一眼說: 「叫『大蓋齊』」。咱現在也只能來他個「大概齊」了……。 漢藏語系分四個語族:漢語自成一家;藏-緬語族,包括藏語和緬甸語這兩大語種,以及彝、僳僳、納西、拉祜、景頗、京等上百個小語種;泰-老語族,包括泰語和寮國語這兩個國語,以及壯、布依、侗等幾個小語種(壯語不應算小語種!有一千多萬人講壯語,比一些小的語系還大,他們不是還有自己的自治區嘛);還有一個苗-瑤語族,由苗語和瑤語組成。另外,不少人認為越南語與漢語有遠親關係,事實上越南語有一半的詞來源於漢語,但是它們的關係仍有待進一步研究。 講漢藏語言的人除了在中國以外,還分布在緬甸、印度、尼泊爾、泰國、寮國等國,以及在東南亞和世界各地的華人中。總之,持漢藏語言的各民族中,漢族生活在最北面。 <Part6> 漢語是論人口世界上最大的語言,有十多億人以漢語為母語:這包括在台灣的二千萬、馬來西亞的五百萬、泰國的五百萬、香港的五百萬、新加坡的二百萬、印度尼西亞的一百萬、越南的一百萬等。漢語是聯合國1945年成立時的五種工作語言之一(1974年又加上了阿拉伯語)。 漢語有七種主要的方言:北方方言約佔總人口的四分之三,所覆蓋的地域包括中國的東北、華北、西北、山東、河南、湖北和安徽、江蘇的長江以北部分、四川、雲南和貴州的漢族人聚居區,在另外還有一些北方方言的「孤島」在福建、廣西和海南;吳方言,通行於江蘇的長江以南部分、浙江和上海市,人口有七千萬,是第二大方言;粵方言,主要流行於廣東、廣西和海外華人中間,約有六千萬人;閩方言,通行於福建、台灣和東南亞諸國,約有六千萬人,其中情形十分複雜,到了互不通行的程度,可能是漢人在秦漢時代南侵時與當地的語言交互的結果;湘方言通行於湖南;贛方言通行於江西,這兩種方言的特徵不太突出,受周圍方言的影響較大;還有客家話,主要分布於廣東、廣西、福建和台灣。這些「方言」之間差別常常是很大——比如北京人聽廣州人講話,決不比英國人聽法國人講話輕鬆,台灣人去聽陝西話,也會聽得一頭霧水。是什麼理由語言學仍把這些方言統統歸為一種語言?除了長期以來的統一民族、統一文化和統一國家這些因素以外,還有一個重要的原因是文字——漢字。 從商朝的甲古文開始,漢字有三千多年的連續歷史,三千多年來漢字的字形、字義的變化都是連續的。與大多數其它語言不同的是,漢字的發展經歷了一條象形—表意—形聲的途徑。這條道路產生了兩個主要效應:第一,隨著文明的不斷發展,語言所要表達的概念不斷增加,使得漢字擁有了一個數量龐大的字符集(雖然現代漢語已經不用增加字元來表達新的概念,而是創造新詞,這在一定程度上減少了使用的字數)。漢字的龐大的字符集使它顯得非常複雜:難學、難記、難用;第二,歷史上的漢字作為表意文字(ideograph),文字與語音沒有直接關係,無論用哪種語言或方言去讀,意義沒有變化。這是幾千年來各種口語分化交熔變遷,而漢字一直作為一種統一的文字被所有人認同的原因。這一優勢甚至體現在當它被別的語言借用的時候:哪怕不懂日語的人也能讀懂一半意思吧。漢字使操不同口語的人互相交流成為可能,而隔膜是統一的主要障礙。 後來,隨著漢字的演變,漢字已不再是純粹的表意文字,許慎『說文解字』中的9353字裡面,「形聲字」佔了80%以上,「會意字」不到20%,而甲骨文中形聲字僅佔20%多。特別是近年來多音詞的比例急劇上升,漢字已向表音文字方向發展。(關於「形聲字」、「會意字」,後面還要提到。) 現代漢語的文字仍有幾萬字之多,但是使用頻率極不平衡。據北京語言學院1985年的統計結果,最常出現的前十個字及其出現頻率為: 的 4.16% (你每說二十五個字就要說一個!) 一 1.84% 了 1.71% 是 1.52% 不 1.37% 我 1.28% 在 1.08% 有 0.98% 人 0.97% 這 0.93% 累計 15.85% 前100字的累計字頻已達47.34%,500字到了79.76%,2000字覆蓋了98.07%,如果你認識4000字(就象我一樣),你讀一萬個字只有四個不認得(當然讀我寫的東西再多你也不會有不認得的字,因為我認的字和你一樣多)。 語言學院還統計了詞:共計出31159個不同的詞,其中單音節詞(一個字的)佔12.2%,雙音節詞73.6%,三音節詞7.6%,四音節詞6.4%五以上的佔0.2%,平均詞長2.09。前100詞的累計頻率為41.7%,2000詞為82.2%,9000詞為95.85%。不同漢字的構詞能力(與別的字組成新詞的能力)也不一樣,最多的是「子」字,構詞668個。 <Part7> 漢字是怎樣起源、怎樣演變的?據漢代緯書『春秋元命苞』:「倉頡生而能書,及受河圖錄字,於是窮天地之變,仰視奎星圜曲之勢,俯察魚文鳥語,山川指掌,而創文字。」文字雖美,實無所據。傳說倉頡為黃帝的史官,而黃帝的生存年代及其事迹都屬傳說史的範圍,具體內容多不可究,「倉頡造字」實在太玄了。又『易經』云:「上古結繩而治,後世聖卜易之以書契。」,意思是說從前的人結繩記事,後來有「聖人」把這改造成了文字。繩結與文字差距甚大,不以為然也。 後世的漢文字學家一般持兩種看法:起源於原始氏族社會晚期的陶器符號,或起源於原始圖畫。得到考古支持的商代甲骨文最早出現在三千三百年前,這比古埃及的文字及兩河流域的蘇美爾文字都要晚近二千年,漢字學家因而不服,他們認為最早的甲骨文被發現時已有了一定程度的會意和形聲成分,所以文字的出現應當比那時早得多(范文瀾:『中國通史』,人民出版社1954),因而推斷說例如山東龍山文化中的陶器符號可能是原始的文字(龍山文化據今四至五千年)。這些目前仍缺少考古證據和足夠的研究。順便提一句,至今共發現了五千個以上的甲骨文單字,其中可以認識的約有一千七百字。 總之不管從哪兒來、來了多久,從「帝盤庚遷殷」(約在公元前1312年)時開始,漢字開始了它的長達三千多年的連續發展史,中華文明史也開始了連續至今的文字記載。可以想像,一開始的象形文字(hieroglyphs)工作得不錯。可是隨著漢語的不斷豐富,有些語言不能用形象表達了,怎麼辦? 古埃及人和蘇美爾人開始創造一些僅代表發音的符號來記錄這些語言;瑪雅人(美洲印第安人)開始借用那些畫得出來的同音字來表達它們(例如,借用畫得出來的「eye」來表示畫不出來的「I」,漢語中叫「通假字」);而中國人則想出了一種叫做「形聲字」的「中庸之道」:用兩部分拼成一個字,一半表示發音一半表示意思(屬性),象「中-盅-忠-鍾-種-腫,羊-洋-癢-樣」之類。這真是一個好辦法:既能表達大量的新概念又與舊的文字體系「兼容」,於是大喜,到秦篆時形聲字大增,漢字總數已數萬,每當出現一種新概念我就發明一個新字來對付你,一字一意,文章簡短,節約用紙。漢字的表達能力大大增加,形成了一個完備的文字體系。春秋戰國時期的文化大發展與此不無關係。 原來我們從小學習表意文字,覺得從象形文字演變到現在的漢字非常自然,覺得從象形文字演變到拼音文字很不可思議:現在看來後者比前者好象更自然一點。拼音文字的演變想在討論中、近東語言的時候再提。 作為語言發展歷史的一部分,會意字、表音字和通假字也不同程度地存在於漢語中。會意字如「日+月=明,女+子=好」,這類字是在原始象形文字基礎上意義的擴展,但是因為表達能力仍受限制,所以它們占的比例也不太大。通假字在古漢語中出現得比現代漢語多得多(如「說-悅」),說明當時人們也想從這方面想辦法,後來認識到這不現實。試想,如果所有的抽象概念都用同音異字表示,那文章讀起來大概是太累了,而且多半讀不懂。事實上沒有一種文字能純粹用這辦法解決問題,最多是部分地採用這技術,多了就不靈了。漢字也有少量的表音字,如「阿」,沒有任何意義,只表示一個音節。自春秋時期開始形聲字得到了極大的發展,具有了很強的表達能力,這可能反而抑制了向表音文字的進一步發展——表音文字在漢語中至今仍處於初級階段。 <Part8> 在結束漢-藏語言的討論前,再看一眼我們的鄰居們。在中國境內的語言是多種多樣的,北方的語言多屬阿爾泰語系,有屬阿爾泰語系突厥語族的維吾爾語、哈薩克語、烏孜別克語、柯爾克孜語、塔塔爾語(韃靼語)、撒拉語(青海境內的撒拉族);阿爾泰語系通古斯語族的滿語、錫伯語、鄂溫克語和鄂倫春語;阿爾泰語系蒙古語族的蒙古語、達斡爾語、東鄉語和土語(青海土族的語言);還有印歐語系的俄語和伊朗語族的塔吉克語等等。南方的語言多屬漢藏語系,除了上文提到的漢-藏語系諸語言外,尚有屬南亞語系孟-高棉語族的佤語和德昂語、布朗語,以及屬南亞語系印度尼西亞語族的高山語(台灣高山族)。 中國境內文字的種類同樣多種多樣。除了使用(或部分使用)漢字的語言以外,還有許多使用羅馬拼音文字,如壯文。這其中又有不少是原本沒有文字的,「新中國成立後,當地人民政府依照本民族人民的意願,為他們創造了以拼音字母為基礎的文字。」還有使用梵語字母的如藏文,使用阿拉伯語字母的如維吾爾文,使用「十三世紀維吾爾文」的蒙文、滿文、錫伯文(維吾爾人後來丟了自己的文字用了阿拉伯文,嗚乎),有些民族使用自己的表意文字,如彝文。還有用象形文字的納西文(可能現在已經不用了)。至今沒有自己文字的民族都借用了就近的大語種文字。 朝鮮族用的朝鮮文是維一東方自己發明的「純粹」拼音字母。說它是「純粹」,因為它有表達母音和輔音的完整音素集合。音素(phone)是人能分辨的最小語音單位。與此相對的是日語的假名,雖然也是拼音文字,但是每個假名表達的是整個音節(syllable)而不是音素。朝鮮語在語法結構上最象日語,但是它們的辭彙並不相似,所以它們的關係仍有待於進一步研究。另一方面,朝鮮語又從漢語借走好多辭彙,但在語法結構上又非常不一樣。有人認為朝鮮最早的居民是一萬年以前從北方移入的通古斯人一部。朝鮮文字母發明於十五世紀中葉(相當我國明朝前期),共有二十五個字母——字母在哪兒? 你要是仔細看就可以看出,雖然它們看上去象一個個的「方塊字」,但每個「方塊字」其實是由一些更小的「小零件」組成,這每個「小零件」就是一個字母,它們的種類是有限的,對嗎?他們的字母不象其它拼音文字那樣排成一條線,而是上下左右錯落有致地拼在一個方塊內,非常別緻。象「眼淚」這個詞,它們讀作nunmul(nun意為「眼睛」,mul意為「水」),寫成從左到右兩個「方塊字」: nmuunl 在亞洲的東南部,不是還有菲律賓、馬來西亞、印度尼西亞等國嗎,他們的語言是什麼樣子的? 他們的語言屬於馬來亞-玻利尼西亞語系,又有人把這語系與孟-高棉語系(主要是柬埔寨的高棉語)和印度南部的蒙達語系合稱「南亞語系」。這一系語言橫跨了半個地球:東起夏威夷諸島,西達非洲東南的大島「馬達加斯加」(Madagascar),包括了幾乎所有的印度洋和太平洋島嶼(包括密克羅尼西亞、美拉尼西亞和玻利尼西亞諸島,但不包括巴布亞紐幾內亞和澳洲)。 它包括四種國語:馬來西亞語、印度尼西亞語、他加祿語(菲律賓語)和馬拉加斯語(馬達加斯加),總人數有二億多。關於他們的祖先,有人類學家認為是生活在中國大陸東南沿海地區,在公元前二千紀至一千紀之間漢族人開始南侵的同時,他們的航海技術也發展到了一定的水平,開始向海外移居(不知是不是受到了漢族的壓力),台灣高山人可能就是他們的後裔。在其後的二千年間,他們遍布了如此眾多的海島,佔據了如此遼闊的海域,這應當算一大奇蹟——儘管他們自己可能倒沒意識到。有人說,是航海、貿易與殖民造就了今日的資本主義,那他們的航海要比西方的「厲害」得多,也早得多,為什麼一點兒也沒有「發達」的意思? <Part9> 澳大利亞和巴布亞紐幾內亞的語言和上面講到的馬來亞-玻利尼西亞語言又有很大不同。 所謂澳大利亞語言,當然是指生活在那兒的土著居民,白種人們自然是講英語。 今天在澳大利亞的土著人只剩下數萬人,可是他們仍在講數百種語言!對這些語言的研究進行得很不充分,連它們是否屬於一個單一的語系也沒搞清楚。由於澳大利亞自人類出現時就已經成為一塊獨立的陸地,所以,所謂的「當地土著」,肯定也是什麼時候從其它地方遷來的。澳大利亞本地的哺乳動物都是非常原始的有袋類,離進化到人類還差十萬八千里。現代許多人類學家認為當地人是新石器時代某個時候從馬來亞——印度尼西亞渡海而來,可這還沒有找到足夠的語言學方面的證據支持(其它方面可能有證據,我不清楚)。今天,許多當地的語言都面臨絕滅,可憐它們作為歷史的遺迹只在英語中留下了象kangaroo,koala等少數幾個辭彙。 在巴布亞紐幾內亞的情況與此相似:三百多萬人說著五、六百種語言,從這不難想到,有些語言肯定只有很少的人使用,有的可能只有一個村子,甚至一個家庭。鄰村的人可能互相都聽不懂,許多人尚生活在石器時代。所有這些給獨立後的政府提出了很大的難題:不可能找到一種(甚至幾種)當地語言作為官方語言來發號施令。所幸的是,在幾百年的殖民統治以後,當地土著居民發明了一種叫「洋涇浜英語」的交流工具,它取得了官方語言的地位。 「洋涇浜」是俗稱,正式的稱呼是皮欽英語(Pidgin English)。「洋涇浜」一詞來自上海原來的一條河,就是現在的延安路。當時在上海英租界也有自己的「洋涇浜英語」,「假洋鬼子」們常常使用。 |
推薦閱讀: