漢語中字與詞的關係?
從語言學的角度來說
最近剛好看到這一方面的一篇文章,在這裡分享一下。
在具體回答這個問題之前,我們必須弄清楚幾個概念,第一,什麼是語素;第二,什麼是詞;第三,什麼是字。首先,讓我們了解下什麼是語素、詞。這套話語系統進入漢語系統,就出現了問題了,主要是漢語中沒有完美對應於印歐語言學中的「word」的東西。英語中詞是現成的,可以有效地區分開來,例如「production」,「reduce」。但是漢語中,類似於英語的「word」這樣的形式並不是現成的,而「字」反而是現成的。「詞」有時候可以是字,有時候又不是字,是字的組合。
那麼「字」是什麼呢?漢字是一套書寫符號,但這套符號有個比較特殊的地方,「字」不僅是一個音節單位,同時也可以是承載意義的單位,即語素。這是漢語比較有特色地方,即漢語的語素大都是由單音節(字)表示,即所謂的「一音一義」。
而當這些單音節語素,能夠獨立應用的話,就是詞。這個在漢語中非常明顯,尤其是一些基本辭彙中,如「大」、「小」、「手」、「花」、「走」等。而有些單音節語素,不能夠獨立使用,就不是詞,只能夠是語素。現代漢語中也有很多,例如:「第-;老-;- 們」等。但是情況並沒有這麼簡單,漢語中又有很多的例外。
1)大於一個音節的語素。 這一類比較多的例子是雙聲連綿詞,例如逍遙、蟑螂等。 還有一些音譯詞,例如「亞歷山大」等。 單獨一個字拉出來沒有任何意義,或者意義已經改變。2)小於一個音節的語素。 這個例子有,北方方言中的兒化,它僅僅是一個區別特徵「捲舌」,例如花兒(一個詞,雖然是兩個字,但其實只有一個語音形式,兒字並沒有獨立的語音形式);以及吳語一些地方只用鼻音韻尾-n/-ng表示小稱。這些都使得字和詞的關係變得非常複雜。「字」其實就是指「漢字」,字是中文最小的文字單位,國外漢字學的文獻,通常將其譯作「character」。所以每一個漢字,都能算作一個字。還有,根據維基百科對詞(word)的解釋:詞是能獨立運用並含有語義內容或語用內容(即具有表面含義或實際含義)的最小單位。
可是「詞」的概念,根據不同學術觀點,還有不同的定義。以下引用在《The Morphology of Chinese: A Linguistic and Cognitive Approach》提過的概念,盡量簡單地說:
正書詞(orthographic word)正書詞,是根據文字的書寫常規而定義的,書寫常規則通常以正寫規作定義[a.1]。音位文字(或稱「字母文字」)一般有空格分隔,所以全音位文字的用者,可從分詞來直觀地看出各詞之間的分段。但正寫規則對斷詞法進行規範時候,還是總得根據一些語言特徵來制定的,也就是說還是要用另一個「詞」的定義。中文方面,最小的文字單位是「字」不是詞。因此,如果用正書詞這個概念來理解漢語的辭彙,每個字都會被看作一個詞,也就是「字」就等於「詞」。社會詞(sociological word)社會詞,這概念最初由趙元任提出,是指社會意識上約定俗成的「大於音位而小於句子的語言單位」[2]。比如,英語的社會詞和它的正書詞,大抵相同。在英語,社會詞的正書詞唯一較難分清的情形,通常是由連接號造成的。所以一些有連接號的詞,在英語中應該看作一個詞還是兩個詞,還是有爭議。中文的話,社會詞指的就是「字」和有聲語言的「詞素」。語匯詞(lexical word)
「Lexical word」或稱「listeme」,兩者在中文可統一譯作「語彙詞」或「辭彙詞」,但也有學者建議將 listeme 譯作「錄位」。語彙詞,是獨立組合成的音義結合體[3];其音、義,並不符合一般通則。所以,語彙詞是要單獨記憶的。可是,按這個定義的話,所有英語熟語都可以是語彙詞,唯有不符合這些定義的才不算作語彙詞。因此,傑羅姆·帕卡徳(Jerome Packard)等語言學家也認為,語彙詞不便於用來理解中文的詞。語義詞(semantic word)語義詞,可理解作一個「整體概念」:能夠整體表達出一個或更多概念、形象的語義,可算作「語義詞」。另外一些學者,認為語義詞就是形式語義學中的「基本語句」。基本語句,能構成更複雜的表達式,而且其語義已不能再細分,即表達整體概念的最小單位。但是,語義詞忽略了語音等因素,所以語義詞定義出來的東西不是「詞」,反而是更接近「詞素」的概念。韻律詞(prosodic word)「Prosodic word」(韻律詞)〖推薦〗或稱「phonological word」(語音詞),不過不少學者也提倡將兩者區別。為免太過複雜,本回答不會刻意區分它們。首先,所謂韻律詞可分兩類:基本韻律詞、複合韻律詞。簡單地,韻律詞就是有意義的語段,裡面是沒有停頓的,是一個「連續發音的單位」。但是,各韻律詞之間,都會有小停頓[4]。請參考《使用韻律階層及大量辭彙的中文文轉音系統》圖三:- 「我今天要到台北去玩」是句子(S);
- 「我今天」和「要到台北去玩」是韻律片語(PP);
- 「我今天」「要到」「台北去玩」是韻律詞(PW);
- 最後分成的有意義的單位就是詞:「我」「今天」「要」「到」「台北」「去」「玩」。
可以看見,按此定義的話,句子中自然分成的每一節停頓,就是一個韻律詞。而在句子,不能自然分段的有意義的單位,就是「詞」。可是,韻律詞還是不能用來做分清字、詞的準則,它只能幫助我們進一步了解詞的分析。
句法詞(syntactic word)句法詞不同於語法詞(function word;英語原文含歧義),不過也有翻譯者將兩者混同。句法詞的語義結構,是能夠被分析出的通過構詞句法檢測的詞項[6]。
總結如果想要深入了解漢語的詞和構詞法,我推薦《The Morphology of Chinese: A Linguistic and Cognitive Approach》這本書。除了以上說過的幾個概念,書中還有提及更多對詞的定義和觀點,比如「心理語言詞」(psycholinguistic word)和「形態詞」(morphological word)等等。另外在參考資料那裡的文獻,對詞的理解都有幫助,有興趣可以看看。〔注〕[a] 文中譯名多新譯或少見,故附原文。[a.1]「Orthography」的官方譯法是「正寫法」,但本文暫時將其譯作「正寫規則」,方便理解。如想知道官方的推薦譯法,請見《漢語信息處理辭彙02部分:漢語和漢字》:「正寫法,即是文字元號形體的規範和使用規則,包括正字法和正詞法。漢字正字法可依據《簡化字總表》、修訂後的《第一批異體字整理表》、《現代漢語通用字表》等。漢語正詞法可參照《漢語拼音正詞法基本規則》和《信息處理用現代漢語分詞規範》」。
參考
- The Morphology of Chinese: A Linguistic and Cognitive Approach
- 《WORD 與「字」的形態結構對比研究》
- 《計量語詞探索》
- 《使用韻律階層及大量詞彙的中文文轉音系統》
- 《語篇上韻律與上層訊息——兼論語音學研究方法與發現》
- 《在論漢語的聲調與重音》
字和詞並不是完全相對應的。主要分為:單字成詞,雙字成詞,以及多字成詞。
一、單字成詞
通常來說,一個字可以成詞,也就是單音節詞,可以單獨使用。比如:山,紅,男。文言文中存在著許多單音節詞,這也就是文言文翻譯中要經常把一個字翻譯成現代漢語中的雙音節詞的原因。 二、兩個字組成的詞,這就要分兩種情況: 1、兩個字是一個語素,不能拆開或拆開後表示其他意思。 A、雙聲(聲母相同):伶俐(聲母都是l,分開各自無法組詞)、參差(聲母都是c)、坎坷(聲母都是k); B、疊韻(韻母相同):蜻蜓(韻母是ing)、徘徊(韻母是ai)、徜徉(韻母是ang)C、疊音(AA不等於A):猩猩(單獨拆開不能組其他詞)、奶奶(拆開後的單字的詞義不同)、姥姥(拆開後單字無義) D、雙音節音譯外來詞:咖啡、沙發 ,兩個字放一塊才能表示一定的意義。 E、雙音節擬聲詞:乒乓、噼啪 以上情況是必須用兩個字組合才能成詞。2、合成詞(A+B)
A、複合式:由兩個字組成,這兩個字分別代表意義,組成雙音節的詞。比如人民、朋友、眼花、吸煙、火紅。B、附加式:一個字有實義,另一個是詞綴。比如老師,阿姨,學者。C、重疊式(AA等於A):爸爸、試試。 三、三個字及三個以上的字組成詞 1、音譯外來詞:巧克力、歇斯底里 2、部分附加式:科學家、藝術家、喜洋洋、笑嘻嘻、現代化 另外,有的字既不是詞也不是語素,比如說 玻,橄,琵,葡等,這些字只有和另外的語素合作才能成詞。F.其實沒什麼關係!!字是文字單位,詞是語言單位。再加上音節-語音單位。
上面的回答已很完善,我就說說自己的學習體會吧。
我更傾向於贊同1)字承載音節。2)字的含義取決於它在詞中的含義,脫離了詞的字只是音節的載體。詞賦予字意義。【漢語字詞的關係真的非常複雜。文字學看來,造字之初,字便已是有實際含義的,單純說 文字載音 就顯得有些片面。要說 文字承載音節 大於 承載含義, 之前的回答里舉得例子可以借來一用。連綿詞(字):逍遙、蟑螂譯音詞 :亞歷山大這些例子的文字形式是不定的,寫法也有很多種。兒話 : 花兒蘇倏的回答里也看到,兒字只是「記錄」語音形式。可見 字 最終是為了服務於語音的。形聲字更是顯著。】3)字和詞的不對應關係 除了上面回答的多音字對應多個詞,補充一種是 字(音同)對應多個詞,主要的表現是詞性不同。如:米 1. 長度單位 2. 一種食物兩 1. 重量單位 2. 數詞在北大版《現代漢語》中,當討論到詞和字的分類,是以「音節」,也可以說是有幾個字組成詞劃分出單音節詞、雙音節詞和多音節詞等。沒有涉及到意義的討論。~~~~~權當我亂說吧。。。。這個問題其實不用我們班門弄斧,呂叔湘的《漢語語法分析問題》中已經說的很明確了,我來摘錄整理一下。1、字指的是漢語中的一個個音節;2、語素可定義為最小的語音語意結合體;3、詞可定義為最小的自由活動的語言片段。從印刷長度上來看,漢字應當是最短的,漢語語素單音節的多也有雙音節乃至多音節的情況,從這點看來語素的範圍似乎要比字的範圍大,其實不然,因為多音字的存在,一個字可能對應多個語素,因此語素和字不是簡單的大小問題。詞的劃分主要是兩端問題,即與語素和短語的邊界問題。由於漢語缺乏發達的形態所以很多語法片段的劃分是漸變的而不是頓變的,這要取決於你相信的是哪種理論。
漢字與漢語早前是兩套系統,你可以念古文,但古人日常交流並不說古文,就像豐臣秀吉可以寫漢詩,但不會用日式發音來開軍事會議一樣。因為單音節太容易產生歧義,而且時值也太短,大腦反應不過來。單就說話交流來講,多音節是必要的。一開始,文字只在祝巫中流傳,尚可講究一下超脫的語法,後世經歷了貴族、士階層、庶人士子到全民普通教育的變遷,語音就越來越多地進入文字,由於語音才是語言的核心,文字只有適應的份,直至白話文的出現,其本質就是書面語對於其使用者群體的不斷適應革新。~~~~所以說,字和詞究竟什麼關係,一開始是既要學寫字,又要學說辭,兩套系統要花好多時間,只能精英主義,後來要寫字的屌絲越來越多,乾脆就直接寫詞,好多快好省了。(同樣的理由,由於寫字的屌絲越來越多,寫,也得多快好省,這才有漢字的不斷簡化)
我比較贊同饕餮的回答。這裡其實沒必要牽涉到語素一層。
文字是一種記錄語言的符號,就像紅燈代表停,綠燈代表行一樣,文字代表的是語言。為什麼會產生文字想必不難理解。語音稍縱即逝,需要一種手段來記錄和保存吧。文字的產生可以考證,但語言的產生就無從考證了,總之文字是語言出現之後,出於記錄等需要發明出來的一套符號系統。
詞是語言系統中的一級單位,由語素構成。西方語言學將語言分為一個層級系統,由低到高為語素--詞--片語--句子,後者由前者構成。語言更是一種符號系統了,它記錄的是人類所有的表達。所以有種說法,「文字是符號的符號」。詞的定義:最小的能夠獨立應用的語言單位。
漢語中字和詞的關係,就是一種記錄與被記錄的關係。不過,我們可以說說兩者的對應關係。
漢字是表義系統文字,「形音義一體」。比如說「象」這個字,從字形的角度來說,可以從甲骨文字中看到其象形性,字形就是一隻大象的形象;從字音的角度來說,「xiang」這個音,可以作為聲符構成形聲字「像」等;從字義的角度來看,「象」直接表達的就是其字形所畫,觀其形知其義。這是漢字系統的特性,形音義一體導致漢字絕大部分都是一字一詞,即每一個字所記錄的都是詞,都能夠獨立使用。當然,有例外情況,比如「沙發」是一個詞,但需要用兩個字來記錄,這是外來語譯音的結果,這類的很多了,看看「陀思妥耶夫斯基」;還有類似「葡萄、窟窿」等,也是兩個字,漢語本身有的連綿詞,需要用兩個以上的字來記錄。
這裡簡單說一下英語的文字系統,做個對比。英語的文字系統以字母為單位,是表音文字,即一個字母僅代表其讀音,觀其形知其音,無法得知其義。音義結合才能進入語言系統中,再來計較到底是語素--詞--片語--句子的哪一級。所以英語是用字母(串)來記錄詞的語音,與漢字有根本的不同。有時需要向別人簡單地解釋這個問題,我會想是否可以避開引入「語素」和「音節」的概念——雖然它們可能涉及問題的本質,但也把原來1*1的關係變成了4*3/2=6組關係,理解的過程因此複雜了不少,沒接觸過語言學的人可能不太有興趣去理解。
可否把漢字和英文字母、漢字詞和英文單詞作個類比?字之於詞相當於字母之於單詞,若干(大於等於1)字排列組合構成詞,猶如若干(大於等於1)字母排列組合構成單詞。只是「若干」取不同值時中英文的「成詞」情況相差比較大,比如現代漢語可能主要集中在取值為2時,其次是1;取值較大時,漢語基本就剩下音譯詞,等等。
以上胡思亂想……詞即是單詞,是語義單位,字是語音語文(發音書寫)單位。一字不一定具有含義,但一字必定有對應的發音,漢字是記錄發音的,但與拼音文字不同,漢字記錄的是音節,而不是音素。詞是用來記錄語義信息的,語言表達以片語成句作為基本程序。漢語因為存在大量單音節詞,所以文字剛好可以記錄詞,即同時具有表意功能,但文字不等於詞,也不屬於詞的一種,因為文字不能記錄多音節單詞,例如,人民不能用一個發音為renmin的漢字單位記錄,同時,一個漢字亦不一定具有詞義,例如,琵琶的琵、琶,它們僅記錄語音,並不具有語義,也不是語素(因為不能拆開與其他語素組成單詞),只有琵琶結合,才具有語義。所以,字與詞有關係,但是不具有包含關係,亦沒有因果關係。
這個問題極為複雜,足夠用一本厚書來專門探討,不是用幾句話還是篇文章就能說清楚。
要搞懂他們的關係,必須要明確: 它們分屬兩個不同的系統。一個屬語言學範疇,一個屬文字學範疇。一個屬語言系統,一個屬文字系統。語言和文字,是兩個分離的各自發展的系統。
詞是語言學概念,意思是: 最小的、能獨立運用的、語言單位。
字是文字學概念,是記錄語言的書寫符號,漢語中一般是一個字記錄一個音節。
字和詞並不是一一對應的關係。相同的音節因為使用方法不同,會有多個字來記錄,比如「狗,苟,枸,go」;
同一個記錄符號(字)也可以表不同的音節,從而記錄不同的詞,比如「差」就記錄了三個不同的音,分別表三個不同的詞。
詞,作為語言的基本組成部分,比字的出現早好幾萬年。
推薦閱讀:
※方言和普通話的關係,是否需要統一語言,還是保留地方方言特色?
※哪些語言的拉丁字母系統用國際音標的濁音符號表示清音?
※能否用幾個簡單的例子解釋語言研究的主要學科?
※母語是中文的人學習英語到一定程度會在大腦里用英語思考嗎?是否經過將英文翻譯成中文的過程?
※語義學(Semantics)和修辭學(Rhetorics)的差別是什麼?