標籤:

牛津高階中一個詞能被列為一個詞條的標準是什麼?不同的詞典有沒有一個公認的標準?

在英文詞典中,有些詞在做了一定的詞性變化後,會被附在原詞條後(如在OALD第七版中simultaneous-simultaneity);而有的會成為一個單獨的詞條(同OALD第七版:beautiful-beauty)。


謝喵。本來想抓 @Chris Xia過來從語義和詞形變化的角度回答的,害怕她用貓爪撓我,遂放棄。

編纂詞典的過程中,字詞在日常生活中的使用頻率使用語境是非常重要的考慮因素。簡單粗暴地來講,使用頻率越高的詞,越有可能被單獨列為一個詞條,而使用語境越是不同的兩個同根詞,越有可能被列為不同詞條

下面我就結合語料庫語言學Corpus linguistics來解釋一下為什麼,simultaneous/simultaneity劃歸到一個詞條下面,而beautiful/beauty被分為兩個不同詞條。

我們首先進入[bnc] British National Corpus,這個語料庫彙集了英國從1980-1993年的新聞媒體,文學作品,口頭對話中的口頭書面用語,收納超過1億個詞條。

接下來,我使用BNC裡面的compare功能,分別比較兩對詞條它們的使用頻率和使用語境。先看simultaneous和simultaneity

簡單解釋一下上圖,左邊是simultaneous (word1),右邊是simultaneity (word2),而word那一欄顯示的是跟simultaneous或者simultaneity 同時出現的詞條,按照頻率從高到低排列。W1那欄表示simultaneous 這個詞跟左邊一欄所列各個詞條同時出現的頻次,W2那欄同理。W1/W2很好理解,就是測算W1和W2跟同一個詞條同時出現的頻率之比。而Score那一欄,是用W1/W2,除以總樣本數中W1一共出現的頻次和W2一共出現的頻次之比(這個數顯示在表格最上面兩個單詞的旁邊)。得分越高,就表明在某一特定語境(比如說with這個詞出現的時候),simultaneous比simultaneity(或simultaneity比simultaneous)更有可能出現的幾率越大(感謝 @Gregory Tang 幫我理順這個統計學上的意義)。用中文說感覺說不清的樣子,我用英語再複述一遍:the higher the score is, the more likely that W1 co-occurs with the word (with, by, elections, etc.) rather than W2.

從樣本總數(也就是1億個單詞中間)來看,simultaneous這個詞出現的次數要遠遠大於simultaneity(使用頻率高)25:1,也就是說,每出現25個simultaneous,才會出現一個simultaneity。

我們再來看使用語境。看最後一欄Score,只有在Idea這個詞出現的語境當中,simultaneity的語境相關性要顯著高於simultaneous(75),在其他情況下我們可以看到Score的數值都是要小於10的(表格背景顏色的深淺也能表明兩個詞的使用語境相同或不同,顏色越深,表明越不同)。所以我們可以得出結論,在大多數情況下,simultaneous和simultaneity兩者的使用語境是相同或相似的。

綜合以上兩個條件:simultaneous的使用頻率要遠遠高於simultaneity,再加上兩個詞的使用語境較為相似,所以編纂詞典的語言學家就做出判斷:把simultaneity歸到simultaneous的詞條之下,是較為合適的(詞典編纂也要考慮經濟性,一詞一條顯然是不現實的)。

然後我們再來看beautiful和beauty,依然是使用BNC中compare的功能。

呀,一大片深綠色。我們上文提到了,表格的背景顏色一定程度上表明比較的雙方使用語境的差異性或相似性,顏色越深,差異越大。我們再倆看看Score一欄的得分,普遍在30以上,甚至還有過百的得分,這表明我們的最開始的觀察結果是成立的:beautiful和beauty這兩個詞使用的語境非常不同。

接下來我們來看頻率。從樣本總數來看,beautiful這個詞出現的頻率要略多於beauty 2.05:1,表明每出現2.05個beautiful就會出現一個beauty,使用頻率差距不大

綜合以上兩個條件:beautiful與beauty兩個詞的使用語境迥異,且使用頻率相當,所以他們更應當被列為兩個不同的詞條。

以上就是我使用語料庫做出的使用頻率和使用語境對比分析得出的結論,再次感謝小夥伴Gregory Tang的幫助。


推薦閱讀:

為什麼2009版《中國語言地圖集》裡面把川西劃作漢語區,而不把西藏也劃成漢語區?
什麼叫更接近「中古漢語語音」?
語言多樣性是怎麼產生的?
文字(script)、書寫系統(writing system)和語言(language)分別是什麼含義?
為什麼義大利語「Firenze」一詞中的「Fi」在其他語言中轉變為「Fl」?

TAG:詞典 | 語言學 |