漢語中「著」「了」「過」等,處理成詞尾還是處理成助詞對漢語的詞法分析有什麼影響?


從語言學的角度來講:

1. 漢語是孤立語,不是屈折語,沒有明顯的形態變化,最接近「詞尾」這個概念的就是「們」,而「們」只附加在名詞後面;而英語的詞尾可以作為劃分詞類的標準之一,比如-s,-ly,-ing,-ed等等,顯然這三個詞是不具備這個功能的,所以不是詞尾。

2. 漢語對時態也沒有要求,只要敘述清楚一件事即可,不是形式語言,不靠「著」「了」「過」作為唯一的時態標記,還可以使用副詞、時間名詞來表示時間,所以即使把這幾個時態助詞處理成詞尾(類似於英語的現在分詞、過去分詞),也起不到關鍵性的作用。

3. 還要考慮的一種情況是這三個詞未必會緊跟著動詞出現,如果認為她們是詞尾,那麼這條尾巴常常會被截斷。比如「說過你了」,當然,這也可能是因為「了」的功能特別複雜。

從分詞的角度來看:

1. 如果題主的原意是想把這三個詞與動詞斷開的話,那麼這三個詞的詞性被標註為詞尾或助詞都影響不大,因為詞尾不能單獨使用,動態助詞也不能單獨使用,而且這兩類詞在詞法層面上都不會成為關鍵詞,是次要角色。

2. 如果題主想把這三個詞與前面的動詞合成一個來處理,會讓漢語的動詞數量翻倍增加。比如,一個動詞「走」,會產生「走著」「走了」「走過」三個詞,會讓相似問題匹配難度增加。而且,有的詞有兩種分詞方法,並且意思不一樣,比如「穿過」這個詞,當表示「穿」這個動作是一種經歷的話,最好斷開,即「穿/過」,而表示pass through的時候,是一整個詞,不能一概而論。

本回答來自Emotibot語言學家范敏。


謝邀。

語言學的影響不太清楚,從自然語言處理的角度來看,

這些詞在分詞,lexicalized句法分析等問題中會是比較有意義的特徵。

處理成詞尾還是處理成助詞,這種語法現象在自然語言處理的系統中其實沒太大的現實區分意義,更高層的理解部分還無法使用這種區別。

簡單來說,分完詞以後,我一般會把這些詞當成停用詞,不會再用到了。


這也就說明了虛詞為什麼叫虛詞,甚至對於助詞而言,完全可以忽略它作為獨立詞的條件,從而當成詞尾。


簡單來說,這三個詞都帶有一定的語氣性,

作詞尾就比較偏口語化

作助詞就是語氣助詞~


的,得,地;

著,了,過。

很小的時候,爺爺教我們讀書認字時,用一首歌謠,教我們區分這六個字的運用情況。可惜我現在已經記不清了。

我們這一代人從小中英文一起學,導致很多文法句式用詞都混用。中文的表達,用西方文法來解構,就有點不倫不類了。


推薦閱讀:

谷歌翻譯原理是什麼,從語言A到B,中間是否要翻譯成中介語言C(如英語)?
如何使用「爬蟲/數據挖掘」自動尋找某「話題」的「父話題」?
推薦系統中的推薦理由實現,有什麼好的思路嗎?
自然語言處理的master和PhD比較是完全沒有優勢嗎?

TAG:漢語 | 自然語言處理 | 語言學 | 現代漢語 |