中國人有多少中文辭彙量/識字量?
普通高中畢業
記得一段時間之前,我看過這個問題。不過由於沒有一個可以在線測試的漢字識字量的網站(應用),於是身為程序員的我,就自己做了一個判斷漢字識字量的應用。
測漢字:http://hanzi.sjz.io
網站里的漢字的總量大概是1W多一點,每次抽取60個漢字。每個漢字對應一個識字量,選擇相應的漢字,會計算總的識字量,對照出來,就是你會的識字量了。
不過為何我一個大學畢業的,每次測試的都是4000多一點的識字量呢?難道我的應用不準確?我很好奇。
截圖如下:
歡迎大家提意見!
加劉景長說得好。
我從前年開始一直在做關於象形文字與電影哲學的論文。實際上漢語無需藉助語音就能夠實現形象與意義的連接。從這個意義上講,電影語言的抽象性高於現實,低於戲劇,戲劇低於象形文字。而西方電影哲學在研究的時候,大部分從拼音文字出發,與漢語有不同路徑。
象形文字有很多獨特之處,漢語是唯一大規模使用的象形文字。索緒爾在研究語言學一般規律的時候,把語言當作一種符號系統進行科學研究。但是,在具體操作中,對漢語獨特性和與拼音文字比較研究中還處於比較弱勢的地位。關鍵是,必須培養漢語在科學研究中的信心。現在,國家開始重視在漢語雜誌上發表的科研文章,對漢語發展而言,這是好事情。回到本題。古漢語大多是單字為詞(很多人說是單音節詞)。古漢語時代,單字詞已經能夠完整豐富地表達意義了。隨著漢語的發展,雙字詞,包括成語不斷出現。這是在漢語實際使用中不斷進行經典化的過程,將新的意義附著到固有的字上,通過組成詞表達更加精確的意義。從過程看,英語以及德語等詞語,通過詞的變化表達更加精確的意義。而漢語則通過字的組合表達更加精確的意義。所以有「轉注」假借」等用字法。即使高中畢業識字量達到6600,也需要不斷豐富辭彙量。因為實踐中可知,大部分人即使認識很多字,由於重書寫,在口語表達的時候辭彙量很匱乏。對漢語教學而言,訓練口語應當是一個重點,而不應僅僅關注寫作。按照九年制義務教育的要求,國家教委頒布的基礎教育教學大綱規定基礎教育階段的識字量為3500字。小學識字量為2400,中學識字量為3800,而整個中學的識字量為6600。
附帶一提:
毛喻原先生曾經說過與英語相比,漢語的辭彙量是非常小。即使一部歐美普通學生所用的字典所收單詞也至少在十六至十七萬個以上。這種類比的說法是不正確的。江蘇大學何南林教授跟北大外語學院世界文學研究所辜正坤教授都指出:中國兒童記住2000---3000個漢字,就可以閱讀《人民日報》而不會有多少生詞。印歐語系的兒童即使記住了8000左右的單詞,在閱讀《華盛頓郵報》時仍然會有很多生詞。
而國務院通過的教育部、國家語言文字工作委員會組織制定《通用規範漢字表》收字8300個。根據字的通用程度,字表劃分為三級:
一級字表收字3500個,是使用頻度最規範漢字規範漢字高的常用字,主要滿足基礎教育和文化普及層面的用字需要。
二級字表收字3000個,使用頻度低於一級字。一級、二級字合起來共6500字,主要滿足現代漢語文本印刷出版用字需要。
三級字表則是一些專門領域,包括姓氏人名、地名、科學技術術語、中小學語文教材文言文使用的未進入一、二級字表的較通用的字,共收字1800個,主要滿足與大眾生活和文化普及密切相關的專門領域的用字需要。
漢字的每一個字本身就具有意義自我闡釋的作用。因為它的根底來源於圖畫文字。圖畫就是外部世界事物的縮影。一個字就是表達的含義從它的書寫本身就已經顯示出來了。這等於說每個漢字就是自身的含義小詞典。如果有兩個、三個、四個字組成的漢字片語,則各個單字便等於可以相互闡釋,互證互釋互彰。
參考資料
[1]《課程·教材·教法》1992年第6期 文摘 《九年義務教育全日制小學語文教學大綱》
署名陳國雄、崔巒
[2]華東師範大學 2012年碩士論文 文摘 《小學語文識字量調查研究》 署名何玉婷
[3]語言文字論辯集
[4]國務院關於公布《通用規範漢字表》的通知
[5]《通用規範漢字表》(徵求意見稿)背景知識詞條 - 中華人民共和國教育部政府門戶網站
為什麼會有人認為認識字就能知道詞的意思?這些人怕是難得看詞典,才會有這種幻覺,甚至極端到認為,只要語文老師就夠了,其它學科只要自學就可以了。
測試了一點,確實有bug,繁體字不應該介入。像我次常用字都認識的,所以一定在7000以上,但測試了一遍,才6000多,應已新華字典為標準。作為取樣的標準
一個剛高考完的文科生
不知道準不準
推薦閱讀:
※為何頻繁看到有人會不分「的」、「地」、「得」的用法?
※X不啦幾作為顏色形容詞的後綴是怎麼來的?黑不拉幾,灰不拉幾,黃不拉幾…?
※為什麼「埋」只有在「埋怨」裡面才讀mán的音?這個讀音來源是什麼?
※古有倉頡造字,漢字是否到了捉襟見肘,並需要製做新字的時刻?
※表示「全部、統統」的方言詞「humblung」(含蹦楞)源自粵語還是吳語?正確寫法是什麼?