在數字信息時代,孩子們還要痛苦地練字嗎?

本文非原創,轉載自公眾號「香樟經濟學術圈(ID:camphor2014)",轉載已經公眾號同意。原文作者鄭筱婷,鏈接【香樟推文0962】在數字信息時代,孩子們還要痛苦地練字嗎?。

圖片來源:is2.mzstatic.com/image/

原文信息:Xu, Jianfeng; Jianxin Gong, 2017, Statistical Discrimination, Taste-based Bias, and Cognitive Bias --- Analyzing Grading Bias Caused by Handwriting Quality in a Randomized Control Trial.

家有小學生,剛上二年級,背不完的《笠翁對韻》,寫不完的《書法1+1》。書法練習,小朋友每個字寫了擦,擦了又寫,寫到自覺老師滿意為止,經常寫上1個多小時才完成,有一次寫著寫著睡著了(心疼!)。推文作者對此項作業甚是不解:儘管自己字丑了點,但未妨礙學業優秀,上985,工作在211,自覺從未因為字丑影響到各項工作任務的完成。況且,在互聯網時代,一切信息數字化、電子化,個體無需手寫記錄信息,何須花那麼多時間練習書法?

那麼,老師布置書法作業是否有科學的依據呢?孩子們練字要不要那麼精益求精?把練字的時間若是用於閱讀、破解數學難題和鍛煉身體,是否能取得更好的成績?

伊利諾伊斯大學香檳分校經濟系的徐劍鋒博士的最新研究回答了上述問題。他的求職論文(Job market paper)《Statistical Discrimination, Taste-based Bias, andCognitive Bias --- Analyzing Grading Bias Caused by Handwriting Quality in aRandomized Control Trial》,設計模擬了中考語文閱卷的隨機實驗,發現如果字寫得太丑,作文會被閱卷老師打低分。論文巧妙地測量出這個閱卷偏差為0.44 個標準差(內容完全相同的作文,字丑1個標準差,內容分被打低0.44個標準差,字丑1分(分數範圍0-5),內容分(分數範圍0-60)打低2.45分),這樣的偏差影響到了3.8%的中考錄取結果(糾正偏差前後高中錄取狀態發生變化的考生比例)。此外,打分偏差導致了70%的男女作文分差(女生字寫得好也有錯嗎?哈哈)。看來,對於在中考錄取分數線上下的學生來講,字的好壞直接決定了他們的命運——能不能上好的高中,能不能上普通高中。但是,對於那些遠遠高於分數線的人是不是字寫得美醜就不那麼重要了呢?通過將學生作文內容由好到差分為10等分,結果發現,不論作文寫得多好,字美的作文總是比字丑的作文(內容完全相同)得到的評分要高。

不要以為自己是學霸,就不用練字了喲!現在一分就刷掉很多人哦!

原文作者認為這種「以字取文」的做法是赤裸裸的歧視!為什麼這個閱卷偏差是歧視?因為字寫得丑是有生理基礎的,作者引用了心理學,兒童發展,神經科學,法律鑒證學的論文來證明字的美醜背後有生物學基礎。左利手比右利手的字要丑,男生的字比女生的字丑。任何影響到肢體末端控制和視覺精度的生理差別都會影響到書寫,比如閱讀障礙患者和多動症患者的字丑。字丑是個「群體特性」,歧視的定義是「用群體特性來評判個人,進而影響個人的機會均等。」比如,因為某人的膚色或性別而不僱傭某人,這就是歧視。字雖然可以練,但總有一部分人因生理原因要付出更多的努力。因為字丑就給作文打低分,自然也是一種歧視了。

測量歧視有兩種方法,一種是直接測量(審計實驗法),代表為Bertrand and Mullainathan(2004),發送帶有黑人白人名字特徵,但內容相同的簡歷,然後看回應率;另一種是間接測量,代表作是Goldin and Rouse (2000),通過比較女性演奏家在引入盲聽制度前後入選交響樂團的幾,間接測量性別歧視。原文作者同時用了兩種方法,得到了幾乎相等的估計:直接測量是通過第一步實驗,隨機安排學生抄寫作文(抽取了800份中考考生的作文,讓初中生學生重新謄寫,每篇作文有兩個copy,共1600份作文),比較內容相同但是字體美觀程度不同的作文版本,估得偏差為0.44標準差(具體做法:讓4名參與過中考閱卷的初中教師評所有1600份作文的寫字分。然後,隨機選15名有中考閱卷經驗的初中教師,來給800份卷子的其中一個版本評內容分,另外15名評另一個版本的內容分,回歸時去掉了那些學生謄寫有錯誤的卷子,剩下謄寫無誤且兩個版本一致的原始卷674份)。間接測量則通過比較中考考生實際的作文成績和第三個實驗中的印刷體的評分。原文作者調出了這些作文的中考評分成績,寫字分與內容分相關性為0.64。原文作者又設計了第三個實驗:讓人把所有中考作文用田英章字體列印出來,印刷體作文寫字分與內容分的相關性為0.25。兩者的差值是0.39,與0.44非常接近。

綜上所述,「字美分高」很大一部分是歧視造成的。打分偏差也不只限於作文,一切手寫的主觀題都可能受這個偏差影響。原文作者建議教育系統應該儘早批閱列印的作業和考試,想辦法消除歧視。因為這個閱卷偏差在早期教育階段的影響非常大,一些有潛力的學生可能因為僅僅是字寫得不好而被教師潛意識認為內容質量較低,從而給出偏低的評價或評分,進而失去了學習動機,甚至是學習的機會。如果閱卷制度不變,沒法消除閱卷偏差,為提高成績,家長和老師只能讓學生多練字!多練字!(感覺聽到了孩子們的哭聲)。

---分割線---

原文作者借閱卷這個話題研究了歧視的一般機制,對研究歧視的文獻有貢獻。定量估計歧視有直接和間接兩種經典方法,首先,作者同時使用了兩種方法,印證了兩種方法的等價性。作者提出了分離統計歧視的新方法——切斷統計信息;這種方法需要的假設比前人的方法要弱。原文作者建議在分析歧視的框架內引入行為經濟學的元素——認知偏差也可以導致歧視。

過去研究歧視的文獻一般處理離散變數(黑/白,男/女,殘疾/非殘疾),原文作者首先遇到了連續的右側變數的問題。連續模型比離散的更有一般性,但連續變數也更難測量。為了處理右側變數(寫字分)的測量誤差,作者用了多次測量取平均的傳統平均法,還改進了工具變數法,降低了工具變數法在小樣本內的偏差。作者發明的對稱工具變數法,可能在樣本比較少並且測量誤差比較大的實驗研究中起到用處。

寫字與閱卷誤差原本是心理學和教育學研究的範圍,原文作者把它做成了經濟學問題;這本是個中國問題,原文作把它做成了一般性問題;閱卷偏差是個小話題,原文作者做成了分析歧視背後機制的大話題;作者在分離統計歧視的實驗方法和校正測量誤差的計量方法上做了貢獻;作者甚至提出了歧視背後有行為機制的假說,用認知偏差來解釋歧視,這是繼偏好歧視,統計歧視之後的一大創新。

原文作者還用中考數據做了反事實分析(模擬中考錄取,分析男女差別),發現僅僅校正作文這60分的內容分偏差,就可以影響3.8%學生的錄取結果。F地區某縣有四所大規模普通高中,質量一字排開,所以中考有4道分數線。如果把作文內容按照實驗估得的打分偏差補回去,每道分數線都有接近總學生數1%的錄取結果改變。原文作者發現如果校正閱卷偏差,數學、物理、化學成績較好的學生會被錄取到較好的高中,而語文、英語、政治較好的學生會被降低到較差的高中,這個結論在控制男女差別後仍然成立。原文作者還調用了他另外一篇論文中,學生心理測試和家庭背景的數據,發現校正閱卷偏差後,做事謹慎、外向、班幹部等級較高的學生會被降低錄取,而校正偏差與學生家庭背景無關。結合原文作者之前對這些中考學生進行的心理測試結果和家庭背景調查,發現字的美醜與數學能力和創造力負相關,這個負相關在男女兩個性別內都成立。字丑,則數學成績好,思維活躍開放,該論文可能是首次估計出了這個負相關的係數。負相關性意味著閱卷偏差對數學成績好的人不利,反事實模擬中考錄取的結果也印證了這個推測。

原文作者還發現女生在作文成績中的優勢70%歸功於字寫得漂亮。這或許可以部分解釋全世界現代教育體系下陰盛陽衰的現象。假如女孩子有同等的教育機會,閱卷偏差會使女生的語文成績會更大幅超越男生,而與女生相比,男生在數學成績上的優勢微不足道,補不回語文成績的劣勢(女生也要克服女生數理化不如男生的刻板印象)。比如,原文研究的F地區女生作文內容分比男生平均高1.5分,原文作者發現其中1.05分的差距完全是由這個閱卷偏差導致的,只有0.45分是女生的真正優勢。

原文有近70頁,請還不過癮的讀者閱讀原文!

致謝:推文寫作過程中得到了原文作者徐劍鋒的大力協助,謹此表示感謝!

論文作者主頁:http://www.economics.illinois.edu/people/candidates/。

原文摘要:Poor handwriting has biological roots. Grading of essay content may be biased against poor handwriting, resulting in discrimination against students with poor handwriting. This study is the first to estimate the bias against poor handwriting, and to decompose the bias to uncover its sources. It finds that the bias alters 3.8% of high school admission outcomes and contributes to 70% of the gender gap in writing test. The challenge with identifying bias is that ability may be correlated with handwriting quality. To quantify handwriting quality, this study conducts a field experiment in a prefecture of China utilizing special rubrics for handwriting quality. To break the intrinsic correlation between handwriting and content quality, this study randomly creates two handwritten versions for each of 800 essays. The estimated bias is about 0.44 of a standard deviation: 1 point in handwriting (0-5) results in 2.45 points bias in content scores (0-60). Further experiments break the mechanism of this bias into statistical discrimination and Becker』s taste-based bias. Statistical discrimination is found to be negligible. In addition to true taste-based bias, this study proposes two cognitive biases (halo effect and cognitive fluency effect). Although the context is specific, this experiment suggests that Becker』s taste-based bias may include unconscious discrimination caused by behavioral factors. The study also makes a methodological contribution to correct the attenuation bias caused by measurement error. It develops a new instrumental variable estimator that improves the small sample properties of traditional instrumental variable estimators.

聲明:推文僅代表文章原作者觀點及推文作者的評論觀點,並不代表香樟經濟學術圈公眾號平台觀點。

本文非原創,轉載自公眾號「香樟經濟學術圈(ID:camphor2014)",轉載已經公眾號同意。原文作者鄭筱婷,鏈接【香樟推文0962】在數字信息時代,孩子們還要痛苦地練字嗎?。


推薦閱讀:

芭蕾不需要「消滅」種族歧視
海外留學被歧視?大師兄告訴你如何保護自己
什麼才叫真正的「照顧好自己」?
這算是落井下石吧

TAG:歧视 | 教育经济学 | 劳动经济学 |