為什麼不能用調查數據中"直接匯總"的總和生育率

黃匡時 中國人口與發展研究中心副研究員

新出版的《中國統計年鑒2017年》刪除了「直接匯總」的生育率數據,引發了社會熱議。其實,從2010年「六普」和2015年全國1%抽樣調查所獲得的年齡別生育率數據的直接匯總結果來看,都與通過當年的粗出生率水平換算的出生人口再計算出來的總和生育率有出入,由此引發人們對從普查「長表」和1%抽樣調查以及1‰抽樣調查中的「直接匯總」總和生育率的深入思考,以及對總和生育率測量規律的進一步探索。

六普總和生育率1.18是「直接匯總」的

2012年4月,由中國統計出版社出版的《中國2010年人口普查資料》(下冊)第2100頁表6-3中公布了全國育齡婦女分年齡、孩次的生育狀況(2009.11.1-2010.10.31)。此表包括年齡別的平均育齡婦女和年齡別的出生人數以及年齡別的生育率。社會各界根據總和生育率的概念和計算方法由此表匯總出總和生育率為1.18。而且根據表6-3a、表6-3b和標6-3c分別可以匯總出城市總和生育率(0.89)、鎮總和生育率(1.16)和鄉村總和生育率(1.44)。

社會上不少人由此認定,2010年我國總和生育率為1.18,並由此推斷出一些危言聳聽的結論。事實上,國家統計局並沒有在其他場合正式公布總和生育率,而且在公布2010年人口普查數據的時候特別做了說明,「按照通常做法,資料中的數據為人口普查直接登記的匯總結果,未做任何誤差校正。根據事後質量抽查,2010年人口普查人口漏登率為0.12%,總體質量較高。但有些指標(如出生人口、死亡人口和按分年齡婦女生育率計算的總和生育率)現場登記難度較大,漏登率要相對高一些,請讀者使用普查相關數據時,應考慮不同指標登記誤差因素的影響。」因此,學者在使用普查數據的時候應對「資料使用說明」 有了充分的了解。

國家統計局之所以公布年齡別生育率數據也是儘可能滿足國人對生育率數據總量和結構的需求,也是情理之中,而且也對數據用戶做了溫馨的提示。根據「資料使用說明」,我們知道,根據計算機直接匯總的總和生育率是存在較大漏登的。生育的漏登率至少比0.12%要高。儘管國家統計局並沒有告訴具體漏登率,但是我們根據《中國2010年人口普查資料》表1-12《各地區分性別、月份的出生人口(2009.11.1-2010.10.31)》(第188頁)和表3-1《全國分年齡、性別的人口》(第265頁)可以大致了解一些。

表3-1《全國分年齡、性別的人口》(第265頁)給出了0歲-100歲的人口數,其中,0歲人口數為13786434人,1歲人口數為15657955人。我國知道,普查時間是2010年11月1日,也就是說,0歲組的人口數是2009年11月1日到2010年10月31日出生的,而1歲組的人口數是2008年11月1日到2009年10月31日出生的。這兩個數都不是自然年的概念。所以,我們不能說2010年的出生人口就是0歲組的13786434人。要計算2010年的出生人口數還需要考慮月份的情況。而表1-12《各地區分性別、月份的出生人口(2009.11.1-2010.10.31)》恰好給出了出生的月度分布。根據表1-12,可以得知,2009年11月1日到2010年10月31日的出生人口數為13836187人。如果我們假定2010年11月和12月的出生人口數與2009年11月和12月一致,那我們可以初步認為,2010年的出生人口數為13836187人,比0歲年齡組的人口數13786434人略多49753人。考慮到月度出生數要比將0歲年齡組人口數視為出生數更為科學,因此我們採用分月出生匯總數視為2010年的出生數。

如果按照2010年出生人口數為13836187人來計算,採用同樣的年齡別生育分布(即表6-3中全國育齡婦女分年齡、孩次的生育狀況)來計算,全國的總和生育率為1.28。所以說總和生育率1.18是低估的,是受到漏登扭曲後的直接匯總結果。如果按照總和生育率為1.18來核算,2010年出生人口數為1289萬人,與1384萬相差較大。

2010年的總和生育率約在1.5左右

那麼,根據出生月份數匯總核算的總和生育率為1.28是否就是真實的生育水平呢?當然不是。我們知道,國家統計局公布的《中國2010年人口普查資料》中的「資料使用說明」說的很清楚,出生漏登率要相對高一些。根據中國人口出版社出版的《人口與計劃生育常用數據手冊》(2016)第165頁,2010年的出生人口數大約在1592萬人,如果按著1289萬來計算,漏登率達到23.51%,如果按照1384萬來核算,2010年的出生人口數漏登率達到15.06%。

2010年出生人口數為1592萬是根據國家統計局公布的2010年的粗出生率乘以2010年的平均人口數計算而來的,即11.9‰×[(134091 133450)/2]=1592萬。由此可見,國家統計局對2010年的出生人口數的判斷是1592萬,而不是總和生育率為1.18所對應的1289萬和根據出生月份匯總的1384萬。也正因為如此,國家統計局在公布2010年普查資料的時候在「資料使用說明」中特意提醒用戶在使用出生數據的時候要注意漏報問題。

聯合國世界人口展望2017年修訂版估計,2010年出生人口總數為1724萬人,對應的粗出生率為12.7‰,總和生育率為1.59。聯合國人口司世界人口展望2017年修訂版基於中國曆次人口普查數據對歷史人口數據進行了修正,可能更加符合中國實際。

圖1 2010年直接匯總結果和按照出生月份人數以及粗出生率核算的年齡別生育率

從2010年的1.18到2015年的1.05

既然2010年總和生育率是「直接匯總」的,是受到出生漏報數據的扭曲,那麼2015年根據1%小普查數據直接匯總的數據是否也是低估呢?

根據《中國統計年鑒2016年》中表2-17《育齡婦女分年齡、孩次的生育狀況》,將年齡別的生育率直接匯總,2015年總和生育率為1.05。同樣地,國家統計局對錶2-17特別做了說明「2015年全國1%人口抽樣調查樣本數據,抽樣比為1.55%」。這是樣本數據所對應的總和生育率,國家統計局並沒有公開說明在總和生育率和年齡別生育率指標上樣本能代表總體。不可否認,國家統計局2015年1%的樣本具有代表性,但是要做到所有的指標都具有代表性是很困難的,尤其是出生和死亡方面的統計指標。正是因為這一點,國家統計局在2017年公布《中國統計年鑒2017年》不再公布年齡別生育率。這也是避免出生統計上對世人的誤導,由此引發學界和政府部門對一些錯誤認識的應對和反饋所帶來的無謂消耗。

不過,國家統計局依然公布每年的出生人口數和粗出生率。相對於年齡別生育率,國家統計局公布的每年出生人口數和粗出生率可能誤差相對小些。根據國家統計局公布的2015年出生人口數為1655萬,粗出生率為12.07‰。根據國家統計局1%小普查的年齡別生育分布,我可以推算了1655萬出生人口所對應的總和生育率為1.55。根據聯合國世界人口展望2017年修訂版的估計,2015年出生人口總數為1704萬人,對應的粗出生率為12.2‰,總和生育率為1.62。因此,2015年總和生育率為1.05也是低估的。

美國統計學家達萊爾·哈夫出版了一本書《How to Lie with Statistics》,中文翻譯為《統計數字會撒謊》,是警告世人要對直接匯總和直接分析的統計數據要有清醒的認識。從2010年和2015年這兩個時點上的年齡別生育率這個統計指標來看,直接匯總的統計數字真的會說謊。如果我們單純從普查數據或者1%小普查數據直接匯總年齡別生育率數據,可能要陷入統計數字的謊言中。這種出生統計的年齡別生育率統計假象值得深入研究。為什麼每年的出生人口總數和粗出生率與真實情況比較接近,而無論是普查還是抽樣調查,年齡別匯總的總和生育率卻常常偏離根據當年出生人口總數核算的總和生育率?這種年齡別生育率直接匯總導致的「總和生育率低估」背後究竟是什麼因素使然?對這些問題的思考將對分析歷次生育狀況調查結果具有重要意義。

從數據採集入手來分析可能更能發現調查數據中直接匯總年齡別生育率所存在的問題。我們知道,年齡別生育率的計算既要年齡別的出生人口(分子)準確,又要年齡別的育齡婦女(分母)準確。更重要的是,分母和分子能匹配上。就是說,分子都是分母所生且分母所有生育的孩子沒有遺漏,加上準確地將沒有生育的育齡婦女考慮在內。如此看來,一個抽樣調查數據要準確估計年齡別生育率,至少需要滿足三個條件:

(1)分母中育齡婦女所生孩子都在分子中,

(2)非分母中的育齡婦女所生育的孩子不在分子中,

(3)適當比例的未婚和未育的育齡婦女考慮在分母中。

這三個條件,(1)和(3)是最難保證的,也是總和生育率測不準的關鍵所在。這與我們調查樣本的代表性和育齡婦女在回答問卷時的認真程度以及問卷中未婚、未育育齡婦女的比例設計等緊密關聯。

當然,如果我們從全員人口來看,直接匯總全國所有育齡婦女年齡別生育率是沒有問題的。而且這也需要確保全員人口資料庫出生人口數據的準確性和及時性。所以完善全員人口資料庫和出生人口資料庫對獲得準確真實的生育水平至關重要。當然,即使我們獲得了真實的總和生育率,我們也應該很清醒地認識到,其實,我們所統計的總和生育率從人口學角度來看,是一種時期總和生育率,是根據假想隊列來核算的總和生育率,其本質上是一種假想生育率。因此,只有通過對歷史人口數據的校正,析出歷史年份的隊列總和生育率和時期總和生育率,完善中國生育資料庫,對認識歷史尤其是展望未來非常重要。

大國人口
推薦閱讀:

從經濟學角度分析,是否生育孩子,對個人或社會會帶來哪些經濟層面的影響?
瑪法里奧和泰蘭德為什麼沒孩子?
養兩個孩子是一種什麼樣的體驗?
是什麼在影響男人的生育能力
70後婦女接近生育期結束 或再沒機會生二胎

TAG:生育 | 數據 | 調查 | 生育率 |