傾向得分方法的雙重穩健且有效的改進

在政策評價中經常使用傾向得分的方法計算平均處理效應(ATE),其中Inverse probability of treatment weighting (IPTW) 方法是非常常用的方法之一。如果觀察到數據(Ti, Yi, Xi),其中Ti為處理變數,Yi為結果變數,Xi為處理之前的個體特徵,且處理的過程滿足強可忽略性的假設:

那麼IPTW的方法可以通過:

進行計算。

然而在實證中發現,這個方法雖然簡單易行,但是對於傾向得分(propensity score)的設定非常敏感。為了解決這個問題,學者們提出了一些方法使得IPTW變的穩健,其中協變數平衡的傾向得分(Covariate Balancing Propensity Score, CBPS)被發現在實證中表現的非常好。這個方法通過設定傾向得分的函數形式,通過解方程:

得到傾向得分中β的估計,其中f為需要平衡的X的一些函數。一般f取X的一階項,也有時會取二階項進行計算。如果取一階項,這個方法保證了經過傾向得分加權之後,處理組和對照組有相同的樣本均值。

然而,雖然以上方法表現比較穩健,在實證中究竟該如何選擇f(X)仍然在理論上沒有很好的解答,此外當π的錯誤設定對結果有何影響也沒有充分的討論。

Jianqing Fan, Kosuke Imai, Han Liu, Yang Ning and Xiaolin Yang 等人的文章《Improving Covariate Balancing Propensity Score:nA Doubly Robust and Efficient Approach》對CBPS方法進行了更加深入的討論,並在此基礎上提出了一個雙重穩健且漸進有效的方法(iCBPS)。

首先,作者計算了CBPS方法的bias。如果π的方程形式錯誤設定:

而β的估計值收斂到:

CBPS方法可以保證:

而通過作者的計算,IPTW的bias為:

其中K和L的定義為:

因而,如果f滿足:

那麼不管π如何錯誤設定,CBPS方法都可以矯正bias。

進而,作者更進一步將以上的bias分解為:

作者提出,只要將以上兩項分別降為0,那麼估計量的bias就可以降為0。因而作者提出可以通過改進的CBPS方法:

將以上兩個方程同時最小化(解方程)即可得到一個ATE的無偏估計量。

更進一步,作者指出,以下條件只要有一個成立

  1. 傾向得分模型正確設定
  2. K(·)和L(·)分別在h1和h2所張成的線性空間中

那麼,通過iCBPS方法計算的IPTW估計量就是ATE的一致估計量,因而是「雙重穩健的」。

這裡h1代表擬合K(·)的基函數,而h2代表擬合L(·)的基函數,因而實證中可以選取X的一次項、二次項等多項式基函數擬合K和L函數,將β的維數適當擴大到h1的維數+h2的維數即可。此外,針對傾向得分的錯誤設定問題,作者提出可以使用sieve logit的半參數方法解決,這裡不再贅述。

IPTW是處理效應中雖然比較古老但是非常常用的方法。然而簡單實用IPTW會有不穩健的問題,本文的方法實現並不複雜,是做處理效應實證的又一利器。


推薦閱讀:

內生性和選擇性偏誤有什麼區別?
學習計量經濟學的學生需要學習編程嗎?如果需要,要學習到什麼程度,有什麼好的建議嗎?
如何寫好一篇計量經濟學論文?
如何理解計量經濟學中的「檢驗過度識別約束」?

TAG:计量经济学 | 经济学 |