傾向得分方法的雙重穩健且有效的改進
進行計算。
然而在實證中發現,這個方法雖然簡單易行,但是對於傾向得分(propensity score)的設定非常敏感。為了解決這個問題,學者們提出了一些方法使得IPTW變的穩健,其中協變數平衡的傾向得分(Covariate Balancing Propensity Score, CBPS)被發現在實證中表現的非常好。這個方法通過設定傾向得分的函數形式,通過解方程:
得到傾向得分中β的估計,其中f為需要平衡的X的一些函數。一般f取X的一階項,也有時會取二階項進行計算。如果取一階項,這個方法保證了經過傾向得分加權之後,處理組和對照組有相同的樣本均值。然而,雖然以上方法表現比較穩健,在實證中究竟該如何選擇f(X)仍然在理論上沒有很好的解答,此外當π的錯誤設定對結果有何影響也沒有充分的討論。
Jianqing Fan, Kosuke Imai, Han Liu, Yang Ning and Xiaolin Yang 等人的文章《Improving Covariate Balancing Propensity Score:nA Doubly Robust and Efficient Approach》對CBPS方法進行了更加深入的討論,並在此基礎上提出了一個雙重穩健且漸進有效的方法(iCBPS)。
首先,作者計算了CBPS方法的bias。如果π的方程形式錯誤設定:
而β的估計值收斂到:CBPS方法可以保證:
而通過作者的計算,IPTW的bias為:其中K和L的定義為:因而,如果f滿足:
那麼不管π如何錯誤設定,CBPS方法都可以矯正bias。
進而,作者更進一步將以上的bias分解為:
作者提出,只要將以上兩項分別降為0,那麼估計量的bias就可以降為0。因而作者提出可以通過改進的CBPS方法:
將以上兩個方程同時最小化(解方程)即可得到一個ATE的無偏估計量。更進一步,作者指出,以下條件只要有一個成立:
- 傾向得分模型正確設定
- K(·)和L(·)分別在h1和h2所張成的線性空間中
那麼,通過iCBPS方法計算的IPTW估計量就是ATE的一致估計量,因而是「雙重穩健的」。
這裡h1代表擬合K(·)的基函數,而h2代表擬合L(·)的基函數,因而實證中可以選取X的一次項、二次項等多項式基函數擬合K和L函數,將β的維數適當擴大到h1的維數+h2的維數即可。此外,針對傾向得分的錯誤設定問題,作者提出可以使用sieve logit的半參數方法解決,這裡不再贅述。
IPTW是處理效應中雖然比較古老但是非常常用的方法。然而簡單實用IPTW會有不穩健的問題,本文的方法實現並不複雜,是做處理效應實證的又一利器。
推薦閱讀:
※內生性和選擇性偏誤有什麼區別?
※學習計量經濟學的學生需要學習編程嗎?如果需要,要學習到什麼程度,有什麼好的建議嗎?
※如何寫好一篇計量經濟學論文?
※如何理解計量經濟學中的「檢驗過度識別約束」?