如何用多個定性變數構建計量模型?

我在做計量模型的時候遇到一個問題,就是在理論分析時都分析ok,也提出了相應的假設,但是到建模實證的時候,發現定性變數過多(重組方式,是否關聯交易,重組動因,支付方式,是否國有,行業,估值方法,價值類型等),不知道怎麼設置變數和對定性賦值,還有就是這樣的模型做出來之後怎麼解釋模型結果呢?


最直接的方法肯定是設dummy變數回歸,有這個特性取1,沒這個特性取0。控制其它變數以後這個變數的係數就反映了這個特徵對結果的影響。你還可以取dummy變數之間或者dummy變數和定量變數的交互項來看不同截面上某個特性的影響。如果某個特性有程度之分,可以用效果編碼dummy變數,用j-1個編碼來反映j個特性。不過這種方法可能會扭曲偏差,要小心使用(Cohen and Cohen, 1963)。你也可以用一對對比編碼dummy變數來反映兩個特性的交互影響,這時候的操作方法和效果編碼是一樣的,只是注意兩對編碼要正交就可以了。關於dummy變數的使用,可以參考Hardy的經典教材《虛擬變數回歸》,有中文版。如果涉及到比較複雜的回歸模型和結構模型的估計,建議直接看論文(Winship and Mare, 1983; Winship and Mare, 1984)。

不過,如果真的有那麼多定性變數,也可以採用一些其它辦法吧。這些方法經濟學可能用得沒有那麼多,但其它社會科學經常用。比如比較法,包括求同、求異、求同求異還有共變法,都是從定性變數裡面挖信息挖結論的好辦法。比較法不是隨便比的,具體操作有嚴格的流程。如果懷疑不同的變數之間有因果聯繫,除了估計結構方程,也可以用圖解代數。這種方法政治學研究用得比較多,畫得好的話文章會很簡明清晰。這兩種方法分別可以參考Caramani和Brown的經典教材,都有中文版。以上推薦的三本教材中譯版都屬於格致出版社翻譯的格致系列(Sage的社定量研究系列),都是小冊子,比較容易看,價錢也便宜。

參考文獻:

Brown C. Graph algebra: mathematical modeling with a systems approach[M]. Sage, 2008.

Caramani D. Introduction to the comparative method with Boolean algebra[M]. Sage publications, 2008.

Cohen J. Cohen. P.(1983). Applied multiple regression/correlation analysis for the behavioral sciences[J]. Hillsdale, NJ: Erlbaum, 84.

Hardy M A. Regression with dummy variables[M]. Sage, 1993.

Winship C, Mare R D. Structural equations and path analysis for discrete data[J]. American Journal of Sociology, 1983: 54-110.

Winship C, Mare R D. Regression models with ordinal variables[J]. American Sociological Review, 1984: 512-525.


瀉藥。豬月說的很清楚了。補充一點就是如果這些都是控制變數而你有一個 panel 的話,那麼用一下 fixed effect 能夠幫你節約一些自由度。如果你肯用貝葉斯的話,把他們歸歸類做做 hierarchical model 也行,具體自己 google 吧


也只能百度百度了


建立多個dummy variables,並剔除一個dummy variable作為base參考變數,用其餘的變數和base比較。

例如:wage=beta0+beta1*male+beta2*manager+beta3*workathome

這個多變數回歸模型中有三個dummy variables 是否是男性,經理,還有是否在家裡工作

這時你可以設置再設置一個omitted variable作為比較變數和其他三個比較比如local是否是本地人。

那麼舉例解釋:

beta1的含義就是:

如果這個人是男生那麼相對於本地人來說工資要高beta1個單位。

渣渣只能解釋到這裡了


推薦閱讀:

WACC 在資產評估中的都有哪些作用?
我國的資產評估業應該取消前置審批嗎?會產生哪些影響?
做房地產評估有沒有前景呢?

TAG:計量經濟學 | 資產評估 | 碩士論文 |