在進行 OLS 估計時,為了滿足 BLUE 條件,為什麼會有 X 取值要在重複抽樣時固定的前提?

1.這個原則看上去和隨機抽樣的原則不相容啊?這應該是nonerandom的吧?

2.為什麼這樣是更嚴格的?為什麼它是BLUE的條件之一?

3.最早這個說法哪裡來的呢?

4.完整的英文說法是X values are fixed in repeated sampling.


謝 @Vas Brandon邀。

你在哪本書上看的?不用的,因為我們有條件期望這個有力的工具。


BLUE的三大條件為:

1. zero mean condition

2. homoskedasticity (constant variance)

3. no auto-correlation

接下來上圖解釋什麼叫homoskedasticity

Last but no the least, 由於有了CLT理論經常可以被省略的假設- - Normality of error terms,也是BLUE的條件之一哦

繼續上圖:

不知道有沒有解答題主的疑惑呢?


剛好看見了,應該是這個意思。以下是伍德里奇的原話,「零條件均值假定導致了一個方便的技術簡化。具體而言,我們可以以樣本中的xi值為條件OLS估計量的統計性質。從技術上講,以自變數的樣本值為條件的統計推導,與把xi視為在重複樣本中固定不變的處理方法相同。其過程如下,我們首先選擇n個樣本x1,x2,x3.。。xn。給定這些值我們便可以得到y的一個樣本。然後利用相同的x1,x2,x3.。。xn,再得到y的一個樣本。並依此重複下去。

在重複樣本中保存不變的這種構想在非實驗背景中不是很現實。例如,在工資教育一例忠抽取個人時,事先選擇edu的值,再在特定受教育程度下抽取個人,這樣的想法很難講的通。在隨機抽樣時,個人是隨機抽樣的,工資和受教育程度同事被記錄下來,這才是社會領域中進行經驗分析時獲得多數數據集的典型方法。一旦我們假定E(u1x)=0,並進行隨機抽樣那麼,把xi視為非隨機的處理辦法,在推導中就不會遺漏什麼。「


是英文表達的問題,說的就是 @遲鈍 回答中homoskedasticity的問題,all observations need to be independent and identically distributed. (iid)


進行ols估計時其實是有這樣的一種思想在裡面的,就是假定x提取了所有確定性信息,不確定的東西都交給殘差項。因為如果這種假定成立的話,那麼我們就能只通過x就能最大程度的了解y。要想x.提取了所有確定性信息的話,那麼x本身就應該也是確定的,非隨機的。順便說一下,blue對於殘差的假定也可以這樣理解,就是保證了殘差項不存在趨勢之類的確定性的東西。總而言之,blue成立就是代表對於這個數據,採用ols估計,我們已經儘力了,做到了我們能做到的最好了,剩下的不準確的東西都是隨機因素造成的,不是我的鍋。。。一點淺見,如有錯誤請輕噴。。。


對比了幾本外文的計量教材(woodridge,Hayashi,Stock),都沒有這樣的表述,取而代之的是殘差的條件期望為零,基本就是為了達到殘差與自變數之間的獨立關係,即在自變數固定的情況下,殘差的期望為零。

經濟學等不像自然學科,經濟模型中的自變數一般都是觀測值而非實驗控制值,很多都是隨機變數,所以不可能滿足固定X的條件。所以條件期望非常方便的滿足了這一現實。


推薦閱讀:

學生化殘差中的學生化是什麼意思?
非線性回歸的驗證?
線性回歸中,殘差的和為什麼等於0?這個假設的依據是什麼?
線性回歸的相關指數R平方的表達式(見圖)是怎麼來的?
如何簡明地解釋「線性回歸」「貝葉斯定理」「假設檢驗」這些術語?

TAG:經濟學 | 計量經濟學 | 數理統計學 | 線性回歸 | 概率論與數理統計 |