在進行 OLS 估計時,為了滿足 BLUE 條件,為什麼會有 X 取值要在重複抽樣時固定的前提?
01-14
1.這個原則看上去和隨機抽樣的原則不相容啊?這應該是nonerandom的吧?
2.為什麼這樣是更嚴格的?為什麼它是BLUE的條件之一?3.最早這個說法哪裡來的呢?4.完整的英文說法是X values are fixed in repeated sampling.
謝 @Vas Brandon邀。你在哪本書上看的?不用的,因為我們有條件期望這個有力的工具。
BLUE的三大條件為:
1. zero mean condition
2. homoskedasticity (constant variance)3. no auto-correlation接下來上圖解釋什麼叫homoskedasticity
Last but no the least, 由於有了CLT理論經常可以被省略的假設- - Normality of error terms,也是BLUE的條件之一哦
繼續上圖:
剛好看見了,應該是這個意思。以下是伍德里奇的原話,「零條件均值假定導致了一個方便的技術簡化。具體而言,我們可以以樣本中的xi值為條件OLS估計量的統計性質。從技術上講,以自變數的樣本值為條件的統計推導,與把xi視為在重複樣本中固定不變的處理方法相同。其過程如下,我們首先選擇n個樣本x1,x2,x3.。。xn。給定這些值我們便可以得到y的一個樣本。然後利用相同的x1,x2,x3.。。xn,再得到y的一個樣本。並依此重複下去。在重複樣本中保存不變的這種構想在非實驗背景中不是很現實。例如,在工資教育一例忠抽取個人時,事先選擇edu的值,再在特定受教育程度下抽取個人,這樣的想法很難講的通。在隨機抽樣時,個人是隨機抽樣的,工資和受教育程度同事被記錄下來,這才是社會領域中進行經驗分析時獲得多數數據集的典型方法。一旦我們假定E(u1x)=0,並進行隨機抽樣那麼,把xi視為非隨機的處理辦法,在推導中就不會遺漏什麼。「
是英文表達的問題,說的就是 @遲鈍 回答中homoskedasticity的問題,all observations need to be independent and identically distributed. (iid)
進行ols估計時其實是有這樣的一種思想在裡面的,就是假定x提取了所有確定性信息,不確定的東西都交給殘差項。因為如果這種假定成立的話,那麼我們就能只通過x就能最大程度的了解y。要想x.提取了所有確定性信息的話,那麼x本身就應該也是確定的,非隨機的。順便說一下,blue對於殘差的假定也可以這樣理解,就是保證了殘差項不存在趨勢之類的確定性的東西。總而言之,blue成立就是代表對於這個數據,採用ols估計,我們已經儘力了,做到了我們能做到的最好了,剩下的不準確的東西都是隨機因素造成的,不是我的鍋。。。一點淺見,如有錯誤請輕噴。。。
對比了幾本外文的計量教材(woodridge,Hayashi,Stock),都沒有這樣的表述,取而代之的是殘差的條件期望為零,基本就是為了達到殘差與自變數之間的獨立關係,即在自變數固定的情況下,殘差的期望為零。經濟學等不像自然學科,經濟模型中的自變數一般都是觀測值而非實驗控制值,很多都是隨機變數,所以不可能滿足固定X的條件。所以條件期望非常方便的滿足了這一現實。
推薦閱讀:
※學生化殘差中的學生化是什麼意思?
※非線性回歸的驗證?
※線性回歸中,殘差的和為什麼等於0?這個假設的依據是什麼?
※線性回歸的相關指數R平方的表達式(見圖)是怎麼來的?
※如何簡明地解釋「線性回歸」「貝葉斯定理」「假設檢驗」這些術語?