Section1 Introduction

Section1 Introduction

來自專欄 Blogs of Ruili Feng

在健康、社會、行為科學等學課中,最常見的問題大都是因果性的而非關聯性的。舉例而言,給定人群攝入給定藥物後會有怎樣的反應?統計數據是否能證明僱主具有某種歧視?如果施行某項政策,哪些以往發生的犯罪行為可能被避免?這些問題被稱為因果關係,在於他們:

  • 需要一定的關於數據生成方式的先驗知識
  • 無法單獨從數據中計算出來
  • 無法單獨從概率分布中計算出來

幸運的是,關於此類問題的很多概念上與演算法上的工作業已取得不錯的進展,他們主要可以被歸類為四個方面:

  • Conterfactual analysis (反事實分析,假設分析)
  • Nonparametric structural equations (非參數結構等式)
  • Graphical models (圖模型)
  • Symbiosis between counterfactual and graphical methods (1與3的聯合)

這一系列文章的目的旨在於:

  1. 鮮明的區別因果分析與標準的統計分析
  2. 提供一個統一的理論用以解決因果問題的大多數層面
  3. 提供一些簡單但有力的工具以解決一系列廣泛的因果問題
  4. 展示之前工作在新的統一理論下的一致性

各個章節的劃分如下:

  • Section 2:介紹兩個統計理論難以逾越的概念上的障礙;
  • Section 3.1:介紹因果分析的基礎定義和結構模型的基礎定義
  • Section 3.2:使用結構模型表示干涉
  • Section 3.3:介紹數學手段估計因果效應
  • Section 3.4:介紹數學手段估計假設量
  • Section 3.5:分析被noncompliance損害的實驗

這些工具將允許研究人員通過圖解的方式表示因果假設,並:

  1. 決定為了觀測到目標量的一致的估計,所作出的假設是否充分;
  2. (在1解決的情況下)找到目標量關於觀測量概率分布的閉式解;
  3. (在1未解決的情況下)尋找能產生一致估計的充分假設

在Section 4中,我們將一個著名的模型:潛在收益框架(Potential-outcome framework)統一到結構模型的框架之中。

在Section 5中,我們進一步闡釋結構模型的優越之處。

推薦閱讀:

TAG:數學 | 數據分析 |