相關配對檢驗--斯特魯普效應

特魯普效應是著名的心理學現象,展示了人們對事物的認知過程已是一個自動化的歷程。當有一個新的刺激出現時,如果它的特徵和原先的刺激相似或符合一致,便會加速人們的認知;反之,若新的刺激特徵與原先的刺激不相同,則會干擾人們的認知,使人們的所需的反映數據變長。

簡單來說,斯特魯普效應是當有與原有認知不同的情況出現時,人們的反應時間會較長。

我們想要驗證斯特魯普效應。

實驗設計

通過網上的stroop實驗做測試人的反應時間(https://faculty.washington.edu/chudler/java/ready.html)。 每名參與者得到兩組有顏色的文字,第一組數據是字體內容和字體顏色一致,第二組數據是字體內容和字體顏色不一致。每名參與者對每組文字說出文字的顏色,並分別統計完成每組的時間。

此次實驗共記錄25組數據(樣本量),並匯總到Excel表格中。

一、描述統計分析

#導入包import numpy as np import pandas as pdimport matplotlib.pyplot as plt路徑和文件名中不要用中文,不然會報錯encoding用於指定文件的編碼,因為讀取的csv中有中文,所以指定文件編碼為中文編碼「GBK」data = pd.read_csv(rC:houzi estdata.csv, encoding = GBK)data.head()

「一致」列是字體內容和字體顏色一致情況下,實驗者的反應時間(單位:秒)。「不一致」列是字體內容和字體顏色不一致情況下,實驗者的反應時間。

#獲取描述統計信息data.describe()

從描述信息中可以看出「不一致」情況下所用平均時間均大於「一致」情況。

使用柱狀圖對兩個樣本數據進行比較

#兩個樣本數據集對比#畫板fg = plt.figure(figsize = (20,10))#畫紙ax = fg.add_subplot(1,1,1)#繪製柱狀圖data.plot(kind = bar,ax = ax)#顯示圖形plt.show()

「不一致」情況下所用時間均大於「一致」情況。

二、推論統計分析

1.問題是什麼?

自變數是指原因。因變數是指結果,也就是自變數發生變化導致改變的值就是因變數。

自變數:我們有兩組實驗數據,第一組是字體內容和顏色一致。第二組數據值是字體內容和顏色不一致。所以自變數是實驗數據的顏色和文字是否相同

因變數:實驗者的反應時間

所以,我們要考察的是自變數(字體內容和顏色是否相同)兩種情況下對因變數(反應時間)的影響。

零假設和備選假設

假設第一組「一致」的均值為 u1 ,第二組「不一致」的均值為 u2

零假設H0:人們的反應時間不會因為字體內容和字體顏色是否相同(u1 = u2 ,或者 u1-u2=0 )

備選假設H1:特魯普效應確實存在。根據特魯普效應的定義,顏色和文字不同的情況下,人們的完場測試的時間會變長( u1 < u2 )

檢驗類型

因為該使用兩組數據是相關樣本(同一個實驗對象前後做兩次實驗),所以選擇相關配對檢驗。

相關配對檢驗只關注每對相關數據的差值,從而避免得到的結論受到參與人員間正常反應時間獨立性的影響。在只關注差值集的情況下,樣本集處理後只有一組(差值集)。下面我們對樣本數據進行處理,從而得到差值集。

抽樣分布類型

我們還要判斷抽樣分布是哪種?因為抽樣分布的類型,決定了後面計算p值的不同。

在我們這個案例中,樣本大小是25(小於30),屬於小樣本。那小樣本的抽樣分布是否滿足t分布呢?因為t分布還要求數據集近似正態分布,所以下面圖片我們看下差值數據集的分布長什麼樣。

通過觀察上面差值數據集分布圖,數據集近似正態分布,所以滿足t分布的使用條件,我們可以使用相關樣本t檢驗。

檢驗方向

因為備選假設是:特魯普效應確實存在,根據Stroop Effect的定義,顏色和文字不同的情況下,人們的完成測試的時間會變長( u1 < u2 )。

所以我們使用單尾檢驗中的左尾檢驗,顯著水平為5%,t檢驗的自由度df=n-1=25-1=24

2.證據是什麼?

在零假設成立前提下,得到樣本平均值的概率p是多少?

3.判斷標準是什麼?

#顯著水平使用alpha=5%alpha=0.05

4.做出結論

5. 置信區間

6.效應量

三、數據分析報告總結

1、描述統計分析

第一組樣本數據:字體內容和字體顏色一致情況下,平均反應時間是: 13.89 秒,標準差是 3.47 秒

第二組樣本數據:字體內容和字體顏色不一致情況下,平均反應時間是: 22.62 秒,標準差是 5.09 秒

「不一致」情況下所用時間均大於「一致」情況,也就是當字體內容和字體驗證不一致時,實驗者的平均反應時間變長

2、推論統計分析

1)假設檢驗

相關配對檢驗t(24)=-8.35,p=7.32e-09 (α=5%),左尾檢驗

統計上存在顯著差異,拒絕零假設,從而驗證斯特魯普效應存在。

2)置信區間

兩個平均值差值的置信區間,95%置信水平 CI=[-8.80,-8.67]

3)效應量

d= - 1.67


推薦閱讀:

假設檢驗——獨立雙樣本檢驗之 AB測試案例
如何理解假設檢驗
需求定律中的假設、事實及啟示
假設檢驗之斯特魯普效應檢驗

TAG:數據分析 | 假設檢驗 |