閃電約會數據
七夕,是中國傳統節日中最具浪漫色彩的一個節日,也是傳說中牛郎織女鵲橋相會的日子。這一天,對於情侶們來說是美好的一天,而對於「單身汪」們來說就是各種「被撒狗糧」的一天。世間最美好的願景莫過於「遇一人白首,擇一城終老」,七夕將近,用一組數據告訴「單身汪」們什麼樣的氣質在異性眼裡最有魅力,什麼樣的表現在約會中勝率最大。
數據來源:閃電約會數據可視化 | 清帆遠航
分析目的:
1. 男性和女性在擇偶觀上有什麼差異;
2. 約會中最受歡迎的男性和女性分別具備什麼特質;
3. 有共同興趣愛好的約會夥伴是否更容易約會成功;
第一步:導入數據
數據理解:
iid: 整體實驗中參與者的編號
id: 參與者在所在實驗輪次中的子編號
gender:性別(女 0 男 1)
wave: 實驗輪次
round: 參與者該輪約會對象的總人數
order: 該約會對象是參與者當晚約會的第幾個異性
partner: 參與者約會對象的編號
pid: 參與者約會對象在該實驗輪次中的編號
match: 1 匹配成功(雙方都願意與對方再次約會)0 匹配不成功
samerace: 1 雙方同種族, 0 雙方不同種族
attr: 「吸引力」指標的偏好程度分配(6 個指標共 100 分)
sinc: 「真誠度」指標的偏好程度分配(6 個指標共 100 分)
intel:「智商」指標的偏好程度分配(6 個指標共 100 分)
fun: 「有趣度」指標的偏好程度分配(6 個指標共 100 分)
amb: 「進取心」指標的偏好程度分配(6 個指標共 100 分)
shar: 「共同愛好」指標的偏好程度分配(6 個指標共 100 分)
第二步:數據處理
這裡主要是對缺失數據進行處理,直接就採用了mice包進行缺失值補足。
library(mice)nmicedata <- mice(iiddata,method = "rf")niiddata <- complete(micedata)n
第三步:數據分析
3.1 男性和女性在擇偶觀上有什麼差異;
首先是參加實驗前,對擇偶觀的看法:
從圖中可以看出,參與者在參加實驗前,女性最看重的前三項選擇是:真誠度、智商、有趣,男性最看重的前三項是:吸引力、智商、有趣。不管是女性還是男性都同時看重智商和有趣。
參加實驗後,對擇偶觀的看法:
從圖中可以看出,參與者在參加實驗後,女性最看重的前三項選擇是:吸引力、智商、有趣,男性最看重的前三項是:吸引力、有趣、智商。
具體數值比較:
共有274名女性、277名男性參加了實驗,實驗前後對各擇偶觀點的偏好程度發生了改變,最明顯的變化就是更看重吸引力。
因此,對於男性來說看重異性的吸引力、有趣和智商,而女性在約會前看重的是真誠、智商和有趣,約會後看重的是吸引力、有趣和智商。不管怎樣,一個有趣又有智商的人總是討人喜歡的。
3.2 約會中最受歡迎的男性和女性分別具備什麼特質;
首先需要分析那些人更受歡迎,也就是約會者對參與者的喜愛程度最高,喜愛程度為10的對象:
共有182位約會者對參與者非常滿意。
3.2.1約會中最受歡迎的男性具備什麼特質:
最受歡迎的男性數據:
共有74位男性參與者比較受異性約會者的喜愛。
3.2.1.1分析受歡迎男性的職業:
職位前三項是 Lawyer、Investment Banking、Teacher/Professor。
3.2.1.1分析受歡迎男性的專業:
專業的前三項是:MBA、Law、Business。
3.2.1.3最受歡男性的愛好:
篩選哪位男性是受約會者喜愛的,也就是有多名約會者選擇他,看看他的愛好是什麼:
最受歡迎的男性是ID為107和125的男性。
共同愛好是:喜歡外出飲食、美術館、藝術、俱樂部、閱讀、戲劇、電影、音樂會、瑜伽。
出乎意料的是,居然是對瑜伽很感興趣....
3.2.2約會中最受歡迎的女性具備什麼特質:
最受歡迎的女性數據:
共有108位女性參與者比較受異性約會者的喜愛。
3.2.1.1分析受歡迎女性的職業:
職位前三項是 Lawyer、medicine、International Development。
3.2.1.1分析受歡迎女性的專業:
專業的前三項是:Law、Social Work、medicine。
3.2.1.3最受歡女性的愛好:
篩選哪位女性是受約會者喜愛的,也就是有多名約會者選擇她:
最受歡迎的女性是ID為470的女性。
愛好是:喜歡外出飲食、美術館、藝術、閱讀、戲劇、電影、購物。
更意外是,居然是對瑜伽沒興趣....
所以,約會中最受歡迎的男性和女性職業是Lawyer,專業是Law,愛好是外出飲食、美術館、藝術、閱讀、戲劇、電影,也就是專業性強,且屬於愛好廣泛的人。
3.3 有共同興趣愛好的約會夥伴是否更容易約會成功
成功配對中有共同愛好的數據:
共有1380對情侶配對成功。
篩選出關於共同愛好指標的評價數據:
其中,share_o是約會對象對參與者「共同愛好」指標的評價(1-10),shar是參與者對約會對象「共同愛好」指標的評價(1-10),接下來篩選出這兩個分值在8、9、10中的數據:
共有224對情侶覺得他們有著共同的愛好,計算佔比16.23%,有著共同愛好的男女在成功配對中佔比只有16.23%,也就是說有著共同愛好的人並不是更容易配對成功。
粗略分析了一下,總體來說,有趣有料的人更受歡迎~
推薦閱讀:
※給30個PM拉了一年的sql,我學到了這些
※撰寫數據分析報告的常用套路
※大數據能拯救你的愛情生活嗎?
※R|ggplot2(四)|stat_ geom_ 和position
※急速入門Python數據分析(2)--矩陣回顧
TAG:数据分析 |