傳說中的子承父業,都在這560萬Facebook人際關係數據里了
文/數據俠 Adamic等
當你走出校門邁向職場,擇業時也許很難完全避免來自父母的影響。而這種影響甚至還不是一時,而是打你一出生就已經開始了。「龍生龍鳳生鳳」,父母的職業在多大程度上會影響子女的職業呢?來自Facebook的兩位數據科學家通過分析Facebook社交平台上的數百萬條職業和人際關係數據,為我們揭示了父母和子女的職業代際傳承關係的「真相」。
子女選什麼職業,多大程度上受到父母的影響?
父母和子女間的關係不只限於基因。父母是孩子的榜樣,會為他們提供機會,還會為他們的職業道路提供建議。那麼,孩子最終會和父母從事同樣的工作嗎?其他的兄弟姐妹也會選擇一樣的職業嗎?不同的職業,父母對孩子的影響會有什麼不同?
為了弄清這些問題,Facebook憑藉自己的社交大數據對這一現象進行了研究。
Facebook分析了移除了身份信息後的兩組相關的數據:一組是兄弟姐妹的職業選擇,另一組是父母子女的職業選擇。樣本包括了英語語言區在Facebook上關聯了各種家人、親戚關係的這些人,當然這些人也都填寫了自己的職業,但需要注意,這些信息都沒有經過驗證。
Facebook把各類職業劃分為幾個主要類別,其中軍事職業類別存在重複的情況,因為這個類別同時包括了僱主身份、職業分類以及過往的服役記錄,而其他工作分類只是基於選擇的職業分類。
由於數據不包括那些無法在Facebook上勾選的職業,因此它可能並不代表整體人口,但瑕不掩瑜,研究本身還是很有趣的。
下面這兩張圖展示的是父親和兒子、母親和女兒的職業關聯度情況:
根據圖片來看,子女和父母選擇同一個特定職業的可能性,確實因職業而異。
Facebook一共收集了560萬份數據,這些數據都來自英語語言區,且父母和子女都填寫了職業信息。Facebook先計算了在給定父母職業的情況下子女從事某一職業的概率,比如,一個律師父親有一個醫生兒子的概率是5%。然後,Facebook還計算出這一概率相對於其他行業的情況是個什麼程度。結果發現,在這個案例里,法律從業者的兒子比其他行業從業者的兒子,從事醫藥行業的概率高4.6倍。
對學歷要求較高的職業,父母子女間的代際關聯度較高
在下面這張可視化網路圖中,每個節點表示「職業-性別」的配對,藍色表示男性,紫色表示女性,例如,標有science字樣的紫色節點意思是「女性科學家」。
另外,職業標籤都是縮寫的。2個節點間的連線和箭頭方向,表示父母是某一職業的小孩會在多大程度上選擇另外一個職業(DT君註:衡量的標準是和人群的平均水平的比較)。所有線條只有當比平均概率至少大2.5倍以上才會顯示,線條越粗,意味著子女選擇另個職業的概率更高。
通過這樣的可視化網路,我們可以了解父母與子女職業之間的聯繫。比如說,從藍色的military(軍事、軍隊相關工作)和藍色的protective service(安保類工作)間這條線可以看出,父親在軍隊中工作的話,兒子比平均水平更可能從事安保類的服務(DT君註:至少比平均水平高2.5倍以上)。
通過展示這樣一個關係網,並且使用力引導布局演算法(force-directed
network layout algorithm)去把那些代際關係比一般水平高很多的關係放在更靠近的地方的話,我們就可以看到,在上圖的左側,那些需要更高學歷知識的職業會聚集得更緊密;另一方面,相對低學歷需求的職業在右側。儘管相對來說,一個孩子很有可能跟隨父母的腳步,但絕對百分比可能還是很低的。比如如果你的父親在軍隊工作,則你入伍的概率是普通情況的5倍,這聽上去非常誇張,但其實如果看絕對值,父親是軍人的兒子中,每4個兒子只有1個會選擇入伍,也就是25%而已。至於父親從事農業,漁業,林業的,只有3%的子女繼承了這個行業,但還是比總體水平高出了7.6倍。
母親是白領或者行政人員的女兒里,有20%會從事同樣的職業,但這隻比一般概率大了兩倍。另一方面,如果母親是醫護人員,那女兒有8.5%的幾率同樣成為醫護人員,並且這是總體的3.75倍。
我們也能看到跨性別的職業「繼承」,例如:科學家父親有一個科學家女兒的概率是總體的3.9倍,而律師母親的兒子也幹這一行的概率是總體的6.6倍。
另外需要注意的是,由於家庭背景,孩子進入某些職業的可能性會非常小。比如說,對於父親從事法律的人來說,他們進入到建築行業、維修、維護行業的可能性只是平均水平的85%。
除了父母,兄弟姐妹也會影響你的職業選擇
接下來我們來看看兄弟姐妹們會選擇一樣的職位嗎?
兄弟姐妹們不僅有一樣的父母,對於雙胞胎來說,他們還擁有相同的基因。對於同卵雙胞胎來說,他們有完全一樣的基因,對於異卵雙胞胎來說,從基因上來說,他們和兄弟姐妹們沒有區別。但不管是同卵還是異卵,雙胞胎都是從相似的環境中成長起來的,儘管隨著家裡孩子數量的增加,父母的教養方式可能會產生變化,比如一個家庭中,對老大的教育可能比較嚴格,對最小的可能比較寵愛。但我們一般認為雙胞胎受到的教養方式還是接近的。
為了分析兄弟姐妹的職業,Facebook收集了237萬份數據。數據對象都是美國的同性別兄弟姐妹,並且他們在個人資料中填寫了職業信息。
Facebook把兄弟姐妹分成三組,一組是同性別雙胞胎,另一組是年齡相差不超過兩歲的同性別的兄弟姐妹,第三組是大樣本中任意兩個年齡相差不超過兩歲的同性別人士。他們將會比較這三組樣本中從事相同工作的概率。不難看出第三組是參照組。
在第二組中,也就是年齡相差不超過兩歲的兄弟姐妹間,有15%的幾率選擇同樣的工作,這比第三組任意兩個同性別同年齡的人選擇相同工作的概率8.6%要高。但更驚人的數據是,雙胞胎選擇同樣職業的概率是24.7%。
下面這些柱狀圖將這個結論按照職業和性別進行了更具體的細分。
如圖,每條柱子有三種不同深淺的顏色。顏色最深最不透明的代表了基準線的概率。稍淺一點的代表了同性別的非雙胞胎擁有相同工作的概率。最淺的代表了雙胞胎擁有相同工作的概率。
第一張圖是按照雙胞胎從事同一類職業比例的大小來排序,第二張是按照兄弟姐妹間的大小來排,第三張是基準組。
總結來說,我們可以發現,來自一個家庭的成員傾向於選擇相同的職業,特別是對於雙胞胎來說。然而,絕大多數的孩子都還是選擇了走自己的道路,選擇與父母或兄弟姐妹不同的職業。
註:本文編譯自Facebook研究博客(http://research.fb.com)文章《Do jobs run in families?》,內容僅代表作者觀點,文中圖表均來自原文,DT君作了部分漢化。關注DT數據俠點擊「閱讀原文「查看原文(注意科學上網)。
數據俠門派
本文數據俠為Lada Adamic及Ismail Onur Filiz,兩人均為Facebook數據科學家。
(Lada Adamic)
(Ismail Onur Filiz)
DT字幕組
感謝「數問」團隊的毛哥,Chelsea對本文的翻譯貢獻。
數問數據科學平台是一個一站式數據玩家的驛站,目前有問答、競賽、工作、線下活動等內容版塊。任何數據愛好者都可以在平台上提問題、找答案、分享學習資料和經驗、對接資源等。他們希望幫助各個階層的數據使用者解決「從哪裡來」,「到哪裡去」的問題。
「DT字幕組」致力於發掘和傳播全球數據領域的優質內容,長期招募組員,歡迎郵件聯繫:chengyixiang@yicai.com。
加入數據俠
「數據俠計劃」由第一財經數據新媒體DT財經發起的數據人社群平台,旗下有數據俠專欄、數據大咖及愛好者社群、線上線下「數據俠實驗室」系列活動等項目。
+ 投稿:chengyixiang@dtcj.com
+ 合作:zhaonan@dtcj.com
推薦閱讀: