Kaggle 入門 1.0——Titanic 問題介紹

今天介紹 Kaggle 入門級別(Getting Started)比賽的經典問題,泰坦尼克生存問題。(題圖即 Kaggle 網站上該問題的封面,可以看到已經有7338支隊伍參賽)

簡單而言,本問題是給定泰坦尼克號上891名乘客的信息,包括艙位、名字、性別、年齡、船上兄弟姐妹個數、父母孩子個數、船票號、船票費用、艙號、登船港口以及是否存活等信息,預測其他在船上的418名乘客是否存活,當然其他418名乘客的信息也會提供。

需要注意的是,乘客信息並不一定全部完整,即會出現缺失的情況。

截至2017年8月6日,該比賽用 Python 完成的 Kernel 前六名如下:

本專欄將逐一進行介紹,並對各 Kernel 進行總結。

推薦閱讀:

Kaggle 的比賽在 Machine Learning 領域中屬於什麼地位?
kaggle首戰,踩坑?學習?
泰坦尼克號倖存預測n ——Kaggle排名321名(前4%)
kaggle小黃車競賽 得分:0.41038

TAG:Kaggle | jupyter | Python |