Kaggle入門系列:(二)Kaggle簡介

Kaggle是全球最大的數據分析在線平台,吸引了全球範圍內數十萬的頂級數據科學家,同時也是檢測我們機器學習技能的最佳平台。

一、Kaggle簡介

Kaggle成立於2010年,網址:kaggle.com/

Kaggle是全球範圍內最大的數據眾包平台。

企業或者研究者與Kaggle合作之後,可以將數據、問題描述、期望的指標發布到Kaggle上,以競賽的形式向廣大的數據科學家徵集解決方案,類似於KDD-CUP(國際知識發現和數據挖掘競賽)。

Kaggle上的參賽者將數據下載下來,分析數據,然後運用機器學習、數據挖掘等知識,建立演算法模型,解決問題得出結果,最後將結果提交,如果提交的結果符合指標要求並且在參賽者中排名第一,將獲得比賽豐厚的獎金。

二、參加Kaggle比賽的基本流程

1.選擇一個比賽項目

2.加入競賽,理解項目需求「Competition Details」

3.下載數據,訓練模型,得出結果「Get the Data」

4.提交結果「Make a submission」

三、解題思路

模仿是最好的學習方式!

這裡為大家推薦幾篇非常好的文章,裡面手把手的教了大家入門級的三個經典練習項目,供大家學習。

1.Titanic(泰坦尼克之災)

中文教程: 邏輯回歸應用之Kaggle泰坦尼克之災

英文教程:An Interactive Data Science Tutorial

2.House Prices: Advanced Regression Techniques(房價預測)

中文教程:Kaggle競賽 — 2017年房價預測

英文教程:How to get to TOP 25% with Simple Model using sklearn

3.Digital Recognition(數字識別)

中文教程:大數據競賽平台—Kaggle 入門

英文教程:Interactive Intro to Dimensionality Reduction

系列文章:

Kaggle入門系列:(一)機器學習環境搭建

Kaggle入門系列:(二)kaggle簡介

Kaggle入門系列:(三)Titanic初試身手

歡迎關注微信公眾號:kaggle數據分析


推薦閱讀:

遺憾未進前10%, Kaggle&Quora競賽賽後總結
Kaggle 入門 1.1——A Journey through Titanic
【持續更新】機器學習特徵工程實用技巧大全
深度學習入門:Tensorflow實戰Digit Recognizer(一)

TAG:Kaggle | 数据分析 | 机器学习 |