Kaggle入門系列:(二)Kaggle簡介
01-31
Kaggle是全球最大的數據分析在線平台,吸引了全球範圍內數十萬的頂級數據科學家,同時也是檢測我們機器學習技能的最佳平台。
一、Kaggle簡介
Kaggle成立於2010年,網址:https://www.kaggle.com/。
Kaggle是全球範圍內最大的數據眾包平台。
企業或者研究者與Kaggle合作之後,可以將數據、問題描述、期望的指標發布到Kaggle上,以競賽的形式向廣大的數據科學家徵集解決方案,類似於KDD-CUP(國際知識發現和數據挖掘競賽)。
Kaggle上的參賽者將數據下載下來,分析數據,然後運用機器學習、數據挖掘等知識,建立演算法模型,解決問題得出結果,最後將結果提交,如果提交的結果符合指標要求並且在參賽者中排名第一,將獲得比賽豐厚的獎金。
二、參加Kaggle比賽的基本流程
1.選擇一個比賽項目
2.加入競賽,理解項目需求「Competition Details」
3.下載數據,訓練模型,得出結果「Get the Data」
4.提交結果「Make a submission」
三、解題思路
「模仿是最好的學習方式!」
這裡為大家推薦幾篇非常好的文章,裡面手把手的教了大家入門級的三個經典練習項目,供大家學習。
1.Titanic(泰坦尼克之災)中文教程: 邏輯回歸應用之Kaggle泰坦尼克之災
英文教程:An Interactive Data Science Tutorial2.House Prices: Advanced Regression Techniques(房價預測)
中文教程:Kaggle競賽 — 2017年房價預測英文教程:How to get to TOP 25% with Simple Model using sklearn3.Digital Recognition(數字識別)
中文教程:大數據競賽平台—Kaggle 入門英文教程:Interactive Intro to Dimensionality Reduction系列文章:
Kaggle入門系列:(一)機器學習環境搭建
Kaggle入門系列:(二)kaggle簡介
Kaggle入門系列:(三)Titanic初試身手
歡迎關注微信公眾號:kaggle數據分析!
推薦閱讀:
※遺憾未進前10%, Kaggle&Quora競賽賽後總結
※Kaggle 入門 1.1——A Journey through Titanic
※【持續更新】機器學習特徵工程實用技巧大全
※深度學習入門:Tensorflow實戰Digit Recognizer(一)