1:改進我們的特征 在上一個任務中,我們完成了我們在Kaggle上一個機器學習比賽的第一個比賽提交泰坦尼克號:災難中的機器學習。 可是我們提交的分數並不是非常高。有三種主要的方法可以讓我們能夠提高他: 用一個更好的機器學習算法; 生成更好的特征; 合並多重機器學習算法 ...
,介紹 Titanic: Machine Learning from Disaster是kaggle比賽的入門訓練,具體介紹可以看鏈接,數據在官網上下載,但需要注冊登錄。訓練集在train.csv中,測試集在test.csv。這里對特征的處理主要是來自Sina的Titanic best working Classifier。 首先對訓練集的信息進行了解,從中可以看出訓練集有 個樣本, 個特征,分 ...
2017-03-10 20:11 0 3063 推薦指數:
1:改進我們的特征 在上一個任務中,我們完成了我們在Kaggle上一個機器學習比賽的第一個比賽提交泰坦尼克號:災難中的機器學習。 可是我們提交的分數並不是非常高。有三種主要的方法可以讓我們能夠提高他: 用一個更好的機器學習算法; 生成更好的特征; 合並多重機器學習算法 ...
1個,用最高頻率值填充 特征工程:由於Fare分布非常不均,所以這里不用cut函數,而是 ...
Titanic是kaggle上一個練手的比賽,kaggle平台提供一部分人的特征,以及是否遇難,目的是預測另一部分人是否遇難。目前抽工作之余,斷斷續續弄了點,成績為0.79426。在這個比賽過程中,接觸並了解了一些數據挖掘比賽的基本流程,現記錄一下。 1. 分析數據 ...
完整代碼: https://github.com/cindycindyhi/kaggle-Titanic 特征工程系列: Titanic系列之原始數據分析和數據處理 Titanic系列之數據變換 Titanic系列之派生屬性&維歸約 之前的三篇博文已經進行了一次還算完整的特征工程 ...
分享一篇kaggle入門級案例,泰坦尼克號幸存遇難分析。 參考文章: 技術世界,原文鏈接 http://www.jasongj.com/ml/classification/ 案例分析內容: 通過訓練集分析預測什么人可能生還,並對測試集中乘客做出預測判斷 ...
最近埋頭苦讀,啃機器學習的算法和編程,真是非(xiang)常(dang)歡(lan)樂(sou)呢~ 於是開始自我膨脹躍躍欲試。 嗯,那就從Kaggle的playground開始吧,找了個經典而又浪漫的愛情故事—泰坦尼克,應該能引起我的興趣好好挖掘吧~ "You jump! I jump ...
背景 Titanic: Machine Learning from Disaster - Kaggle 2 年前就被推薦照着這個比賽做一下,結果我打開這個頁面便蒙了,完全不知道該如何下手。 兩年后,再次打開這個頁面,看到清清楚楚的Titanic Tutorial - Kaggle,完全傻瓜式 ...
Kaggle入門 1:競賽 我們將學習如何為Kaggle競賽生成一個提交答案(submisson)。Kaggle是一個你通過完成算法和全世界機器學習從業者進行競賽的網站。如果你的算法精度是給出數據集中最高的,你將贏得比賽。Kaggle也是一個實踐你機器學習技能的非常有趣的方式 ...