原文:Kaggle入門Titanic——特征工程

,介紹 Titanic: Machine Learning from Disaster是kaggle比賽的入門訓練,具體介紹可以看鏈接,數據在官網上下載,但需要注冊登錄。訓練集在train.csv中,測試集在test.csv。這里對特征的處理主要是來自Sina的Titanic best working Classifier。 首先對訓練集的信息進行了解,從中可以看出訓練集有 個樣本, 個特征,分 ...

2017-03-10 20:11 0 3063 推薦指數:

查看詳情

kaggle入門2——改進特征

1:改進我們的特征 在上一個任務中,我們完成了我們在Kaggle上一個機器學習比賽的第一個比賽提交泰坦尼克號:災難中的機器學習。 可是我們提交的分數並不是非常高。有三種主要的方法可以讓我們能夠提高他: 用一個更好的機器學習算法; 生成更好的特征; 合並多重機器學習算法 ...

Thu Jul 28 17:37:00 CST 2016 0 2089
Kaggle Titanic補充篇

1個,用最高頻率值填充 特征工程:由於Fare分布非常不均,所以這里不用cut函數,而是 ...

Mon Oct 02 05:57:00 CST 2017 0 1592
kaggle Titanic心得

Titanickaggle上一個練手的比賽,kaggle平台提供一部分人的特征,以及是否遇難,目的是預測另一部分人是否遇難。目前抽工作之余,斷斷續續弄了點,成績為0.79426。在這個比賽過程中,接觸並了解了一些數據挖掘比賽的基本流程,現記錄一下。 1. 分析數據 ...

Wed May 31 00:08:00 CST 2017 4 1258
kaggle數據挖掘競賽初步--Titanic<隨機森林&特征重要性>

完整代碼: https://github.com/cindycindyhi/kaggle-Titanic 特征工程系列: Titanic系列之原始數據分析和數據處理 Titanic系列之數據變換 Titanic系列之派生屬性&維歸約 之前的三篇博文已經進行了一次還算完整的特征工程 ...

Tue Mar 24 00:13:00 CST 2015 4 10996
Titanic幸存預測分析(Kaggle)

分享一篇kaggle入門級案例,泰坦尼克號幸存遇難分析。 參考文章: 技術世界,原文鏈接 http://www.jasongj.com/ml/classification/ 案例分析內容: 通過訓練集分析預測什么人可能生還,並對測試集中乘客做出預測判斷 ...

Sun Dec 24 05:29:00 CST 2017 0 2043
Kaggle實戰之Titanic: Machine Learning from Disaster

最近埋頭苦讀,啃機器學習的算法和編程,真是非(xiang)常(dang)歡(lan)樂(sou)呢~ 於是開始自我膨脹躍躍欲試。 嗯,那就從Kaggle的playground開始吧,找了個經典而又浪漫的愛情故事—泰坦尼克,應該能引起我的興趣好好挖掘吧~ "You jump! I jump ...

Fri Dec 07 00:42:00 CST 2018 0 1036
我的第一個 Kaggle 比賽學習 - Titanic

背景 Titanic: Machine Learning from Disaster - Kaggle 2 年前就被推薦照着這個比賽做一下,結果我打開這個頁面便蒙了,完全不知道該如何下手。 兩年后,再次打開這個頁面,看到清清楚楚的Titanic Tutorial - Kaggle,完全傻瓜式 ...

Sat Jan 25 21:30:00 CST 2020 0 286
Kaggle入門

Kaggle入門 1:競賽 我們將學習如何為Kaggle競賽生成一個提交答案(submisson)。Kaggle是一個你通過完成算法和全世界機器學習從業者進行競賽的網站。如果你的算法精度是給出數據集中最高的,你將贏得比賽。Kaggle也是一個實踐你機器學習技能的非常有趣的方式 ...

Sun Jul 31 05:43:00 CST 2016 0 3030
 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM