原文:用決策樹做泰坦尼克號乘客的生存預測

前言 前些天學習了一下決策樹算法 ID C . cart算法 ,今天實際練習一下。 數據集 測試集地址: https: github.com cystanford Titanic Data 原始數據: train.csv 是訓練數據集,包含特征信息和存活與否的標簽 test.csv: 測試數據集,只包含特征信息。 我們需要做的,就是使用訓練集的數據,構建決策樹,然后對測試集數據進行預測。 訓練集中 ...

2019-11-13 22:53 0 897 推薦指數:

查看詳情

決策樹算法6-案例:泰坦尼克號乘客生存預測

1 案例背景 泰坦尼克號沉沒是歷史上最臭名昭着的沉船之一。1912年4月15日,在她的處女航中,泰坦尼克號在與冰山相撞后沉沒,在2224名乘客和機組人員中造成1502人死亡。這場聳人聽聞的悲劇震驚了國際社會,並為船舶制定了更好的安全規定。 造成海難失事的原因之一是乘客和機組人員沒有足夠的救生艇 ...

Fri Sep 24 05:29:00 CST 2021 0 208
決策樹泰坦尼克號實戰

決策樹分類的應用場景非常廣泛,在各行各業都有應用,比如在金融行業可以用決策樹貸款風險評估,醫療行業可以用決策樹生成輔助診斷,電商行業可以用決策樹對銷售額進行預測等。 基於決策樹還誕生了很多數據挖掘算法,比如隨機森林(Random forest)。 sklearn 中的決策樹模型 到目前為止 ...

Mon Apr 08 04:03:00 CST 2019 0 841
決策樹泰坦尼克號幸存者預測項目

項目目標 泰坦尼克號的沉沒是歷史上最著名的還難事件之一,在船上的2224名乘客和機組人員中,共造成1502人死亡。本次項目的目標是運用機器學習工具來預測哪些乘客能夠幸免於難。 項目過程 導入並探索數據 處理缺失值,刪除與預測無關的特征 將分類變量轉換為數值型變量 實例化 ...

Sun Feb 21 22:24:00 CST 2021 0 418
Kaggle泰坦尼克號生存情況預測

Kaggle 是一個流行的數據科學競賽平台 一、機器學習的基本步驟 二、提出問題 什么樣的人更容易生存? 三、理解數據 3.1數據來源 https://www.kaggle.com/c/titanic 分為 訓練集:train.csv,891條數據 測試 ...

Thu Dec 26 07:08:00 CST 2019 0 568
泰坦尼克號生存預測分析

此文發表在簡書,復制過來,在下方放上鏈接。 https://www.jianshu.com/p/a09b4dc904c9 泰坦尼克號生存預測 1.背景與挖掘目標 “泰坦尼克號”的沉沒是歷史上最臭名昭著的海難之一。1912年4月15日,泰坦尼克號在處女航中與冰山相撞后沉沒,2224名乘客 ...

Thu Oct 10 06:51:00 CST 2019 0 562
泰坦尼克號幸存預測

本次項目主要圍繞Kaggle上的比賽題目: "給出泰坦尼克號上的乘客的信息, 預測乘客是否幸存" 進行數據分析 環境 win8, python3.7, jupyter notebook 目錄 1. 項目背景 2. 數據概覽 3. 特征分析 4. 特征工程 5. 構建模型 正文 ...

Thu Oct 25 01:37:00 CST 2018 2 5148
用Python隨機森林預測泰坦尼克號生存情況

假期閑着無聊,做了一下Kaggle練手的項目--預測泰坦尼克號乘客的存活情況。對於一些函數和算法,剛開始也是懵懵懂懂的,但通過自己查資料,還是明白了許多。然后就是自己寫的時候還看了下別人的做法,特別是國外的文章,寫得很詳細,邏輯特別清晰,還把不同算法的結果給你列出來,最后選擇了最優算法。好佩服 ...

Sat Apr 07 12:00:00 CST 2018 0 8334
 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM