本次項目主要圍繞Kaggle上的比賽題目: "給出泰坦尼克號上的乘客的信息, 預測乘客是否幸存" 進行數據分析 環境 win8, python3.7, jupyter notebook 目錄 1. 項目背景 2. 數據概覽 3. 特征分析 4. 特征工程 5. 構建模型 正文 ...
現有數據維度:PassengerId survival 生存 No, Yespclass 票類 社會經濟地位, Upper, Middle, Lowersex 性別 Age 年齡 sibsp 兄弟姐妹 配偶在泰坦尼克號上 parch 父母 孩子在泰坦尼克號上 ticket 票號fare 客運票價 cabin 艙位數量embarked 始發港 C Cherbourg, Q Queenstown, S ...
2017-07-24 17:30 0 1739 推薦指數:
本次項目主要圍繞Kaggle上的比賽題目: "給出泰坦尼克號上的乘客的信息, 預測乘客是否幸存" 進行數據分析 環境 win8, python3.7, jupyter notebook 目錄 1. 項目背景 2. 數據概覽 3. 特征分析 4. 特征工程 5. 構建模型 正文 ...
項目目標 泰坦尼克號的沉沒是歷史上最著名的還難事件之一,在船上的2224名乘客和機組人員中,共造成1502人死亡。本次項目的目標是運用機器學習工具來預測哪些乘客能夠幸免於難。 項目過程 導入並探索數據 處理缺失值,刪除與預測無關的特征 將分類變量轉換為數值型變量 實例化 ...
前言 這個是Kaggle比賽中泰坦尼克號生存率的分析。強烈建議在做這個比賽的時候,再看一遍電源《泰坦尼克號》,可能會給你一些啟發,比如婦女兒童先上船等。所以是否獲救其實並非隨機,而是基於一些背景有先后順序的。 1,背景介紹 1912年4月15日,載着1316號乘客和891名船員的豪華 ...
此文發表在簡書,復制過來,在下方放上鏈接。 https://www.jianshu.com/p/a09b4dc904c9 泰坦尼克號生存預測 1.背景與挖掘目標 “泰坦尼克號”的沉沒是歷史上最臭名昭著的海難之一。1912年4月15日,泰坦尼克號在處女航中與冰山相撞后沉沒,2224名乘客 ...
使用python3 學習了決策樹分類器的api 涉及到 特征的提取,數據類型保留,分類類型抽取出來新的類型 需要網上下載數據集,我把他們下載到了本地, 可以到我的git下載代碼和數據 ...
Kaggle 是一個流行的數據科學競賽平台 一、機器學習的基本步驟 二、提出問題 什么樣的人更容易生存? 三、理解數據 3.1數據來源 https://www.k ...
python3 學習使用隨機森林分類器 梯度提升決策樹分類 的api,並將他們和單一決策樹預測結果做出對比 附上我的git,歡迎大家來參考我其他分類器的代碼: https://github.com/linyi0604/MachineLearning ...