Kaggle 是一個流行的數據科學競賽平台 一、機器學習的基本步驟 二、提出問題 什么樣的人更容易生存? 三、理解數據 3.1數據來源 https://www.kaggle.com/c/titanic 分為 訓練集:train.csv,891條數據 測試 ...
也不知道對不對,就憑着自己的思路寫了一個 數據集:https: www.kaggle.com c titanic data 效果一般吧,不過至少出來了,hiahiahia ...
2018-12-14 16:41 0 1088 推薦指數:
Kaggle 是一個流行的數據科學競賽平台 一、機器學習的基本步驟 二、提出問題 什么樣的人更容易生存? 三、理解數據 3.1數據來源 https://www.kaggle.com/c/titanic 分為 訓練集:train.csv,891條數據 測試 ...
數據分析練手項目: 開源項目《動手學數據分析》:https://github.com/datawhalechina/hands-on-data-analysis DCIC 2020算法分析 ...
此文發表在簡書,復制過來,在下方放上鏈接。 https://www.jianshu.com/p/a09b4dc904c9 泰坦尼克號生存預測 1.背景與挖掘目標 “泰坦尼克號”的沉沒是歷史上最臭名昭著的海難之一。1912年4月15日,泰坦尼克號在處女航中與冰山相撞后沉沒,2224名乘客 ...
前言 這個是Kaggle比賽中泰坦尼克號生存率的分析。強烈建議在做這個比賽的時候,再看一遍電源《泰坦尼克號》,可能會給你一些啟發,比如婦女兒童先上船等。所以是否獲救其實並非隨機,而是基於一些背景有先后順序的。 1,背景介紹 1912年4月15日,載着1316號乘客和891名船員的豪華 ...
數據中標簽的含義: PassengerId => 乘客ID Pclass => 乘客等級(1/2/3等艙位) Name => 乘客姓名 Sex => 性別 ...
概述 1912年4月15日,泰坦尼克號在首次航行期間撞上冰山后沉沒,2224名乘客和機組人員中有1502人遇難。沉船導致大量傷亡的原因之一是沒有足夠的救生艇給乘客和船員。雖然幸存下來有一些運氣因素,但有一些人比其他人更有可能生存,比如婦女,兒童和上層階級。在本文中將對哪些人 ...
1、數據來源 (1)數據來源 來自kaggle的數據集Titanic:Titanic: Machine Learning from Disaster train文檔數據是用來分析和建模,包含有生存情況信息;test數據是用來最終預測其生存情況並生成結果文件。 2、分析流程 (1)不同變量 ...
前言 前些天學習了一下決策樹算法(ID3、C4.5、cart算法),今天實際練習一下。 數據集、測試集地址: https://github.com/cystanford/Titanic_Data ...