原文:【數據分析入門】泰坦尼克號生存率預測(一)

數據加載 首先在Kaggle上找到對應的競賽頁面,報名參賽下載數據,可以得到了一個train.csv和test.csv文件。 當然,如果你的電腦上已經安裝了kaggle的包,當然也可以使用命令行直接下載: 接着載入數據,可以選擇使用相對路徑或絕對路徑,這里將使用絕對路徑,將表頭修改成中文,索引改為乘客的ID,便於觀察。 其中,chunksize是在對數據進行逐塊提取時使用的參數。之所以進行逐塊提取 ...

2020-08-19 00:14 0 457 推薦指數:

查看詳情

數據分析-kaggle泰坦尼克號生存率分析

概述 1912年4月15日,泰坦尼克號在首次航行期間撞上冰山后沉沒,2224名乘客和機組人員中有1502人遇難。沉船導致大量傷亡的原因之一是沒有足夠的救生艇給乘客和船員。雖然幸存下來有一些運氣因素,但有一些人比其他人更有可能生存,比如婦女,兒童和上層階級。在本文中將對哪些人 ...

Wed Apr 03 04:42:00 CST 2019 0 2332
泰坦尼克號生存預測分析

此文發表在簡書,復制過來,在下方放上鏈接。 https://www.jianshu.com/p/a09b4dc904c9 泰坦尼克號生存預測 1.背景與挖掘目標 “泰坦尼克號”的沉沒是歷史上最臭名昭著的海難之一。1912年4月15日,泰坦尼克號在處女航中與冰山相撞后沉沒,2224名乘客 ...

Thu Oct 10 06:51:00 CST 2019 0 562
Kaggle泰坦尼克號生存情況預測

Kaggle 是一個流行的數據科學競賽平台 一、機器學習的基本步驟 二、提出問題 什么樣的人更容易生存? 三、理解數據 3.1數據來源 https://www.kaggle.com/c/titanic 分為 訓練集:train.csv,891條數據 測試 ...

Thu Dec 26 07:08:00 CST 2019 0 568
Kaggle入門——泰坦尼克號生還者預測

前言   這個是Kaggle比賽中泰坦尼克號生存率分析。強烈建議在做這個比賽的時候,再看一遍電源《泰坦尼克號》,可能會給你一些啟發,比如婦女兒童先上船等。所以是否獲救其實並非隨機,而是基於一些背景有先后順序的。 1,背景介紹   1912年4月15日,載着1316乘客和891名船員的豪華 ...

Wed Apr 22 19:42:00 CST 2020 0 2640
泰坦尼克號幸存預測

本次項目主要圍繞Kaggle上的比賽題目: "給出泰坦尼克號上的乘客的信息, 預測乘客是否幸存" 進行數據分析 環境 win8, python3.7, jupyter notebook 目錄 1. 項目背景 2. 數據概覽 3. 特征分析 4. 特征工程 5. 構建模型 正文 ...

Thu Oct 25 01:37:00 CST 2018 2 5148
泰坦尼克號之災分析

大神經驗: 1、 應用機器學習,千萬不要一上來就試圖做到完美,先擼一個baseline的model出來,再進行后續的分析步驟,一步步提高,所謂后續步驟可能包括『分析model現在的狀態(欠/過擬合),分析我們使用的feature的作用大小,進行feature selection,以及我們模型下 ...

Sat Aug 18 19:41:00 CST 2018 1 1185
泰坦尼克號沉沒之謎,用數據還原真相——Titanic獲救分析(用pyecharts)

泰坦尼克號獲救數據分析報告,用數據揭露真相。 一,船上乘客生存率分析報告 泰坦尼克號生存率僅有38%的,可見此次事件救援不力,救生艇嚴重不足,且泰坦尼克號撞得是冰山,海水冷,沒有救生艇,在水里凍死的乘客不少。 二,哪個年齡段存活最高(青年人(18歲以下),中年人(18到50歲 ...

Sat Sep 22 19:56:00 CST 2018 1 3733
 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM