原文:動手數據分析-泰坦尼克案例(數據可視化)

回顧學習完第一章,我們對泰坦尼克號數據有了基本的了解,也學到了一些基本的統計方法,第二章中我們學習了數據的清理和重構,使得數據更加的易於理解 今天我們要學習的是第二章第三節:數據可視化,主要給大家介紹一下Python數據可視化庫Matplotlib。 第二章:數據可視化 開始之前,導入numpy pandas以及matplotlib包和數據 思考 最基本的可視化圖案有哪些 分別適用於那些場景 思考 ...

2021-06-21 22:37 0 320 推薦指數:

查看詳情

數據分析-kaggle泰坦尼克號生存率分析

概述 1912年4月15日,泰坦尼克號在首次航行期間撞上冰山后沉沒,2224名乘客和機組人員中有1502人遇難。沉船導致大量傷亡的原因之一是沒有足夠的救生艇給乘客和船員。雖然幸存下來有一些運氣因素,但有一些人比其他人更有可能生存,比如婦女,兒童和上層階級。在本文中將對哪些人 ...

Wed Apr 03 04:42:00 CST 2019 0 2332
數據分析入門】泰坦尼克號生存率預測(一)

數據加載 首先在Kaggle上找到對應的競賽頁面,報名參賽下載數據,可以得到了一個train.csv和test.csv文件。 當然,如果你的電腦上已經安裝了kaggle的包,當然也可以使用命令行直接下載: 接着載入數據,可以選擇使用相對路徑或絕對路徑,這里將使用絕對路徑,將表頭修改成中文 ...

Wed Aug 19 08:14:00 CST 2020 0 457
數據挖掘案例分析-泰坦尼克號數據

一、數據挖掘流程介紹   1.數據讀取    -讀取數據   -統計指標   -數據規模  2.數據探索(特征理解)   -單特征的分析,諸個變量分析對結果y的影響(x,y的相關性)    -多變量分析(x,y之間的相關性)    -統計繪圖  3.數據清洗和預處理 ...

Tue Sep 24 21:22:00 CST 2019 0 954
python代寫缺失值處理案例分析:泰坦尼克數據

缺失值處理 真實數據往往某些變量會有缺失值。 首先,我們用 info( ) 語句操作,看到整份數據的大概情況:   titanic_df.info() 從這份數據我們可以發現,這里一共有 891 行數據,所以在中間那一列數據中看到的不是 891 個數據的,都是有缺失值的。比如年齡Age ...

Tue Aug 07 00:19:00 CST 2018 0 2618
 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM