原文:动手数据分析-泰坦尼克案例(数据可视化)

回顾学习完第一章,我们对泰坦尼克号数据有了基本的了解,也学到了一些基本的统计方法,第二章中我们学习了数据的清理和重构,使得数据更加的易于理解 今天我们要学习的是第二章第三节:数据可视化,主要给大家介绍一下Python数据可视化库Matplotlib。 第二章:数据可视化 开始之前,导入numpy pandas以及matplotlib包和数据 思考 最基本的可视化图案有哪些 分别适用于那些场景 思考 ...

2021-06-21 22:37 0 320 推荐指数:

查看详情

数据分析-kaggle泰坦尼克号生存率分析

概述 1912年4月15日,泰坦尼克号在首次航行期间撞上冰山后沉没,2224名乘客和机组人员中有1502人遇难。沉船导致大量伤亡的原因之一是没有足够的救生艇给乘客和船员。虽然幸存下来有一些运气因素,但有一些人比其他人更有可能生存,比如妇女,儿童和上层阶级。在本文中将对哪些人 ...

Wed Apr 03 04:42:00 CST 2019 0 2332
数据分析入门】泰坦尼克号生存率预测(一)

数据加载 首先在Kaggle上找到对应的竞赛页面,报名参赛下载数据,可以得到了一个train.csv和test.csv文件。 当然,如果你的电脑上已经安装了kaggle的包,当然也可以使用命令行直接下载: 接着载入数据,可以选择使用相对路径或绝对路径,这里将使用绝对路径,将表头修改成中文 ...

Wed Aug 19 08:14:00 CST 2020 0 457
数据挖掘案例分析-泰坦尼克号数据

一、数据挖掘流程介绍   1.数据读取    -读取数据   -统计指标   -数据规模  2.数据探索(特征理解)   -单特征的分析,诸个变量分析对结果y的影响(x,y的相关性)    -多变量分析(x,y之间的相关性)    -统计绘图  3.数据清洗和预处理 ...

Tue Sep 24 21:22:00 CST 2019 0 954
python代写缺失值处理案例分析:泰坦尼克数据

缺失值处理 真实数据往往某些变量会有缺失值。 首先,我们用 info( ) 语句操作,看到整份数据的大概情况:   titanic_df.info() 从这份数据我们可以发现,这里一共有 891 行数据,所以在中间那一列数据中看到的不是 891 个数据的,都是有缺失值的。比如年龄Age ...

Tue Aug 07 00:19:00 CST 2018 0 2618
 
粤ICP备18138465号  © 2018-2025 CODEPRJ.COM