原文:量化投资学习笔记19——回归分析:实操,泰坦尼克号乘客生还机会预测,线性回归方法。

用kaggle上的泰坦尼克的数据来实操。 https: www.kaggle.com c titanic overview 在主页上下载了数据。 任务:使用泰坦尼克号乘客数据建立机器学习模型,来预测乘客在海难中是否生存。 在实际海难中, 位乘客中有 位遇难了。似乎有的乘客比其它乘客更有机会获救。本任务的目的就是找出哪类人更容易获救。 数据集有两个,一个是训练数据集 train.csv ,另一个是测 ...

2020-02-21 19:23 0 769 推荐指数:

查看详情

Kaggle入门——泰坦尼克号生还预测

前言   这个是Kaggle比赛中泰坦尼克号生存率的分析。强烈建议在做这个比赛的时候,再看一遍电源《泰坦尼克号》,可能会给你一些启发,比如妇女儿童先上船等。所以是否获救其实并非随机,而是基于一些背景有先后顺序的。 1,背景介绍   1912年4月15日,载着1316乘客和891名船员的豪华 ...

Wed Apr 22 19:42:00 CST 2020 0 2640
机器学习——用逻辑回归及随机森林实现泰坦尼克号的生存预测

1.实验背景 本次实验是Kaggle上的一个入门比赛——Titanic: Machine Learning from Disaster。比赛选择了泰坦尼克号海难作为背景,并提供了样本数据及测试数据,要求我们根据样本数据内容建立一个预测模型,对于测试数据中每个人是否获救做个预测。样本数据包括891 ...

Mon Sep 24 22:05:00 CST 2018 0 2816
泰坦尼克号生存预测分析

此文发表在简书,复制过来,在下方放上链接。 https://www.jianshu.com/p/a09b4dc904c9 泰坦尼克号生存预测 1.背景与挖掘目标 “泰坦尼克号”的沉没是历史上最臭名昭著的海难之一。1912年4月15日,泰坦尼克号在处女航中与冰山相撞后沉没,2224名乘客 ...

Thu Oct 10 06:51:00 CST 2019 0 562
泰坦尼克号幸存预测

本次项目主要围绕Kaggle上的比赛题目: "给出泰坦尼克号上的乘客的信息, 预测乘客是否幸存" 进行数据分析 环境 win8, python3.7, jupyter notebook 目录 1. 项目背景 2. 数据概览 3. 特征分析 4. 特征工程 5. 构建模型 正文 ...

Thu Oct 25 01:37:00 CST 2018 2 5148
量化投资学习笔记15——回归分析:一元线性回归

变量之间的非确定性相关关系。 一般形式:y = f(x0,x1,x2,…xp)+ε 若为线性回归,y = β0+β1x1+β2x2+…+βnxn+ε β0,β1等为回归系数,ε为随机误差。 模型假设 ①零均值,ε均值为0 ②同方差,ε项方差为常数 ③无自相关性,ε项值之间无自相关性 ④正态分布 ...

Sat Feb 15 05:46:00 CST 2020 0 1042
用决策树做泰坦尼克号乘客的生存预测

前言 前些天学习了一下决策树算法(ID3、C4.5、cart算法),今天实际练习一下。 数据集、测试集地址: https://github.com/cystanford/Titanic_Data 原始数据: train.csv 是训练数据集,包含特征信息和存活与否的标签 ...

Thu Nov 14 06:53:00 CST 2019 0 897
决策树算法6-案例:泰坦尼克号乘客生存预测

1 案例背景 泰坦尼克号沉没是历史上最臭名昭着的沉船之一。1912年4月15日,在她的处女航中,泰坦尼克号在与冰山相撞后沉没,在2224名乘客和机组人员中造成1502人死亡。这场耸人听闻的悲剧震惊了国际社会,并为船舶制定了更好的安全规定。 造成海难失事的原因之一是乘客和机组人员没有足够的救生艇 ...

Fri Sep 24 05:29:00 CST 2021 0 208
 
粤ICP备18138465号  © 2018-2025 CODEPRJ.COM