原文:量化投資學習筆記19——回歸分析:實操,泰坦尼克號乘客生還機會預測,線性回歸方法。

用kaggle上的泰坦尼克的數據來實操。 https: www.kaggle.com c titanic overview 在主頁上下載了數據。 任務:使用泰坦尼克號乘客數據建立機器學習模型,來預測乘客在海難中是否生存。 在實際海難中, 位乘客中有 位遇難了。似乎有的乘客比其它乘客更有機會獲救。本任務的目的就是找出哪類人更容易獲救。 數據集有兩個,一個是訓練數據集 train.csv ,另一個是測 ...

2020-02-21 19:23 0 769 推薦指數:

查看詳情

Kaggle入門——泰坦尼克號生還預測

前言   這個是Kaggle比賽中泰坦尼克號生存率的分析。強烈建議在做這個比賽的時候,再看一遍電源《泰坦尼克號》,可能會給你一些啟發,比如婦女兒童先上船等。所以是否獲救其實並非隨機,而是基於一些背景有先后順序的。 1,背景介紹   1912年4月15日,載着1316乘客和891名船員的豪華 ...

Wed Apr 22 19:42:00 CST 2020 0 2640
機器學習——用邏輯回歸及隨機森林實現泰坦尼克號的生存預測

1.實驗背景 本次實驗是Kaggle上的一個入門比賽——Titanic: Machine Learning from Disaster。比賽選擇了泰坦尼克號海難作為背景,並提供了樣本數據及測試數據,要求我們根據樣本數據內容建立一個預測模型,對於測試數據中每個人是否獲救做個預測。樣本數據包括891 ...

Mon Sep 24 22:05:00 CST 2018 0 2816
泰坦尼克號生存預測分析

此文發表在簡書,復制過來,在下方放上鏈接。 https://www.jianshu.com/p/a09b4dc904c9 泰坦尼克號生存預測 1.背景與挖掘目標 “泰坦尼克號”的沉沒是歷史上最臭名昭著的海難之一。1912年4月15日,泰坦尼克號在處女航中與冰山相撞后沉沒,2224名乘客 ...

Thu Oct 10 06:51:00 CST 2019 0 562
泰坦尼克號幸存預測

本次項目主要圍繞Kaggle上的比賽題目: "給出泰坦尼克號上的乘客的信息, 預測乘客是否幸存" 進行數據分析 環境 win8, python3.7, jupyter notebook 目錄 1. 項目背景 2. 數據概覽 3. 特征分析 4. 特征工程 5. 構建模型 正文 ...

Thu Oct 25 01:37:00 CST 2018 2 5148
量化投資學習筆記15——回歸分析:一元線性回歸

變量之間的非確定性相關關系。 一般形式:y = f(x0,x1,x2,…xp)+ε 若為線性回歸,y = β0+β1x1+β2x2+…+βnxn+ε β0,β1等為回歸系數,ε為隨機誤差。 模型假設 ①零均值,ε均值為0 ②同方差,ε項方差為常數 ③無自相關性,ε項值之間無自相關性 ④正態分布 ...

Sat Feb 15 05:46:00 CST 2020 0 1042
用決策樹做泰坦尼克號乘客的生存預測

前言 前些天學習了一下決策樹算法(ID3、C4.5、cart算法),今天實際練習一下。 數據集、測試集地址: https://github.com/cystanford/Titanic_Data 原始數據: train.csv 是訓練數據集,包含特征信息和存活與否的標簽 ...

Thu Nov 14 06:53:00 CST 2019 0 897
決策樹算法6-案例:泰坦尼克號乘客生存預測

1 案例背景 泰坦尼克號沉沒是歷史上最臭名昭着的沉船之一。1912年4月15日,在她的處女航中,泰坦尼克號在與冰山相撞后沉沒,在2224名乘客和機組人員中造成1502人死亡。這場聳人聽聞的悲劇震驚了國際社會,並為船舶制定了更好的安全規定。 造成海難失事的原因之一是乘客和機組人員沒有足夠的救生艇 ...

Fri Sep 24 05:29:00 CST 2021 0 208
 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM