Kaggle 是一個流行的數據科學競賽平台 一、機器學習的基本步驟 二、提出問題 什么樣的人更容易生存? 三、理解數據 3.1數據來源 https://www.kaggle.com/c/titanic 分為 訓練集:train.csv,891條數據 測試 ...
此文發表在簡書,復制過來,在下方放上鏈接。 https: www.jianshu.com p a b dc c 泰坦尼克號生存預測 .背景與挖掘目標 泰坦尼克號 的沉沒是歷史上最臭名昭著的海難之一。 年 月 日,泰坦尼克號在處女航中與冰山相撞后沉沒, 名乘客和機組人員中有 人死亡。這場聳人聽聞的悲劇震驚了國際社會,並導致了更好的船舶安全條例。 造成沉船事故的原因之一是沒有足夠的救生艇供乘客和機組人 ...
2019-10-09 22:51 0 562 推薦指數:
Kaggle 是一個流行的數據科學競賽平台 一、機器學習的基本步驟 二、提出問題 什么樣的人更容易生存? 三、理解數據 3.1數據來源 https://www.kaggle.com/c/titanic 分為 訓練集:train.csv,891條數據 測試 ...
數據加載 首先在Kaggle上找到對應的競賽頁面,報名參賽下載數據,可以得到了一個train.csv和test.csv文件。 當然,如果你的電腦上已經安裝了kaggle的包,當然也可以使用命令行直 ...
本次項目主要圍繞Kaggle上的比賽題目: "給出泰坦尼克號上的乘客的信息, 預測乘客是否幸存" 進行數據分析 環境 win8, python3.7, jupyter notebook 目錄 1. 項目背景 2. 數據概覽 3. 特征分析 4. 特征工程 5. 構建模型 正文 ...
大神經驗: 1、 應用機器學習,千萬不要一上來就試圖做到完美,先擼一個baseline的model出來,再進行后續的分析步驟,一步步提高,所謂后續步驟可能包括『分析model現在的狀態(欠/過擬合),分析我們使用的feature的作用大小,進行feature selection,以及我們模型下 ...
前言 前些天學習了一下決策樹算法(ID3、C4.5、cart算法),今天實際練習一下。 數據集、測試集地址: https://github.com/cystanford/Titanic_Data ...
假期閑着無聊,做了一下Kaggle練手的項目--預測泰坦尼克號乘客的存活情況。對於一些函數和算法,剛開始也是懵懵懂懂的,但通過自己查資料,還是明白了許多。然后就是自己寫的時候還看了下別人的做法,特別是國外的文章,寫得很詳細,邏輯特別清晰,還把不同算法的結果給你列出來,最后選擇了最優算法。好佩服 ...
1.實驗背景 本次實驗是Kaggle上的一個入門比賽——Titanic: Machine Learning from Disaster。比賽選擇了泰坦尼克號海難作為背景,並提供了樣本數據及測試數據,要求我們根據樣本數據內容建立一個預測模型,對於測試數據中每個人是否獲救做個預測。樣本數據包括891 ...