原文:Titanic幸存預測分析(Kaggle)

分享一篇kaggle入門級案例,泰坦尼克號幸存遇難分析。 參考文章:技術世界,原文鏈接http: www.jasongj.com ml classification 案例分析內容: 通過訓練集分析預測什么人可能生還,並對測試集中乘客做出預測判斷 案例分析 加載包 加載文件 數據整理 統計幸存和遇難人數是否與艙位等級有關 可以看到,頭等艙的乘客獲救率是最高的,艙位等級越高,獲救幾率越大 計算艙位等級 ...

2017-12-23 21:29 0 2043 推薦指數:

查看詳情

kaggle-titanic 數據分析過程

1. 引入所有需要的包 2. 讀入數據源 3. 分析數據 總結:所有的數據中一共包括12個變量,其中7個是數值變量,5個是屬性變量 PassengerId(忽略):這是乘客的編號,顯然對乘客是否幸存完全沒有任何作用 ...

Thu Mar 01 21:02:00 CST 2018 0 1638
Kaggle Titanic補充篇

1.關於年齡Age 除了利用平均數來填充,還可以利用正態分布得到一些隨機數來填充,首先得到已知年齡的平均數mean和方差std,然后生成[ mean-std, mean+std ]之間的隨機數,然 ...

Mon Oct 02 05:57:00 CST 2017 0 1592
kaggle Titanic心得

Titanickaggle上一個練手的比賽,kaggle平台提供一部分人的特征,以及是否遇難,目的是預測另一部分人是否遇難。目前抽工作之余,斷斷續續弄了點,成績為0.79426。在這個比賽過程中,接觸並了解了一些數據挖掘比賽的基本流程,現記錄一下。 1. 分析數據 ...

Wed May 31 00:08:00 CST 2017 4 1258
kaggle預測

兩個預測kaggle比賽 一 .https://www.kaggle.com/c/web-traffic-time-series-forecasting/overview Arthur Suilin•(1st in this Competition)•a year ago•Options ...

Wed Sep 26 04:36:00 CST 2018 0 813
Kaggle入門Titanic——特征工程

1,介紹 Titanic: Machine Learning from Disaster是kaggle比賽的入門訓練,具體介紹可以看鏈接,數據在官網上下載,但需要注冊登錄。訓練集在train.csv中,測試集在test.csv。這里對特征的處理主要是來自Sina的Titanic best ...

Sat Mar 11 04:11:00 CST 2017 0 3063
kaggle數據挖掘競賽初步--Titanic<原始數據分析&缺失值處理>

Titanickaggle上的一道just for fun的題,沒有獎金,但是數據整潔,拿來練手最好不過啦。 這道題給的數據是泰坦尼克號上的乘客的信息,預測乘客是否幸存。這是個二元分類的機器學習問題,但是由於數據樣本相對較少,在當時慌亂的情況下幸存者有一定的隨機性,還是有一定挑戰的。https ...

Fri Mar 20 21:00:00 CST 2015 1 19721
Kaggle實戰之Titanic: Machine Learning from Disaster

最近埋頭苦讀,啃機器學習的算法和編程,真是非(xiang)常(dang)歡(lan)樂(sou)呢~ 於是開始自我膨脹躍躍欲試。 嗯,那就從Kaggle的playground開始吧,找了個經典而又浪漫的愛情故事—泰坦尼克,應該能引起我的興趣好好挖掘吧~ "You jump! I jump ...

Fri Dec 07 00:42:00 CST 2018 0 1036
 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM