泰坦尼克號獲救率數據分析報告,用數據揭露真相。 一,船上乘客生存率分析報告 泰坦尼克號生存率僅有38%的,可見此次事件救援不力,救生艇嚴重不足,且泰坦尼克號號撞得是冰山,海水冷,沒有救生艇,在水里凍死的乘客不少。 二,哪個年齡段存活率最高(青年人(18歲以下),中年人(18到50歲 ...
泰坦尼克號獲救率數據分析報告,用數據揭露真相。 一,船上乘客生存率分析報告 泰坦尼克號生存率僅有38%的,可見此次事件救援不力,救生艇嚴重不足,且泰坦尼克號號撞得是冰山,海水冷,沒有救生艇,在水里凍死的乘客不少。 二,哪個年齡段存活率最高(青年人(18歲以下),中年人(18到50歲 ...
一、任務基礎 泰坦尼克號沉沒是歷史上最著名的沉船事故之一。1912年4月15日,在她的處女航中,泰坦尼克號在與冰山相撞后沉沒,在2224名乘客和機組人員中造成1502人死亡。這場聳人聽聞的悲劇震驚了國際社會,並為船舶制定了更好的安全規定。造成海難失事的原因之一是乘客和機組人員沒有足夠的救生艇 ...
數據集下載地址: https://github.com/fayduan/Kaggle_Titanic/blob/master/train.csv 視頻地址: http:// ...
四、特征重要性衡量 通過上面可以發現准確率有小幅提升,但是似乎得到的結果還是不太理想。我們可以發現模型似乎優化的差不多了,使用的特征似乎也已經使用完了。准確率已經達到了瓶頸,但是如果我們還想提高精度 ...
學習了機器學習這么久,第一次真正用機器學習中的方法解決一個實際問題,一步步探索,雖然最后結果不是很准確,僅僅達到了0.78647,但是真是收獲很多,為了防止以后我的記憶蟲上腦,我決定還是記錄下來好了。 1,看到樣本是,查看樣本的分布和統計情況 通常遇到缺值的情況,我們會有幾種常見 ...
大神經驗: 1、 應用機器學習,千萬不要一上來就試圖做到完美,先擼一個baseline的model出來,再進行后續的分析步驟,一步步提高,所謂后續步驟可能包括『分析model現在的狀態(欠/過擬合 ...
本次項目主要圍繞Kaggle上的比賽題目: "給出泰坦尼克號上的乘客的信息, 預測乘客是否幸存" 進行數據分析 環境 win8, python3.7, jupyter notebook 目錄 1. 項目背景 2. 數據概覽 3. 特征分析 4. 特征工程 5. 構建模型 正文 ...