...
數據中標簽的含義: PassengerId gt 乘客ID Pclass gt 乘客等級 等艙位 Name gt 乘客姓名 Sex gt 性別 Age gt 年齡 SibSp gt 堂兄弟 妹個數 Parch gt 父母與小孩個數 Ticket gt 船票信息 Fare gt 票價 Cabin gt 客艙 Embarked gt 登船港口 將數據進行描述讀取 發現Age中有缺失值,使用平均值填補缺 ...
2019-10-19 20:53 0 296 推薦指數:
...
一、任務基礎 泰坦尼克號沉沒是歷史上最著名的沉船事故之一。1912年4月15日,在她的處女航中,泰坦尼克號在與冰山相撞后沉沒,在2224名乘客和機組人員中造成1502人死亡。這場聳人聽聞的悲劇震驚了國際社會,並為船舶制定了更好的安全規定。造成海難失事的原因之一是乘客和機組人員沒有足夠的救生艇 ...
數據集下載地址: https://github.com/fayduan/Kaggle_Titanic/blob/master/train.csv 視頻地址: http:// ...
四、特征重要性衡量 通過上面可以發現准確率有小幅提升,但是似乎得到的結果還是不太理想。我們可以發現模型似乎優化的差不多了,使用的特征似乎也已經使用完了。准確率已經達到了瓶頸,但是如果我們還想提高精度 ...
本次項目主要圍繞Kaggle上的比賽題目: "給出泰坦尼克號上的乘客的信息, 預測乘客是否幸存" 進行數據分析 環境 win8, python3.7, jupyter notebook 目錄 1. 項目背景 2. 數據概覽 3. 特征分析 4. 特征工程 5. 構建模型 正文 ...
也不知道對不對,就憑着自己的思路寫了一個 數據集:https://www.kaggle.com/c/titanic/data 效果一般吧,不過至少出來了,hiahiahia ...
前言 這個是Kaggle比賽中泰坦尼克號生存率的分析。強烈建議在做這個比賽的時候,再看一遍電源《泰坦尼克號》,可能會給你一些啟發,比如婦女兒童先上船等。所以是否獲救其實並非隨機,而是基於一些背景有先后順序的。 1,背景介紹 1912年4月15日,載着1316號乘客和891名船員的豪華 ...