假期閑着無聊,做了一下Kaggle練手的項目--預測泰坦尼克號乘客的存活情況。對於一些函數和算法,剛開始也是懵懵懂懂的,但通過自己查資料,還是明白了許多。然后就是自己寫的時候還看了下別人的做法,特別是國外的文章,寫得很詳細,邏輯特別清晰,還把不同算法的結果給你列出來,最后選擇了最優算法。好佩服 ...
.實驗背景 本次實驗是Kaggle上的一個入門比賽 Titanic: Machine Learning from Disaster。比賽選擇了泰坦尼克號海難作為背景,並提供了樣本數據及測試數據,要求我們根據樣本數據內容建立一個預測模型,對於測試數據中每個人是否獲救做個預測。樣本數據包括 條乘客信息及獲救情況,測試數據有 條乘客信息。樣本數據的樣例如下: Passenger:乘客唯一識別id Su ...
2018-09-24 14:05 0 2816 推薦指數:
假期閑着無聊,做了一下Kaggle練手的項目--預測泰坦尼克號乘客的存活情況。對於一些函數和算法,剛開始也是懵懵懂懂的,但通過自己查資料,還是明白了許多。然后就是自己寫的時候還看了下別人的做法,特別是國外的文章,寫得很詳細,邏輯特別清晰,還把不同算法的結果給你列出來,最后選擇了最優算法。好佩服 ...
titanic_forest() 隨機森林找到最優方案/模型,確定最優參數等等 ...
sklearn實戰-乳腺癌細胞數據挖掘(博主親自錄制視頻) https://study.163.com/course/introduction.htm?courseId=1005269003& ...
一、任務基礎 泰坦尼克號沉沒是歷史上最著名的沉船事故之一。1912年4月15日,在她的處女航中,泰坦尼克號在與冰山相撞后沉沒,在2224名乘客和機組人員中造成1502人死亡。這場聳人聽聞的悲劇震驚了國際社會,並為船舶制定了更好的安全規定。造成海難失事的原因之一是乘客和機組人員沒有足夠的救生艇 ...
數據集下載地址: https://github.com/fayduan/Kaggle_Titanic/blob/master/train.csv 視頻地址: http:// ...
四、特征重要性衡量 通過上面可以發現准確率有小幅提升,但是似乎得到的結果還是不太理想。我們可以發現模型似乎優化的差不多了,使用的特征似乎也已經使用完了。准確率已經達到了瓶頸,但是如果我們還想提高精度 ...
此文發表在簡書,復制過來,在下方放上鏈接。 https://www.jianshu.com/p/a09b4dc904c9 泰坦尼克號生存預測 1.背景與挖掘目標 “泰坦尼克號”的沉沒是歷史上最臭名昭著的海難之一。1912年4月15日,泰坦尼克號在處女航中與冰山相撞后沉沒,2224名乘客 ...
Kaggle 是一個流行的數據科學競賽平台 一、機器學習的基本步驟 二、提出問題 什么樣的人更容易生存? 三、理解數據 3.1數據來源 https://www.kaggle.com/c/titanic 分為 訓練集:train.csv,891條數據 測試 ...