概述 1912年4月15日,泰坦尼克號在首次航行期間撞上冰山后沉沒,2224名乘客和機組人員中有1502人遇難。沉船導致大量傷亡的原因之一是沒有足夠的救生艇給乘客和船員。雖然幸存下來有一些運氣因素,但有一些人比其他人更有可能生存,比如婦女,兒童和上層階級。在本文中將對哪些人 ...
回顧學習完第一章,我們對泰坦尼克號數據有了基本的了解,也學到了一些基本的統計方法,第二章中我們學習了數據的清理和重構,使得數據更加的易於理解 今天我們要學習的是第二章第三節:數據可視化,主要給大家介紹一下Python數據可視化庫Matplotlib。 第二章:數據可視化 開始之前,導入numpy pandas以及matplotlib包和數據 思考 最基本的可視化圖案有哪些 分別適用於那些場景 思考 ...
2021-06-21 22:37 0 320 推薦指數:
概述 1912年4月15日,泰坦尼克號在首次航行期間撞上冰山后沉沒,2224名乘客和機組人員中有1502人遇難。沉船導致大量傷亡的原因之一是沒有足夠的救生艇給乘客和船員。雖然幸存下來有一些運氣因素,但有一些人比其他人更有可能生存,比如婦女,兒童和上層階級。在本文中將對哪些人 ...
數據加載 首先在Kaggle上找到對應的競賽頁面,報名參賽下載數據,可以得到了一個train.csv和test.csv文件。 當然,如果你的電腦上已經安裝了kaggle的包,當然也可以使用命令行直接下載: 接着載入數據,可以選擇使用相對路徑或絕對路徑,這里將使用絕對路徑,將表頭修改成中文 ...
課程設計項目名稱: 數據分析與可視化 ...
一、數據挖掘流程介紹 1.數據讀取 -讀取數據 -統計指標 -數據規模 2.數據探索(特征理解) -單特征的分析,諸個變量分析對結果y的影響(x,y的相關性) -多變量分析(x,y之間的相關性) -統計繪圖 3.數據清洗和預處理 ...
缺失值處理 真實數據往往某些變量會有缺失值。 首先,我們用 info( ) 語句操作,看到整份數據的大概情況: titanic_df.info() 從這份數據我們可以發現,這里一共有 891 行數據,所以在中間那一列數據中看到的不是 891 個數據的,都是有缺失值的。比如年齡Age ...
1.工具介紹 本次案例需要的工具(包括但不限於):vscode(代碼編輯器),node.js(各類插件下載工具),china.js,echarts.min.js,juquery.min.js等(JavaScript相關的.js官方插件) 涉及到的語言等技術:html5+css+JavaScript ...
審查中用於讀取,管理,分析和顯示數據的軟件包。運行以下行以安裝和加載所需的包。 if (!requi ...