一、前言 雖然一直算IT男,但是基本沒有接觸過最前沿的IT知識,一直在做生產方面的IT,突發奇想,開始學習算法,學習算法有半年多了,從最初的Python,到線性回歸、邏輯回歸、SVM,聚類,NL ...
一.材料准備 https: www.kaggle.com c titanic gettingStarted 二.提出問題 生存率和哪些因素有關 性別,年齡,是否有伴侶,票價,艙位等級,包間,出發地點 .乘客的年齡和票價的分布 .樣本生存的幾率是多少 .乘客的性別比例 .乘客的艙位分布 .性別和生還有沒有關系 .艙位等級和生還有沒有關系 .年齡和生還有沒有關系 .出發地點和生存率有沒有關系 .票價和 ...
2017-10-17 16:53 0 1394 推薦指數:
一、前言 雖然一直算IT男,但是基本沒有接觸過最前沿的IT知識,一直在做生產方面的IT,突發奇想,開始學習算法,學習算法有半年多了,從最初的Python,到線性回歸、邏輯回歸、SVM,聚類,NL ...
1. 引入所有需要的包 2. 讀入數據源 3. 分析數據 總結:所有的數據中一共包括12個變量,其中7個是數值變量,5個是屬性變量 PassengerId(忽略):這是乘客的編號,顯然對乘客是否幸存完全沒有任何作用 ...
Titanic是kaggle上的一道just for fun的題,沒有獎金,但是數據整潔,拿來練手最好不過啦。 這道題給的數據是泰坦尼克號上的乘客的信息,預測乘客是否幸存。這是個二元分類的機器學習問題,但是由於數據樣本相對較少,在當時慌亂的情況下幸存者有一定的隨機性,還是有一定挑戰的。https ...
數據分析的概念 什么是數據分析 就是從現有的數據中挖掘出價值 數據分析應用領域 商品推薦 eg:在淘寶上搜索了一款產品之后,接下來就會瘋狂給你推薦相關產品 量化交易 股票,期貨等數據分析 短視頻推送 抖音,今日頭條等短視頻 (數據分析 ...
百度搜索大數據,就會發現這是一個日均搜索達到4000K的熱詞,在頭條上也是如此,只增不降。  第三章:Numpy 01 Numpy → B站視頻鏈接(p4-p9) 第四章:Pandas 01 Pandas → B站視頻鏈接 ...
概要 數據分析的概念 數據分析三劍客簡介 ipython模塊 jupyter模塊 Anaconda軟件使用 詳細 數據分析的概念 數據分析就是從現有的數據中挖掘出需要的價值。 數據分析應用領域 1、商品推薦:在淘寶等電商平台 ...