數據分析


數據分析的概念

 什么是數據分析

  就是從現有的數據中挖掘出價值

數據分析應用領域

  商品推薦

    eg:在淘寶上搜索了一款產品之后,接下來就會瘋狂給你推薦相關產品

  量化交易

    股票,期貨等數據分析

  短視頻推送

    抖音,今日頭條等短視頻

(數據分析絕對是未來所有公司不可或缺的崗位,目前社會上獲取數據方法太多了,這么多數據,只要我們擁有數據分析的技能,絕對可以應付任何崗位上的工作)

為什么數據分析需要學python

  python簡單易學,並且是數據分析必備的語言

數據分析的工作流程

以下工作流程是一般情況下常見流程,也有可能會出現偏差

1.需求分析

  搞明白到底要分析什么數據,以什么方式分析,想要什么樣的結果

2.數據采集

  數據的來源

    1.公司內部自帶

      直接調用即可  MySQL MongoDB

    2.網絡爬蟲獲取

      需要編寫代碼  爬蟲相關技能

    3.第三方服務

      花錢直接購買  鈔能力

3.數據清理

  針對獲取到的數據還需要效驗是否符合分析條件

    缺失數據,異常數據...

4.數據分析

  選擇相應的計算公式,算法模型分析數據

5.生成數據分析報告

  撰寫分析報告並給出分析之后的規律及建議

6.數據可視化

  將復雜的數據用圖表的形式展示出來,便於查看相應規律

  數據可視化一般是結合數據分析報告一起

數據分析三劍客簡介

numpy

  數學計算模塊  該模塊是很多計算模塊的底層模塊

pandas

  數據分析最為核心的模塊之一  主要用於操作excel表格

(既然excel軟件可以非常輕松快捷的操作表格,為什么還需要學pandas

當表格的數據低於10萬行的時候采取excel軟件操作方便

但是數據高於10萬行之后使用excel軟件就會出現卡頓不方便

所以pandas模塊能夠解決數據量較大的情況下的處理操作)

matplotlib

  數據可視化

ipython模塊

在cmd終端中可以編寫python代碼,但是存在以下缺陷

  1.代碼沒有提示

  2.代碼不會自動縮進

  3.通篇一個顏色過於單調

在cmd中編寫代碼是否可以解決掉上面多個缺陷

  pip3 install ipython

打開cmd之后直接輸入ipython進入全新的編程環境

  1.代碼有提示

  2.代碼自動縮進

  3.通篇顏色不單調

jupyter模塊

pip3 install jupyter

 

命令行輸入jupyter notebook即可

  會自動調用當前計算機默認的瀏覽器打開一個界面

  如果你調用了非默認瀏覽器訪問地址需要輸入一個token值,在啟動服務的展示信息中含有

  打開的界面取決於終端輸入jupyer notebook命令的左側路徑

 

右上方功能區域

  upload用於上傳任意類型的文件

  new下拉框

    python3用於創建notebook文件

    Text File用於創建文本文件

    Folder用於創建文件夾

    Terminal用於模擬cmd終端

 

notebook文件的后綴名是.ipynb 該文件無法以正常的雙擊直接打開

需要使用專門的notebook環境才可以打開並且查看內部的真實數據

  以后看到該類型的文件就使用jupyter notebook打開

(其實該模塊就可以進行數據分析相關的工作,但是有一個非常大的缺憾,就是數據分析過程中需要使用到的其他模塊都需要自己下載

  並且跟數據分析相關的模塊不下於200個)

Anaconda軟件

(內部集成了很多數據分析相關軟件及功能,並且自動下載了接近300個數據分析相關模塊)

去官網下載安裝完成之后並不會在界面上生成圖標,第一次需要自己搜索打開

  點擊電腦左下方放大鏡搜索anaconda navigator點擊啟動即可

 

 

左側菜單欄

 

  Home

    主要是一些已經准備好的軟件,有直接可以使用和下載即可使用

  Environments

    里面主要包括數據分析相關的模塊

  Learning

    里面含有大量的技術教程

  Community

    里面含有大量技術交流平台

Jupyter Notebook詳細操作

(主界面點擊jupyter notebook之后無法呼起瀏覽器打開界面的原因在於

  你的計算機名詞含有中文)

單詞

  cell  單元格

  cut  剪切

  copy  拷貝

  paste  黏貼

  above  在...上面

  below  在...下面

  replace  替換

  delete  刪除

  undo  撤銷

  split  切割

  merge  合並

 

命令行模式與編輯模式

  藍色對應的是命令行模式,綠色對應的是編輯模式

  兩種模式的切換

    編輯模式切換到命令行模式  按esc鍵

    命令行模式切換到編輯模式  鼠標左鍵點擊即可

 

1.運行當前單元格

  ctrl+enter

2.運行當前單元格並選中下方的單元格

  shift+enter

3.如何書寫md格式的標題

  方式1:命令行模式下按m鍵,之后按照#個數書寫幾級標簽執行即可

  方式2:編輯模式下先寫文本,之后進入命令行模式按數字來控制幾級標題

4.如何在當前單元格的下方新建一個單元格

  命令行模式下按b鍵

5.如何在當前單元格的上方新建一個單元格

  命令行模式下按a鍵

6.如何刪除單元格

  命令行模式下連續按兩下d鍵

7.如何撤銷刪除

  命令行模式下按z鍵


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM