數據分析入門


概要

  • 數據分析的概念

  • 數據分析三劍客簡介

  • ipython模塊

  • jupyter模塊

  • Anaconda軟件使用


詳細

數據分析的概念

  數據分析就是從現有的數據中挖掘出需要的價值。

數據分析應用領域

  1、商品推薦:在淘寶等電商平台搜索一款產品后,會給你推薦更多相關產品。

  2、量化交易:實時關注股票、期貨變動並分析投資策略。

  3、短視頻推送:抖音、今日頭條等短視頻推薦會大量出現用戶常看的內容。

  4、還有更多......

  數據分析是未來所有公司不可或缺的崗位。 目前社會上獲取數據方式太多了,海量的數據,擁有數據分析的技能,就可以應付任何崗位上的工作。

  Python簡單易學,是數據分析領域必備的語言。

數據分析的工作流程(常見的)

1、需求分析:搞清楚需要分析什么數據,以什么方式分析這些數據,想要獲得什么樣的結果。

2、數據采集:數據來源主要有以下三種。

  (1) 公司內部數據:直接調用即可,如MySQL,MongoDB等數據庫。

  (2) 網絡爬蟲獲取:編寫一些代碼,需要掌握一些爬蟲相關技能。

  (3) 第三方服務:花錢購買第三方服務,讓專業人員幫忙收集數據。

3、數據清洗:獲得的數據不全是可用的有效數據,可能存在缺失或異常,需要對其進行校驗並去除。

4、數據分析:選擇相應的計算方法,建立對應的算法模型分析數據。

5、生成數據分析報告:撰寫數據分析報告並分析出之后的規律或建議。

6、數據可視化:將復雜難懂的數據用圖表等形式展現出來,便於查看規律,一般與數據分析報告相結合。

數據分析三劍客簡介

1、第一劍:numpy

      數學計算相關的模塊,是很多計算模型的底層模塊

2、第二劍:pandas

      數據分析領域最為核心的模塊之一,主要用於操作Excel表格

3、第三劍:matplotlib

      數據可視化相關模塊

ipython模塊

我們知道,在命令行窗口也可以編寫Python代碼,但是有下列缺陷

  1.代碼沒有提示

  2.代碼不會自動縮進

  3.整個界面顏色單調

如何解決!!!

這個時候就需要安裝ipython模塊。

    pip3 install ipython

安裝以后再打開命令行窗口輸入ipython進入全新編程環境

  1.代碼有提示

  2.代碼自動縮進

  3.通篇顏色有區分

jupyter模塊

1、首先安裝該模塊 pip3 install jupyter

2、然后在命令行輸入 jupyter notebook

  會自動調用當前計算機默認瀏覽器打開一個網頁

  調用非默認瀏覽器訪問地址需要輸入token值,啟動服務的展示信息中有token值

  打開的界面取決於終端輸入jupyer notebook命令的左側路徑

3、右上方是功能區域

  upload   用於上傳任意類型的文件。

  new    下拉框

  python3      用於創建notebook文件

  Text File  用於創建文本文件

  Folder   用於創建文件夾

  Terminal     用於模擬cmd終端

notebook文件的注意點:

notebook文件的后綴名是.ipynb,該格式的文件無法正常雙擊直接打開。

需要使用專門的notebook環境,可以打開並查看內部的真實數據。

用jupyter notebook打開即可

其實該模塊就可以進行數據分析相關的工作,有一個非常大的缺陷。 數據分析過程中需要使用到的其他模塊都需要自己下載,並且跟數據分析相關的模塊不下於200個。

Jupyter Notebook詳細操作

主界面點擊jupyter notebook之后無法打開瀏覽器打開界面原因在於 你的計算機名詞含有中文

    單詞

    • cell單元格
      • cut剪切
        • copy拷貝
          • paste粘貼
            • above 在...上面
              • below 在...下面
                • replace 替換
                  • delete刪除
                    • undo撤銷
                      • split切割
                        • merge 合並

命令行模式與編輯模式

藍色—命令行模式 | 綠色—編輯模式

1.運行當前單元格
    CTRL + ENTER
2.運行當前單元格並選中下方的單元格
    SHIFT + ENTER
3.書寫md格式標題
    (1)命令行模式下按M鍵,然后按照#個數控制標題格式
    (2)編輯模式先寫標題文本,然后切換命令行模式按數字選擇標題格式
4.在當前單元格下方新建單元格
    命令行模式下按B鍵
5.在當前單元格上方新建單元格
    命令行模式下按A鍵
6.刪除單元格
    命令行模式下連續按兩下D鍵
7.撤銷刪除
    命令行模式下按Z鍵

Anaconda軟件

1、這軟件內部集成了很多數據分析相關軟件及功能,自動下載接近300個數據分析相關模塊

2、去官網下載安裝完成之后並不會在界面上生成圖標 第一次需要自己搜索打開,點擊電腦左下方放大鏡搜索anaconda navigator點擊啟動即可。

3、左側菜單欄

  Home: 是一些已經准備好的軟件 有直接可以使用和下載即可使用

  Environments: 主要包含數據分析相關的模塊

  Learning: 含有大量的技術教程

  Community: 含有大量技術交流平台

 


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM