Python數據分析開發環境


准備工作

下載並安裝最新版本的Anaconda

下載並安裝最新版本的Visual Studio Code

編輯器

Tips:

可以選擇自己喜歡並且熟悉的編輯器或IDE。如:VIM、Emacs、Notepad++、Sublime、Pycharm等。

如果安裝的是完整版本的Anaconda,會默認安裝Spyder以及Jupyter Notebook。那么不想折騰編輯器的話,推薦使用這兩款應用是足夠的。

Visual Studio Code

推薦插件

  • Python

可選插件

  • vscode-icons

包管理器選擇

Conda

Conda是目前比較常用的包管理工具,其大致功用於pip類似,這里使用Conda的原因,主要在於Conda除可以安裝python的包外,還可以很方便的安裝其他變成語言的包(如C++、C等)。這樣的話,就可以很方便的解決有些數據分析的包依賴非python編寫的程序包的問題。

為了能夠直接在命令行中使用conda命令,這里將Anaconda3\Scripts目錄添加到了環境變量中。

基本使用

創建虛擬環境:conda create -n <env_name> python=<python_version_num>

激活虛擬環境:activate <env_name>

安裝程序包到指定虛擬環境:conda install -n <env_name> <pakcage_name>

關閉虛擬環境:deactivate

刪除虛擬環境:conda remove <env_name> --all

刪除虛擬環境中的某個包:conda remove --name <env_name> <package_name>

查看已安裝包:conda list

查看已安裝環境:conda env list

檢查更新conda:conda update conda

更新所有程序包:conda update --all

常用包安裝

安裝好Anaconda后,可以使用Anaconda來管理包的安裝。

如果是用於學習與研究,而不用與其他人協作或者能夠有良好的約定的話,那么可以直接使用conda的默認的環境,這樣就可以少安裝很多包。


REM 基礎包

conda install numpy
conda install scipy
conda install pandas
conda install matplotlib

REM ORM,用於連接數據庫

conda install sqlalchemy


更改Conda的下載鏡像

如果要使用的包並不包含在默認的conda環境中,又想加快下載速度與穩定性的話,可以添加國內的下載鏡像。

在終端中執行以下命令:


conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/free/

conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/main/

conda config --set show_channel_urls yes

參考:

  1. Anaconda 鏡像使用幫助

PIP

因為某些原因使用Conda可能無法順利安裝一些包,那么可以使用PIP來進行安裝。


REM 更新PIP

python -m pip install --upgrade pip

REM 中國股票數據獲取

pip install tushare

REM 導出當前環境所有依賴包信息

pip freeze > requirements.txt

REM 根據導出的依賴包信息安裝包

pip install -r requirements.txt -d <your_download_dir>

常用包推薦

數據獲取&爬蟲

  • Tushare:提供便捷的國內股票行情數據的獲取(自動爬取相關網站數據)
  • requests:一款優秀的HTTP Request包,可以用於與HTML/XML解析的包結合起來制作爬蟲工具。
  • urllib:Python3的內置包,主要用於訪問、解析指定URL。
  • Beautiful Soup:一個可以從HTML或XML文件中提取數據的Python庫。

數據整理

  • Numpy:提供強大的矩陣操作,以及一些非常有用的計算工具(如:irr、npv等)
  • Pandas:提供強大的數據框操作(類似R語言中的DataFrame)
  • SciPy:提供強大的統計工具。

數據可視化

數據庫操作

  • sqlalchemy:數據庫建議使用自己熟悉的或項目統一要求的,如:Oracle、MySQL、PostgreSQL、MSSQL、SQLite等。sqlalchemy包可以有效的連接各類常用的數據庫,並處理各類操作。


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM