Anaconda發行版預裝了150多個常用的Package,囊括了數據分析常用的庫,非常適合數據分析。
Jupyter Notebook
Jupyter Notebook是一個交互式筆記本,支持運行40多種編程語言。它本質上是一個支持實時代碼、數學方程、可視化和Markdown的Web應用程序。對於數據分析,Jupyter Notebook最大的優點是可以重現整個分析過程,並將說明文字、代碼、圖表、公式和結論都整合在一個文檔中。用戶可以通過電子郵件、Dropbox、GitHub和Jupyter Notebook Viewer將分析結果分享給他人。
一、Jupyter Notebook 的界面及其構成
1、Notebook文檔由一系列單元構成,主要有兩種形式的單元:代碼單元和Markdown單元。
(1)代碼單元:編寫代碼的位置,通過按“Shift+Enter”組合鍵運行代碼,其結果顯示在本單元的下方。代碼單元左邊有“In[ ]:”編號,方便使用者查看代碼的執行次序。
(2)Markdown單元:此單元內可對文本進行編輯,采用Markdown語法規范,可以設置文本格式,插入鏈接、圖片甚至數學公式。同樣,按“Shift+Enter”組合鍵可運行Markdown單元,顯示格式化的文本。
2、Jupyter Notebook編輯界面類似於VIM編輯界面,也分為編輯模式和命令模式兩種模式。
(1)編輯模式:用於編輯文本和代碼。選中單元並按“Enter”鍵進入編輯模式,此時單元左側顯示綠色豎線。
(2)命令模式:用於執行鍵盤輸入的快捷命令。通過按“ESC”鍵進入命令模式,此時單元左側顯示藍色豎線。常用快捷鍵有:“Y”鍵切換到代碼單元;“M”鍵切換到命令單元;“B”鍵在本單元的下方增加一單元;“H”鍵查看所有快捷命令。
二、Jupyter Notebook的高級功能
1、Markdown
Markdown是一種可以使用普通文本編輯器編寫的標記語言。通過簡單的標記語法,它可以使普通文本內容具有一定的格式。Markdown具有一系列的衍生版本,用於擴展Markdown的功能(如表格、腳注、內嵌HTML等)它們能讓Markdown轉成更多格式,例如LaTeX,Docbook應用於文檔快速排版。
(1)標題
Markdown一般使用Atx形式,在首行前加一個“#”字符代表一級標題,兩個代表二級標題,以此類推。
(2)列表
列表一般分為兩種:一種是無序列表,使用一些圖標標記,沒有序號,沒有排列順序;另一種是有序列表,使用數字標記,有排列順序。Markdown在文字前面加“*”或“+”或“-”來表示無序列表,運行后“*”“+”“-”都會變為一個圓點。對於有序列表則使用“.”或“ ”(一個空格)表示。
(3)字體
Markdown排版工具通常使用星號“*”和下划線“_”作為標記字體的符號。前后有兩個星號或下划線表示加粗,前后有3個星號或下划線表示斜體。
(4)表格
使用Markdown同樣也可以繪制表格。代碼的第一行表示表頭。第二行分隔表頭和主體部分。從第三行開始,每一行代表一個表格行。列與列之間用“|”分隔,表格每一行的兩邊也要加上“|”符號。
(5)數學公式編輯
Markdown單元中可以使用LaTeX來插入數學公式。在公式前后分別添加一個“$”符號來插入數學公式。如果要插入一個數學區塊,則使用兩個“$”符號($$)。
2、導出功能
Jupyter Notebook可以將Notebook導出為多種格式,如HTML、Markdown、reST、PDF(通過LaTeX)等格式。其中,導出PDF功能,可以讓讀者不用寫LaTeX即可創建漂亮的PDF文檔。