Jupyter NoteBook功能介紹


一、Jupyter Notebook 介紹

文學編程

在介紹 Jupyter Notebook 之前,讓我們先來看一個概念:文學編程 ( Literate programming ),這是由 Donald Knuth 提出的編程方法。傳統的結構化編程,人們需要按計算機的邏輯順序來編寫代碼;與此相反,文學編程則可以讓人們按照自己的思維邏輯來開發程序。

簡單來說,文學編程的讀者不是機器,而是人。 我們從寫出讓機器讀懂的代碼,過渡到向人們解說如何讓機器實現我們的想法,其中除了代碼,更多的是敘述性的文字、圖表等內容。這么一看,這不正是數據分析人員所需要的編碼風格么?不僅要當好一個程序員,還得當好一個作家。那么 Jupyter Notebook 就是不可或缺的一款集編程和寫作於一體的效率工具。

歷史傳承

也許說到 Jupyter 你會覺得陌生,但想必你或多或少聽過鼎鼎大名的 IPython。其實Jupyter 脫胎於 IPython 項目,IPython 顧名思義,是專注於 Python 的項目,但隨着項目發展壯大,已經不僅僅局限於 Python 這一種編程語言了。Jupyter 的名字就很好地釋義了這一發展過程,它是 Julia、Python 以及 R 語言的組合,字形相近於木星(Jupiter),而且現在支持的語言也遠超這三種了。

優點

以下列舉了 Jupyter Notebook 的眾多優點:

  • 極其適合數據分析
    想象一下如下混亂的場景:你在終端中運行程序,可視化結果卻顯示在另一個窗口中,包含函數和類的腳本存在其他文檔中,更可惡的是你還需另外寫一份說明文檔來解釋程序如何執行以及結果如何。此時 Jupyter Notebook 從天而降,將所有內容收歸一處,你是不是頓覺靈台清明,思路更加清晰了呢?

  • 支持多語言
    也許你習慣使用 R 語言來做數據分析,或者是想用學術界常用的 MATLAB 和 Mathematica,這些都不成問題,只要安裝相對應的核(kernel)即可。這里列出了 Jupyter 支持的所有語言,供您參考。

  • 分享便捷
    支持以網頁的形式分享,GitHub 中天然支持 Notebook 展示,也可以通過 nbviewer 分享你的文檔。當然也支持導出成 HTML、Markdown 、PDF 等多種格式的文檔。

  • 遠程運行
    在任何地點都可以通過網絡鏈接遠程服務器來實現運算,這里給出一個遠程運行的例子,可以體驗一下 Jupyter Notebook。

  • 交互式展現
    不僅可以輸出圖片、視頻、數學公式,甚至可以呈現一些互動的可視化內容,比如可以縮放的地圖或者是可以旋轉的三維模型。這就需要交互式插件(Interactive widgets)來支持,更多內容請參考這里


二、Jupyter Notebook 使用入門

安裝

對於初學者,最簡單的方法是安裝 Anaconda,因為它自帶了 Jupyter Notebook。如果想進一步了解 Anaconda 的使用方法,可參考我的上一篇文章《致Python初學者們 - Anaconda入門使用指南》

對於有經驗的同學,自然使用命令行最為便捷。

如果在 conda 環境中,可以使用如下命令安裝:

conda install jupyter notebook

或者直接通過 pip 安裝:

pip install jupyter notebook

更多的安裝說明請參考官網

運行

如果使用 Anaconda,可以在其 Navigator 圖形界面中點擊打開 Notebook。但是最快捷的方法還是在命令行中輸入:

jupyter notebook

此時你的 Web 瀏覽器被自動打開,顯示文件目錄。通過點擊右上角的 new 創建新文檔。

 
進入 notebook

而關閉 notebook 文檔可以通過選擇文件名前的復選框后,點擊 Shutdown 按鈕實現。如果要關閉整個服務,則在原來的終端中按 Control + C 兩次。

 
退出 notebook

 

界面

Notebook 文檔是由一系列單元(Cell)構成,主要有兩種形式的單元:

  • 代碼單元:這里是你編寫代碼的地方,通過按 Shift + Enter 運行代碼,其結果顯示在本單元下方。代碼單元左邊有 In [1]: 這樣的序列標記,方便人們查看代碼的執行次序。

  • Markdown 單元:在這里對文本進行編輯,采用 markdown 的語法規范,可以設置文本格式、插入鏈接、圖片甚至數學公式。同樣使用 Shift + Enter 運行 markdown 單元來顯示格式化的文本。

 
Jupyter Notebook 編輯界面

類似於 Linux 的 Vim 編輯器,在 notebook 中也有兩種模式:

  • 編輯模式:編輯文本和代碼。選中單元並按 Enter 鍵進入編輯模式,此時單元左側顯示綠色豎線。

  • 命令模式:用於執行鍵盤輸入的快捷命令。通過 Esc 鍵進入命令模式,此時單元左側顯示藍色豎線。

如果要使用快捷鍵,首先按 Esc 鍵進入命令模式,然后按相應的鍵實現對文檔的操作。比如切換成代碼單元(Y)或 markdown 單元(M),或者在本單元的下方增加一單元(B)。查看所有快捷命令可以按H

盡管一開始需要花費一些學習成本,但熟練使用快捷鍵將大大提高工作效率。試想你在鍵盤上十指如飛時,如果還需要通過鼠標來操作文檔,是不是很影響思考速度呢?


三、Jupyter Notebook 進階功能

數學公式編輯

如果你曾做過嚴肅的學術研究,一定對 LaTeX 並不陌生,這簡直是寫科研論文的必備工具,不但能實現嚴格的文檔排版,而且能編輯復雜的數學公式。在 Jupyter Notebook 的 markdown 單元中我們也可以使用 LaTeX 的語法來插入數學公式。

在文本行中插入數學公式,使用一對 $符號,比如質能方程 $E = mc^2$。如果要插入一個數學區塊,則使用一對 $$ 符號。比如下面公式表示 z=x/y:

$$ z = \frac{x}{y} $$ 

如何在 notebook 中使用 LaTeX,可進一步參考 A Primer on Using LaTeX in Jupyter Notebooks 這篇文章。

幻燈片制作

既然Jupyter Notebook 擅長展示數據分析的過程,除了通過網頁形式分享外,當然也可以將其制作成幻燈片的形式。這里有一個幻燈片示例供參考,其制作風格簡潔明晰。

那么如何用 Jupyter Notebook 制作幻燈片呢?首先在 notebook 的菜單欄選擇 View > Cell Toolbar > Slideshow,這時在文檔的每個單元右上角顯示了 Slide Type 的選項。通過設置不同的類型,來控制幻燈片的格式。有如下5中類型:

  • Slide:主頁面,通過按左右方向鍵進行切換。
  • Sub-Slide:副頁面,通過按上下方向鍵進行切換。
  • Fragment:一開始是隱藏的,按空格鍵或方向鍵后顯示,實現動態效果。
  • Skip:在幻燈片中不顯示的單元。
  • Notes:作為演講者的備忘筆記,也不在幻燈片中顯示。
 
Jupyter Notebook 幻燈片設置

當編寫好了幻燈片形式的 notebook,如何來演示呢?這時需要使用 nbconvert

jupyter nbconvert notebook.ipynb --to slides --post serve

在命令行中敲入上述代碼后,瀏覽器會自動打開相應的幻燈片。

魔術關鍵字

魔術關鍵字(magic keywords),正如其名,是用於控制 notebook 的特殊的命令。它們運行在代碼單元中,以 % 或者 %% 開頭,前者控制一行,后者控制整個單元。

比如,要得到代碼運行的時間,則可以使用 %timeit;如果要在文檔中顯示 matplotlib 包生成的圖形,則使用 % matplotlib inline;如果要做代碼調試,則使用 %pdb。但注意這些命令大多是在Python kernel 中適用的,其他 kernel 大多不適用。有許許多多的魔術關鍵字可以使用,更詳細的清單請參考 Built-in magic commands





免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM