詳解運(yùn)行Python的神器Jupyter Notebook
Jupyter Notebook
Jupyter項(xiàng)目是從Ipython項(xiàng)目中分出去的,在Ipython3.x之前,他們兩個(gè)是在一起發(fā)布的。在Ipython4.x之后,Jupyter作為一個(gè)單獨(dú)的項(xiàng)目進(jìn)行開(kāi)發(fā)和管理。因?yàn)镴upyter不僅僅可以運(yùn)行Python程序,它還可以執(zhí)行其他流程編程語(yǔ)言的運(yùn)行。
Jupyter Notebook包括三個(gè)部分,第一個(gè)部分是一個(gè)web應(yīng)用程序,提供交互式界面,可以在交互式界面中運(yùn)行相應(yīng)的代碼。
上圖是NoteBook的交互界面,我們可以對(duì)文檔進(jìn)行編輯,運(yùn)行等操作。
主要的功能如下:
- 在瀏覽器中進(jìn)行代碼編輯,自動(dòng)語(yǔ)法突出顯示,縮進(jìn)和制表符完成/自檢功能。
- 從瀏覽器執(zhí)行代碼的能力,并將計(jì)算結(jié)果附加到生成它們的代碼上。
- 使用諸如HTML,LaTeX,PNG,SVG等富媒體表示來(lái)顯示計(jì)算結(jié)果。例如,可以內(nèi)嵌包含matplotlib庫(kù)渲染的具有出版質(zhì)量的圖形。
- 使用Markdown標(biāo)記語(yǔ)言在瀏覽器中對(duì)富文本進(jìn)行的編輯(可以為代碼提供注釋)不僅限于純文本。
- 使用LaTeX輕松在markdown單元中包含數(shù)學(xué)符號(hào)的能力,并由MathJax本地呈現(xiàn)。
第二個(gè)部分就是NoteBook的文檔了,這個(gè)文檔存儲(chǔ)了要運(yùn)行的代碼和一些描述信息。一般這個(gè)文檔是以.ipynb的后綴進(jìn)行存儲(chǔ)的。
notebook文檔是以json的形式存儲(chǔ)的,并用base64進(jìn)行編碼。使用json的好處就是可以在不同的服務(wù)器中方便的進(jìn)行數(shù)據(jù)的交互。
Notebook documents中除了可運(yùn)行的代碼文件,還可以存儲(chǔ)說(shuō)明等解釋性內(nèi)容,從而將代碼和解釋內(nèi)容完美結(jié)合,尤其適合做學(xué)習(xí)筆記使用。
筆記本可以通過(guò)nbconvert命令導(dǎo)出為多種靜態(tài)格式,包括HTML,reStructuredText,LaTeX,PDF等多種格式。
另外文檔還可以方便的在網(wǎng)絡(luò)上進(jìn)行共享。
第三個(gè)部分就是代碼運(yùn)行的核心Kernels,通過(guò)不同的Kernels搭配,notebook可以支持運(yùn)行多種程序。比如:Python,java,go,R,ruby,nodejs等等。
這些Kernels和notebook之間是以Json的形式通過(guò)MQ來(lái)進(jìn)行通信的。
啟動(dòng)notebook server
有了文檔之后,如果我們想要運(yùn)行文檔,需要啟動(dòng)notebook server。
jupyter notebook
默認(rèn)情況下會(huì)開(kāi)啟下面的URL: http://127.0.0.1:8888
啟動(dòng)的時(shí)候還可指定要打開(kāi)的.ipynb文件:
jupyter notebook my_notebook.ipynb
具體的notebook界面的操作這里就不多介紹了,基本上和普通的編譯器差不多。大家可以自行探索。
notebook document 的結(jié)構(gòu)
notebook中包含了多個(gè)cells,每個(gè)cell中包含了多行文本輸入字段,可以通過(guò)Shift-Enter 或者工具欄中的播放按鈕來(lái)執(zhí)行其中的代碼。
這里的cell有三種類型,分別是code cells,markdown cells和raw cells。
code cells
代碼單元允許您編輯和編寫(xiě)新代碼,并突出顯示完整的語(yǔ)法和制表符。 您使用的編程語(yǔ)言取決于內(nèi)核,默認(rèn)內(nèi)核(IPython)運(yùn)行Python代碼。
執(zhí)行代碼單元時(shí),它包含的代碼將發(fā)送到與筆記本關(guān)聯(lián)的內(nèi)核。 然后,從該計(jì)算返回的結(jié)果將在筆記本中顯示為單元格的輸出。 輸出不僅限于文本,還有許多其他可能的輸出形式,包括matplotlib圖形和HTML表格(例如,在pandas數(shù)據(jù)分析包中使用的表格)。
我們看一個(gè)code cells的例子:
#%% import numpy as np my_arr = np.arange(1000000) my_list = list(range(1000000))
每個(gè)單元格是以 #%% 來(lái)進(jìn)行分隔的。
Ipython本身還支持多種富文本的展示格式,包括HTML,JSON,PNG,JPEG,SVG,LaTeX等。
Ipython提供了一個(gè)display方法,我們可以使用display來(lái)展示要呈現(xiàn)的對(duì)象:
from IPython.display import display
display(obj) 將會(huì)尋找這個(gè)對(duì)象所有可能的展示類型,并從中挑選一個(gè)最適合的類型進(jìn)行展示,并將結(jié)果存儲(chǔ)在Notebook文檔里面。
如果你想展示特定類型的對(duì)象,那么可以這樣:
from IPython.display import ( display_pretty, display_html, display_jpeg, display_png, display_json, display_latex, display_svg )
舉個(gè)展示圖片的例子:
from IPython.display import Image i = Image(filename='../images/ipython_logo.png') i display(i)
上面的例子中i包含了一個(gè)Image對(duì)象,直接調(diào)用i即可展示,我們也可以顯示的調(diào)用display(i)。
其他的富文本類型可以參考Image,使用方法都是類似的。
markdown cells
markdown是一種簡(jiǎn)介的標(biāo)記語(yǔ)言,使用起來(lái)非常簡(jiǎn)單,使用范圍非常廣泛,所以notebook document也支持markdown的語(yǔ)法。
先看一個(gè)markdown cell的例子:
#%% md ```python $ python Python 3.6.0 | packaged by conda-forge | (default, Jan 13 2017, 23:17:12) [GCC 4.8.2 20140120 (Red Hat 4.8.2-15)] on linux Type "help", "copyright", "credits" or "license" for more information. >>> a = 5 >>> print(a) 5 ```
markdown中的語(yǔ)法在notebook中都是可以用的。
還支持標(biāo)準(zhǔn)的LaTeX 和 AMS-LaTeX語(yǔ)法。
raw cells
原始單元格提供了一個(gè)可以直接寫(xiě)入輸出的位置。 notebook不會(huì)對(duì)原始單元格中的內(nèi)容進(jìn)行計(jì)算。
以模塊的形式導(dǎo)入Jupyter Notebooks
有時(shí)候我們希望以模塊的形式導(dǎo)入Jupyter Notebooks,但是可惜的是,Jupyter Notebooks并不是一個(gè)標(biāo)準(zhǔn)的python程序,不過(guò)Python提供了一些鉤子程序,讓我們能夠方便的進(jìn)行導(dǎo)入。
首先,我們需要導(dǎo)入一些基本的API :
import io, os, sys, types from IPython import get_ipython from nbformat import read from IPython.core.interactiveshell import InteractiveShell
接下來(lái)需要注冊(cè)NotebookFinder到sys.meta_path:
sys.meta_path.append(NotebookFinder())
這個(gè)NotebookFinder就是定義的鉤子。
我們看下NotebookFinder的定義:
class NotebookFinder(object): """Module finder that locates Jupyter Notebooks""" def __init__(self): self.loaders = {} def find_module(self, fullname, path=None): nb_path = find_notebook(fullname, path) if not nb_path: return key = path if path: # lists aren't hashable key = os.path.sep.join(path) if key not in self.loaders: self.loaders[key] = NotebookLoader(path) return self.loaders[key]
里面使用了兩個(gè)重要的方法,find_notebook用來(lái)找到notebook,和NotebookLoader,用來(lái)加載notebook。
看下find_notebook的定義:
def find_notebook(fullname, path=None): """find a notebook, given its fully qualified name and an optional path This turns "foo.bar" into "foo/bar.ipynb" and tries turning "Foo_Bar" into "Foo Bar" if Foo_Bar does not exist. """ name = fullname.rsplit('.', 1)[-1] if not path: path = [''] for d in path: nb_path = os.path.join(d, name + ".ipynb") if os.path.isfile(nb_path): return nb_path # let import Notebook_Name find "Notebook Name.ipynb" nb_path = nb_path.replace("_", " ") if os.path.isfile(nb_path): return nb_path
看下NotebookLoader的定義:
class NotebookLoader(object): """Module Loader for Jupyter Notebooks""" def __init__(self, path=None): self.shell = InteractiveShell.instance() self.path = path def load_module(self, fullname): """import a notebook as a module""" path = find_notebook(fullname, self.path) print ("importing Jupyter notebook from %s" % path) # load the notebook object with io.open(path, 'r', encoding='utf-8') as f: nb = read(f, 4) # create the module and add it to sys.modules # if name in sys.modules: # return sys.modules[name] mod = types.ModuleType(fullname) mod.__file__ = path mod.__loader__ = self mod.__dict__['get_ipython'] = get_ipython sys.modules[fullname] = mod # extra work to ensure that magics that would affect the user_ns # actually affect the notebook module's ns save_user_ns = self.shell.user_ns self.shell.user_ns = mod.__dict__ try: for cell in nb.cells: if cell.cell_type == 'code': # transform the input to executable Python code = self.shell.input_transformer_manager.transform_cell(cell.source) # run the code in themodule exec(code, mod.__dict__) finally: self.shell.user_ns = save_user_ns return mod
有了他們,我們就可以直接import我們自己編寫(xiě)的notebook了。
以上就是詳解運(yùn)行Python的神器Jupyter Notebook的詳細(xì)內(nèi)容,更多關(guān)于運(yùn)行Python的神器Jupyter Notebook的資料請(qǐng)關(guān)注腳本之家其它相關(guān)文章!
相關(guān)文章
python中pip安裝、升級(jí)以及升級(jí)固定的包
我們知道python有大量的第三方庫(kù),這也是python的優(yōu)勢(shì)之一,pip就是python整的軟件包管理系統(tǒng),類似于Linux平臺(tái)的yum倉(cāng)庫(kù),下面這篇文章主要給大家介紹了關(guān)于python中pip安裝、升級(jí)以及升級(jí)固定包的相關(guān)資料,需要的朋友可以參考下2022-02-02Python 輸入一個(gè)數(shù)字判斷成績(jī)分?jǐn)?shù)等級(jí)的方法
今天小編就為大家分享一篇Python 輸入一個(gè)數(shù)字判斷成績(jī)分?jǐn)?shù)等級(jí)的方法,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。一起跟隨小編過(guò)來(lái)看看吧2018-11-11Matplotlib學(xué)習(xí)筆記之plt.xticks()用法
在matplotlib中ticks表示的是刻度,而刻度有兩層意思,一個(gè)是刻標(biāo)(locs),一個(gè)是刻度標(biāo)簽(tick?labels),下面這篇文章主要給大家介紹了關(guān)于Matplotlib學(xué)習(xí)筆記之plt.xticks()用法的相關(guān)資料,需要的朋友可以參考下2022-09-09python中json、字典的區(qū)別以及相互轉(zhuǎn)換方法
在Python中我們經(jīng)常會(huì)用到JSON格式的數(shù)據(jù),而將JSON格式轉(zhuǎn)化為Python的字典類型是一種常見(jiàn)的操作,這篇文章主要給大家介紹了關(guān)于python中json、字典的區(qū)別以及相互轉(zhuǎn)換方法的相關(guān)資料,需要的朋友可以參考下2023-11-11Django QuerySet查詢集原理及代碼實(shí)例
這篇文章主要介紹了Django QuerySet查詢集原理及代碼實(shí)例,文中通過(guò)示例代碼介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友可以參考下2020-06-06