如何使用 Colab 和 Jupyter 學習數據科學?

快速上手 Colab 和 Jupyter

什麼是 Jupyter?

Jupyter (Jupyter Notebooks) 是一個數據科學跨時代的程式語言編輯平台,讓你可以在網上或桌面編輯語言。

過去大部分的軟體工程師都是在離線的桌面端編輯,現在你可以透過 Jupyter 在網上或桌面編寫、修改和分享編碼。所有的編碼可在網上或桌面端運算,並及時地將編碼結果輸出(這也是與傳統程式編輯器最大的差別)。

你可以在任何瀏覽器直接使用 Jupyter,他有兩種編輯器:Jupyter Notebook 和 JupyterLab。選擇 Class Notebook 是傳統編輯器,專注於語言編程沒有其他多餘的功能。選擇 JupyterLab 則是有較多的加強功能(你可以看到歷史編輯檔案、文件夾、與協作功能等)。兩者都可以讓你直接在瀏覽器中編輯幾乎所有你想編輯的語言,例如 R、Python 等。

如果你想要在離線的桌面上運行 Jupyter,我們建議透過 Anacoda 來安裝。Anacoda 是一個免費的軟體,透過它的一健安裝,避免了繁瑣的 Terminal 語言。

安裝後,你就可以執行 Jupyter Notebook 和 JupyterLab 與更多其他的IDE軟體。

什麼是 Colab?

Colab 是 Google 建立在 Jupyter 基礎上所開發的產品,基本上核心功能與 Jupyter Notebook 一樣,就是介面不一樣和新增了一些對 Github 的整合。當然您必須要有 Google 的帳號才能編輯檔案。

如果你使用 Google Drive,也許 Colab 會對你是個好的選擇,因為所以檔案都可以透過 Google Drive 儲存和擷取。

如何用 Colab 與 Jupyter 同步課程內容?

Colab

在諾亞方舟線上課程數據分析以後的所有課程都可以透過 Colab 和 Jupyter 同步學習。

在每一章的開頭,找到 Colab 同步學習 的連結,點擊並開啟 Colab。

在 Colab 中你能同步所有的課程內容,直接在編輯器上一步步透過執行、編輯、和修改編碼,來達到最快速有效的學習!如果在當中出錯了,或是遇到不明的錯誤,你只要重新讀取網站就可以了。

你也可以將檔案複製到你的 Google Drive 裡,這樣就可以儲存為以後使用。

Jupyter

如果你想在 Jupyter 上同步課程內容,請先在 Colab 選擇 檔案 > 下載

上傳檔案你就可以在網上的 Jupyter Notebook 編輯,或者透過 Anacoda 安裝的 Jupyter 桌面端來開啟檔案,同步練習每章課程的內容。

接下來,我們來快速的學習如何使用 Colab。

如何使用 Colab?

執行編碼

Colab 的結構是由兩種區塊所組成:文字和編碼。

在 Colab 裡的編碼區塊會呈現灰色底色:

按下左上角的播放鍵,你就可以執行該區塊的編碼了!

(第一次執行會看到 Google 的警示,請按 Run anyway 放心執行,所有教學檔案不會有任何病毒或資料竊取。)

另一種方式是點選編碼區塊,按下快捷鍵 Control(或 ⌘Command) + Enter

Markdown

如果萬一你雙點擊了文字的區塊,你會看到類似編輯的狀態,別擔心你只要使用 Control/⌘Command + Enter 執行它就會恢復原狀了。

這些文字區塊所使用的是一種叫做 Markdown 的程式語言,專門當作程式語言中的文字註解,有興趣的朋友可以參閱本文章

運作流程

所有在 Colab 的編碼區塊是有前後順序的。意思是有些有些編碼需要前方執行的結果,不然會顯示錯誤。在學習時如果出現錯誤,可以查看是否遺漏執行了上方的編碼區塊。

在實際編輯時,常用的幾種邊執行編碼方式:

  • Control/Command + Enter 執行編碼區塊
  • Shift + Enter 執行編碼區塊,完成後跳至下一區塊
  • 選取編碼區域 > Runtime >選擇 Run all, Run beforeRun after

發生錯誤

往往會有許多不可測的因素導致執行編碼後遇到錯誤訊息,這時你可以選擇 > Runtime > Restart runtime

有可能是因為你修改了一些數值所導致的錯誤,你可以直接重新讀取一次畫面,大部分的問題都可以解決。如果還不能解決請聯絡我們

儲存

最後,如果您想儲存該檔案可以按 Copy to Drive 複製到您的私人雲端或下載成 .ipynb 或 .py 以便之後使用。

請告訴我們

請告訴我們您的問題或勘誤建議。
您的意見是我們前進的動力,非常感激!