Jupyter notebook là gì

     

Nếu chúng ta là người mới và thắc mắc muốn search một nguyên lý nào giúp phát triển cũng như hỗ trợ tương tác cho project về data science, thì chắc hẳn rằng hầu không còn mọi người sẽ trả lời là Jupyter Notebook.

Bạn đang xem: Jupyter notebook là gì

*


*

Một notebook hoàn toàn có thể xuất ra một tài liệu độc nhất vô nhị trong đó phối hợp hình ảnh trực quan, văn phiên bản tường thuật, phương trình toán học với đa phương tiện đi lại khác. Chỉ cần một notebook, chúng ta có thể biểu diễn được một dự án, hay một bài báo công nghệ một phương pháp trực quan tiền nhất. Với Jupyter Notebook đó là thứ mà nhiều người đang cần tìm.

1. Jupyter Notebook là gì?

Trước đây Jupyter Notebook có tên là IPython Notebook, mang lại năm 2014 bóc tách ra ngoài IPython và đổi tên thành Jupyter Notebook. Jupyter hỗ trợ rất nhiều những kernel cho những ngôn ngữ không giống nhau, trong đó tập trung vào 3 ngôn ngữ là Julia, Python R. Jupyter là 1 trong nền tảng đo lường khoa học mã nguồn mở, với năng lực nổi bật được cho phép tương tác trực tiếp với từng dòng code (interactive).

Bài viết này được đăng tại


Jupyter Notebook bao gồm 2 nhân tố chính:

Ứng dụng Web: cho phép tạo và share tài liệu đựng live code, hình ảnh, tài liệu (viết bên dưới dạng markdown),...Notebook documents: trình bày những gì gồm trong một notebook (code, thiết bị thị,...)

2. Ưu điểm của Jupyter Notebook

Code ngay trong trình duyệt, hỗ trợ syntax highlight, thụt lề,... Như một code editor.Chạy được code tức thì trong trình duyệt.Hiển thị kết quả tính toán bằng cách sử dụng màn biểu diễn đa phương tiện, như HTML, LaTeX, PNG, SVG,....Hỗ trợ markdown, để cho việc bình luận cho code trở đề nghị trực quan tiền hơn nhiều so với vấn đề dùng plain text.

3. Cách thiết lập Jupyter Notebook

Cách thiết lập dễ nhất, cũng giống như được khích lệ nhất, đó là chúng ta cài Anaconda, nó thiết lập sẵn mang lại ta Python, Jupyter Notebook, cùng ti tỉ sản phẩm công nghệ khác - tất cả những thứ mà một người ban đầu với data science cần.

Nếu bạn không muốn cài Anaconda thì Jupyter cũng có thể cài qua pip - trình thống trị package của Python. Tất yếu là bạn cần cài Python trước, tiếp nối mở terminal lên mà lại nhập command sau:


pip install jupyter
Hoặc nếu cần sử dụng Linux, bạn có thể tải và setup bằng command:


sudo apt-get install jupyter-notebook python-matplotlib

4. Bước đầu với Jupyter Notebook

Mở Jupyter Notebook Server

Sau khi đã cài đặt xong Jupyter, bạn chỉ việc mở terminal và nhập command sau:


jupyter notebook
Hoặc trường hợp đã tải Anaconda bên trên Windows, bạn có thể mở trực tiếp Jupyter Notebook:

Sau đó thì trên terminal đã hiển thị như sau:

Và kế tiếp thì trình chăm chút sẽ bật ra một trang web như sau:

Vậy là Jupyter Notebook cơ bản đã được cài xong, bây giờ ta vẫn thử tạo nên 1 notebook và test xem nhé.

Tạo cùng chạy một notebook

Tạo một notebook

Để chế tạo một notebook, ta click chuột vào nút New nằm tại bên góc cần và lựa chọn Python 3:

Mọi notebook mới tạo đều chọn cái tên là Untitled, nếu còn muốn sửa bạn chỉ cần nhấn vào vào tên, môt vỏ hộp thoại thay tên sẽ nhảy ra như sau:

Nếu chuyển hẳn sang tab làm chủ file thì ta đang thấy notebook đang chuyển sang màu sắc xanh, đấy là trạng thái Running:

Bạn hoàn toàn có thể tắt notebook bằng phương pháp chọn và nhấn shutdown:

Hello world với notebook

Khi vừa mới tạo thì notebook sẽ làm cho ta sẵn một cell (ô), cell này vẫn ở tâm lý "Code", nghĩa là bạn có thể nhập code Python vào với chạy:

Chúng ta đã thử chạy đoạn code nhỏ in ra dòng "Hello World":

Mỗi lúc chạy xong một cell thì notebook đã tự tạo thêm 1 cell mới. Ta có thể đổi cell này trường đoản cú code sang markdown để viết một đoạn văn bản như sau:

Và Run cell này:

5. Hướng dẫn sử dụng Jupyter Notebook

Trong phần này, bọn họ sẽ tìm kiếm hiểu chi tiết về các thành phần cũng tương tự cách cần sử dụng của Jupyter Notebook.

Xem thêm: Quy Phạm Là Gì - (Cập Nhật 2022)

Mở Jupyter Notebook Server

Như đang nói sinh hoạt trên, bạn có thể mở một notebook bằng phương pháp chạy command sau:


jupyter notebook
Lưu ý rằng nếu bạn trỏ terminal đến thư mục như thế nào thì Jupyter vẫn mở folder đó, chẳng hạn nếu như bản thân mở vận dụng Jupyter mặc định bên trên Windows, nó đã mở băng thông "/" trên sản phẩm tính:

Ta trả toàn có thể trỏ đến thư mục khác, chẳng hạn:

Mặc định thì sau thời điểm chạy Jupyter Notebook, một website sẽ bật ra (mặc định là http://localhost:8888) được gọi là dashboard (bảng điều khiển) nó giống như một trình thống trị file, vào này đã hiển thị toàn bộ các file phía trong thư mục mà ta vừa hướng dẫn và chỉ định mở với Jupyter Notebook:

Nếu như bạn có nhu cầu mở trực tiếp file notebook mà không cần phải mở trải qua dashboard thì chúng ta có thể nhập command sau vào terminal:


jupyter notebook .ipynb
Trong đó .ipynb chính là đuôi của một file notebook, nếu khách hàng chỉ nhập thương hiệu file cơ mà không nhập đuôi thì Jupyter vẫn sẽ tự hiểu và thêm vào.

Ngoài ra, bạn hoàn toàn hoàn toàn có thể mở các Jupyter Notebook và một lúc, mang định thì Jupyter sẽ mở tại port 8888, và nếu bạn mở thêm thì nó vẫn nhận port sớm nhất (8889, 8890,...), hoặc chúng ta có thể tự chọn port mang đến Jupyter khi mở như sau:


jupyter notebook --port
Ví dụ:

Giao diện của Notebook

Trong 1 notebook sẽ sở hữu được 4 phần chủ yếu (mình vẫn đánh số theo thiết bị tự từ 1, 2, 3, 4) như sau:

1: thương hiệu của tệp tin notebook, tương ứng với tên file .ipynb.2: Thanh menu hiển thị nhiều công dụng khác nhau để điều khiển notebook.3: Thanh biện pháp (toolbar) chứa các công núm được áp dụng nhiều (run, dịch chuyển code cell lên xuống, restart kernel...).4: Code cell (sẽ nói kỹ tại phần tiếp)

Cấu trúc của một Notebook

Cell Code

Một notebook bao gồm một chuỗi các cell. Một cell giống hệt như một text editor mini, rất có thể thực thi code bằng tổ hợp phím Shift + Enter hoặc thừa nhận nút Run trên toolbar. Tuỳ trực thuộc vào hình dáng cell mà output sẽ khác nhau, bao gồm 4 các loại cell được cung cấp trong Jupyter Notebook:

Code: Là kiểu dáng hay cần sử dụng nhất, bạn nhập và tiến hành code trên loại cell này.

Markdown: vẻ bên ngoài cell được dùng cho việc nhập văn bản, tổng thể văn bạn dạng của các bạn sẽ được format bằng Markdown

Raw NBConvert: được sử dụng để hiển thị những định dạng code khác nhau thành HTML hoặc LaTeX.Heading: Thêm tiêu đề mang đến notebook, loại cell này hiện đã có được merge vào Markdown và không còn được khích lệ dùng

Ta sẽ chăm chú một lấy ví dụ như nhỏ, gõ đoạn code sau tiếp nối nhấn Shift + Enter hoặc click Run trên toolbar:


print("ktktdl.edu.vn")

Khi bạn xúc tiến 1 cell, đầu ra của code sẽ tiến hành hiển thị sinh hoạt phía dưới, đồng thời label ở phía phía trái chuyển tự In<> (chưa thực thi) => In<*> (đang thực thi) => In<1> (đã triển khai - số vào ô ngoặc khớp ứng với số lần triển khai cell của notebook)

Một điều cần để ý là không nhất thiết phải nhập hàm print mới rất có thể in ra screen được, bạn cũng có thể nhập tên biến chuyển ở cuối cell như sau:

Kernel

Cùng cùng với cell, kernel (nhân) là 2 thành phần quan trọng đặc biệt nhất của Jupyter. Kernel thực chất là một lịch trình thông dịch và thực hiện code. Jupyter Notebook đã cài đặt sẵn cho họ Kernel IPython để triển khai việc cùng với Python, tuy nhiên có khá nhiều kernel giành cho ngôn ngữ không giống mà bạn có thể cài thêm (R, Julia,...) làm cho sử dụng Jupyter trở đề xuất rất tiện dụng.

Khi bạn xúc tiến một cell code, code sẽ tiến hành thực thi vị kernel với trả về output tựa như những ví dụ trên. Một điều đặc biệt quan trọng trong Jupyter Notebook là kernel vẫn chạy và links giữa những cell code với nhau, chứ không tách bóc rời từng cell riêng biệt lẻ, điều đó trở nên cực kì tiện dụng cho vấn đề debug.

Ví dụ như các bạn khai báo một hàm, import một thư viện,... Vào một trong những cell và thực thi nó, thì cell khác vẫn nhận được giá trị đó trong đợt thực thi tiếp, lấy ví dụ như:

Trong lấy ví dụ như trên, ta khai báo một hàm tính tổng như sau:


def sum(x, y): return x + y
Vào một cell code cùng thực thi, sau đó ta tạo nên 1 cell code khác và truyền hai biến chuyển a cùng b sẽ khai báo trước vào, và hiệu quả là tổng của 2 biến chuyển a và b đó.

Trong phần lớn thời gian, code của ta thường sẽ đi từ trên xuống, tuy nhiên bạn nên chú ý tới tâm trạng của từng cell code, do nó biểu thị cell code này đã được thực thi lúc nào, ví dụ như ta thay đổi giá trị thay đổi b sinh hoạt cell code bên trên như sau:

Thì sau khi ta chạy lại hàm sum sinh sống dưới, công dụng cũng sẽ biến hóa theo:

Vì vậy, mỗi khi làm việc với notebook ta đề nghị phải để ý thứ từ thực thi của cell code.

Bởi vì sự việc trên, giả dụ một lúc notebook của khách hàng quá rối và bạn băn khoăn biến như thế nào đang cất giá trị nào, thì cách giải quyết và xử lý nằm trong thực đơn Kernel:

Interrupt: giả dụ như cell code đang triển khai quá lâu mà bạn muốn ngừng thì chúng ta cũng có thể chọn tuỳ chọn này.Restart: Khởi rượu cồn lại kernel, mọi đổi thay được lưu sẽ ảnh hưởng xoá khỏi bộ nhớ.Restart và Clear Output: kiểu như restart nhưng đi kèm là xoá toàn bộ output trong notebook.Restart & Run All: tương đương Restart tuy vậy sẽ thực hiện lại tổng thể các cell sau thời điểm restart xong.

Xem thêm: Về Chữ “Nhàn” Trong Hai Bài Thơ : Cảnh Ngày Hè Của Nguyễn Trãi Và Nhàn Của Nguyễn Bỉnh Khiêm.

Xuất Notebook

Jupyter cung cấp rất các định dạng xuất ra như mặt dưới:

Bạn chỉ việc chọn tệp tin => tải về as => chọn kiểu file mà bạn thích xuất, rất dễ dàng và đơn giản và dễ dàng.

6. Tổng kết

Sau khi dứt bài này thì nhìn toàn diện bạn đã gắng được hầu như concept cơ phiên bản của Jupyter Notebook. Đây là một trong công cố rất hữu ích, dễ thực hiện và hiệu quả, đặc biệt là dành mang lại Data Science. Chúng ta có thể bắt đầu một project cùng với Jupyter và khám phá thêm nhiều nhân tài khác, ví như đang bắt đầu với Data Science, hãy nhớ là ghé qua series về NumPy, Pandas và Matplotlib - hầu như thư viện số 1 về xử lý tài liệu trên Python nhé