Bài giảng Lập trình cho khoa học dữ liệu - Bài 9: Thư viện Pandas

Bài giảng Lập trình cho khoa học dữ liệu - Bài 9: Thư viện Pandas cung cấp cho người học những kiến thức như: Giới thiệu và cài đặt pandas; Cấu trúc dữ liệu trong pandas; Làm việc với series; Làm việc với dataframe; Làm việc với panel; Chọn và nhóm phần tử. Mời các bạn cùng tham khảo! | LOGO LẬPTRÌNH CHO KHOA HỌC DỮ LIỆU Bài 9. Thư viện Pandas Nội dung 1 Giới thiệu vàcài đặt pandas 2 Cấu trúc dữ liệu trong pandas 3 Làmviệc với series 4 Làmviệc với dataframe 5 Làm việc với panel 6 Chọn và nhóm phần tử 2 Giới thiệu Pandas pandas là thư viện mở rộng từnumpy chuyên để xử lý dữ liệu cấu trúc dạngbảng Tên pandas là dạng số nhiều của panel data 3 Giới thiệu Pandas Đặc điểm nổi bật của pandas Đọc dữ liệu từ nhiều định dạng Liên kết dữ liệu và tích hợp xử lý dữ liệu bịthiếu Xoay và chuyển đổi chiều của dữ liệu dễ dàng Tách đánh chỉ mục và chia nhỏ các tập dữ liệu lớn dựa trên nhãn Có thể nhóm dữ liệu cho các mục đích hợp nhất và chuyển đổi Lọc dữ liệu và thực hiện query trên dữliệu Xử lý dữ liệu chuỗi thời gian và lấy mẫu 4 Cấu trúc dữ liệu trong pandas Dữ liệu của pandas có 3 cấu trúc chính Series loạt cấu trúc 1 chiều mảng dữ liệu đồngnhất Dataframe khung cấu trúc 2 chiều dữ liệu trên các cột là đồng nhất có phần giống như table trong SQL nhưng với các dòng được đặt tên Panel bảng cấu trúc 3 chiều có thể xem như một tập các dataframe với thông tin bổsung Dữ liệu series gần giống kiểu array trong numpy nhưng có 2 điểm khác biệt quantrọng Chấp nhận dữ liệu thiếu NaN không xácđịnh Hệ thống chỉ mục phong phú giốngdictionary 5 Cấu trúc dữ liệu trong pandas Cấu trúc dataframe Dữ liệu 2 chiều Các cột cótên Dữ liệu trên cột là đồng nhất series Các dòng có thể cótên Có thể có ô thiếu dữ liệu 6 Cấu trúc dữ liệu trong pandas Cấu trúc panel Dữ liệu 3 chiều Một tập cácdataframe Các dataframe có cấu trúc tương đồng Có thể có các thôngtin bổ sung cho từng dataframe 7 Làm việc với series Tạo dữ liệu series import pandas as pd import numpy as np S 100 size 4 print S 0 73 print 1 80 print 2 4 3 7 dtype int32 RangeIndex start 0 stop 4 step 1 73 80 4 7 8 Làm việc với series Tạo dữ liệu series import pandas as pd import numpy as np chi_so quot Ke toan quot quot KT quot quot CNTT quot quot Co k h i quot gia_tri 310 360 580 340 S .

Không thể tạo bản xem trước, hãy bấm tải xuống
TÀI LIỆU MỚI ĐĂNG
1    90    2    18-06-2024
Đã phát hiện trình chặn quảng cáo AdBlock
Trang web này phụ thuộc vào doanh thu từ số lần hiển thị quảng cáo để tồn tại. Vui lòng tắt trình chặn quảng cáo của bạn hoặc tạm dừng tính năng chặn quảng cáo cho trang web này.