Bài giảng Kho dữ liệu và khai phá dữ liệu: Chương 3 - Nguyễn Hoàng Ân (2018)

Bài giảng "Khai phá dữ liệu - Chương 3: Qui trình phát triển kho dữ liệu" cung cáp cho người học các kiến thức: Xem xét những hoạt động cơ bản trong lập kế hoạch kho dữ liệu, chu trình cho một dự án kho dữ liệu, thảo luận về tổ chức, vai trò và trách nhiệm của nhóm dự án, xem xét các dấu hiệu cảnh báo và nhân tố thành công. Mời các bạn cùng tham khảo. | Bài giảng Kho dữ liệu và khai phá dữ liệu Chương 3 - Nguyễn Hoàng Ân 2018 Kho dữ liệu và khai phá dữ liệu Chương 2 Qui trình phát triển kho dữ liệu Mục tiêu Xem xét những hoạt động cơ bản trong lập kế hoạch kho dữ liệu Chu trình cho một dự án kho dữ liệu Thảo luận về tổ chức vai trò và trách nhiệm của nhóm dự án Xem xét các dấu hiệu cảnh báo và nhân tố thành công Nội dung Các phương pháp luận phát triển kho dữ liệu Thiết kế mô hình dữ liệu Data model Business Dimensional Lifecycle Quá trình ETL ELT Làm sạch và chuẩn hóa dữ liệu Một số các vân đề lưu ý khi thiết kế kho dữ liệu 1. Tổng quan Một số câu hỏi quan trọng cần được xem xét trước khi quyết định xây dựng kho dữ liệu Theo các tiếp cận Top-down hay bottom-up Dùng cho mức doanh nghiệp hay phòng ban Cái nào trước - data warehouse hay data mart Build pilot or go with a full-fledged implementation Data mart phục thuộc hay độc lập Source adapted from Strange 1997 . 5 2. Các phương pháp phát triển KDL Có 2 phương pháp phát triển chính Top-Down Bottom-Up Top-Down Cách tiếp cận của Bill Inmon Dữ liệu trong KDL được lưu trữ ở mức hạt granularity thấp nhất dựa trên mô hình dữ liệu đã chuẩn hóa KDL là trung tâm của Xưởng thông tin công ty Corporate Information Factory-CIF cung cấp một khung nền luận lý logical framework cho việc chuyển giao kinh doanh thông minh đến doanh nghiệp. Các hoạt động kinh doanh cung cấp dữ liệu cho CIF. KDL được tập trung hóa sẽ cung cấp các data mart phụ thuộc có thể được thiết kế dựa trên mô hình dữ liệu có chiều Top-Down tt Nguồn A Managers Guide to Data Warehousing Top-Down tt Thuận lợi Có được cái nhìn toàn diện mức doanh nghiệp về dữ liệu Có kiến trúc rõ ràng không phải là việc hợp nhất các data mart khác nhau Lưu trữ tập trung Các luật và kiểm soát tập trung Có thể thấy kết quả nhanh chóng nếu được thực hiện bằng các bước lặp Hạn chế Mất nhiều thời gian Tiềm ẩn rủi ro và thất bại cao Cần có những kỹ năng của nhiều lĩnh vực ở mức cao Tốn chi phí Bottom-Up Cách tiếp cận .

Không thể tạo bản xem trước, hãy bấm tải xuống
TỪ KHÓA LIÊN QUAN
TÀI LIỆU MỚI ĐĂNG
13    120    1    29-03-2024
40    342    6    29-03-2024
Đã phát hiện trình chặn quảng cáo AdBlock
Trang web này phụ thuộc vào doanh thu từ số lần hiển thị quảng cáo để tồn tại. Vui lòng tắt trình chặn quảng cáo của bạn hoặc tạm dừng tính năng chặn quảng cáo cho trang web này.