Bài giảng Kho dữ liệu và khai phá dữ liệu: Chương 3 - Nguyễn Ngọc Duy

Tiếp tục chương 2, chương 3 của Bài giảng Kho dữ liệu và khai phá dữ liệu gồm các nội dung về khái niệm kho dữ liệu, mô hình dữ liệu đa chiều, kiến trúc của kho dữ liệu, cài đặt kho dữ liệu và xử lí phân tích trực tuyến, kho dữ liệu hỗ trợ quyết các bạn tham khảo. | KHÁI NIỆM CHUNG VỀ KHO DỮ LIỆU VÀ KHAI PHÁ DỮ LIỆU 1 1 Nội dung 1. Khái niệm về kho dữ liệu. 2. Mô hình dữ liệu đa chiều 3. Kiến trúc của kho dữ liệu. 4. Cài đặt kho dữ liệu và Xử lý phân tích trực tuyến. 5. Liên hệ công nghệ kho dữ liệu với khai pha dữ liệu. 6. Xây dựng kho dữ liệu với mục đích hỗ trợ quyết định. 2 Khái niệm về kho dữ liệu Kho dữ liệu data warehouse là nơi lưu trữ dữ liệu. Dữ liệu được tích hợp. Dữ liệu được thu thập từ nhiều nguồn Khác về không gian Khác về thời gian Khác về thể hiện và cấu trúc. Lưu trữ dữ liệu thông tin tri thức và siêu dữ liệu phục vụ cho phân tích. Các tổ chức có thể chết đuối trong dữ liệu nhưng đói thông tin. 3 Khái niệm về kho dữ liệu Kho dữ liệu dung cho mục đích riêng biệt lĩnh vực hẹp gọi là Data Mart. Một Data warehouse có thể hình thành nhiều Data Mart. Thuật ngữ Data Warehousing Quá trình xây dựng và sử dụng một kho dữ liệu. 4 Khái niệm về kho dữ liệu Công cụ ETL Extract Transform Load Rút trích Extract Rút trích thông tin từ những nguồn đã có Những phiên bản phụ thuộc thời gian của dữ liệu Chọn lựa dữ liệu. Chuyển đổi Transform Chuyển đổi các định dạng khác nhau về định dạng cho trước. Tải Load Sắp xếp hợp nhất lập chỉ mục và phân hoạch. 5 Các đặc tính của kho dữ liệu Dữ liệu hướng chủ thể Dữ liệu hướng theo từng nhóm đối tượng khách hang bệnh nhân sản phẩm Tập trung vào việc mô hình hóa và phân tích các dữ liệu cho các nhà sản xuất quyết định Chuyển từ hướng ứng dụng sang hướng hỗ trợ quyết định. Không dùng cho các hoạt động hang ngày hoặc xử lý giao dịch. 6 Các đặc tính của kho dữ liệu Tính tích hợp Dữ liệu được tập hợp từ nhiều nguồn có thể khác kiểu khác cấu trúc Các nguồn cơ sở dữ liệu quan hệ tập tin có cấu trúc tập tin phẳng Cần được chuẩn hóa để đảm bảo tính nhất quán trong quy ước đặt tên Việc chuẩn hóa cần thực hiện trước khi tích hợp. 7 Các đặc tính của kho dữ liệu Dữ liệu biến thời gian. Thông tin về quá khứ hiện tại So sánh dữ liệu theo chiều thời gian Hỗ trợ quyết định cho tương lai. Thành phần thời .

Không thể tạo bản xem trước, hãy bấm tải xuống
TỪ KHÓA LIÊN QUAN
TÀI LIỆU MỚI ĐĂNG
Đã phát hiện trình chặn quảng cáo AdBlock
Trang web này phụ thuộc vào doanh thu từ số lần hiển thị quảng cáo để tồn tại. Vui lòng tắt trình chặn quảng cáo của bạn hoặc tạm dừng tính năng chặn quảng cáo cho trang web này.