Bài giảng Kho dữ liệu và khai phá dữ liệu (2014): Phần 2

Nối tiếp phần 1, Bài giảng Kho dữ liệu và khai phá dữ liệu (2014): Phần 2 tiếp tục trình bày những nội dung về công nghệ kho dữ liệu và xử lý phân tích trực tuyến; mô hình dữ liệu đa chiều; cài đặt kho dữ liệu; xây dựng kho dữ liệu với mục đích hỗ trợ quyết định (DSS); khai phá dữ liệu; tiền xử lý dữ liệu trước khi khai phá; phương pháp khai phá bằng luật kết hợp; phương pháp cây quyết định; . Mời các bạn cùng tham khảo! | HỌC VIỆN CÔNG NGHỆ BƯU CHÍNH VIỄN THÔNG - - KHOA CÔNG NGHỆ THÔNG TIN BÀI GIẢNG KHO DỮ LIỆU VÀ KHAI PHÁ DỮ LIỆU NGUYỄN QUỲNH CHI HàNội 2014 Chƣơng 3 Công nghệ kho dữ liệu và xử lý phân tích trực tuyến Nội dung chƣơng này bao gồm 1. Khái niệm về kho dữ liệu 2. Mô hình dữ liệu đa chiều 3. Kiến trúc kho dữ liệu 4. Cài đặt kho dữ liệu 5. Tƣơng lai phát triển công nghệ khối dữ liệu 6. Từ công nghệ kho dữ liệu đến khai phá dữ liệu Khái niệm về kho dữ liệu Kho dữ liệu đƣợc định nghĩa theo nhiều cách khác nhau nhƣng không chặt chẽ - Có thể đƣợc coi nhƣ một cơ sở dữ liệu hỗ trợ quyết định mà đƣợc duy trì một cách riêng biệt từ cơ sở dữ liệu tác nghiệp của một tổ chức. - Hỗ trợ xử lý thông tin bằng cách cung cấp một nền tảng vững chắc dữ liệu lịch sử và hợp nhất cho việc phân tích. Một trong những định nghĩa hay gặp của kho dữ liệu của .Inmon đuợc phát biểu nhƣ sau quot Một kho dữ liệu là một bộ dữ liệu hƣớng chủ đề tích hợp biến động theo thời gian và không mất đi đƣợc sử dụng để hỗ trợ quá trình ra quyết định quản lý Khái niệm công nghệ kho dữ liệu đƣợc dùng để chỉ quá trình xây dựng và sử dụng kho dữ liệu. Tiếp tới chúng ta cùng phân tích kỹ hơn các đặc điểm của kho dữ liệu đƣợc nêu ra trong định nghĩa trên. - Đặc điểm hƣớng chủ đề của khi dữ liệu đƣợc thể hiện o Qua việc cung cấp một khung nhìn xúc tích và đơn giản xung quanh các vấn đề của một chủ đề cụ thể. Chúng ta có thể thực hiện đặc điểm này bằng cách loại trừ các dữ liệu không hữu ích trong tiến trình hỗ trợ quyết định. o Qua việc đƣợc tổ chức xung quanh các đối tƣợng chính chẳng hạn nhƣ khách hàng sản phẩm bán hàng. o Qua viêc tập trung vào mô hình hóa và phân tích các dữ liệu cho những ngƣời ra quyết định không phải cho các hoạt động tác nghiệp hàng ngày hoặc cho xử lý giao dịch. - Kho dữ liệu có tính tích hợp đƣợc thể hiện qua các đặc điểm sau 79 o Đƣợc xây dựng bằng cách tích hợp nhiều nguồn dữ liệu không đồng nhất nhƣ cơ sở dữ liệu quan hệ các tệp lƣu trữ bằng văn bản các bản ghi của giao dịch trực .

Không thể tạo bản xem trước, hãy bấm tải xuống
TỪ KHÓA LIÊN QUAN
TÀI LIỆU MỚI ĐĂNG
Đã phát hiện trình chặn quảng cáo AdBlock
Trang web này phụ thuộc vào doanh thu từ số lần hiển thị quảng cáo để tồn tại. Vui lòng tắt trình chặn quảng cáo của bạn hoặc tạm dừng tính năng chặn quảng cáo cho trang web này.