Nối tiếp phần 1, "Bài giảng Kho dữ liệu và kỹ thuật khai phá: Phần 2" tiếp tục trình bày những nội dung về công nghệ kho dữ liệu và xử lý phân tích trực tuyến; xây dựng kho dữ liệu với mục đích hỗ trợ quyết định (DSS); khai phá dữ liệu; tiền xử lý dữ liệu trước khi khai phá; phương pháp khai phá bằng luật kết hợp; phương pháp cây quyết định; phương pháp phân nhóm và phân đoạn; . Mời các bạn cùng tham khảo! | Học viện Công nghệ Bưu Chính Viễn thông- Khoa Công nghệ thông tin I KHO DỮ LIỆU VÀ KỸ THUẬT KHAI PHÁ BÀI GIẢNG DÀNH CHO SINH VIÊN CÔNG NGHỆ THÔNG TIN NGUYỄN QUỲNH CHI Chương 3 Công nghệ kho dữ liệu và xử lý phân tích trực tuyến Nội dung chương này bao gồm 1. Khái niệm về kho dữ liệu 2. Mô hình dữ liệu đa chiều 3. Kiến trúc kho dữ liệu 4. Cài đặt kho dữ liệu 5. Tương lai phát triển công nghệ khối dữ liệu 6. Từ công nghệ kho dữ liệu đến khai phá dữ liệu Khái niệm về kho dữ liệu Kho dữ liệu được định nghĩa theo nhiều cách khác nhau nhưng không chặt chẽ - Có thể được coi như một cơ sở dữ liệu hỗ trợ quyết định mà được duy trì một cách riêng biệt từ cơ sở dữ liệu tác nghiệp của một tổ chức. - Hỗ trợ xử lý thông tin bằng cách cung cấp một nền tảng vững chắc dữ liệu lịch sử và hợp nhất cho việc phân tích. Một trong những định nghĩa hay gặp của kho dữ liệu của .Inmon đuợc phát biểu như sau quot Một kho dữ liệu là một bộ dữ liệu hướng chủ đề tích hợp biến động theo thời gian và không mất đi được sử dụng để hỗ trợ quá trình ra quyết định quản lý Khái niệm công nghệ kho dữ liệu được dùng để chỉ quá trình xây dựng và sử dụng kho dữ liệu. Tiếp tới chúng ta cùng phân tích kỹ hơn các đặc điểm của kho dữ liệu được nêu ra trong định nghĩa trên. - Đặc điểm hướng chủ đề của khi dữ liệu được thể hiện o Qua việc cung cấp một khung nhìn xúc tích và đơn giản xung quanh các vấn đề của một chủ đề cụ thể. Chúng ta có thể thực hiện đặc điểm này bằng cách loại trừ các dữ liệu không hữu ích trong tiến trình hỗ trợ quyết định. o Qua việc được tổ chức xung quanh các đối tượng chính chẳng hạn như khách hàng sản phẩm bán hàng. o Qua viêc tập trung vào mô hình hóa và phân tích các dữ liệu cho những người ra quyết định không phải cho các hoạt động tác nghiệp hàng ngày hoặc cho xử lý giao dịch. - Kho dữ liệu có tính tích hợp được thể hiện qua các đặc điểm sau 86 o Được xây dựng bằng cách tích hợp nhiều nguồn dữ liệu không đồng nhất như cơ sở dữ liệu quan hệ các tệp lưu trữ bằng văn bản các .