Làm sạch (Bỏ các dữ liệu không cần thiết hoặc quá chuyên dụng). Liên kết các số liệu (Tính trước số liệu tích, tổng, trung bình). Biến đổi dữ liệu (Số liệu được biến đổi thành dạng thích hợp, tổ chức lại phù hợp với DWH). Tích hợp số liệu từ nguồn khác nhau Đồng bộ hóa số liệu ở một thời điểm xác định | Thành viên nhóm: Nguyễn Ngọc Khánh Hương 1041060. Tạ Thụy Kim Ngân 1041090. Trần Thị Phượng 1041111. Dương Quốc Trung 1041155. Nguyễn Doãn Trường Huy 1041347. Nguyễn Thị Oanh 1041391. Topic #9: Tìm hiểu về Data Warehouse – OLAP – BI Công cụ mã nguồn mở SpagoBI - DATA WAREHOUSE - OLAP - BI - Công cụ mã nguồn mở SpagoBI 1041090 - TẠ THỤY KIM NGÂN DATA WAREHOUSE I. GIỚI THIỆU SƠ LƯỢC Giới thiệu Lịch sử Mục tiêu Tính chất Đặc điểm II. XÂY DỰNG DATA WAREHOUSE Các thành phần Quá trình đưa dữ liệu vào data warehouse Cái khái niệm cơ bản của CSDL đa chiều Tiến trình ETL Ứng dụng Data warehouse MỤC LỤC 1. Giới thiệu - Một ứng dụng thường đi kèm 1 CSDL. Một công ty có nhiều ứng dụng. Muốn kiểm soát lượng dữ liệu của toàn công ty ? Muốn đưa ra quyết định tiên đoán tương lai của công ty? I. GIỚI THIỆU SƠ LƯỢC I. GIỚI THIỆU SƠ LƯỢC 3. Lịch sử Cuối những năm 1980, Barry Devlin và Paul Murphy nghiên cứu “decision support environment”. I. GIỚI THIỆU SƠ LƯỢC 3. Mục tiêu Truy cập dễ dàng Thông tin nhất | Thành viên nhóm: Nguyễn Ngọc Khánh Hương 1041060. Tạ Thụy Kim Ngân 1041090. Trần Thị Phượng 1041111. Dương Quốc Trung 1041155. Nguyễn Doãn Trường Huy 1041347. Nguyễn Thị Oanh 1041391. Topic #9: Tìm hiểu về Data Warehouse – OLAP – BI Công cụ mã nguồn mở SpagoBI - DATA WAREHOUSE - OLAP - BI - Công cụ mã nguồn mở SpagoBI 1041090 - TẠ THỤY KIM NGÂN DATA WAREHOUSE I. GIỚI THIỆU SƠ LƯỢC Giới thiệu Lịch sử Mục tiêu Tính chất Đặc điểm II. XÂY DỰNG DATA WAREHOUSE Các thành phần Quá trình đưa dữ liệu vào data warehouse Cái khái niệm cơ bản của CSDL đa chiều Tiến trình ETL Ứng dụng Data warehouse MỤC LỤC 1. Giới thiệu - Một ứng dụng thường đi kèm 1 CSDL. Một công ty có nhiều ứng dụng. Muốn kiểm soát lượng dữ liệu của toàn công ty ? Muốn đưa ra quyết định tiên đoán tương lai của công ty? I. GIỚI THIỆU SƠ LƯỢC I. GIỚI THIỆU SƠ LƯỢC 3. Lịch sử Cuối những năm 1980, Barry Devlin và Paul Murphy nghiên cứu “decision support environment”. I. GIỚI THIỆU SƠ LƯỢC 3. Mục tiêu Truy cập dễ dàng Thông tin nhất quán Thích nghi với thay đổi Bảo mật Hỗ trợ ra quyết định Tính thành công I. GIỚI THIỆU SƠ LƯỢC 4. Tính chất Tính hướng chủ đề (subject orientation) Tổ chức xoay quanh các chủ đề chính. Tập trung vào việc mô hình hóa và phân tích dữ liệu. Cung cấp khung nhìn đơn giản xoay quanh các chủ đề. I. GIỚI THIỆU SƠ LƯỢC 4. Tính chất Tính hướng chủ đề I. GIỚI THIỆU SƠ LƯỢC 4. Tính chất Tính tích hợp (intergrated) Được xây dựng từ các nguồn dữ liệu khác nhau. Các kỹ thuật làm sạch và tích hợp dữ liệu được áp dụng nhằm đảm bảo sự đồng nhất của dữ liệu. I. GIỚI THIỆU SƠ LƯỢC I. GIỚI THIỆU SƠ LƯỢC 4. Tính chất Tính bền vững (non-volatile) Data warehouse chỉ cho phép người dùng truy cập và tải dữ liệu về xem. Người dùng không thể cập nhật lại dữ liệu đó. I. GIỚI THIỆU SƠ LƯỢC 4. Tính chất Tính bền vững (non-volatile) I. GIỚI THIỆU SƠ LƯỢC 4. Tính chất Biến thời gian (time variant) Thông tin thời gian được lưu kèm theo dữ liệu. Người dùng có thể truy cập dữ liệu cũ của 5-10 năm trước để đưa ra các .