Bài viết Kiến trúc hồ dữ liệu: Lưu trữ và phân tích dữ liệu lớn trong các tổ chức tài chính - ngân hàng tập trung nghiên cứu kiến trúc hồ dữ liệu cho mô hình dữ liệu ngân hàng dựa trên cơ sở tham chiếu đến mô hình dữ liệu của hãng IBM. Tiếp theo bài báo phân tích vai trò và sự cần thiết của hồ dữ liệu, trình bày về quy trình xây dựng cũng như kiến trúc hồ dữ liệu phù hợp trong các tổ chức tài chính ngân hàng. | Kiến trúc hồ dữ liệu lưu trữ và phân tích dữ liệu lớn trong các tổ chức tài chính- ngân hàng Ngô Thùy Linh Khoa Hệ thống thông tin quản lý Trường Học viện Ngân hàng Ngày nhận 29 04 2022 Ngày nhận bản sửa 16 06 2022 Ngày duyệt đăng 22 06 2022 Tóm tắt Data lake hồ dữ liệu là khái niệm mới xuất hiện những năm gần đây trong thời đại của dữ liệu lớn big data . Mặc dù chủ đề về big data đã được thảo luận nhưng vẫn còn nhiều thách thức trong nghiên cứu đặc biệt là sự đa dạng của dữ liệu. Một trong những thách thức đó là làm thế nào để tích hợp và truy vấn khối lượng dữ liệu lớn từ nhiều nguồn khác nhau khi phương thức lưu trữ dữ liệu truyền thống là kho dữ liệu không đáp ứng được. Data lake- Hồ dữ liệu được đề xuất như một giải pháp cho vấn đề này. Bài báo tập trung nghiên cứu kiến trúc hồ dữ liệu cho mô hình dữ liệu ngân hàng dựa trên cơ sở tham chiếu đến mô hình dữ liệu của hãng IBM. Tiếp theo bài báo phân tích vai trò và sự cần thiết của hồ dữ liệu trình bày về quy trình xây dựng cũng như kiến trúc hồ dữ liệu phù hợp trong các tổ chức tài chính ngân hàng. Cuối cùng là thảo luận về lợi ích của hồ dữ liệu giúp cho các bộ phận nghiệp vụ truy cập và phân tích dữ liệu trên toàn bộ tổ chức ngoài ra thách thức về công nghệ trong quá Data lake architecture big data storage and analysis in financial banking organizations Abstract Data Lake is one of the dominant concepts in the era of big data. Although big data has been discussed it still has many research challenges especially the variety of data. It poses a huge difficulty to efficiently integrate and query the large volume of diverse data in information silos with the traditional approaches such as data warehouses. Data lakes have been proposed as a solution to this problem. This paper focuses on studying data lake architecture for banking data model based on reference to IBM s data model. Next this paper analyzes the role and necessity of a data lake presents the data lake execution process and the right data lake .