Bài viết "Thiết kế các lược đồ XML ở mức khái niệm" giới thiệu phương pháp chuyển đổi dữ liệu của các tác giả, đồng thời đề xuất một phương pháp chuyển đổi các thuộc tính đa trị và phức hợp lồng nhau của một kiểu thực thể sang lược đồ XML. | 1 THIẾT KẾ CÁC LƯỢC ĐỒ XML Ở MỨC KHÁI NIỆM Hoàng Quang Trường Đại học Khoa học Đại học Huế Võ Hoàng Liên Minh Trường Đại học Khoa học Đại học Huế Võ Văn Hải Trường Đại học Công nghiệp Tp Hồ Chí Minh TÓM TẮT Hiện nay XML chiếm vị trí rất quan trọng trong việc trao đổi dữ liệu giữa các ứng dụng. Việc phát triển cơ sở dữ liệu XML để lưu trữ thông tin lớn trở nên cần thiết. Liên quan đến vấn đề thiết kế lược đồ XML từ mô hình mức khái niệm Massimo Franceschet và các cộng sự 2013 đã xây dựng một phương pháp chuyển đổi các thành phần của mô hình ER sang lược đồ XML. Tuy nhiên vấn đề chuyển đổi các thuộc tính đa trị và phức hợp lồng nhau của một kiểu thực thể trong một mô hình ER đã không được các tác giả đề cập đến. Nghiên cứu này ngoài việc giới thiệu phương pháp chuyển đổi của các tác giả trên chúng tôi muốn đề xuất một phương pháp chuyển đổi các thuộc tính đa trị và phức hợp lồng nhau của một kiểu thực thể sang lược đồ XML. 1. GIỚI THIỆU XML - ngôn ngữ đánh dấu mở rộng là một ngôn ngữ đánh dấu được tạo nên bởi W3C nhằm khắc phục những hạn chế của HTML. Hiện nay XML chiếm vị trí rất quan trọng trong việc chuyển tải trao đổi dữ liệu và liên lạc giữa các ứng dụng. Cùng với việc XML ngày càng phổ biến số lượng các ứng dụng sử dụng các tài liệu XML tăng lên nhanh chóng các tài liệu XML tạo ra ngày càng nhiều. Các tài liệu XML thường được thiết kế theo cảm tính nên có thể dẫn đến những dư thừa và không nhất quán về mặt dữ liệu. Do đó các phương pháp để thiết kế một lược đồ XML tốt nhằm tránh được những dư thừa và không nhất quán về mặt dữ liệu là rất đáng được quan tâm nghiên cứu. Có hai phương pháp tiếp cận chính đã được thực hiện bởi các nhà nghiên cứu cơ sở dữ liệu XML để thiết kế các tài liệu XML không tồn tại dư thừa dữ liệu 10 . Phương pháp tiếp cận thứ nhất là sử dụng mô hình dữ liệu mức khái niệm 3 5 9 và phương pháp thứ hai sử dụng lý thuyết chuẩn hóa 1 4 7 . Cả hai phương pháp tiếp cận này là đều dựa trên lý thuyết thiết kế cơ sở dữ liệu quan hệ. Phương pháp tiếp