Xây dựng kho dữ liệu phục vụ hệ thống phát hiện sao chép

Bài viết Xây dựng kho dữ liệu phục vụ hệ thống phát hiện sao chép trình bày kết quả xây dựng kho dữ liệu sẽ được sử dụng trong hệ thống phát hiện sao chép từ các nguồn tài liệu của Đại học Đà Nẵng. Kho dữ liệu này bao gồm các tài liệu gốc, cơ sở dữ liệu thông tin chung về tài liệu và dữ liệu đã được trích xuất từ các tài liệu lưu trữ dưới định dạng XML. | ISSN 1859-1531 - TẠP CHÍ KHOA HỌC VÀ CÔNG NGHỆ ĐẠI HỌC ĐÀ NẴNG SỐ 1 86 .2015 113 XÂY DỰNG KHO DỮ LIỆU PHỤC VỤ HỆ THỐNG PHÁT HIỆN SAO CHÉP BUILDING A DATA WAREHOUSE FOR DUPLICATE DETECTION SYSTEM Châu Thùy Dương1 Võ Trung Hùng2 Hồ Phan Hiếu2 1 Trường Đại học Quảng Nam 2 Đại học Đà Nẵng vthung@ hophanhieu@ Tóm tắt - Trong bài báo này chúng tôi trình bày kết quả xây dựng Abstract - This paper presents the results of building a data bank kho dữ liệu sẽ được sử dụng trong hệ thống phát hiện sao chép từ to be used in the duplication detection system from learning các nguồn tài liệu của Đại học Đà Nẵng. Kho dữ liệu này bao gồm resources of the University of Danang. This data bank includes các tài liệu gốc cơ sở dữ liệu thông tin chung về tài liệu và dữ liệu original documents abstract information database about the đã được trích xuất từ các tài liệu lưu trữ dưới định dạng XML. original documents and the data which has been extracted from the Chúng tôi đã đề xuất cấu trúc lưu trữ và các chương trình tương documents to store in XML format. We have proposed storage ứng để dễ dàng lưu trữ cập nhật kho dữ liệu và xử lý các dữ liệu structure and the corresponding programs to easily store update trên kho. Chúng tôi đã tiến hành thử nghiệm và lưu trữ trên kho and manage data in data bank. We have experimented and stored này với hơn 100 tài liệu mỗi loại cho báo cáo tốt nghiệp của sinh in this data bank over 300 documents such as course papers by IT viên ngành công nghệ thông tin luận văn tốt nghiệp cao học và students master theses and reports of research projects. Results báo cáo tổng kết đề tài nghiên cứu. Kết quả nghiên cứu này là tiền of this study imply a prerequisite for building an automated system đề để xây dựng một hệ thống phát hiện tự động việc sao chép trái to detect the duplication in the scientific documents contributing to phép trên các tài liệu khoa học góp phần hạn chế nạn đạo văn controlling quot plagiarism quot . .

Không thể tạo bản xem trước, hãy bấm tải xuống
TÀI LIỆU MỚI ĐĂNG
Đã phát hiện trình chặn quảng cáo AdBlock
Trang web này phụ thuộc vào doanh thu từ số lần hiển thị quảng cáo để tồn tại. Vui lòng tắt trình chặn quảng cáo của bạn hoặc tạm dừng tính năng chặn quảng cáo cho trang web này.