Phát hiện motif bằng thuật toán Scrimp++ cải tiến

Bài viết này giới thiệu một phiên bản cải tiến của thuật toán Scrimp++ cho bài toán khám phá motif nhằm cải thiện thời gian thực thi của thuật toán. Kết quả thực nghiệm cho thấy thuật toán đề xuất thực hiện tốt hơn thuật toán gốc về mặt thời gian nhưng vẫn đảm bảo về độ chính xác. | TẠP CHÍ KHOA HỌC HO CHI MINH CITY UNIVERSITY OF EDUCATION TRƯỜNG ĐẠI HỌC SƯ PHẠM TP HỒ CHÍ MINH JOURNAL OF SCIENCE Tập 19 Số 3 2022 435-448 Vol. 19 No. 3 2022 435-448 ISSN Website http https 2022 2734-9918 Bài báo nghiên cứu PHÁT HIỆN MOTIF BẰNG THUẬT TOÁN SCRIMP CẢI TIẾN Nguyễn Thành Sơn Trần Thị Dung Trường Đại học Sư phạm Kỹ thuật Thành phố Hồ Chí Minh Việt Nam Tác giả liên hệ Nguyễn Thành Sơn Email sonnt@ Ngày nhận bài 27-9-2021 ngày nhận bài sửa 14-3-2022 ngày duyệt đăng 18-3-2022 TÓM TẮT Motif trên chuỗi thời gian là cặp chuỗi con giống nhau nhất trong một chuỗi thời gian hay các cặp chuỗi giống nhau nhất trong một cơ sở dữ liệu chuỗi thời gian. Khám phá motif trên chuỗi thời gian là bài toán quan trọng trong khai phá dữ liệu chuỗi thời gian. Gần đây một số thuật toán mới đã được giới thiệu cho bài toán khám phá motif dựa vào vector chứa khoảng cách giữa một chuỗi con với lân cận gần nhất của nó. Các thuật toán này sử dụng kĩ thuật kết hợp việc chuẩn hóa chuỗi thời gian vào trong công thức tính độ đo khoảng cách Euclid khi tính toán ma trận khoảng cách. Phương pháp tiêu biểu cho cách tiếp cận này là thuật toán Scrimp . Bài báo này giới thiệu một phiên bản cải tiến của thuật toán Scrimp cho bài toán khám phá motif nhằm cải thiện thời gian thực thi của thuật toán. Kết quả thực nghiệm cho thấy thuật toán đề xuất thực hiện tốt hơn thuật toán gốc về mặt thời gian nhưng vẫn đảm bảo về độ chính xác. Từ khóa ma trận khoảng cách khám phá motif chuỗi thời gian thuật toán Scrimp motif trên chuỗi thời gian 1. Giới thiệu Một chuỗi thời gian là một dãy các số thực được ghi nhận tại những khoảng thời gian bằng nhau. Dữ liệu chuỗi thời gian được sử dụng trong rất nhiều lĩnh vực khác nhau. Ngày nay dữ liệu chuỗi thời gian ngày càng chiếm một tỉ trọng lớn trong dữ liệu được cung cấp trên thế giới. Motif trên chuỗi thời gian là cặp chuỗi con giống nhau nhất trong một chuỗi thời gian dài hay các cặp chuỗi .

Không thể tạo bản xem trước, hãy bấm tải xuống
TÀI LIỆU MỚI ĐĂNG
289    103    1    20-04-2024
Đã phát hiện trình chặn quảng cáo AdBlock
Trang web này phụ thuộc vào doanh thu từ số lần hiển thị quảng cáo để tồn tại. Vui lòng tắt trình chặn quảng cáo của bạn hoặc tạm dừng tính năng chặn quảng cáo cho trang web này.