Bài viết trình bày về phương pháp dự báo dữ liệu chuỗi thời gian bằng cách kết hợp giữa mô hình ARIMA (Auto Regression Integrated Move Average) với Support Vector Machine (SVM), mạng Neural, giải thuật di. Các mô hình kết hợp này được đánh giá, so sánh với tập dữ liệu tại Công ty Dịch vụ Trực tuyến Cộng đồng Việt. | Kỷ yếu Hội nghị KHCN Quốc gia lần thứ XI về Nghiên cứu cơ bản và ứng dụng Công nghệ thông tin FAIR Hà Nội ngày 09-10 8 2018 DOI KẾT HỢP MÔ HÌNH ARIMA VÀ SUPPORT VECTOR MACHINE ĐỂ DỰ BÁO TẠI CÔNG TY DỊCH VỤ TRỰC TUYẾN CỘNG ĐỒNG VIỆT Nguyễn Đình Thuận 1 Hồ Công Hoài2 1 2 Trường Đại học Công nghệ Thông tin ĐHQG-TPHCM thuannd@ hoconghoai@ TÓM TẮT Các kết quả về mô hình chuỗi thời gian và dự báo có nhiều ứng dụng quan trọng trong thực tế. Vì vậy trong những năm gần đầy nhiều tác giả nghiên cứu và có nhiều kết quả dự báo về vấn đề này. Nhiều mô hình đã được đề xuất trong để nâng cao tính chính xác và hiệu quả của dự báo trong mô hình chuỗi thời gian. Bài báo này trình bày về phương pháp dự báo dữ liệu chuỗi thời gian bằng cách kết hợp giữa mô hình ARIMA Auto Regression Integrated Move Average với Support Vector Machine SVM mạng Neural giải thuật di. Các mô hình kết hợp này được đánh giá so sánh với tập dữ liệu tại Công ty Dịch vụ Trực tuyến Cộng đồng Việt. Từ khóa Time series ARIMA SVM Neural Network. I. GIỚI THIỆU Chuỗi thời gian time series là một tập hợp các điểm dữ liệu data points hay các điểm quan sát observations được thu thập và sắp xếp theo thứ tự thời gian. Trong Toán học chuỗi thời gian được định nghĩa là một tập các vector z t t 0 1 2 với t là các thời điểm thu thập dữ liệu. Biến z t được xem như là một biến ngẫu nhiên 1 . Chuỗi thời gian thường chịu ảnh hưởng hoặc bị tác động từ 4 yếu tố hay thành phần chính là xu hướng trend chu kỳ cyclical mùa seasonal và khác thường irregular 1 . Dựa trên sự tác động của 4 thành phần trên mà có hai loại mô hình được sử dụng cho chuỗi thời gian đó là mô hình nhân Multiplicative model và mô hình cộng Additive model . - Mô hình nhân Y t T t S t C t I t . - Mô hình cộng Y t T t S t C t I t . Với Y t là các điểm dữ liệu T t S t C t và I t lần lượt là các thành phần xu hướng mùa chu kỳ khác thường của chuỗi thời gian. Bài toán về khai thác dữ liệu dựa trên chuỗi thời gian đã và đang .