Hiện nay, tình trạng sinh viên bị buộc ngừng học đang diễn ra rất phổ biến tại các trường đại học ở Việt Nam. Bài báo này đề xuất phương pháp cho phép dự đoán được khả năng bị buộc ngừng học dựa vào phân tích dữ liệu từ điểm thi đầu vào, điểm thi các môn của ba học kỳ đầu và tình trạng hiện thời (tiếp tục học hoặc ngừng học) của hơn 555 sinh viên khóa 54, 55, 56 ngành Công nghệ thông tin, Trường Đại học Vinh. Từ dữ liệu đã có, hai thuật toán khai phá dữ liệu Logistic Regression, Naive Bayes đã được áp dụng để tìm ra mô hình tốt nhất cho việc dự báo tình trạng học tập cho sinh viên các khóa tiếp theo. Việc nghiên cứu này sẽ giúp cho Nhà trường đưa ra được những cảnh báo sớm và có phương án hỗ trợ để giảm tỷ lệ bị buộc thôi học cho các sinh viên khóa sau. | Dự đoán kết quả học tập của sinh viên bằng kỹ thuật khai phá dữ liệu N. T. Uyên, N. M. Tâm / Áp dụng thuật toán khai phá dữ liệu trong dự báo kết quả học tập của sinh viên DỰ ĐOÁN KẾT QUẢ HỌC TẬP CỦA SINH VIÊN BẰNG KỸ THUẬT KHAI PHÁ DỮ LIỆU Nguyễn Thị Uyên, Nguyễn Minh Tâm Trường Đại học Vinh Ngày nhận bài 22/5/2019, ngày nhận đăng 12/9/2019 Tóm tắt: Hiện nay, tình trạng sinh viên bị buộc ngừng học đang diễn ra rất phổ biến tại các trường đại học ở Việt Nam. Bài báo này đề xuất phương pháp cho phép dự đoán được khả năng bị buộc ngừng học dựa vào phân tích dữ liệu từ điểm thi đầu vào, điểm thi các môn của ba học kỳ đầu và tình trạng hiện thời (tiếp tục học hoặc ngừng học) của hơn 555 sinh viên khóa 54, 55, 56 ngành Công nghệ thông tin, Trường Đại học Vinh. Từ dữ liệu đã có, hai thuật toán khai phá dữ liệu Logistic Regression, Naive Bayes đã được áp dụng để tìm ra mô hình tốt nhất cho việc dự báo tình trạng học tập cho sinh viên các khóa tiếp theo. Việc nghiên cứu này sẽ giúp cho Nhà trường đưa ra được những cảnh báo sớm và có phương án hỗ trợ để giảm tỷ lệ bị buộc thôi học cho các sinh viên khóa sau. Từ khóa: Khai phá dữ liệu giáo dục; cảnh báo ngừng học. 1. Giới thiệu Trong những năm qua, công tác tuyển sinh ngày càng khó khăn, nhưng số lượng sinh viên bị buộc thôi học, cảnh báo thôi học lại ngày càng có xu hướng gia tăng. Theo thống kê chưa chính thức tại Trường Đại học Vinh, mỗi năm có tới hàng trăm sinh viên rơi vào tình trạng bị buộc thôi học, chủ yếu tập trung vào các sinh viên học năm thứ 3, hoặc năm thứ 4, khi các em đã gần tốt nghiệp. Vì vậy, việc phát hiện sớm các sinh viên có khả năng bị buộc ngừng học nhằm giúp họ lập kế hoạch học tập sao cho phù hợp là một nhu cầu rất cần thiết của nhà trường hiện nay. Khai phá dữ liệu giáo dục là một lĩnh vực nghiên cứu đã và đang được nhiều nhà khoa học quan tâm. Các thuật toán khai phá dữ liệu như Logistic Regression, Naive Bayes đã được áp dụng nhiều trong