Cải tiến thuật toán K-Means và ứng dụng hỗ trợ sinh viên chọn chuyên ngành theo học chế tín chỉ

K-Means là thuật toán được ứng dụng rất hiệu quả trong nhiều bài toán phân cụm dữ liệu. Tác giả áp dụng thuật toán này để phân cụm chuyên ngành trên tập dữ liệu điểm số, tuy nhiên thuật toán kém hiệu quả trong một số trường hợp nên độ chính xác không cao. Vì vậy, trong bài báo này, nhóm tác giả đề xuất phương pháp phân cụm trên tập dữ liệu nhóm điểm đặc trưng cho mỗi chuyên ngành. | Tạp chí Khoa học công nghệ và Thực phẩm 15 (1) (2018) 152-160 CẢI TIẾN THUẬT TOÁN K-MEANS VÀ ỨNG DỤNG HỖ TRỢ SINH VIÊN CHỌN CHUYÊN NGÀNH THEO HỌC CHẾ TÍN CHỈ Nguyễn Văn Lễ*, Mạnh Thiên Lý Nguyễn Thị Định, Nguyễn Thị Thanh Thủy Trường Đại học Công nghiệp Thực phẩm *Email: lecntp@ Ngày nhận bài: 27/4/2018; Ngày chấp nhận đăng: 05/6/2018 TÓM TẮT K-Means là thuật toán được ứng dụng rất hiệu quả trong nhiều bài toán phân cụm dữ liệu. Nhóm tác giả áp dụng thuật toán này để phân cụm chuyên ngành trên tập dữ liệu điểm số, tuy nhiên thuật toán kém hiệu quả trong một số trường hợp nên độ chính xác không cao. Vì vậy, trong bài báo này, nhóm tác giả đề xuất phương pháp phân cụm trên tập dữ liệu nhóm điểm đặc trưng cho mỗi chuyên ngành. Ngoài ra, cải tiến thuật toán K-Means để loại bỏ phần tử nhiễu nhằm giảm thời gian tính toán của thuật toán. Kết quả phân cụm sẽ hỗ trợ sinh viên Khoa Công nghệ Thông tin, Trường Đại học Công nghiệp thực phẩm Thành phố Hồ Chí Minh lựa chọn chuyên ngành phù hợp. Từ khóa: K-Means, phân cụm dữ liệu, chọn chuyên ngành, khoảng cách Euclid, trọng tâm. 1. GIỚI THIỆU . Phân cụm Phân cụm dữ liệu là phương pháp xử lý thông tin nhằm khám phá mối liên hệ giữa các mẫu dữ liệu bằng cách tổ chức chúng thành các cụm tương tự. Tất cả các dạng dữ liệu được biểu diễn bởi các đặc trưng đó là vectơ n-chiều. Để phân cụm dữ liệu cần thực hiện các bước cơ bản sau: Chọn đặc trưng: Các đặc trưng lựa chọn phải hợp lý để có thể mã hoá nhiều nhất các thông tin liên quan đến công việc quan tâm. Chọn độ đo gần nhất: Một độ đo chỉ ra mức độ tương tự hay không tương tự giữa hai vectơ đặc trưng. Tiêu chuẩn phân cụm: Tiêu chuẩn phân cụm có thể được biểu diễn bởi hàm chi phí hoặc một vài quy tắc khác. Công nhận kết quả: Sau khi có kết quả phân cụm, cần kiểm tra tính đúng đắn của nó. Giải thích kết quả: Bằng kết quả thực nghiệm cần phân tích để đưa ra kết luận đúng đắn. Một số phương pháp phân cụm điển hình: Phân cụm phân hoạch, phân cụm phân cấp, phân cụm .

Không thể tạo bản xem trước, hãy bấm tải xuống
TỪ KHÓA LIÊN QUAN
TÀI LIỆU MỚI ĐĂNG
Đã phát hiện trình chặn quảng cáo AdBlock
Trang web này phụ thuộc vào doanh thu từ số lần hiển thị quảng cáo để tồn tại. Vui lòng tắt trình chặn quảng cáo của bạn hoặc tạm dừng tính năng chặn quảng cáo cho trang web này.