Đang chuẩn bị liên kết để tải về tài liệu:
Tóm tắt Luận văn Thạc sĩ Công nghệ thông tin: Phương pháp phân cụm dựa trên tập thô và giải thuật di truyền

Tấn Trình 86 30 pdf

Không đóng trình duyệt đến khi xuất hiện nút TẢI XUỐNG Tải xuống

Luận văn trình bày khảo cứu một cách hệ thống của bài báo các kiến thức về phân cụm dữ liệu rõ, thô theo hướng KMeans và ứng dụng giải thuật di truyền để phân cụm dữ liệu thô. Trên cơ sở đó xây dựng chương trình thực nghiệm trên một số bộ dữ liệu, kết quả cho thấy ưu điểm của phương pháp mới. | ĐẠI HỌC QUỐC GIA HÀ NỘI TRƢỜNG ĐẠI HỌC CÔNG NGHỆ HOÀNG HUYỀN TRANG PHƢƠNG PHÁP PHÂN CỤM DỰA TRÊN TẬP THÔ VÀ GIẢI THUẬT DI TRUYỀN Chuyên ngành: Hệ thống thông tin Mã số: 60480104 TÓM TẮT LUẬN VĂN THẠC SĨ Hà Nội - 2016 1 MỞ ĐẦU Phân cụm dữ liệu là một trong những nghiên cứu quan trọng trong khai thác dữ liệu và được áp dụng cho đa lĩnh vực [7,8]. Mục tiêu chính trong phân cụm dữ liệu là để phân loại các đối tượng không có nhãn thành nhiều cụm mà các đối tượng thuộc cùng một cụm thì tương tự nhau và khác nhau đối với các cụm khác nhau. Phân cụm dữ liệu được chia làm hai loại là phân cụm cứng/rõ và phân cụm mềm [12,15]. Một kỹ thuật được sử dụng phổ biến trong phân cụm dữ liệu là thuật toán K-Means, thuộc phân cụm rõ, với sự hội tụ nhanh chóng và khả năng tìm kiếm địa phương mạnh mẽ. Trong quá trình phân cụm K-Means truyền thống, các đối tượng dữ liệu thu được trong cụm là nhất định. Tuy nhiên, trong thực tế giữa những đối tượng thường không có ranh giới rõ ràng. Để tăng hiệu quả và kết quả chính xác cho phân cụm việc sử dụng lý thuyết tập thô tiếp cận hỗ trợ phân cụm K-Meansđược đề xuất. Mặc dù giải thuật K-Means thô có khả năng tìm kiếm địa phương mạnh mẽ nhưng lại dễ rơi vào cực trị địa phương. Một trong những biện pháp có thể khắc phục được hạn chế này là kết hợp với giải thuật di truyền là một thuật toán dựa trên nguyên tắc của sự tiến hóa sinh học, có lượng lớn số song song tiềm ẩn thực hiện không gian tìm kiếm lớn và cung cấp giải pháp tối ưu hóa toàn cầu giúp tránh được tối ưu địa phương. Luận văn trình bày khảo cứu một cách hệ thống của bài báo [6] các kiến thức về phân cụm dữ liệu rõ, thô theo hướng KMeans và ứng dụng giải thuật di truyền để phân cụm dữ liệu thô. Trên cơ sở đó xây dựng chương trình thực nghiệm trên một số bộ dữ liệu, kết quả cho thấy ưu điểm của phương pháp mới. Cấu trúc của luận văn gồm 3 chương : Chương I. Phân cụm dữ liệu và một số vấn đề liên quan. Chương II. Phân cụm dựa trên tập thô và thuật toán di truyền. Chương III. Cài đặt và

TÀI LIỆU LIÊN QUAN