Bài viết này trình bày phương pháp phân cụm các khuôn mặt trong một tập ảnh khuôn mặt đã có dựa vào đặc trưng là các thành phần chính được trích rút bằng thuật toán PCA. Sau đó sử dụng thuật toán phân cụm phân cấp (HAC) để phân cụm các khuôn mặt vào các cụm riêng biệt. Nghiên cứu đã thực nghiệm trên tập ảnh gồm 100 ảnh. Các kết quả thực nghiệm cho thấy phương pháp mới đề xuất cho kết quả với độ chính xác tốt. | Nguyễn Hữu Quỳnh Tạp chí KHOA HỌC & CÔNG NGHỆ 181(05): 9 - 14 MỘT PHƯƠNG PHÁP PHÂN CỤM KHUÔN MẶT HIỆU QUẢ TRÊN MẠNG XÃ HỘI Nguyễn Hữu Quỳnh* Trường Đại học Điện lực TÓM TẮT Trong những năm gần đây, lượng thông tin trên mạng xã hội đang phát triển như vũ bão, chỉ tính riêng trên mạng facebook đã có hàng trăm tỷ bức hình. Do đó, xử lý các nguồn dữ liệu này để trợ giúp người dùng trong việc phát hiện tri thức và khai phá dữ liệu sẽ vô cùng cần thiết. Bài báo này trình bày phương pháp phân cụm các khuôn mặt trong một tập ảnh khuôn mặt đã có dựa vào đặc trưng là các thành phần chính được trích rút bằng thuật toán PCA. Sau đó sử dụng thuật toán phân cụm phân cấp (HAC) để phân cụm các khuôn mặt vào các cụm riêng biệt. Nghiên cứu đã thực nghiệm trên tập ảnh gồm 100 ảnh. Các kết quả thực nghiệm cho thấy phương pháp mới đề xuất cho kết quả với độ chính xác tốt. Từ khóa: phân cụm phân cấp; phân tích thành phần chính; khai phá dữ liệu; khuôn mặt;phân cụm GIỚI THIỆU* Hiện nay thế giới có hàng trăm mạng mạng xã hội khác nhau như MySpace và Facebook nổi tiếng trong thị trường Bắc Mỹ và Tây Âu; Orkut và Hi5 tại Nam Mỹ; Friendster tại Châu Á và các đảo quốc Thái Bình Dương. Một số mạng xã hội khác đã gặt hái được thành công đáng kể theo vùng miền như Bebo tại Anh Quốc, CyWorld tại Hàn Quốc, Mixi tại Nhật Bản. Ở Việt Nam xuất hiện rất nhiều các mạng xã hội như: Facebook, Zing Me, YuMe, Tamtay. Với số lượng mạng xã hội đông đảo như thế, lượng thông tin dữ liệu thu được là khổng lồ. Trong lượng thông tin khổng lồ này, có một lượng lớn là hình ảnh. Một minh chứng rõ nhất là mạng xã hội facebook, cho đến nay đã có hàng trăm tỷ bức hình trong cơ sở dữ liệu. Việc tìm ra thông tin hữu ích trên lượng dữ liệu hình ảnh lớn như vậy sẽ rất cấp thiết. Nhiều thông tin được chia sẻ trên mạng xã hội thể hiện bằng các hình ảnh cung cấp cho người dùng về thông tin của người, cảnh, Tuy nhiên, mỗi khimột người dùng muốn tìm hiểu thông tin về một ai đógặp phải vấn đề phải tìm thông tin về người đó