Trong bài báo này, tác giả đề xuất một thuật toán theo mô hình phân cấp nhờ kết hợp thuật toán Seeded-Kemean (Basu et al, 2002) với tiêu chuẩn thông tin Bayes để xác định số cụm k và các cụm con. Các thí nghiệm trên bộ dữ liệu chuẩn UCI cho thấy giải pháp này thực sự có ý nghĩa trong việc dự đoán K một cách chính xác mà vẫn giữ được cấu trúc cụm tốt.