Collocation là những cụm từ (gồm hai hay nhiều từ) thường được sử dụng với toán xác định collocation trong một kho ngữ liệu đã và đang nhận được nhiều sự quantâm, nghiên cứu của các nhà khoa học trên thế giới. Có rất nhiều phương pháp để giải quyết bài toán này, song hiện nay, các phương pháp thống kê đang được sử dụng phổ biếnbởi những người làm trong lĩnh vực Xử lý ngôn ngữ tự nhiên. Khóa luận tốt nghiệp với đề tài "Nghiên cứu bài toán xác định collocation trong Tiếng Việt" tập trung nghiên.