Luận văn này tập trung nghiên cứu cơ sở lý thuyết truy xuất thông tin và xây dựng thử nghiệm một hệ thống truy xuất thông tin cho phép tìm kiếm các tài liệu mang nội dung tiếng anh chứa trong một máy tính. Hệ thống được xây dựng dựa trên thư viện mã nguồn mở truy xuất thông tin Lucene