Bài báo này đề xuất giải pháp trích xuất thông tin hữu ích về tình trạng giao thông từ dữ liệu GPS thu thập được từ các thiết bị giám sát hành trình của phương tiện giao thông. Giải thuật gom cụm dựa trên mật độ được tích hợp vào trong quy trình khai thác dữ liệu để lọc ra các vị trí thường xuyên ùn tắc trong mạng lưới giao thông đô thị. Chúng tôi tiến hành thực nghiệm trên bộ dữ liệu thật phạm vi Thành phố Hồ Chí Minh và thu được kết quả khá hứa hẹn về mặt ứng dụng. | Khai thác thông tin tình trạng ùn tắc giao thông từ dữ liệu GPS - Trường hợp thành phố Hồ Chí Minh 36 Journal of Transportation Science and Technology, Vol 20, Aug 2016 KHAI THÁC THÔNG TIN TÌNH TRẠNG ÙN TẮC GIAO THÔNG TỪ DỮ LIỆU GPS - TRƯỜNG HỢP THÀNH PHỐ HỒ CHÍ MINH MINING INFORMATION ABOUT TRAFFIC CONGESTIONS FROM GPS DATA – CASE STUDY OF HO CHI MINH CITY Lê Văn Quốc Anh Khoa CNTT, ĐH GTVT , anh@ Tóm tắt: Bài báo này đề xuất giải pháp trích xuất thông tin hữu ích về tình trạng giao thông từ dữ liệu GPS thu thập được từ các thiết bị giám sát hành trình của phương tiện giao thông. Giải thuật gom cụm dựa trên mật độ được tích hợp vào trong quy trình khai thác dữ liệu để lọc ra các vị trí thường xuyên ùn tắc trong mạng lưới giao thông đô thị. Chúng tôi tiến hành thực nghiệm trên bộ dữ liệu thật phạm vi Thành phố Hồ Chí Minh và thu được kết quả khá hứa hẹn về mặt ứng dụng. Từ khóa: Dữ liệu hành trình GPS; khai thác dữ liệu; phát hiện ùn tắc. Abstract: This paper presents an approach to the discovery of useful information about traffic condition from GPS data obtained from vehicle tracking devices. A density - based clustering approach is intergrated into the data mining process to figure out the most likely areas of congestions in urban traffic networks. We performed experiments on real - life datasets of Ho Chi Minh City and obtained very promissing results for developing applications. Keywords: Gps trajectory data; data mining; congestion detection. 1. Giới thiệu Mặc dù tính ứng dụng của bài toán này là Khai thác dữ liệu là quá trình tìm kiếm và khá đa dạng nhưng việc xử lý trên dữ liệu GPS rút trích những thông tin tiềm ẩn có giá trị, hữu và rút trích được những thông tin có giá trị gặp ích từ một khối lượng dữ liệu khá lớn ban đầu. nhiều thách thức. Thứ nhất, với sự ổn định và Những thông tin được rút trích được gọi là tri tính chính xác tương đối, bản thân dữ liệu thức, là yếu tố quyết định giúp