Nhận dạng và truy vấn đối tượng ba chiều với Ring View và Neural Embedding

Bài toán nhận dạng và truy vấn vật thể ba chiều (3D) dành được sự quan tâm. Trong công trình này, tác giả đề xuất phương pháp nhận dạng vật thể 3D bằng cách khai thác các hình chiếu 2D của vật thể 3D từ nhiều góc nhìn khác nhau. Tác giả khai thác tính thứ tự giữa các hình chiếu 2D trong một ring, trong khi không ép buộc tính thứ tự giữa tất cả các hình chiếu. | Giải thưởng Sinh viên nghiên cứu khoa học Euréka lần 20 năm 2018 Kỷ yếu khoa học NHẬN DẠNG VÀ TRUY VẤN ĐỐI TƯỢNG BA CHIỀU VỚI RING VIEW VÀ NEURAL EMBEDDING Bùi Ngọc Minh Đỗ Trọng Lễ Nguyễn Vinh Tiệp Trần Minh Triết Trường Đại học Khoa học Tự nhiên Đại học Quốc gia TP. Hồ Chí Minh Tác giả liên lạc bnminh@ TÓM TẮT Bài tóa n nhận dạng và truy vấn vật thể ba chiều 3D dành được sự quan tâm. Trong công trình này tác giả đề xuất phương pháp nhận dạng vật thể 3D bằng cách khai thác các hình chiếu 2D của vật thể 3D từ nhiều góc nhìn khác nhau. Tác giả khai thác tính thứ tự giữa các hình chiếu 2D trong một ring trong khi không ép buộc tính thứ tự giữa tất cả các hình chiếu. Với cấu trúc Ring View đã được định nghĩa chúng tôi đề xuất một mạng neural network để phân lớp các vật thể 3D. Phương pháp được đề xuất không chỉ giới hạn cho các đối tượng 3D toàn vẹn mà cũng có thể phân lớp những đối tượng không toàn vẹn thường bắt gặp từ dữ liệu thu thập bởi robot. Tác giả thí nghiệm với tập dữ liệu từ cuộc thi SHREC 2017 và 2018 phần RGB-D to CAD retrieval cũng như với tập dữ liệu ModelNet40. Phương pháp đề xuất đạt độ chính xác truy vấn mAP trong tập dữ liệu từ SHREC 2017 trong tập dữ liệu từ SHREC 2018 và trong tập dữ liệu ModelNet40 tương đương với các công trình liên quan trong lĩnh vực. Từ khóa Máy học thị giác máy tính 3D nhận dạng đối tượng truy vấn đối tượng. 3D OBJECT CLASSIFICATION AND RETRIEVAL WITH RING VIEW AND NEURAL EMBEDDING Bui Ngoc Minh Do Trong Le Nguyen Vinh Tiep Tran Minh Triet University of Science VNU Ho Chi Minh City Corresponding Author bnminh@ ABSTRACT The problem of 3D object classification and retrieval has attracted lot of attention. In this work we propose a method to recognize 3D object by exploiting the 2D projections of the 3D objects from different viewpoints. We based on the topological combination between views in a ring which has several views while we do not enforce the topological relationship

Không thể tạo bản xem trước, hãy bấm tải xuống
TÀI LIỆU MỚI ĐĂNG
Đã phát hiện trình chặn quảng cáo AdBlock
Trang web này phụ thuộc vào doanh thu từ số lần hiển thị quảng cáo để tồn tại. Vui lòng tắt trình chặn quảng cáo của bạn hoặc tạm dừng tính năng chặn quảng cáo cho trang web này.