Tăng cường trọng số BM25 kết hợp mô hình ngữ cảnh cho việc dò tìm báo cáo lỗi trùng nhau

Những báo cáo lỗi được những người sử dụng gửi thường được lưu trữ và quản lý bởi những hệ thống quản lý lỗi của những dự án phần mềm nguồn mở như Open Office, Mozilla Firefox, Eclipse . Trong bài viết này, nhóm tác giả giới thiệu một phương pháp mới tự động dò tìm những báo cáo lỗi trùng nhau bằng cách sử dụng mô hình LDANWF (Latent Dirichlet Allocation-New Weight Feature). | ISSN 1859-1531 - TẠP CHÍ KHOA HỌC VÀ CÔNG NGHỆ - ĐẠI HỌC ĐÀ NẴNG VOL. 19 NO. 7 2021 53 TĂNG CƯỜNG TRỌNG SỐ BM25 KẾT HỢP MÔ HÌNH NGỮ CẢNH CHO VIỆC DÒ TÌM BÁO CÁO LỖI TRÙNG NHAU IMPROVING BM25 WEIGHTING COMBINED WITH CONTEXTUAL MODEL FOR DUPLICATE BUG REPORT DETECTION Nhan Minh Phúc1 Nguyễn Thừa Phát Tài1 Nguyễn Hoàng Duy Thiện1 1 Trường Đại học Trà Vinh Tác giả liên hệ nhanminhphuc@ Nhận bài 07 9 2020 Chấp nhận đăng 28 6 2021 Tóm tắt - Những báo cáo lỗi được những người sử dụng gửi thường Abstract - Bug reports submitted by users are usually stored and được lưu trữ và quản lý bởi những hệ thống quản lý lỗi của những managed by issue management systems in open source software dự án phần mềm nguồn mở như Open Office Mozilla Firefox projects such as Open Office Mozilla Firefox Eclipse. The Eclipse. Những lập trình viên sẽ dựa vào những báo cáo lỗi này để developers will rely on these bug reports to process bugs. xử lý lỗi. Tuy nhiên có quá nhiều báo cáo lỗi gửi đến hệ thống khi However there are too many bug reports sent to the system đó sẽ có những báo cáo lỗi trùng nhau. Do đó việc phải xác định which leads to the duplication of bug reports. Therefore it will báo cáo lỗi vừa được gửi đến có bị trùng hay không sẽ mất nhiều take time and effort of the person assigned to handle the bug for thời gian và công sức của người được phân công xử lý lỗi. Trong bài determining if the bug has been duplicated or not. In this paper báo này nhóm tác giả giới thiệu một phương pháp mới tự động dò we introduce a new approach of detecting duplicate bug reports tìm những báo cáo lỗi trùng nhau bằng cách sử dụng mô hình LDA- automatically using the Latent Dirichlet Allocation-New Weight NWF Latent Dirichlet Allocation-New Weight Feature . Mô hình Feature LDA model. This model is a combination of the LDA này là sự kết hợp giữa mô hình LDA với đặc điểm trọng số mới. Kết model with the new weighting feature. Experimental results on quả thực nghiệm trên ba hệ thống Open Office .

Không thể tạo bản xem trước, hãy bấm tải xuống
TÀI LIỆU LIÊN QUAN
TỪ KHÓA LIÊN QUAN
TÀI LIỆU MỚI ĐĂNG
15    15    4    23-11-2024
Đã phát hiện trình chặn quảng cáo AdBlock
Trang web này phụ thuộc vào doanh thu từ số lần hiển thị quảng cáo để tồn tại. Vui lòng tắt trình chặn quảng cáo của bạn hoặc tạm dừng tính năng chặn quảng cáo cho trang web này.