Cải tiến trọng số kết hợp kỹ thuật rút trích đa đặc điểm trong việc dò tìm những báo cáo lỗi trùng nhau

Bài viết giới thiệu một mô hình đa đặc điểm kết hợp với sự cải tiến trọng số từ CFC (Class-Feature-Centroid) để phát hiện các báo cáo lỗi trùng nhau chính xác hơn. Chúng tôi đã tiến hành thực nghiệm trên ba kho phần mềm chứa lỗi lớn từ Firefox, Eclipse và OpenOffice. Kết quả cho thấy rằng kỹ thuật của chúng tôi có thể cải thiện tốt hơn từ 8-11 % khi so với các phương pháp được so sánh. | Kỷ yếu Hội nghị KHCN Quốc gia lần thứ XII về Nghiên cứu cơ bản và ứng dụng Công nghệ thông tin FAIR Huế ngày 07-08 6 2019 DOI CẢI TIẾN TRỌNG SỐ KẾT HỢP KỸ THUẬT RÚT TRÍCH ĐA ĐẶC ĐIỂM TRONG VIỆC DÒ TÌM NHỮNG BÁO CÁO LỖI TRÙNG NHAU Nhan Minh Phúc1 Nguyễn Hoàng Duy Thiện2 Dƣơng Ngọc Vân Khanh3 1 2 3 Khoa Kỹ thuật và Công nghệ Trường Đại học Trà Vinh nhanminhphc@ thiennhd@ vankhanh@ TÓM TẮT Đối với các phần mềm mở như Firefox Eclipse Subversion họ thường có hệ thống kho lưu trữ những báo cáo lỗi do người dùng gửi đến. Những báo cáo lỗi này giúp cho hệ thống xác định được những lỗi khác nhau của phần mềm điều này làm cho việc bảo trì phần mềm tốt hơn. Do số lượng người dùng ngày càng tăng do đó số lượng báo cáo lỗi được phát hiện cũng ngày càng nhiều. Điều này dẫn đến tình huống có nhiều báo cáo lỗi được gửi đến kho xử lý mà những báo cáo lỗi này đã được những người dùng khác nhau báo cáo trước đó điều này được gọi là báo cáo lỗi trùng nhau. Để giải quyết vấn đề này một lập trình viên được phần công phụ trách việc xử lý lỗi cần phải gắn nhãn các báo cáo lỗi này theo cách thủ công dưới dạng các báo cáo lỗi trùng nhau. Tuy nhiên trong thực tế có quá nhiều báo cáo lỗi trùng được gửi hàng ngày nếu cứ thực hiện công việc nhận biết thủ công sẽ tốn nhiều thời gian và công sức. Để giải quyết vấn đề này gần đây một số kỹ thuật đã được đề xuất để tự động phát hiện các báo cáo lỗi trùng lặp tuy nhiên kết quả chính xác chỉ chiếm khoảng 36-89 lý do vì hai báo cáo của cùng một lỗi có thể được viết theo nhiều cách khác nhau do đó việc cải tiến về tính chính xác của quá trình phát hiện trùng lặp đang là chủ đề được nhiều sự quan tâm của các nhà nghiên cứu gần đây. Trong bài báo này chúng tôi giới thiệu một mô hình đa đặc điểm kết hợp với sự cải tiến trọng số từ CFC Class-Feature-Centroid để phát hiện các báo cáo lỗi trùng nhau chính xác hơn. Chúng tôi đã tiến hành thực nghiệm trên ba kho phần mềm chứa lỗi lớn từ Firefox Eclipse và

Không thể tạo bản xem trước, hãy bấm tải xuống
TÀI LIỆU LIÊN QUAN
TỪ KHÓA LIÊN QUAN
TÀI LIỆU MỚI ĐĂNG
28    65    2    26-04-2024
Đã phát hiện trình chặn quảng cáo AdBlock
Trang web này phụ thuộc vào doanh thu từ số lần hiển thị quảng cáo để tồn tại. Vui lòng tắt trình chặn quảng cáo của bạn hoặc tạm dừng tính năng chặn quảng cáo cho trang web này.