Báo cáo khoa học: "An Off-the-shelf Language Identification Tool"

We present , an off-the-shelf language identification tool. We discuss the design and implementation of , and provide an empirical comparison on 5 longdocument datasets, and 2 datasets from the microblog domain. We find that maintains consistently high accuracy across all domains, making it ideal for end-users that require language identification without wanting to invest in preparation of in-domain training data.

Không thể tạo bản xem trước, hãy bấm tải xuống
TÀI LIỆU MỚI ĐĂNG
Đã phát hiện trình chặn quảng cáo AdBlock
Trang web này phụ thuộc vào doanh thu từ số lần hiển thị quảng cáo để tồn tại. Vui lòng tắt trình chặn quảng cáo của bạn hoặc tạm dừng tính năng chặn quảng cáo cho trang web này.