Báo cáo tài liệu vi phạm
Giới thiệu
Kinh doanh - Marketing
Kinh tế quản lý
Biểu mẫu - Văn bản
Tài chính - Ngân hàng
Công nghệ thông tin
Tiếng anh ngoại ngữ
Kĩ thuật công nghệ
Khoa học tự nhiên
Khoa học xã hội
Văn hóa nghệ thuật
Sức khỏe - Y tế
Văn bản luật
Nông Lâm Ngư
Kỹ năng mềm
Luận văn - Báo cáo
Giải trí - Thư giãn
Tài liệu phổ thông
Văn mẫu
THỊ TRƯỜNG NGÀNH HÀNG
NÔNG NGHIỆP, THỰC PHẨM
Gạo
Rau hoa quả
Nông sản khác
Sữa và sản phẩm
Thịt và sản phẩm
Dầu thực vật
Thủy sản
Thức ăn chăn nuôi, vật tư nông nghiệp
CÔNG NGHIỆP
Dệt may
Dược phẩm, Thiết bị y tế
Máy móc, thiết bị, phụ tùng
Nhựa - Hóa chất
Phân bón
Sản phẩm gỗ, Hàng thủ công mỹ nghệ
Sắt, thép
Ô tô và linh kiện
Xăng dầu
DỊCH VỤ
Logistics
Tài chính-Ngân hàng
NGHIÊN CỨU THỊ TRƯỜNG
Hoa Kỳ
Nhật Bản
Trung Quốc
Hàn Quốc
Châu Âu
ASEAN
BẢN TIN
Bản tin Thị trường hàng ngày
Bản tin Thị trường và dự báo tháng
Bản tin Thị trường giá cả vật tư
Tìm
Danh mục
Kinh doanh - Marketing
Kinh tế quản lý
Biểu mẫu - Văn bản
Tài chính - Ngân hàng
Công nghệ thông tin
Tiếng anh ngoại ngữ
Kĩ thuật công nghệ
Khoa học tự nhiên
Khoa học xã hội
Văn hóa nghệ thuật
Y tế sức khỏe
Văn bản luật
Nông lâm ngư
Kĩ năng mềm
Luận văn - Báo cáo
Giải trí - Thư giãn
Tài liệu phổ thông
Văn mẫu
NGÀNH HÀNG
NÔNG NGHIỆP, THỰC PHẨM
Gạo
Rau hoa quả
Nông sản khác
Sữa và sản phẩm
Thịt và sản phẩm
Dầu thực vật
Thủy sản
Thức ăn chăn nuôi, vật tư nông nghiệp
CÔNG NGHIỆP
Dệt may
Dược phẩm, Thiết bị y tế
Máy móc, thiết bị, phụ tùng
Nhựa - Hóa chất
Phân bón
Sản phẩm gỗ, Hàng thủ công mỹ nghệ
Sắt, thép
Ô tô và linh kiện
Xăng dầu
DỊCH VỤ
Logistics
Tài chính-Ngân hàng
NGHIÊN CỨU THỊ TRƯỜNG
Hoa Kỳ
Nhật Bản
Trung Quốc
Hàn Quốc
Châu Âu
ASEAN
BẢN TIN
Bản tin Thị trường hàng ngày
Bản tin Thị trường và dự báo tháng
Bản tin Thị trường giá cả vật tư
Thông tin
Tài liệu Xanh là gì
Điều khoản sử dụng
Chính sách bảo mật
0
Trang chủ
Công Nghệ Thông Tin
Cơ sở dữ liệu
Một tiếp cận đánh giá độ trùng lặp văn bản sử dụng trọng số mờ và ứng dụng trong tra cứu văn bản
Đang chuẩn bị liên kết để tải về tài liệu:
Một tiếp cận đánh giá độ trùng lặp văn bản sử dụng trọng số mờ và ứng dụng trong tra cứu văn bản
Minh Sơn
320
3
pdf
Không đóng trình duyệt đến khi xuất hiện nút TẢI XUỐNG
Tải xuống
Bài viết Một tiếp cận đánh giá độ trùng lặp văn bản sử dụng trọng số mờ và ứng dụng trong tra cứu văn bản đề xuất cải tiến đánh giá độ tương tự giữa hai văn bản tiếng Việt và ứng dụng trong hệ thống tra cứu văn bản. | Tuyển tập Hội nghị Khoa học thường niên năm 2019. ISBN 978-604-82-2981-8 MỘT TIẾP CẬN ĐÁNH GIÁ ĐỘ TRÙNG LẶP VĂN BẢN SỬ DỤNG TRỌNG SỐ MỜ VÀ ỨNG DỤNG TRONG TRA CỨU VĂN BẢN Nguyễn Tu Trung Trường Đại học Thủy lợi email trungnt@tlu.edu.vn 1. GIỚI THIỆU CHUNG hiện kiểm tra một bài báo điện tử được thu thập về xem có giống gần giống với các bài Trùng lặp nội dung văn bản là hiện tượng phổ biến trong đời sống. Vì nhiều nguyên đã được thu thập trước đó hay không. nhân các văn bản thường bị sao chép trích 2.2. Độ đo tương tự dẫn. Đối với các hệ thống lưu trữ tài liệu việc lưu các văn bản có độ trùng lặp cao chỉ gây lãng phí và tốn tài nguyên. Với các máy tìm kiếm khi thu thập dữ liệu từ Internet nếu đánh giá tốt độ trùng lặp của dữ liệu mới so với các tài liệu có trong kho dữ liệu sẽ tránh được việc tiếp tục tải thêm và lưu trữ một dữ liệu mới trùng lặp vào kho dữ liệu. Phát hiện trùng lặp là bài toán phức tạp vì các văn bản thường không bị sao chép toàn Hình 1. Mô hình không gian vector phần mà chỉ một phần có thể ít có thể nhiều. cho văn bản 4 . Các phần bị sao chép có thể bị thay đổi và Văn bản thường được biểu diễn dưới dạng nằm ở vị trí khác nhau trong văn sao chép. vector dựa theo mô hình tần suất 4 mà tiêu Trong 1 Muneer và cộng sự đã đề xuất biểu là các phương pháp dựa trên tần số TF và thuật toán cho việc thiết lập các cụm trang nghịch đảo tần số IDF . Hình 2 là ví dụ trong web trùng lặp. Ngoài ra Fresno và cộng sự trường hợp biểu diễn văn bản với số Token là đã đề xuất hàm trọng số FCC là hệ mờ cho 2. Về mặt tổng quát số Token rất nhiều ví dụ việc gán các trọng số đặc trưng và sự kết hợp Tổng số âm tiết nếu dùng đặc trưng âm tiết của chúng 2 . Hiện nay trong nước cũng đã Tổng số từ nếu dùng đặc trưng từ . có một số công trình nghiên cứu về việc phát Có một số độ đo được sử dụng như hiện nội dung trùng lặp trong kho văn bản độ tương tự cosine cosine similarity hệ tiếng Việt 3 5 các nghiên cứu cho thấy số Jaccard Jaccard coeficient khoảng cách việc kết hợp các tiêu
TÀI LIỆU LIÊN QUAN
Trao đổi về cách đọc và viết một số địa danh ở Tây Nguyên – tiếp cận từ góc độ ngôn ngữ - văn hóa
Vận dụng một số kĩ thuật đánh giá tích cực cho môn học tư duy hệ thống nhằm đạt chuẩn đầu ra theo hướng tiếp cận CDIO tại trường Đại học Sư phạm Kĩ thuật thành phố Hồ Chí Minh
Nâng cao cơ chế thực thi quyền được tiếp cận thông tin về hoạt động đánh giá tác động môi trường đến với người dân: Những hạn chế và một số giải pháp
Luận văn Thạc sĩ Kinh tế nông nghiệp: Đánh giá thực trạng và đề xuất một số giải pháp tiếp cận tín dụng của các hợp tác xã nông nghiệp trên địa bàn huyện Nho Quan tỉnh Ninh Bình
Tài liệu hướng dẫn sử dụng cổng dịch vụ công trực tuyến và phần mềm một cửa điện tử (Dành cho cán bộ tiếp nhận hồ sơ)
Về kiểu “ẩn danh” nhân vật - Tiếp cận qua một số tiểu thuyết Việt Nam đương đại
Khó khăn tâm lí của giáo viên tiểu học khi đánh giá bằng nhận xét cho học sinh ở một số trường tiểu học tại thành phố Sơn La
Tiếng Anh Dành Cho Người Mới Học: Bắt chuyện với một người lạ
Thuyết trình: Kurt Lewin và tiếp cận thay đổi được hoạch định: Một sự tái đánh giá
Những nhân tố ảnh hưởng đến sản lượng khai thác hải sản của đội tàu xa bờ vùng Duyên hải Nam Trung Bộ: Một tiếp cận thực nghiệm
Đã phát hiện trình chặn quảng cáo AdBlock
Trang web này phụ thuộc vào doanh thu từ số lần hiển thị quảng cáo để tồn tại. Vui lòng tắt trình chặn quảng cáo của bạn hoặc tạm dừng tính năng chặn quảng cáo cho trang web này.