Báo cáo tài liệu vi phạm
Giới thiệu
Kinh doanh - Marketing
Kinh tế quản lý
Biểu mẫu - Văn bản
Tài chính - Ngân hàng
Công nghệ thông tin
Tiếng anh ngoại ngữ
Kĩ thuật công nghệ
Khoa học tự nhiên
Khoa học xã hội
Văn hóa nghệ thuật
Sức khỏe - Y tế
Văn bản luật
Nông Lâm Ngư
Kỹ năng mềm
Luận văn - Báo cáo
Giải trí - Thư giãn
Tài liệu phổ thông
Văn mẫu
THỊ TRƯỜNG NGÀNH HÀNG
NÔNG NGHIỆP, THỰC PHẨM
Gạo
Rau hoa quả
Nông sản khác
Sữa và sản phẩm
Thịt và sản phẩm
Dầu thực vật
Thủy sản
Thức ăn chăn nuôi, vật tư nông nghiệp
CÔNG NGHIỆP
Dệt may
Dược phẩm, Thiết bị y tế
Máy móc, thiết bị, phụ tùng
Nhựa - Hóa chất
Phân bón
Sản phẩm gỗ, Hàng thủ công mỹ nghệ
Sắt, thép
Ô tô và linh kiện
Xăng dầu
DỊCH VỤ
Logistics
Tài chính-Ngân hàng
NGHIÊN CỨU THỊ TRƯỜNG
Hoa Kỳ
Nhật Bản
Trung Quốc
Hàn Quốc
Châu Âu
ASEAN
BẢN TIN
Bản tin Thị trường hàng ngày
Bản tin Thị trường và dự báo tháng
Bản tin Thị trường giá cả vật tư
Tìm
Danh mục
Kinh doanh - Marketing
Kinh tế quản lý
Biểu mẫu - Văn bản
Tài chính - Ngân hàng
Công nghệ thông tin
Tiếng anh ngoại ngữ
Kĩ thuật công nghệ
Khoa học tự nhiên
Khoa học xã hội
Văn hóa nghệ thuật
Y tế sức khỏe
Văn bản luật
Nông lâm ngư
Kĩ năng mềm
Luận văn - Báo cáo
Giải trí - Thư giãn
Tài liệu phổ thông
Văn mẫu
NGÀNH HÀNG
NÔNG NGHIỆP, THỰC PHẨM
Gạo
Rau hoa quả
Nông sản khác
Sữa và sản phẩm
Thịt và sản phẩm
Dầu thực vật
Thủy sản
Thức ăn chăn nuôi, vật tư nông nghiệp
CÔNG NGHIỆP
Dệt may
Dược phẩm, Thiết bị y tế
Máy móc, thiết bị, phụ tùng
Nhựa - Hóa chất
Phân bón
Sản phẩm gỗ, Hàng thủ công mỹ nghệ
Sắt, thép
Ô tô và linh kiện
Xăng dầu
DỊCH VỤ
Logistics
Tài chính-Ngân hàng
NGHIÊN CỨU THỊ TRƯỜNG
Hoa Kỳ
Nhật Bản
Trung Quốc
Hàn Quốc
Châu Âu
ASEAN
BẢN TIN
Bản tin Thị trường hàng ngày
Bản tin Thị trường và dự báo tháng
Bản tin Thị trường giá cả vật tư
Thông tin
Tài liệu Xanh là gì
Điều khoản sử dụng
Chính sách bảo mật
0
Trang chủ
Luận Văn - Báo Cáo
Báo cáo khoa học
Báo cáo khoa học: Phương pháp lọc thư rác tiếng Việt dựa trên từ ghép và theo vết người sử dụng
Đang chuẩn bị liên kết để tải về tài liệu:
Báo cáo khoa học: Phương pháp lọc thư rác tiếng Việt dựa trên từ ghép và theo vết người sử dụng
Phượng Uyên
190
11
pdf
Không đóng trình duyệt đến khi xuất hiện nút TẢI XUỐNG
Tải xuống
“Lọc thư spam” là bài toán đang được các nhà nghiên cứu quan tâm và đã xuất hiện nhiều hướng tiếp cận để xây dựng các hệ thống lọc cho hiệu quả cao. Tuy nhiên, có những vấn đề khó khăn thách thức khác đối với bài toán này: xây dựng bộ lọc thư spam tiếng Việt. Bài báo cáo này đề xuất mô hình áp dụng thuật toán Naïve Bayes để lọc thư spam tiếng Việt thông qua việc xử lý ngôn ngữ tiếng Việt. Mời bạn đọc tham khảo. | Một số vấn đề chọn lọc của Công nghệ thông tin và truyền thông, Cần Thơ, 7-8 tháng 10 năm 2011 PHƢƠNG PHÁP LỌC THƢ RÁC TIẾNG VIỆT DỰA TRÊN TỪ GHÉP VÀ THEO VẾT NGƢỜI SỬ DỤNG Phan Hữu Tiếp1, Vũ Đức Lung2, Cao Nguyễn Thủy Tiên1, Lâm Thành Hiển1 1 2 Đại học Lạc Hồng Đại học Công nghệ thông tin, Đại học Quốc Gia Tp.Hồ Chí Minh Tóm tắt báo cáo. “Lọc thư spam” là bài toán đang được các nhà nghiên cứu quan tâm và đã xuất hiện nhiều hướng tiếp cận để xây dựng các hệ thống lọc cho hiệu quả cao. Tuy nhiên, có những vấn đề khó khăn thách thức khác đối với bài toán này: xây dựng bộ lọc thư spam tiếng Việt. Trong bài báo này, chúng tôi đề xuất mô hình áp dụng thuật toán Naïve Bayes để lọc thư spam tiếng Việt thông qua việc xử lý ngôn ngữ tiếng Việt. Từ khóa: Lọc thư rác; anti-spam; spam tiếng Việt. 1. Giới thiệu Tách từ là vấn đề quan tâm nhất khi lọc thư rác tiếng Việt do tiếng Việt có các đặc trưng riêng mặc dù tiếng Việt cũng dùng ký tự latinh như tiếng Anh. Tiếng Việt có 2 thành phần cơ bản [1]: tiếng và từ. Một số mối liên quan giữa từ và tiếng như sau. Về ngữ pháp, tiếng là đơn vị cấu tạo của từ. Từ là đơn vị nhỏ nhất để tạo câu, hình thức và ý nghĩa của từ độc lập với cú pháp. Có 2 loại từ phổ biến: từ một tiếng (từ đơn) và từ n tiếng trở lên (n<5) gọi là từ phức. Trong đặt câu tiếng Việt, sử dụng từ chứ không sử dụng tiếng. Trong tiếng Anh, từ được định nghĩa như sau: “Từ là một nhóm ký tự có nghĩa, được phân cách bởi ký tự khoảng trắng trong câu” (từ điển Webter). Ví dụ: “I am a student” sẽ tách được 4 từ: I, am, a, student. Trong tiếng Việt, ví dụ: “Tôi là học sinh” sẽ tách được 3 từ: tôi, là, học sinh. Trong đó từ ghép “học sinh” là từ được hình thành bởi 2 tiếng: “học”, “sinh”. Do sự khác biệt này, khi tách mô ̣t từ ghép trong các thư rác thành các từ đơn thì la ̣i đươ ̣c dùng phổ biế n trong các thư tố t . Cụ thể, từ “khuyế n mãi ” là từ thường đ ược dùng trong thư rác nhưng khi tách ra thành từ “ khuyế n” và từ “mãi” thì những từ này la
TÀI LIỆU LIÊN QUAN
Báo cáo khoa học: Phương pháp lọc thư rác tiếng Việt dựa trên từ ghép và theo vết người sử dụng
Tạp chí khoa học: Ứng dụng phương pháp lọc Kalman tổ hợp và dự báo quỹ đạo và cường độ bão 5 ngày
Báo cáo: Phương pháp lọc thư rác Tiếng Việt dựa trên từ ghép và theo viết người sử dụng
Báo cáo khoa học: Thu nhận enzyme pectinase từ asp.niger - tinh sạch bằng phương pháp lọc gel & lọc màng
Báo cáo nghiên cứu khoa học: "Phát xung Picô giây hồng ngoại gần bằng phương pháp chọn lọc thời gian phổ"
Báo cáo nghiên cứu khoa học: " THU NHẬN ENZYME PECTINASE TỪ ASP.NIGER - TINH SẠCH BẰNG PHƯƠNG PHÁP LỌC GEL & LỌC MÀNG"
Báo cáo khoa học: " ẢNH HƯỞNG CỦA LI ỀU LƯỢNG VÀ PHƯƠNG PHÁP TIÊM HCG ĐẾN SINH SẢN BÁN NHÂN TẠO CÁ LÓC "
Chuẩn hóa phương pháp sáng lọc định tính kiểm soát tồn dư kháng sinh trong thực phẩm có nguồn gốc động vật theo qui định số 2002/657/EC
Báo cáo nghiên cứu khoa học: "ẢNH HƯỞNG CỦA LI ỀU LƯỢNG VÀ PHƯƠNG PHÁP TIÊM HCG ĐẾN SINH SẢN BÁN NHÂN TẠO CÁ LÓC BÔNG (Channa micropeltes)"
Báo cáo nghiên cứu khoa học: " ĐÁNH GIÁ ẢNH HƯỞNG CỦA CÁC THÔNG SỐ ĐỘNG HỌC VÀ ĐIỀU KIỆN VẬN HÀNH ĐẾN SẢN LƯỢNG BÙN DƯ TRONG HỆ THỐNG XỬ LÝ NƯỚC THẢI ĐÔ THỊ BẰNG PHƯƠNG PHÁP SINH HỌC KẾT HỢP LỌC MÀNG"
Đã phát hiện trình chặn quảng cáo AdBlock
Trang web này phụ thuộc vào doanh thu từ số lần hiển thị quảng cáo để tồn tại. Vui lòng tắt trình chặn quảng cáo của bạn hoặc tạm dừng tính năng chặn quảng cáo cho trang web này.