Báo cáo khoa học: "Chinese Word Segmentation without Using Lexicon and Hand-crafted Training Data"

Chinese word segmentation is the first step in any Chinese NLP system. This paper presents a new algorithm for segmenting Chinese texts without making use of any lexicon and hand-crafted linguistic resource. The statistical data required by the algorithm, that is, mutual information and the difference of t-score between characters, is derived automatically from raw Chinese corpora. The preliminary experiment shows that the segmentation accuracy of our algorithm is acceptable.

Hồng Oanh 61 7 pdf

Upload

Không thể tạo bản xem trước, hãy bấm tải xuống

Tải xuống

TÀI LIỆU LIÊN QUAN

TÀI LIỆU XEM NHIỀU

Thiết kế kế hoạch bài học môn Toán theo định hướng phát triển năng lực học sinh

13 41207 2419

Phân tích và làm rõ ý kiến sau: “Bài thơ Tự tình II vừa nói lên bi kịch duyên phận vừa cho thấy khát vọng sống, khát vọng hạnh phúc của Hồ Xuân Hương”

3 25165 250

31 Câu hỏi ôn tập môn Chủ nghĩa xã hội khoa học

25 24829 4299

Tiểu luận: Vai trò của Nguyễn Ái Quốc đối với việc thành lập Đảng Cộng sản Việt Nam

16 20321 2847

Tiểu luận Tình huống xử lý sai phạm trong thanh toán công tác phí lưu động

20 19732 1550

100 câu hỏi trắc nghiệm Triết học Mác-Lênin kèm đáp án

14 19616 2977

Bảng biến đổi Laplace và biến đổi Z

1 19537 621

Ebook Ôn luyện tiếng Anh 9 có đáp án: Phần 2 - Mai Lan Hương, Hà Thanh Uyên

37 16407 2959

Đề thi và Đáp án môn Tiếng Việt thực hành - ĐH SPKT TP.HCM

3 16352 331

Sự so sánh văn bản văn học và tác phẩm văn học

1 14927 135

TỪ KHÓA LIÊN QUAN

TÀI LIỆU MỚI ĐĂNG

Đề thi học kì 1 môn Toán lớp 1 năm 2021-2022 có đáp án - Trường TH&THCS Tú Thịnh

6 353 2 01-07-2024

Chủ tịch Hồ Chí Minh với hoạt động văn hóa nghệ thuật: Phần 1

57 385 2 01-07-2024

Sáng kiến kinh nghiệm THPT: Dạy học dự án tích hợp liên môn Vật lí - Công nghệ, chủ đề Động cơ nhiệt trong Vật lí 10 THPT

85 106 6 01-07-2024

Application of exercises to develop endurance for female swimmers aged 15-16 at Hanoi Sports Training and Competition Center

8 279 2 01-07-2024

Đề thi kết thúc học phần học kì 2 môn Kiểm toán 1 năm 2018-2019 có đáp án - Trường ĐH Đồng Tháp

3 152 4 01-07-2024

Đề kiểm tra giữa kì 2 môn Toán lớp 10 năm 2021-2022 có đáp án - Trường THPT Ngô Gia Tự, Phú Yên

19 85 2 01-07-2024

Đặc điểm lâm sàng, xquang bệnh nhân hẹp hàm trên điều trị bằng ốc nong nhanh

4 650 1 01-07-2024

Giáo án môn Khoa học tự nhiên lớp 6 sách Chân trời sáng tạo: Bài 38

4 97 2 01-07-2024

Luận văn Thạc sĩ Vật lý: Khảo sát cấu hình nhám từ mật độ hấp thụ tích hợp trong giếng lượng tử InN/GaN

66 84 1 01-07-2024

Ổn định máy bay cánh cụp cánh xòe trên cơ sở điều khiển Backstepping và hiệu chỉnh RHO

6 90 1 01-07-2024

Systematic review and meta-analysis of clinical efectiveness of self-management interventions in Parkinson’s disease

29 92 1 01-07-2024

Giáo án môn Lịch sử lớp 7 sách Chân trời sáng tạo: Bài 20

11 87 1 01-07-2024

Luận án Tiến sĩ Kỹ thuật: Phân tích dao động dầm, tấm sandwich 2D-FGM hai và ba pha bằng phương pháp phần tử hữu hạn

161 243 2 01-07-2024

Appraising sociotechnical visions of sustainable energy futures: A distributed deliberative mapping approach

13 85 1 01-07-2024

Ảnh hưởng nồng độ dung dịch trơn nguội tới độ nhám bề mặt khi mài nhôm bằng đá mài gián đoạn sản xuất ở Việt Nam

5 121 1 01-07-2024

Factors associated with decision-making power of married women to use family planning in sub-Saharan Africa: A multilevel analysis of demographic health surveys

9 67 1 01-07-2024

Bài giảng Bản đồ địa chính

112 100 3 01-07-2024

Giáo trình An toàn vệ sinh công nghiệp (Nghề: Thiết kế đồ họa - Trung cấp) - Trường Cao đẳng Cơ điện Xây dựng Việt Xô

51 436 13 01-07-2024

Luận văn Thạc sĩ Quản lý văn hóa: Bảo vệ và phát huy giá trị Hò Sông Mã trên địa bàn tỉnh Thanh Hóa

153 136 3 01-07-2024

Bài giảng: Xã hội học - Th.S Nguyễn Đức Thành

51 153 1 01-07-2024

TÀI LIỆU HOT

Phân tích và làm rõ ý kiến sau: “Bài thơ Tự tình II vừa nói lên bi kịch duyên phận vừa cho thấy khát vọng sống, khát vọng hạnh phúc của Hồ Xuân Hương”

3 25165 250

Thiết kế kế hoạch bài học môn Toán theo định hướng phát triển năng lực học sinh

13 41207 2419

CẬP NHẬT KINH TẾ VĨ MÔ VIỆT NAM 6 tháng đầu năm 2020

3 3000 81

Sách trắng Doanh nghiệp Việt Nam năm 2020

580 5326 363

Việt Nam 2035 hướng tới thịnh vượng, sáng tạo, công bằng và dân chủ

584 3560 101

BÀI GIẢNG DỰNG HÌNH SKETCHUP 2020 BIÊN SOẠN : GV.KTS PHAN THỨC

62 6912 1

GIÁO TRÌNH TIẾNG ANH ENG BREAKING

171 5927 721

Quản trị khủng hoảng trong quan hệ công chúng

2 3377 78

Báo cáo thực tập chuyên ngành: Nghiên cứu, thiết kế, mô phỏng robot công nghiệp

51 4673 200

Đề tài “ Cân đối ngân sách nhà nước- thực trạng và hướng hoàn thiện”

53 4976 189