Báo cáo khoa học: "An Iterative Algorithm to Build Chinese Language Models"

We present an iterative procedure to build a Chinese language model (LM). We segment Chinese text into words based on a word-based Chinese language model. However, the construction of a Chinese LM itself requires word boundaries. To get out of the chicken-and-egg problem, we propose an iterative procedure that alternates two operations: segmenting text into words and building an LM. Starting with an initial segmented corpus and an LM based upon it, we use a Viterbi-liek algorithm to segment another set of data. Then, we build an LM based on the second set and use the resulting LM to.

Thái Duy 52 5 pdf

Upload

Không thể tạo bản xem trước, hãy bấm tải xuống

Tải xuống

TÀI LIỆU LIÊN QUAN

Ebook Iterative learning control vs. feedback control

45 90 2

New method for improving the iterative LDPC decoding process based on the reliable extrinsic information and its distribution diagram

8 58 0

An iterative greedy algorithm for sparsity-constrained optimization

9 53 0

**Báo cáo khoa học: "Iterative Viterbi A* Algorithm for K-Best Sequential Decoding"**

9 46 0

Báo cáo khoa học: "Iterative Scaling and Coordinate Descent Methods for Maximum Entropy"

4 38 0

Báo cáo khoa học: "An Iterative Implicit Feedback Approach to Personalized Search"

8 53 0

Báo cáo khoa học: "Stochastic Iterative Alignment for Machine Translation Evaluation"

8 36 0

Báo cáo khoa học: "Towards an Iterative Reinforcement Approach for Simultaneous Document Summarization and Keyword Extraction"

8 32 0

Báo cáo khoa học: "Sequential Conditional Generalized Iterative Scaling"

8 29 0

Báo cáo khoa học: "An Iterative Algorithm to Build Chinese Language Models"

5 36 0

TÀI LIỆU XEM NHIỀU

Thiết kế kế hoạch bài học môn Toán theo định hướng phát triển năng lực học sinh

13 41102 2418

Phân tích và làm rõ ý kiến sau: “Bài thơ Tự tình II vừa nói lên bi kịch duyên phận vừa cho thấy khát vọng sống, khát vọng hạnh phúc của Hồ Xuân Hương”

3 25098 248

31 Câu hỏi ôn tập môn Chủ nghĩa xã hội khoa học

25 24728 4286

Tiểu luận: Vai trò của Nguyễn Ái Quốc đối với việc thành lập Đảng Cộng sản Việt Nam

16 20245 2847

Tiểu luận Tình huống xử lý sai phạm trong thanh toán công tác phí lưu động

20 19653 1549

100 câu hỏi trắc nghiệm Triết học Mác-Lênin kèm đáp án

14 19518 2969

Bảng biến đổi Laplace và biến đổi Z

1 19462 618

Ebook Ôn luyện tiếng Anh 9 có đáp án: Phần 2 - Mai Lan Hương, Hà Thanh Uyên

37 16350 2958

Đề thi và Đáp án môn Tiếng Việt thực hành - ĐH SPKT TP.HCM

3 16242 330

Sự so sánh văn bản văn học và tác phẩm văn học

1 14816 133

TỪ KHÓA LIÊN QUAN

TÀI LIỆU MỚI ĐĂNG

Investigating patients’ preferences for new anti-diabetic drugs to inform public health insurance coverage decisions: A discrete choice experiment in China

10 74 1 17-06-2024

Lysophosphatidic acid as a regulator of endometrial connective tissue growth factor and prostaglandin secretion during estrous cycle and endometrosis in the mare

13 166 1 17-06-2024

Đánh giá về chương trình môn “Công dân giáo dục” ở miền Nam (1954-1975) và những đề xuất cho việc xây dựng Chương trình môn Giáo dục công dân giai đoạn sau 2015 của Việt Nam

7 184 1 17-06-2024

Giáo án môn Toán lớp 3 sách Chân trời sáng tạo - Tuần 20: Phép trừ các số trong phạm vi 10000 (Tiết 2)

5 284 1 17-06-2024

Nghiên cứu ảnh hưởng của lưu huỳnh trong nhiên liệu và tải động cơ tới sự phát thải hạt của động cơ diesel tàu thuỷ

5 393 2 17-06-2024

Giáo trình Quản trị hệ điều hành (Nghề: Tin học ứng dụng - Cao đẳng) - Trường Cao đẳng Bách khoa Nam Sài Gòn (2022)

175 18 1 17-06-2024

Yếu tố tiên đoán bệnh nhân nhồi máu não cấp do tắc động mạch lớn thỏa chỉ định can thiệp lấy huyết khối trong cửa sổ 6-24 giờ

8 406 1 17-06-2024

Mức độ hiểu biết của người học tiếng Nhật về quán dụng ngữ liên quan đến bộ phận cơ thể ‒ trường hợp chữ thủ「手」

9 98 6 17-06-2024

Mẫu Tờ khai phí sử dụng đường bộ đối với xe ô tô

1 678 1 17-06-2024

Biên bản thanh lý hợp đồng (Mẫu số: 4b/TC-HĐ)

2 387 1 17-06-2024

Bài giảng Kiến trúc máy tính và hệ điều hành: Bài 10 - Nguyễn Hồng Sơn

28 108 3 17-06-2024

Lựa chọn vị trí lấy vạt da xương mác tự do trong điều trị khuyết hổng phức hợp xương hàm dưới sau cắt ung thư

4 353 2 17-06-2024

Luận văn Thạc sĩ Kinh doanh thương mại: Hoạt động xuất khẩu vật liệu nổ công nghiệp và và tiền chất thuốc nổ của Tổng công ty Công nghiệp Hóa chất mỏ Vinacomin – MICCO: Thực trạng và giải pháp

102 95 6 17-06-2024

Phát triển kinh tế tuần hoàn ở Việt Nam hiện nay

10 112 3 17-06-2024

Transarterial chemoembolization combined with camrelizumab for recurrent hepatocellular carcinoma

8 68 1 17-06-2024

Bảo tồn, phát huy các giá trị văn hóa – Thành tố thúc đẩy sự ổn định và phát triển kinh tế, xã hội vùng Tây Nguyên

10 88 1 17-06-2024

Beaten but not down! Exploring resilience among female sex workers (FSWs) in Nairobi, Kenya

12 152 1 17-06-2024

Trắc địa xây dựng: Phần 2

174 79 1 17-06-2024

Bài giảng Kinh tế chính trị Mác - Lênin - Chương 6: Công nghiệp hóa, hiện đại hóa và hội nhập kinh tế quốc tế của Việt Nam

11 227 9 17-06-2024

Ý thức nữ tính trong thơ Hồ Xuân Hương

9 297 2 17-06-2024

TÀI LIỆU HOT

Phân tích và làm rõ ý kiến sau: “Bài thơ Tự tình II vừa nói lên bi kịch duyên phận vừa cho thấy khát vọng sống, khát vọng hạnh phúc của Hồ Xuân Hương”

3 25098 248

Thiết kế kế hoạch bài học môn Toán theo định hướng phát triển năng lực học sinh

13 41102 2418

CẬP NHẬT KINH TẾ VĨ MÔ VIỆT NAM 6 tháng đầu năm 2020

3 2949 81

Sách trắng Doanh nghiệp Việt Nam năm 2020

580 5263 363

Việt Nam 2035 hướng tới thịnh vượng, sáng tạo, công bằng và dân chủ

584 3504 100

BÀI GIẢNG DỰNG HÌNH SKETCHUP 2020 BIÊN SOẠN : GV.KTS PHAN THỨC

62 6839 1

GIÁO TRÌNH TIẾNG ANH ENG BREAKING

171 5873 721

Quản trị khủng hoảng trong quan hệ công chúng

2 3312 78

Báo cáo thực tập chuyên ngành: Nghiên cứu, thiết kế, mô phỏng robot công nghiệp

51 4620 200

Đề tài “ Cân đối ngân sách nhà nước- thực trạng và hướng hoàn thiện”

53 4907 189