Báo cáo khoa học: "Using Bilingual Comparable Corpora and Semi-supervised Clustering for Topic Tracking"

We address the problem dealing with skewed data, and propose a method for estimating effective training stories for the topic tracking task. For a small number of labelled positive stories, we extract story pairs which consist of positive and its associated stories from bilingual comparable corpora. To overcome the problem of a large number of labelled negative stories, we classify them into some clusters. This is done by using k-means with EM. The results on the TDT corpora show the effectiveness of the method. .

Quang Dũng 58 8 pdf

Upload

Không thể tạo bản xem trước, hãy bấm tải xuống

Tải xuống

TÀI LIỆU LIÊN QUAN

Báo cáo khoa học: "Bilingual Lexicon Generation Using Non-Aligned Signatures"

10 38 0

Báo cáo khoa học: "Using Bilingual Parallel Corpora for Cross-Lingual Textual Entailment"

10 56 0

Báo cáo khoa học: "Using Large Monolingual and Bilingual Corpora to Improve Coordination Disambiguation"

10 39 0

Báo cáo khoa học: "Using Bilingual Information for Cross-Language Document Summarization"

10 51 0

Báo cáo khoa học: "Using Bilingual Comparable Corpora and Semi-supervised Clustering for Topic Tracking"

8 34 0

Báo cáo khoa học: "Bilingual Terminology Mining – Using Brain, not brawn comparable corpora"

8 30 0

Báo cáo khoa học: "Using bilingual dependencies to align words in Enlish/French parallel corpora"

6 65 0

Báo cáo khoa học: "Using Similarity Scoring To Improve the Bilingual Dictionary for Word Alignment"

8 37 0

Báo cáo khoa học: "Using Noisy Bilingual Data for Statistical Machine Translation"

4 32 0

Báo cáo khoa học: "Exploring Syntactic Structural Features for Sub-Tree Alignment using Bilingual Tree Kernels"

10 60 0

TÀI LIỆU XEM NHIỀU

Thiết kế kế hoạch bài học môn Toán theo định hướng phát triển năng lực học sinh

13 40892 2412

Phân tích và làm rõ ý kiến sau: “Bài thơ Tự tình II vừa nói lên bi kịch duyên phận vừa cho thấy khát vọng sống, khát vọng hạnh phúc của Hồ Xuân Hương”

3 24944 248

31 Câu hỏi ôn tập môn Chủ nghĩa xã hội khoa học

25 24492 4281

Tiểu luận: Vai trò của Nguyễn Ái Quốc đối với việc thành lập Đảng Cộng sản Việt Nam

16 20074 2846

Tiểu luận Tình huống xử lý sai phạm trong thanh toán công tác phí lưu động

20 19494 1549

100 câu hỏi trắc nghiệm Triết học Mác-Lênin kèm đáp án

14 19305 2967

Bảng biến đổi Laplace và biến đổi Z

1 19277 616

Ebook Ôn luyện tiếng Anh 9 có đáp án: Phần 2 - Mai Lan Hương, Hà Thanh Uyên

37 16170 2958

Đề thi và Đáp án môn Tiếng Việt thực hành - ĐH SPKT TP.HCM

3 16003 330

Sự so sánh văn bản văn học và tác phẩm văn học

1 14605 133

TỪ KHÓA LIÊN QUAN

TÀI LIỆU MỚI ĐĂNG

Luận văn Thạc sĩ Luật học: Quyết định hình phạt đối với các tội xâm phạm sở hữu (trên cơ sở nghiên cứu thực tiễn địa bàn thành phố Hải Phòng)

133 70 2 02-06-2024

Khảo sát khả năng diệt khuẩn và hiệu quả bảo quản măng tây của polyme gốc guanidine

8 68 1 02-06-2024

Lễ khao Lề thế lính Hoàng Sa với việc giáo dục truyền thống yêu nước cho học sinh ở huyện đảo Lý Sơn, Quảng Ngãi

6 528 1 02-06-2024

Đề kiểm tra cuối học kì 2 môn Toán lớp 6 năm 2020-2021 có đáp án - UBND TP. Thủ Đức

3 85 1 02-06-2024

Bài viết về bình đẳng giới trong xã hội hiện nay

11 534 2 02-06-2024

Giáo trình Marketing thương mại (Ngành: Nghiệp vụ bán hàng - Trung cấp) - Trường Cao đẳng Nghề Đồng Tháp

62 344 5 02-06-2024

The pathogenesis of a North American H5N2 clade 2.3.4.4 group A highly pathogenic avian influenza virus in surf scoters (Melanitta perspicillata)

10 53 1 02-06-2024

Lecture Class #22: International financial analysis

18 85 1 02-06-2024

Giáo án Công nghệ lớp 6: Giới thiệu nghề trồng cây ăn quả

109 83 2 02-06-2024

Luận văn Thạc sĩ Quản trị nhân lực: Tạo động lực lao động thông qua thù lao tài chính tại Công ty Luật Trách nhiệm hữu hạn Nam Dương

104 191 3 02-06-2024

Tóm tắt luận văn Thạc sĩ Quản trị kinh doanh: Áp dụng phương pháp 6-Sigma để cải tiến quy trình phê duyệt vay vốn tín dụng KHCN tại Ngân hàng TMCP Quân đội

14 69 2 02-06-2024

Bài giảng môn Hình học lớp 7 - Bài 7: Định lí

26 380 1 02-06-2024

Xung đột sắc tộc, tôn giáo ở Đông Nam Á từ năm 1945 đến năm 2015: Bài học kinh nghiệm cho Việt Nam trong quá trình phát triển đất nước

6 101 4 02-06-2024

Viral blood-borne infections testing and linkage to care cascade among persons who experience homelessness in the United States: A systematic review and meta-analysis

16 61 1 02-06-2024

Luận văn Thạc sĩ Luật học: Thu thập, đánh giá chứng cứ trong Luật tố tụng hình sự (Trên cơ sở số liệu thực tiễn địa bàn tỉnh Đắk Lắk)

107 110 8 02-06-2024

Giáo trình Bảo dưỡng và vận hành máy trộn bê tông (Nghề Vận hành máy thi công nền - Trình độ Cao đẳng) - CĐ GTVT Trung ương I

40 147 2 02-06-2024

Money and Banking: Lecture 35

20 78 2 02-06-2024

Luận án Tiến sĩ Luật học: Thừa kế thế vị theo pháp luật Việt Nam

167 89 2 02-06-2024

Luận văn Thạc sĩ Giáo dục học: Phát triển năng lực thực hành cho học sinh thông qua hoạt động ngoại khóa chương Từ trường và Cảm ứng ddineenj từ Vật lý 11 trung học phổ thông

113 63 6 02-06-2024

Luận văn Thạc sĩ Kế toán: Nghiên cứu các nhân tố ảnh hưởng đến việc công bố thông tin trên báo cáo tài chính của các ngân hàng thương mại niêm yết trên thị trường chứng khoán Việt Nam

109 70 2 02-06-2024

TÀI LIỆU HOT

Phân tích và làm rõ ý kiến sau: “Bài thơ Tự tình II vừa nói lên bi kịch duyên phận vừa cho thấy khát vọng sống, khát vọng hạnh phúc của Hồ Xuân Hương”

3 24944 248

Thiết kế kế hoạch bài học môn Toán theo định hướng phát triển năng lực học sinh

13 40892 2412

CẬP NHẬT KINH TẾ VĨ MÔ VIỆT NAM 6 tháng đầu năm 2020

3 2779 81

Sách trắng Doanh nghiệp Việt Nam năm 2020

580 5095 363

Việt Nam 2035 hướng tới thịnh vượng, sáng tạo, công bằng và dân chủ

584 3347 100

BÀI GIẢNG DỰNG HÌNH SKETCHUP 2020 BIÊN SOẠN : GV.KTS PHAN THỨC

62 6668 1

GIÁO TRÌNH TIẾNG ANH ENG BREAKING

171 5703 720

Quản trị khủng hoảng trong quan hệ công chúng

2 3138 78

Báo cáo thực tập chuyên ngành: Nghiên cứu, thiết kế, mô phỏng robot công nghiệp

51 4468 200

Đề tài “ Cân đối ngân sách nhà nước- thực trạng và hướng hoàn thiện”

53 4753 189