Automatic extraction of subcorpora based on subcategorization frames from a part-of-speech tagged corpusSusanne GAHL UC Berkeley, Department of Linguistics ICSI 1947 Center St, Suite 600 Berkeley, CA 94704-1105 gahl@icsi.berkeley.eduAbstractThis paper

Automatic extraction of subcorpora based on subcategorization frames from a part-of-speech tagged corpus Susanne GAHL UC Berkeley, Department of Linguistics ICSI 1947 Center St, Suite 600 Berkeley, CA 94704-1105 gahl@ Abstract This paper presents a method for extracting subcorpora documenting different subcategorization frames for verbs, nouns, and adjectives in the 100 mio. word British National Corpus. The extraction tool consists of a set of batch files for use with the Corpus Query Processor (CQP), which is part of the IMS corpus workbench (cf. Christ 1994a,b). A macroprocessor has been developed that allows the user to specify in a simple input file which subcorpora.

Không thể tạo bản xem trước, hãy bấm tải xuống
TÀI LIỆU MỚI ĐĂNG
157    178    18    20-06-2024
Đã phát hiện trình chặn quảng cáo AdBlock
Trang web này phụ thuộc vào doanh thu từ số lần hiển thị quảng cáo để tồn tại. Vui lòng tắt trình chặn quảng cáo của bạn hoặc tạm dừng tính năng chặn quảng cáo cho trang web này.