Ấn phẩm:

Portable language technology: A resource-light approach to morpho-syntactic tagging

Đang tải...
Hình ảnh thu nhỏ

Xem mô tả

49

Xem & Tải

3

Nhan đề khác
Tóm tắt
Morpho-syntactic tagging is the process of assigning part of speech (POS), case, number, gender, and other morphological information to each word in a corpus. Morpho-syntactic tagging is an important step in natural language processing. Corpora that have been morphologically tagged are very useful both for linguistic research, e.g. finding instances or frequencies of particular constructions in large corpora, and for further computational processing, such as syntactic parsing, speech recognition, stemming, and word-sense disambiguation, among others. Despite the importance of morphological tagging, there are many languages that lack annotated resources. This is almost inevitable because these resources are costly to create. But, as described in this thesis, it is possible to avoid this expense. This thesis describes a method for transferring annotation from a morphologically annotated corpus of a source language to a corpus of a related target language. Unlike unsupervised approaches that do not require annotated data at all and, as a consequence, lack precision, the approach proposed in this dissertation relies on linguistic knowledge, but avoids large-scale grammar engineering. The approach needs neither a parallel corpus nor a bilingual lexicon, and requires much less linguistic labor than the standard technology. This dissertation describes experiments with Russian, Czech, Polish, Spanish, Portuguese, and Catalan. However, the general method proposed can be applied to any fusional language.
Tác giả
Feldman, Anna
Người hướng dẫn
Nơi xuất bản
Nhà xuất bản
The Ohio State University
Năm xuất bản
2006
ISSN tạp chí
Nhan đề tập
Từ khóa chủ đề
Thesis
Bộ sưu tập
URI
Tài liệu tham khảo
Thông tin bản quyền

Thực thể liên kết

Kết quả tìm kiếm tác giả/Nhà nghiên cứu

Tìm kiếm của bạn không trả về kết quả. Bạn có gặp khó khăn khi thực hiện tìm kiếm? Hãy thử lại bằng cách đặt từ khóa tìm vào trong cặp dấu ngoặc kép