Please use this identifier to cite or link to this item:
http://hdl.handle.net/2445/129704
Title: | Anotación semiautomática con papeles temáticos de los corpus CESS-ECE |
Author: | Martí Antonin, M. Antònia Taulé Delor, Mariona Màrquez, Lluís Bertran, Manuel |
Keywords: | Tractament del llenguatge natural (Informàtica) Corpus (Lingüística) Natural language processing (Computer science) Corpora (Linguistics) |
Issue Date: | 2007 |
Publisher: | Sociedad Española para el Procesamiento del Lenguaje Natural (SEPLN) |
Abstract: | En este artículo se presenta la metodología seguida en el proceso de anotación semántica automática (estructura argumental y papeles temáticos de los predicados verbales) del corpus CESS-ECE-CAT/ESP, así como la evaluación de los resultados obtenidos. A partir de un léxico verbal (1.482 verbos) con información sobre las funciones sintácticas de cada verbo y su proyección temático-argumental, se ha anotado automáticamente el treebank CESS-ECE aplicando un conjunto de reglas simples sobre los árboles sintácticos. Se ha conseguido anotar automáticamente el 60% de los argumentos y papeles temáticos, con un error muy bajo (inferior al 2%). Este índice de calidad elevado permite usar la presente metodología para semiautomatizar el proceso de anotación semántica del corpus, con el consiguiente ahorro en tiempo de anotación manual. Una vez completada la anotación este corpus podrá ser utilizado como fuente de información para los sistemas de anotación automática de papeles temáticos. |
Note: | Reproducció del document publicat a: http://journal.sepln.org/sepln/ojs/ojs/index.php/pln/article/view/2718 |
It is part of: | Procesamiento del lenguaje natural , 2007, num. 38, p. 67-76 |
URI: | http://hdl.handle.net/2445/129704 |
ISSN: | 1135-5948 |
Appears in Collections: | Articles publicats en revistes (Filologia Catalana i Lingüística General) |
Files in This Item:
File | Description | Size | Format | |
---|---|---|---|---|
550456.pdf | 118.64 kB | Adobe PDF | View/Open |
Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.