Please use this identifier to cite or link to this item:
http://hdl.handle.net/2445/129955
Title: | Creación, etiquetación y desambiguación de un corpus de referencia del español |
Author: | Civit, Montse Castellón Masalles, Irene Martí Antonin, M. Antònia |
Keywords: | Tractament del llenguatge natural (Informàtica) Corpus (Lingüística) Castellà (Llengua) Natural language processing (Computer science) Corpora (Linguistics) Spanish language |
Issue Date: | 2001 |
Publisher: | Sociedad Española para el Procesamiento del Lenguaje Natural (SEPLN) |
Abstract: | En este artículo presentamos los criterios para la anotación y desambiguación morfosintáctica de un corpus de referencia del español que será de libre disposición, proponiendo respuestas concretas a casos problemáticos de ambas tareas. El objetivo final es disponer de una colección escrita de 1 millón de palabras desambiguadas manualmente a nivel tanto morfológico como sintáctico, que pueda utilizarse para el aprendizaje automático así como para la consulta lingüística. Discutimos detalladamente la categorización de las palabras del español así como los criterios lingüísticos de desambigüación. |
Note: | Reproducció del document publicat a: http://journal.sepln.org/sepln/ojs/ojs/index.php/pln/article/view/3339 |
It is part of: | Procesamiento del lenguaje natural , 2001, num. 27, p. 21-28 |
URI: | http://hdl.handle.net/2445/129955 |
ISSN: | 1135-5948 |
Appears in Collections: | Articles publicats en revistes (Filologia Catalana i Lingüística General) |
Files in This Item:
File | Description | Size | Format | |
---|---|---|---|---|
514865.pdf | 162.74 kB | Adobe PDF | View/Open |
Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.