Please use this identifier to cite or link to this item:
https://hdl.handle.net/2445/32875| Title: | A hybrid approach to treebank construction |
| Author: | Marimon Felipe, Montserrat Padró, Lluís |
| Keywords: | Lingüística computacional Morfosintaxi Computational linguistics Morphosyntax |
| Issue Date: | Sep-2012 |
| Publisher: | Sociedad Española para el Procesamiento del Lenguaje Natural (SEPLN) |
| Abstract: | Este artículo describe investigación sobre los efectos de la desambiguación morfosintáctica usada como un preproceso de un analizador sint´actico profundo basado en HPSG, en el contexto del desarrollo de un treebank del español de código abierto, en el entorno de DELPH-IN. La anotación treebank se realiza manualmente tomando las decisiones apropiadas entre las opciones propuestas por el sistema y ordenadas por un módulo estadístico. Los experimentos presentados muestran que el uso de un etiquetador reduce la ambigüedad de las frases, y contribuye a limitar la cantidad de frases cuyo análisis sobrepasa a el límite de tiempo, y ayuda a al m´odulo estadístico a clasificar el árbol correcto entre los n mejores. Por un lado, nuestros resultados validan los beneficios ya reportados en la literatura de tal preproceso de análisis profundo con respecto a la velocidad, cobertura y precisión. Por otro lado, proponemos una estrategia basada en existentes herramientas de código abierto y recursos para desarrollar con alta consitencia treebanks de sintaxis profunda para idiomas con limitada disponibilidad de recursos lingüísticos. |
| It is part of: | Procesamiento del lenguaje natural , 2012, vol. 49, num. 1, p. 139-146 |
| URI: | https://hdl.handle.net/2445/32875 |
| ISSN: | 1135-5948 |
| Appears in Collections: | Articles publicats en revistes (Filologia Catalana i Lingüística General) |
Files in This Item:
| File | Description | Size | Format | |
|---|---|---|---|---|
| 617625.pdf | 207.5 kB | Adobe PDF | View/Open |
Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.
