El CRAI romandrà tancat del 24 de desembre de 2025 al 6 de gener de 2026. La validació de documents es reprendrà a partir del 7 de gener de 2026.
El CRAI permanecerá cerrado del 24 de diciembre de 2025 al 6 de enero de 2026. La validación de documentos se reanudará a partir del 7 de enero de 2026.
From 2025-12-24 to 2026-01-06, the CRAI remain closed and the documents will be validated from 2026-01-07.
 
Carregant...
Miniatura

Tipus de document

Article

Versió

Versió publicada

Data de publicació

Tots els drets reservats

Si us plau utilitzeu sempre aquest identificador per citar o enllaçar aquest document: https://hdl.handle.net/2445/130105

A proposal for Wide-Coverage Spanish Named Entity Recognition

Títol de la revista

Director/Tutor

ISSN de la revista

Títol del volum

Recurs relacionat

Resum

This paper presents a proposal for wide--coverage Named Entity Recognition for Spanish. First, a linguistic description of the typology of Named Entities is proposed. Following this definition an architecture of sequential processes is described for addressing the recognition and classification of strong and weak Named Entities. The former are treated using Machine Learning techniques (AdaBoost) and simple attributes requiring non tagged corpora complemented with external information sources (a list of trigger words and a gazetteer). The latter are approached through a context free grammar for recognizing syntactic patterns. A deep evaluation of the first task on real corpora to validate the appropriateness of the approach is presented. A preliminar version of the context free grammar is qualitatively evaluated with also good results on a small hand--tagged corpus.

Citació

Citació

ARÉVALO, Montse, CARRERAS, Xavier, MARTÍ ANTONIN, M. antònia, MÀRQUEZ, Lluís, PADRÓ, Lluís, SIMÓN, María josé. A proposal for Wide-Coverage Spanish Named Entity Recognition. _Procesamiento del lenguaje natural _. 2002. Vol. 28, núm. 63-80. [consulta: 24 de desembre de 2025]. ISSN: 1135-5948. [Disponible a: https://hdl.handle.net/2445/130105]

Exportar metadades

JSON - METS

Compartir registre