Intensive use of lexicon and Corpus for WSD

Nica, Iulia; Martí Antonin, M. Antònia; Montoyo, Andrés; Vázquez, Sonia

Intensive use of lexicon and Corpus for WSD

dc.contributor.author	Nica, Iulia
dc.contributor.author	Martí Antonin, M. Antònia
dc.contributor.author	Montoyo, Andrés
dc.contributor.author	Vázquez, Sonia
dc.date.accessioned	2019-03-06T14:23:49Z
dc.date.available	2019-03-06T14:23:49Z
dc.date.issued	2004
dc.date.updated	2019-03-06T14:23:49Z
dc.description.abstract	[spa] El artículo trata sobre el uso de información lingüística en la Desambiguación Semántica Automática (DSA). Proponemos un método de DSA basado en conocimiento y no supervisado, que requiere sólo un corpus amplio, previamente etiquetado a nivel morfológico, y muy poco conocimiento gramatical. El proceso de DSA se realiza a través de los patrones sintácticos en los que una ocurrencia ambigua aparece, en base a la hipótesis de 'almost one sense per syntactic pattern'. Esta integración nos permite extraer información paradigmática y sintagmática del corpus relacionada con la ocurrencia ambigua. Usamos variantes de la información de EuroWordNet asociada a los sentidos y dos algoritmos de DSA. Presentamos los resultados obtenidos en la aplicación del método sobre la tarea Spanish lexical sample de Senseval-2. La metodología es fácilmente transferible a otras lenguas. [eng] The paper addresses the issue of how to use linguistic information in Word Sense Disambiguation (WSD). We introduce a knowledge-driven and unsupervised WSD method that requires only a large corpus previously tagged with POS and very little grammatical knowledge. The WSD process is performed taking into account the syntactic patterns in which the ambiguous occurrence appears, relaying in the hypothesis of "almost one sense per syntactic pattern". This integration allows us to obtain, from corpora, paradigmatic and syntagmatic information related to the ambiguous occurrence. We also use variants of EWN information for word senses and different WSD algorithms. We report the results obtained when applying the method on the Spanish lexical sample task in Senseval-2. This methodology is easily transportable to other languages.
dc.format.extent	8 p.
dc.format.mimetype	application/pdf
dc.identifier.idgrec	517619
dc.identifier.issn	1135-5948
dc.identifier.uri	https://hdl.handle.net/2445/129845
dc.language.iso	eng
dc.publisher	Sociedad Española para el Procesamiento del Lenguaje Natural (SEPLN)
dc.relation.isformatof	Reproducció del document publicat a: http://journal.sepln.org/sepln/ojs/ojs/index.php/pln/article/view/3070
dc.relation.ispartof	Procesamiento del lenguaje natural , 2004, num. 33, p. 147-154
dc.rights	(c) Nica, Iula et al., 2004
dc.rights.accessRights	info:eu-repo/semantics/openAccess
dc.source	Articles publicats en revistes (Filologia Catalana i Lingüística General)
dc.subject.classification	Tractament del llenguatge natural (Informàtica)
dc.subject.classification	Semàntica
dc.subject.other	Natural language processing (Computer science)
dc.subject.other	Semantics
dc.title	Intensive use of lexicon and Corpus for WSD
dc.type	info:eu-repo/semantics/article
dc.type	info:eu-repo/semantics/publishedVersion

Fitxers

Paquet original

Mostrant 1 - 1 de 1

Nom:: 517619.pdf
Mida:: 213.74 KB
Format:: Adobe Portable Document Format

Descarregar

Col·leccions

Articles publicats en revistes (Filologia Catalana i Lingüística General)