Please use this identifier to cite or link to this item: http://hdl.handle.net/2445/129843
Title: Análisis de los fenómenos lingüísticos de los mensajes de correo electrónico en catalán desde la prespectiva de la traducción automática
Author: Moré, Joaquim
Climent, Salvador (Climent Roca)
Oliver, Antoni
Taulé Delor, Mariona
Keywords: Tractament del llenguatge natural (Informàtica)
Traducció automàtica
Correu electrònic
Natural language processing (Computer science)
Machine translating
Electronic mail systems
Issue Date: 2005
Publisher: Sociedad Española para el Procesamiento del Lenguaje Natural (SEPLN)
Abstract: [spa] Los sistemas de traducción automática están preparados para traducir textos que son normativamente correctos. Sin embargo, en la traducción automática de mensajes de correo electrónico hay elementos ajenos a la norma que provocan errores de traducción y es necesario conocerlos si se quiere optimizar un entorno de traducción automática de mensajes de correo electrónico, como el que se diseñó para el proyecto Interlingua desarrollado por la UOC. Una tarea importante de dicho proyecto fue el análisis de los fenómenos lingüísticos no normativos de un corpus de mensajes electrónicos escritos en catalán y su impacto en la calidad de traducción al español. En este artículo presentamos este análisis. Curiosamente los errores de competencia de los emisores causan más errores de traducción que los fenómenos característicos de la comunicación por correo electrónico, como los errores de teclado, vocabulario sms, emoticonos, etc. [eng] Emails contain linguistic phenomena that deviate from standard language norms and may cause machine translation errors. In order to design an email translation environment for the Interlingua project developed at UOC, we classified deviations from the standard in a corpus of emails in Catalan and analysed their impact on the machine translation quality in Spanish. Here we present this analysis. Curiously, most translation errors are caused by the lack of linguistic competence of the sender. The impact of characteristic email phenomena (smileys, performance errors, sms vocabulary, etc.) is not so strong.
Note: Reproducció del document publicat a: http://journal.sepln.org/sepln/ojs/ojs/index.php/pln/article/view/2950
It is part of: Procesamiento del lenguaje natural , 2005, num. 35, p. 45-50
URI: http://hdl.handle.net/2445/129843
ISSN: 1135-5948
Appears in Collections:Articles publicats en revistes (Filologia Catalana i Lingüística General)

Files in This Item:
File Description SizeFormat 
530885.pdf143.91 kBAdobe PDFView/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.