Carregant...
Tipus de document
Treball de fi de grauData de publicació
Llicència de publicació
Si us plau utilitzeu sempre aquest identificador per citar o enllaçar aquest document: https://hdl.handle.net/2445/171898
Guia d'anotació de la toxicitat
Títol de la revista
Autors
Director/Tutor
ISSN de la revista
Títol del volum
Resum
[cat] En aquest treball es fa una proposta d’una guia d’anotació per etiquetar la toxicitat o llenguatge
d’odi, amb diferents trets i paràmetres per tal de caracteritzar aquest tipus de llenguatge i poder
classificar-lo en diferents graus de toxicitat. A partir d'aquesta proposta s'ha anotat un
subconjunt del corpus NewsCom-HS que inclou un total de 1262 comentaris que corresponen
a quatre temes: economia, immigració, política i religió. Dels comentaris anotats, 302 són
lleugerament tòxics, 144 tòxics i 69 molt tòxics. A més, els resultats de l’anotació del corpus
ens permeten observar quins trets són més útils per tal de caracteritzar i classificar el llenguatge
d’odi, i també crear un corpus Gold Standard, és a dir, un corpus anotat amb una anotació fiable
i de qualitat que s’utilitzarà per tal d’entrenar sistemes de detecció automàtica de la toxicitat.
Descripció
Treballs Finals de Grau de Lingüística. Facultat de Filologia. Universitat de Barcelona, Curs: 2019-2020, Tutor: Mariona Taulé Delor
Matèries (anglès)
Citació
Col·leccions
Citació
GIRALT MIRÓN, Clara. Guia d'anotació de la toxicitat. [consulta: 9 de desembre de 2025]. [Disponible a: https://hdl.handle.net/2445/171898]