Carregant...
Miniatura

Tipus de document

Treball de fi de grau

Data de publicació

Llicència de publicació

cc-by-nc-nd (c) Giralt Mirón, 2020
Si us plau utilitzeu sempre aquest identificador per citar o enllaçar aquest document: https://hdl.handle.net/2445/171898

Guia d'anotació de la toxicitat

Títol de la revista

Director/Tutor

ISSN de la revista

Títol del volum

Resum

[cat] En aquest treball es fa una proposta d’una guia d’anotació per etiquetar la toxicitat o llenguatge d’odi, amb diferents trets i paràmetres per tal de caracteritzar aquest tipus de llenguatge i poder classificar-lo en diferents graus de toxicitat. A partir d'aquesta proposta s'ha anotat un subconjunt del corpus NewsCom-HS que inclou un total de 1262 comentaris que corresponen a quatre temes: economia, immigració, política i religió. Dels comentaris anotats, 302 són lleugerament tòxics, 144 tòxics i 69 molt tòxics. A més, els resultats de l’anotació del corpus ens permeten observar quins trets són més útils per tal de caracteritzar i classificar el llenguatge d’odi, i també crear un corpus Gold Standard, és a dir, un corpus anotat amb una anotació fiable i de qualitat que s’utilitzarà per tal d’entrenar sistemes de detecció automàtica de la toxicitat.

Descripció

Treballs Finals de Grau de Lingüística. Facultat de Filologia. Universitat de Barcelona, Curs: 2019-2020, Tutor: Mariona Taulé Delor

Citació

Citació

GIRALT MIRÓN, Clara. Guia d'anotació de la toxicitat. [consulta: 9 de desembre de 2025]. [Disponible a: https://hdl.handle.net/2445/171898]

Exportar metadades

JSON - METS

Compartir registre