Please use this identifier to cite or link to this item:
http://hdl.handle.net/2445/171898
Full metadata record
DC Field | Value | Language |
---|---|---|
dc.contributor.author | Giralt Mirón, Clara | - |
dc.date.accessioned | 2020-11-09T17:00:42Z | - |
dc.date.available | 2020-11-09T17:00:42Z | - |
dc.date.issued | 2020-06-12 | - |
dc.identifier.uri | http://hdl.handle.net/2445/171898 | - |
dc.description | Treballs Finals de Grau de Lingüística. Facultat de Filologia. Universitat de Barcelona, Curs: 2019-2020, Tutor: Mariona Taulé Delor | ca |
dc.description.abstract | [cat] En aquest treball es fa una proposta d’una guia d’anotació per etiquetar la toxicitat o llenguatge d’odi, amb diferents trets i paràmetres per tal de caracteritzar aquest tipus de llenguatge i poder classificar-lo en diferents graus de toxicitat. A partir d'aquesta proposta s'ha anotat un subconjunt del corpus NewsCom-HS que inclou un total de 1262 comentaris que corresponen a quatre temes: economia, immigració, política i religió. Dels comentaris anotats, 302 són lleugerament tòxics, 144 tòxics i 69 molt tòxics. A més, els resultats de l’anotació del corpus ens permeten observar quins trets són més útils per tal de caracteritzar i classificar el llenguatge d’odi, i també crear un corpus Gold Standard, és a dir, un corpus anotat amb una anotació fiable i de qualitat que s’utilitzarà per tal d’entrenar sistemes de detecció automàtica de la toxicitat. | ca |
dc.description.abstract | [eng] This work is a proposal for a hate speech annotation guide, with different traits and parameters that allows us to characterize hate speech and help us classificate it in different levels. With this proposal, we have annotated a subset of the corpus NewsCom-HS, which contains a total of 1262 comments that correspond to four different topics: economy, immigration, politics, and religion. Of all the annotated comments, 302 are slightly toxic, 144 are toxic and 69 are very toxic. Also, the results of the corpus annotation using our guide allows us to observe which traits are more useful to characterize and describe hate speech, and to create a Gold Standard corpus, a corpus with a reliable and high quality annotation, which will enable us to train automatic hate speech detection systems. | ca |
dc.format.extent | 38 p. | - |
dc.format.mimetype | application/pdf | - |
dc.language.iso | cat | ca |
dc.rights | cc-by-nc-nd (c) Giralt Mirón, 2020 | - |
dc.rights.uri | http://creativecommons.org/licenses/by-nc-nd/3.0/es/ | * |
dc.source | Treballs Finals de Grau (TFG) - Lingüística | - |
dc.subject.classification | Corpus (Lingüística) | cat |
dc.subject.classification | Discurs de l'odi | cat |
dc.subject.classification | Treballs de fi de grau | cat |
dc.subject.other | Corpora (Linguistics) | eng |
dc.subject.other | Hate speech | eng |
dc.subject.other | Bachelor's theses | eng |
dc.title | Guia d'anotació de la toxicitat | ca |
dc.type | info:eu-repo/semantics/bachelorThesis | ca |
dc.rights.accessRights | info:eu-repo/semantics/openAccess | ca |
Appears in Collections: | Treballs Finals de Grau (TFG) - Lingüística |
Files in This Item:
File | Description | Size | Format | |
---|---|---|---|---|
TFG_Giralt_Miron_Clara.pdf | 1.6 MB | Adobe PDF | View/Open |
This item is licensed under a Creative Commons License