Creació d’un classificador de perfils segons el gènere de l’autor

Cabestany Manen, David

Please use this identifier to cite or link to this item: https://hdl.handle.net/2445/181765

Full metadata record

DC Field	Value	Language
dc.contributor.advisor	Taulé Delor, Mariona	-
dc.contributor.author	Cabestany Manen, David	-
dc.date.accessioned	2021-12-13T18:40:33Z	-
dc.date.available	2021-12-13T18:40:33Z	-
dc.date.issued	2021-06-17	-
dc.identifier.uri	https://hdl.handle.net/2445/181765	-
dc.description	Treballs Finals de Grau de Lingüística. Facultat de Filologia. Universitat de Barcelona, Curs: 2020-2021, Tutora: Maria Taulé Delor	ca
dc.description.abstract	[cat] En el següent estudi s’ha creat i posat a prova un model computacional per identificar el gènere dels autors de textos d’una manera automàtica, basant-nos en els textos del corpus CLEF2013, que han estat extrets de diferents blogs d’internet i dels seus comentaris. L’objectiu d’aquest estudi és elaborar un model de predicció del gènere d’autors desconeguts a partir del corpus emprat en la competició que es va dur a terme el 2013 a la PAN al CLEF. Avaluem dos models d’Aprenentatge Automàtic Supervisat per veure en quin d’ells obtenim millors resultats, la Regressió Logística i el Random Forest. El que millor funciona és el de Regressió Logística amb un encert de 0.64 punts.	ca
dc.description.abstract	[spa] En el siguiente estudio se ha creado y puesto a prueba un modelo computacional para identificar el género de los autores de textos de una forma automática, basándonos los textos del corpus CLEF2013 que han sido extraídos de diferentes blogs de internet y sus comentarios. El objetivo de este estudio es elaborar un modelo de predicción del género de autores desconocidos a partir del corpus empleado en la competición que se llevó a cabo en 2013 en la PAN al CLEF. Evaluamos dos modelos de Aprendizaje Automático Supervisado para ver en cuál de ellos obtenemos mejores resultados, la Regresión Logística y el Random Forest. El que mejor funciona es el de Regresión Logística con un acierto de 0.64 puntos.	ca
dc.description.abstract	[eng] In the following study, we have created and tested a computational model to identify the gender of the authors of texts automatically. Based on the texts of the CLEF2013 corpus, extracted from different internet blogs and their comments. The objective of this study is to develop a model to predict the gender of unknown authors. For that, we used the corpus used in the competition that took place in 2013 at the PAN at CLEF. We evaluated two Supervised Machine Learning models to see which of them obtain better results, the Logistic Regression and the Random Forest. What works best is the Logistic Regression with a hit of 0.64 points.	ca
dc.format.extent	26 p.	-
dc.format.mimetype	application/pdf	-
dc.language.iso	cat	ca
dc.rights	cc-by-nc-nd (c) David Cabestany Manen, 2021	-
dc.rights.uri	http://creativecommons.org/licenses/by-nc-nd/3.0/es/	*
dc.source	Treballs Finals de Grau (TFG) - Lingüística	-
dc.subject.classification	Gènere	cat
dc.subject.classification	Aprenentatge automàtic	cat
dc.subject.classification	Models matemàtics	cat
dc.subject.classification	Treballs de fi de grau	cat
dc.subject.other	Gender	eng
dc.subject.other	Machine learning	eng
dc.subject.other	Mathematical models	eng
dc.subject.other	Bachelor's theses	eng
dc.title	Creació d’un classificador de perfils segons el gènere de l’autor	ca
dc.type	info:eu-repo/semantics/bachelorThesis	ca
dc.rights.accessRights	info:eu-repo/semantics/openAccess	ca
Appears in Collections:	Treballs Finals de Grau (TFG) - Lingüística

Files in This Item:

File	Description	Size	Format
TFG_Cabestany_Manen_David.pdf		557.97 kB	Adobe PDF	View/Open

Show simple item record

This item is licensed under a Creative Commons License