Carregant...
Tipus de document
Treball de fi de grauData de publicació
Llicència de publicació
Si us plau utilitzeu sempre aquest identificador per citar o enllaçar aquest document: https://hdl.handle.net/2445/181765
Creació d’un classificador de perfils segons el gènere de l’autor
Títol de la revista
Autors
Director/Tutor
ISSN de la revista
Títol del volum
Recurs relacionat
Resum
[cat] En el següent estudi s’ha creat i posat a prova un model computacional per identificar el gènere dels autors de textos d’una manera automàtica, basant-nos en els textos del corpus CLEF2013, que han estat extrets de diferents blogs d’internet i dels seus comentaris. L’objectiu d’aquest estudi és elaborar un model de predicció del gènere d’autors desconeguts a partir del corpus emprat en la competició que es va dur a terme el 2013 a la PAN al CLEF. Avaluem dos models d’Aprenentatge Automàtic Supervisat per veure en quin d’ells obtenim millors resultats, la Regressió Logística i el Random Forest. El que millor funciona és el de Regressió Logística amb un encert de 0.64 punts.
[spa] En el siguiente estudio se ha creado y puesto a prueba un modelo computacional para identificar el género de los autores de textos de una forma automática, basándonos los textos del corpus CLEF2013 que han sido extraídos de diferentes blogs de internet y sus comentarios. El objetivo de este estudio es elaborar un modelo de predicción del género de autores desconocidos a partir del corpus empleado en la competición que se llevó a cabo en 2013 en la PAN al CLEF. Evaluamos dos modelos de Aprendizaje Automático Supervisado para ver en cuál de ellos obtenemos mejores resultados, la Regresión Logística y el Random Forest. El que mejor funciona es el de Regresión Logística con un acierto de 0.64 puntos.
[eng] In the following study, we have created and tested a computational model to identify the gender of the authors of texts automatically. Based on the texts of the CLEF2013 corpus, extracted from different internet blogs and their comments. The objective of this study is to develop a model to predict the gender of unknown authors. For that, we used the corpus used in the competition that took place in 2013 at the PAN at CLEF. We evaluated two Supervised Machine Learning models to see which of them obtain better results, the Logistic Regression and the Random Forest. What works best is the Logistic Regression with a hit of 0.64 points.
[spa] En el siguiente estudio se ha creado y puesto a prueba un modelo computacional para identificar el género de los autores de textos de una forma automática, basándonos los textos del corpus CLEF2013 que han sido extraídos de diferentes blogs de internet y sus comentarios. El objetivo de este estudio es elaborar un modelo de predicción del género de autores desconocidos a partir del corpus empleado en la competición que se llevó a cabo en 2013 en la PAN al CLEF. Evaluamos dos modelos de Aprendizaje Automático Supervisado para ver en cuál de ellos obtenemos mejores resultados, la Regresión Logística y el Random Forest. El que mejor funciona es el de Regresión Logística con un acierto de 0.64 puntos.
[eng] In the following study, we have created and tested a computational model to identify the gender of the authors of texts automatically. Based on the texts of the CLEF2013 corpus, extracted from different internet blogs and their comments. The objective of this study is to develop a model to predict the gender of unknown authors. For that, we used the corpus used in the competition that took place in 2013 at the PAN at CLEF. We evaluated two Supervised Machine Learning models to see which of them obtain better results, the Logistic Regression and the Random Forest. What works best is the Logistic Regression with a hit of 0.64 points.
Descripció
Treballs Finals de Grau de Lingüística. Facultat de Filologia. Universitat de Barcelona, Curs: 2020-2021, Tutora: Maria Taulé Delor
Matèries (anglès)
Citació
Col·leccions
Citació
CABESTANY MANEN, David. Creació d’un classificador de perfils segons el gènere de l’autor. [consulta: 15 de gener de 2026]. [Disponible a: https://hdl.handle.net/2445/181765]