Please use this identifier to cite or link to this item: http://hdl.handle.net/2445/181765
Full metadata record
DC FieldValueLanguage
dc.contributor.advisorTaulé Delor, Mariona-
dc.contributor.authorCabestany Manen, David-
dc.date.accessioned2021-12-13T18:40:33Z-
dc.date.available2021-12-13T18:40:33Z-
dc.date.issued2021-06-17-
dc.identifier.urihttp://hdl.handle.net/2445/181765-
dc.descriptionTreballs Finals de Grau de Lingüística. Facultat de Filologia. Universitat de Barcelona, Curs: 2020-2021, Tutora: Maria Taulé Delorca
dc.description.abstract[cat] En el següent estudi s’ha creat i posat a prova un model computacional per identificar el gènere dels autors de textos d’una manera automàtica, basant-nos en els textos del corpus CLEF2013, que han estat extrets de diferents blogs d’internet i dels seus comentaris. L’objectiu d’aquest estudi és elaborar un model de predicció del gènere d’autors desconeguts a partir del corpus emprat en la competició que es va dur a terme el 2013 a la PAN al CLEF. Avaluem dos models d’Aprenentatge Automàtic Supervisat per veure en quin d’ells obtenim millors resultats, la Regressió Logística i el Random Forest. El que millor funciona és el de Regressió Logística amb un encert de 0.64 punts.ca
dc.description.abstract[spa] En el siguiente estudio se ha creado y puesto a prueba un modelo computacional para identificar el género de los autores de textos de una forma automática, basándonos los textos del corpus CLEF2013 que han sido extraídos de diferentes blogs de internet y sus comentarios. El objetivo de este estudio es elaborar un modelo de predicción del género de autores desconocidos a partir del corpus empleado en la competición que se llevó a cabo en 2013 en la PAN al CLEF. Evaluamos dos modelos de Aprendizaje Automático Supervisado para ver en cuál de ellos obtenemos mejores resultados, la Regresión Logística y el Random Forest. El que mejor funciona es el de Regresión Logística con un acierto de 0.64 puntos.ca
dc.description.abstract[eng] In the following study, we have created and tested a computational model to identify the gender of the authors of texts automatically. Based on the texts of the CLEF2013 corpus, extracted from different internet blogs and their comments. The objective of this study is to develop a model to predict the gender of unknown authors. For that, we used the corpus used in the competition that took place in 2013 at the PAN at CLEF. We evaluated two Supervised Machine Learning models to see which of them obtain better results, the Logistic Regression and the Random Forest. What works best is the Logistic Regression with a hit of 0.64 points.ca
dc.format.extent26 p.-
dc.format.mimetypeapplication/pdf-
dc.language.isocatca
dc.rightscc-by-nc-nd (c) David Cabestany Manen, 2021-
dc.rights.urihttp://creativecommons.org/licenses/by-nc-nd/3.0/es/*
dc.sourceTreballs Finals de Grau (TFG) - Lingüística-
dc.subject.classificationGènerecat
dc.subject.classificationAprenentatge automàticcat
dc.subject.classificationModels matemàticscat
dc.subject.classificationTreballs de fi de graucat
dc.subject.otherGendereng
dc.subject.otherMachine learningeng
dc.subject.otherMathematical modelseng
dc.subject.otherBachelor's theseseng
dc.titleCreació d’un classificador de perfils segons el gènere de l’autorca
dc.typeinfo:eu-repo/semantics/bachelorThesisca
dc.rights.accessRightsinfo:eu-repo/semantics/openAccessca
Appears in Collections:Treballs Finals de Grau (TFG) - Lingüística

Files in This Item:
File Description SizeFormat 
Cabestany Manen David.pdf589.25 kBAdobe PDFView/Open


This item is licensed under a Creative Commons License Creative Commons