Please use this identifier to cite or link to this item:
http://hdl.handle.net/2445/181765
Full metadata record
DC Field | Value | Language |
---|---|---|
dc.contributor.advisor | Taulé Delor, Mariona | - |
dc.contributor.author | Cabestany Manen, David | - |
dc.date.accessioned | 2021-12-13T18:40:33Z | - |
dc.date.available | 2021-12-13T18:40:33Z | - |
dc.date.issued | 2021-06-17 | - |
dc.identifier.uri | http://hdl.handle.net/2445/181765 | - |
dc.description | Treballs Finals de Grau de Lingüística. Facultat de Filologia. Universitat de Barcelona, Curs: 2020-2021, Tutora: Maria Taulé Delor | ca |
dc.description.abstract | [cat] En el següent estudi s’ha creat i posat a prova un model computacional per identificar el gènere dels autors de textos d’una manera automàtica, basant-nos en els textos del corpus CLEF2013, que han estat extrets de diferents blogs d’internet i dels seus comentaris. L’objectiu d’aquest estudi és elaborar un model de predicció del gènere d’autors desconeguts a partir del corpus emprat en la competició que es va dur a terme el 2013 a la PAN al CLEF. Avaluem dos models d’Aprenentatge Automàtic Supervisat per veure en quin d’ells obtenim millors resultats, la Regressió Logística i el Random Forest. El que millor funciona és el de Regressió Logística amb un encert de 0.64 punts. | ca |
dc.description.abstract | [spa] En el siguiente estudio se ha creado y puesto a prueba un modelo computacional para identificar el género de los autores de textos de una forma automática, basándonos los textos del corpus CLEF2013 que han sido extraídos de diferentes blogs de internet y sus comentarios. El objetivo de este estudio es elaborar un modelo de predicción del género de autores desconocidos a partir del corpus empleado en la competición que se llevó a cabo en 2013 en la PAN al CLEF. Evaluamos dos modelos de Aprendizaje Automático Supervisado para ver en cuál de ellos obtenemos mejores resultados, la Regresión Logística y el Random Forest. El que mejor funciona es el de Regresión Logística con un acierto de 0.64 puntos. | ca |
dc.description.abstract | [eng] In the following study, we have created and tested a computational model to identify the gender of the authors of texts automatically. Based on the texts of the CLEF2013 corpus, extracted from different internet blogs and their comments. The objective of this study is to develop a model to predict the gender of unknown authors. For that, we used the corpus used in the competition that took place in 2013 at the PAN at CLEF. We evaluated two Supervised Machine Learning models to see which of them obtain better results, the Logistic Regression and the Random Forest. What works best is the Logistic Regression with a hit of 0.64 points. | ca |
dc.format.extent | 26 p. | - |
dc.format.mimetype | application/pdf | - |
dc.language.iso | cat | ca |
dc.rights | cc-by-nc-nd (c) David Cabestany Manen, 2021 | - |
dc.rights.uri | http://creativecommons.org/licenses/by-nc-nd/3.0/es/ | * |
dc.subject.classification | Gènere | cat |
dc.subject.classification | Aprenentatge automàtic | cat |
dc.subject.classification | Models matemàtics | cat |
dc.subject.classification | Treballs de fi de grau | cat |
dc.subject.other | Gender | eng |
dc.subject.other | Machine learning | eng |
dc.subject.other | Mathematical models | eng |
dc.subject.other | Bachelor's theses | eng |
dc.title | Creació d’un classificador de perfils segons el gènere de l’autor | ca |
dc.type | info:eu-repo/semantics/bachelorThesis | ca |
dc.rights.accessRights | info:eu-repo/semantics/openAccess | ca |
Appears in Collections: | Treballs Finals de Grau (TFG) - Lingüística |
Files in This Item:
File | Description | Size | Format | |
---|---|---|---|---|
Cabestany Manen David.pdf | 589.25 kB | Adobe PDF | View/Open |
This item is licensed under a
Creative Commons License