Comparativa métodos de selección de variables

dc.contributor.advisorCortés Martínez, Jordi
dc.contributor.advisorTebé, Cristian
dc.contributor.authorSoler Carballo, Àlex
dc.date.accessioned2026-01-20T07:48:19Z
dc.date.available2026-01-20T07:48:19Z
dc.date.issued2025
dc.descriptionTreballs Finals de Grau en Estadística UB-UPC, Facultat d'Economia i Empresa (UB) i Facultat de Matemàtiques i Estadística (UPC), Curs: 2024-2025, Tutor: Jordi Cortés Martínez i Cristian Tebe Cordomi
dc.description.abstractLa correcta selección de variables es esencial en la construcción de modelos estadísticos, especialmente en contextos de alta dimensionalidad. Este trabajo analiza y compara el rendimiento de seis métodos de selección de variables: regresiones a pasos (en sus variantes), Bootstrap aplicado a la regresión a pasos, Lasso, Elastic Net, Random Forest y Boruta. Para ello, se han diseñado distintitos escenarios (simétricos y asimétricos) y en cada uno de estos, dos escenarios donde en uno no había variables relevantes y en el otro el 50% eran relevantes, generando datos sintéticos artificiales donde se conoce de antemano la relevancia de las variables. Se realizaron un total de 100 simulaciones por escenario, aplicando los métodos y evaluando su eficacia mediante métricas como sensibilidad, especificidad, valor predictivo positivo, valor predictivo negativo y accuracy. Entre los principales resultados, destaca que métodos como Elastic Net y Bootstrap presentan un buen equilibro entre sensibilidad y especificidad cuando la respuesta es simétrica, llegando a valores de 1 y 0.89 en el caso de Elastic Net y de 0.97 y 1 en el caso de Bootstrap. Otras, mientras que técnicas como Boruta, sobresalen por su baja tasa de falsos positivos, no llegando a superar el 3.5% en ninguna de las alternativas usadas de este algoritmo, independientemente de si la respuesta es simétrica o asimétrica. Se concluye que no existe un método universalmente superior, ya que el rendimiento varía según la distribución de la variable respuesta y la magnitud de los efectos.
dc.format.extent81 p.
dc.format.mimetypeapplication/pdf
dc.identifier.urihttps://hdl.handle.net/2445/225770
dc.language.isospa
dc.rightscc-by-nc-nd (c) Soler Carballo, 2025
dc.rights.accessRightsinfo:eu-repo/semantics/openAccess
dc.rights.urihttp://creativecommons.org/licenses/by-nc/4.0/
dc.subject.classificationVariables (Matemàtica)cat
dc.subject.classificationAnàlisi de regressiócat
dc.subject.classificationEstadísticacat
dc.subject.classificationTreballs de fi de graucat
dc.subject.otherVariables (Mathematics)eng
dc.subject.otherRegression analysiseng
dc.subject.otherStatisticseng
dc.subject.otherBachelor's theseseng
dc.titleComparativa métodos de selección de variables
dc.typeinfo:eu-repo/semantics/bachelorThesis

Fitxers

Paquet original

Mostrant 1 - 1 de 1
Carregant...
Miniatura
Nom:
TFG-EST_Soler_Àlex.pdf
Mida:
3.15 MB
Format:
Adobe Portable Document Format