Please use this identifier to cite or link to this item:
http://hdl.handle.net/2445/182100
Title: | Comparació de tècniques de clustering en una base de dades de salut |
Author: | Ventayol Farras, Xavier |
Director/Tutor: | Fernández Martínez, Daniel Sánchez Niubò, Albert |
Keywords: | Anàlisi de conglomerats Bases de dades Estadística Treballs de fi de grau Cluster analysis Databases Statistics Bachelor's theses |
Issue Date: | 2021 |
Abstract: | Les tècniques de clustering tenen l’objectiu de trobar patrons amagats dins de les dades i, particularment, dividir un conjunt d’observacions en grups acord a un conjunt de mesures. Els primers mètodes es van desenvolupar als anys 30 i 40 i avui dia n’existeixen més d’un centenar. En aquest treball s’han estudiat tres tècniques de Hard clustering: K-means, clustering jeràrquic, K-medoids i una tècnica de Soft clustering: Gaussian Mixture Models. Addicionalment, s’han seleccionat aleatòriament dues mostres de 200 persones de l’estudi de salut ELSA amb els objectius d’il·lustrar aquests mètodes per descobrir quins s’adapten millor a aquestes dades i de determinar grups de persones, estratificats per sexe, amb perfils de salut comuns. El K-means i el clustering jeràrquic aglomeratiu són les tècniques que han presentat els millors resultats. En canvi, els Gaussian Mixture Models és el mètode que pitjor s’ha adaptat a les dues mostres analitzades. |
Note: | Treballs Finals de Grau en Estadística UB-UPC, Facultat d'Economia i Empresa (UB) i Facultat de Matemàtiques i Estadística (UPC), Curs: 2020-2021, Tutors: Daniel Fernández Martínez i Albert Sanchez Niubó |
URI: | http://hdl.handle.net/2445/182100 |
Appears in Collections: | Treballs Finals de Grau (TFG) - Estadística UB-UPC |
Files in This Item:
File | Description | Size | Format | |
---|---|---|---|---|
Ventayol_Xavier_TFG.pdf | 5.26 MB | Adobe PDF | View/Open |
This item is licensed under a Creative Commons License