Please use this identifier to cite or link to this item: http://hdl.handle.net/2445/182100
Title: Comparació de tècniques de clustering en una base de dades de salut
Author: Ventayol Farras, Xavier
Director/Tutor: Fernández Martínez, Daniel
Sánchez Niubò, Albert
Keywords: Anàlisi de conglomerats
Bases de dades
Estadística
Treballs de fi de grau
Cluster analysis
Databases
Statistics
Bachelor's theses
Issue Date: 2021
Abstract: Les tècniques de clustering tenen l’objectiu de trobar patrons amagats dins de les dades i, particularment, dividir un conjunt d’observacions en grups acord a un conjunt de mesures. Els primers mètodes es van desenvolupar als anys 30 i 40 i avui dia n’existeixen més d’un centenar. En aquest treball s’han estudiat tres tècniques de Hard clustering: K-means, clustering jeràrquic, K-medoids i una tècnica de Soft clustering: Gaussian Mixture Models. Addicionalment, s’han seleccionat aleatòriament dues mostres de 200 persones de l’estudi de salut ELSA amb els objectius d’il·lustrar aquests mètodes per descobrir quins s’adapten millor a aquestes dades i de determinar grups de persones, estratificats per sexe, amb perfils de salut comuns. El K-means i el clustering jeràrquic aglomeratiu són les tècniques que han presentat els millors resultats. En canvi, els Gaussian Mixture Models és el mètode que pitjor s’ha adaptat a les dues mostres analitzades.
Note: Treballs Finals de Grau en Estadística UB-UPC, Facultat d'Economia i Empresa (UB) i Facultat de Matemàtiques i Estadística (UPC), Curs: 2020-2021, Tutors: Daniel Fernández Martínez i Albert Sanchez Niubó
URI: http://hdl.handle.net/2445/182100
Appears in Collections:Treballs Finals de Grau (TFG) - Estadística UB-UPC

Files in This Item:
File Description SizeFormat 
Ventayol_Xavier_TFG.pdf5.26 MBAdobe PDFView/Open


This item is licensed under a Creative Commons License Creative Commons