Document type

Bachelor thesis

Publication date

Publication license

cc-by-nc-nd (c) Ventayol Farras, 2021
Please use this identifier to cite or link to this item: https://hdl.handle.net/2445/182100

Comparació de tècniques de clustering en una base de dades de salut

Journal Title

Journal ISSN

Volume Title

Related resource

Abstract

Les tècniques de clustering tenen l’objectiu de trobar patrons amagats dins de les dades i, particularment, dividir un conjunt d’observacions en grups acord a un conjunt de mesures. Els primers mètodes es van desenvolupar als anys 30 i 40 i avui dia n’existeixen més d’un centenar. En aquest treball s’han estudiat tres tècniques de Hard clustering: K-means, clustering jeràrquic, K-medoids i una tècnica de Soft clustering: Gaussian Mixture Models. Addicionalment, s’han seleccionat aleatòriament dues mostres de 200 persones de l’estudi de salut ELSA amb els objectius d’il·lustrar aquests mètodes per descobrir quins s’adapten millor a aquestes dades i de determinar grups de persones, estratificats per sexe, amb perfils de salut comuns. El K-means i el clustering jeràrquic aglomeratiu són les tècniques que han presentat els millors resultats. En canvi, els Gaussian Mixture Models és el mètode que pitjor s’ha adaptat a les dues mostres analitzades.

Description

Treballs Finals de Grau en Estadística UB-UPC, Facultat d'Economia i Empresa (UB) i Facultat de Matemàtiques i Estadística (UPC), Curs: 2020-2021, Tutors: Daniel Fernández Martínez i Albert Sanchez Niubó

Citation

Citation

VENTAYOL FARRAS, Xavier. Comparació de tècniques de clustering en una base de dades de salut. [consulted: 7 of June of 2026]. Available at: https://hdl.handle.net/2445/182100

Export metadata

JSON - METS

Share record