Comparació de tècniques de clustering en una base de dades de salut

dc.contributor.advisorFernández Martínez, Daniel
dc.contributor.advisorSánchez Niubò, Albert
dc.contributor.authorVentayol Farras, Xavier
dc.date.accessioned2022-01-04T10:47:29Z
dc.date.available2022-01-04T10:47:29Z
dc.date.issued2021
dc.descriptionTreballs Finals de Grau en Estadística UB-UPC, Facultat d'Economia i Empresa (UB) i Facultat de Matemàtiques i Estadística (UPC), Curs: 2020-2021, Tutors: Daniel Fernández Martínez i Albert Sanchez Niubóca
dc.description.abstractLes tècniques de clustering tenen l’objectiu de trobar patrons amagats dins de les dades i, particularment, dividir un conjunt d’observacions en grups acord a un conjunt de mesures. Els primers mètodes es van desenvolupar als anys 30 i 40 i avui dia n’existeixen més d’un centenar. En aquest treball s’han estudiat tres tècniques de Hard clustering: K-means, clustering jeràrquic, K-medoids i una tècnica de Soft clustering: Gaussian Mixture Models. Addicionalment, s’han seleccionat aleatòriament dues mostres de 200 persones de l’estudi de salut ELSA amb els objectius d’il·lustrar aquests mètodes per descobrir quins s’adapten millor a aquestes dades i de determinar grups de persones, estratificats per sexe, amb perfils de salut comuns. El K-means i el clustering jeràrquic aglomeratiu són les tècniques que han presentat els millors resultats. En canvi, els Gaussian Mixture Models és el mètode que pitjor s’ha adaptat a les dues mostres analitzades.ca
dc.format.extent117 p.
dc.format.mimetypeapplication/pdf
dc.identifier.urihttps://hdl.handle.net/2445/182100
dc.language.isocatca
dc.rightscc-by-nc-nd (c) Ventayol Farras, 2021
dc.rights.accessRightsinfo:eu-repo/semantics/openAccessca
dc.rights.urihttp://creativecommons.org/licenses/by-nc-nd/3.0/es/*
dc.sourceTreballs Finals de Grau (TFG) - Estadística UB-UPC
dc.subject.classificationAnàlisi de conglomeratscat
dc.subject.classificationBases de dadescat
dc.subject.classificationEstadísticacat
dc.subject.classificationTreballs de fi de grau
dc.subject.otherCluster analysiseng
dc.subject.otherDatabaseseng
dc.subject.otherStatisticseng
dc.subject.otherBachelor's theseseng
dc.titleComparació de tècniques de clustering en una base de dades de salutca
dc.typeinfo:eu-repo/semantics/bachelorThesisca

Fitxers

Paquet original

Mostrant 1 - 1 de 1
Carregant...
Miniatura
Nom:
Ventayol_Xavier_TFG.pdf
Mida:
5.14 MB
Format:
Adobe Portable Document Format
Descripció: