Tipus de document

Treball de fi de grau

Data de publicació

Llicència de publicació

memòria: cc-by-nc-nd (c) Andreu Figueras Puiggròs, 2026
Si us plau utilitzeu sempre aquest identificador per citar o enllaçar aquest document: https://hdl.handle.net/2445/228540

De la radiòmica als Foundation Models: estratègies per a l’extracció de característiques d’imatge mèdica

Títol de la revista

Director/Tutor

ISSN de la revista

Títol del volum

Recurs relacionat

Resum

[en] Breast cancer remains a leading cause of mortality among women worldwide. Neoadjuvant Chemotherapy (NAC) is a standard treatment for advanced stages, and achieving Pathological Complete Response (pCR) is a strong predictor of survival. Non-invasive prediction of pCR using Magnetic Resonance Imaging (MRI) is a major goal in precision medicine. This thesis compares two features extraction methods for pCR prediction: classical Radiomics, which is interpretable with hand-crafted features, and modern Foundation Models which are abstract with deep learning embeddings. Beyond standard classification metrics, we propose a rigorous mathematical framework to analyze the intrinsic properties of these feature spaces. We utilize Probabilistic Principal Component Analysis (PPCA) to estimate the intrinsic dimensionality and k-Nearest Neighbors (k-NN) based mutual information estimator (KSG and Ross algorithms) to quantify feature relevance without assuming linearity. Furthermore, we implement a Minimum Redundancy Maximum Relevance (mRMR) algorithm to identify optimal feature subset and employ t-SNE to visualize the structural differences between radiomics features and Foundation Models embeddings. Our results on the MAMA-MIA dataset reveal that both feature spaces exhibit high redundancy and saturation, as Probabilistic PCA successfully reduced dimensionality by over 90% without significant information loss. regarding predictive performance, classical Radiomics outperformed the MRI-CORE Foundation Model, achieving AUC scores between 0.60 and 0.65 compared to the 0.50–0.55 range obtained with deep learning embeddings. Furthermore, while the proposed mutual information-based feature selection method stabilized model training, it did not significantly improve classification performance compared to standard reduction strategies. These findings suggest that, despite the semantic richness of Foundation Models, hand-crafted radiomic features remain more effective for this specific binary classification task without fine-tuning. [ca] El càncer de mama continua sent una de les principals causes de mortalitat femenina a nivell mundial. La Quimioteràpia Neoadjuvant (NAC) és un tractament estàndard, i assolir la Resposta Patològica Completa (pCR) és un fort indicador de supervivència. La predicció no invasiva de la pCR mitjançant Ressonància Magnètica (MRI) és un objectiu clau en la medicina de precisió. Aquest treball compara dos mètodes d’extracció de característiques per a al predicció de pCR: la Radiòmica clàssica amb descriptors interpretables i els Foundation Models amb embeddings d’aprenentatge profund. Més enllà de les mètriques de classificació estàndard, proposem un marc matemàtic rigorós per analitzar les propietats intrínseques d’aquests espais vectorials. Utilitzem l’Anàlisi de Components Principals Probabilístic (PPCA) per estimar la dimensionalitat intrínseca i estimadors d’informació mútua basats en k-Veïns Més Propers (k-NN) (algoritmes KSG i Ross) per quantificar la rellevància sense assumir linealitat. A més, implementem un algoritme de selecció mRMR (Mínima Redundància Màxima Rellevància) per identificar subconjunts òptims. Els nostres resultats sobre el conjunt de dades MAMA-MIA revelen que ambdós espais de característiques presenten una alta redundància i saturació, permetent que el PCA Probabilístic redueixi la dimensionalitat en més d’un 90% sense pèrdua significativa d’informació. Pel que fa a la capacitat predictiva, la Radiòmica clàssica ha superat el Foundation Model MRI-CORE, assolint valors AUC entre 0,60 i 0,65 en comparació amb el rang de 0,50–0,55 obtingut amb els embeddings. A més, tot i que la metodologia de selecció proposada basada en informació mútua ha estabilitzat l’entrenament dels models, no ha millorat significativament els resultats respecte a les estratègies de reducció estàndard. Aquestes conclusions suggereixen que, malgrat la potència dels Foundation Models, els descriptors radiòmics continuen sent més efectius per a aquesta tasca específica de classificació binària sense aplicar fine-tuning.

Descripció

Treballs Finals del Doble Grau Matemàtiques i Enginyeria Informàtica de la Facultat de Matemàtiques i Informàtica, Universitat de Barcelona, Any: 2026, Tutor: Oliver Díaz Montesdeoca

Citació

Citació

FIGUERAS PUIGGRÒS, Andreu. De la radiòmica als Foundation Models: estratègies per a l’extracció de característiques d’imatge mèdica. [consulted: 24 of May of 2026]. Available at: https://hdl.handle.net/2445/228540

Exportar metadades

JSON - METS

Compartir registre