De la radiòmica als Foundation Models: estratègies per a l’extracció de característiques d’imatge mèdica

[en] Breast cancer remains a leading cause of mortality among women worldwide. Neoadjuvant Chemotherapy (NAC) is a standard treatment for advanced stages, and achieving Pathological Complete Response (pCR) is a strong predictor of survival. Non-invasive prediction of pCR using Magnetic Resonance Imaging (MRI) is a major goal in precision medicine. This thesis compares two features extraction methods for pCR prediction: classical Radiomics, which is interpretable with hand-crafted features, and modern Foundation Models which are abstract with deep learning embeddings. Beyond standard classification metrics, we propose a rigorous mathematical framework to analyze the intrinsic properties of these feature spaces. We utilize Probabilistic Principal Component Analysis (PPCA) to estimate the intrinsic dimensionality and k-Nearest Neighbors (k-NN) based mutual information estimator (KSG and Ross algorithms) to quantify feature relevance without assuming linearity. Furthermore, we implement a Minimum Redundancy Maximum Relevance (mRMR) algorithm to identify optimal feature subset and employ t-SNE to visualize the structural differences between radiomics features and Foundation Models embeddings. Our results on the MAMA-MIA dataset reveal that both feature spaces exhibit high redundancy and saturation, as Probabilistic PCA successfully reduced dimensionality by over 90% without significant information loss. regarding predictive performance, classical Radiomics outperformed the MRI-CORE Foundation Model, achieving AUC scores between 0.60 and 0.65 compared to the 0.50–0.55 range obtained with deep learning embeddings. Furthermore, while the proposed mutual information-based feature selection method stabilized model training, it did not significantly improve classification performance compared to standard reduction strategies. These findings suggest that, despite the semantic richness of Foundation Models, hand-crafted radiomic features remain more effective for this specific binary classification task without fine-tuning. [ca] El càncer de mama continua sent una de les principals causes de mortalitat femenina a nivell mundial. La Quimioteràpia Neoadjuvant (NAC) és un tractament estàndard, i assolir la Resposta Patològica Completa (pCR) és un fort indicador de supervivència. La predicció no invasiva de la pCR mitjançant Ressonància Magnètica (MRI) és un objectiu clau en la medicina de precisió. Aquest treball compara dos mètodes d’extracció de característiques per a al predicció de pCR: la Radiòmica clàssica amb descriptors interpretables i els Foundation Models amb embeddings d’aprenentatge profund. Més enllà de les mètriques de classificació estàndard, proposem un marc matemàtic rigorós per analitzar les propietats intrínseques d’aquests espais vectorials. Utilitzem l’Anàlisi de Components Principals Probabilístic (PPCA) per estimar la dimensionalitat intrínseca i estimadors d’informació mútua basats en k-Veïns Més Propers (k-NN) (algoritmes KSG i Ross) per quantificar la rellevància sense assumir linealitat. A més, implementem un algoritme de selecció mRMR (Mínima Redundància Màxima Rellevància) per identificar subconjunts òptims. Els nostres resultats sobre el conjunt de dades MAMA-MIA revelen que ambdós espais de característiques presenten una alta redundància i saturació, permetent que el PCA Probabilístic redueixi la dimensionalitat en més d’un 90% sense pèrdua significativa d’informació. Pel que fa a la capacitat predictiva, la Radiòmica clàssica ha superat el Foundation Model MRI-CORE, assolint valors AUC entre 0,60 i 0,65 en comparació amb el rang de 0,50–0,55 obtingut amb els embeddings. A més, tot i que la metodologia de selecció proposada basada en informació mútua ha estabilitzat l’entrenament dels models, no ha millorat significativament els resultats respecte a les estratègies de reducció estàndard. Aquestes conclusions suggereixen que, malgrat la potència dels Foundation Models, els descriptors radiòmics continuen sent més efectius per a aquesta tasca específica de classificació binària sense aplicar fine-tuning.

Descripció

Treballs Finals del Doble Grau Matemàtiques i Enginyeria Informàtica de la Facultat de Matemàtiques i Informàtica, Universitat de Barcelona, Any: 2026, Tutor: Oliver Díaz Montesdeoca

Matèries

Imatges mèdiques, Ressonància magnètica, Diagnòstic per la imatge, Radiologia mèdica, Programari, Treballs de fi de grau

Matèries (anglès)

Imaging systems in medicine, Magnetic resonance, Diagnostic imaging, Medical radiology, Computer software, Bachelor's theses

Col·leccions

Treballs Finals de Grau (TFG) - Enginyeria Informàtica
Programari - Treballs de l'alumnat
Treballs Finals de Grau (TFG) - Matemàtiques

Pàgina completa de l'ítem

Citació

FIGUERAS PUIGGRÒS, Andreu. De la radiòmica als Foundation Models: estratègies per a l’extracció de característiques d’imatge mèdica. [consulted: 3 of August of 2026]. Available at: https://hdl.handle.net/2445/228540

Estadístiques

Exportar metadades

JSON - METS

Amb motiu del tancament d'estiu, la validació de documents es reprendrà a partir del 28 d'agost de 2026. Disculpeu les molèsties.

Con motivo del cierre de verano, la validación de documentos se reanudará a partir del 28 de agosto de 2026. Disculpad las molestias

Due to the summer closure, document validation will resume starting August 28, 2026. We apologize for any inconvenience.

Fitxers

Tipus de document

Data de publicació

Llicència de publicació

De la radiòmica als Foundation Models: estratègies per a l’extracció de característiques d’imatge mèdica

Títol de la revista

Autors

Director/Tutor

ISSN de la revista

Títol del volum

Recurs relacionat

Resum

Descripció

Matèries

Matèries (anglès)

Citació

Col·leccions

Citació

Exportar metadades

Amb motiu del tancament d'estiu, la validació de documents es reprendrà a partir del 28 d'agost de 2026. Disculpeu les molèsties.

Con motivo del cierre de verano, la validación de documentos se reanudará a partir del 28 de agosto de 2026. Disculpad las molestias

Due to the summer closure, document validation will resume starting August 28, 2026. We apologize for any inconvenience.

Fitxers

Tipus de document

Data de publicació

Llicència de publicació

De la radiòmica als Foundation Models: estratègies per a l’extracció de característiques d’imatge mèdica

Títol de la revista

Autors

Director/Tutor

ISSN de la revista

Títol del volum

Recurs relacionat

Resum

Descripció

Matèries

Matèries (anglès)

Citació

Col·leccions

Citació

Exportar metadades

Compartir registre