Tipus de document

Treball de fi de grau

Data de publicació

Llicència de publicació

memòria: cc by-nc-nd (c) Christian Queralt Aixendri, 2025
Si us plau utilitzeu sempre aquest identificador per citar o enllaçar aquest document: https://hdl.handle.net/2445/228048

Domain adaptation in breast cancer classification

Títol de la revista

Director/Tutor

ISSN de la revista

Títol del volum

Recurs relacionat

Resum

[ca] Aquest treball avalua la capacitat de generalització de models de deep learning per a la classificació binària de càncer de mama entre diferents conjunts de dades. S’han integrat i preprocesat dos repositoris de mamografies (CBIS-DSM i BCDR), convertint imatges DICOM a PNG, unificant metadades i equilibrant etiquetes. S’ha dissenyat un pipeline modular amb PyTorch per a càrrega de dades, augmentació i entrenament, adaptant un ResNet-18 preentrenat amb capes convolucionals congelades i un cap classificació personalitzat. S’han dut a terme cinc experiments: entrenament i prova en el mateix domini (CBIS-DDSM i BCDR), avaluació creuada BCDR→CBIS-DDSM i CBIS-DDSM→BCDR, i un estudi d’adaptació parcial mitjançant la inclusió de percentatges progressius de dades del domini objectiu. Els resultats, mesurats amb accuracy, balanced accuracy i AUC de la corba ROC, mostren un rendiment moderat en domini (AUC ≈0.87 en BCDR) i una millora significativa en generalització creuada quan s’incorpora un 10–20% de dades del domini objectiu (AUC ≥ 0.75). Aquest estudi destaca la importància de la validació creuada de conjunts de dades i evidencia que una petita adaptació de domini pot impulsar la robustesa dels models per a aplicacions clíniques reals. [es] Este trabajo evalúa la capacidad de generalización de modelos de deep learning para la clasificación binaria de cáncer de mama en distintos conjuntos de datos. Se han integrado y preprocesado dos repositorios de mamografías (CBIS-DDSM y BCDR), convirtiendo imágenes DICOM a PNG, unificando metadatos y equilibrando etiquetas. Se ha diseñado un flujo modular con PyTorch para la carga de datos, aumentos y entrenamiento, adaptando un ResNet-18 preentrenado con capas convolucionales congeladas y una cabeza de clasificación personalizada. Se han realizado cinco experimentos: entrenamiento y prueba en el mismo dominio (CBIS-DDSM y BCDR), evaluación cruzada BCDR→CBISDDSM y CBIS-DDSM→BCDR, y un estudio de adaptación parcial mediante la inclusión de porcentajes progresivos de datos del dominio objetivo. Los resultados, medidos con accuracy, balanced accuracy y AUC de la curva ROC, muestran un rendimiento moderado en dominio (AUC ≈0.87 en BCDR) y una mejora significativa en generalización cruzada al incorporar un 10–20% de datos del dominio objetivo (AUC ≥ 0.75). Este estudio subraya la importancia de la validación cruzada de conjuntos de datos y demuestra que una pequeña adaptación de dominio puede reforzar la robustez de los modelos para aplicaciones clínicas reales. [en] This work assesses the generalization ability of deep learning models for binary breast cancer classification across different datasets. Two mammography repositories (CBISDDSM and BCDR) were integrated and preprocessed by converting DICOM images to PNG, unifying metadata, and balancing labels. A modular PyTorch pipeline was developed for data loading, augmentation, and training, adapting a pretrained ResNet-18 with frozen convolutional layers and a custom classification head. Five experiments were conducted: in-domain training/testing on CBIS-DDSM and BCDR, cross-domain evaluation BCDR→CBIS-DDSM and CBIS-DDSM→BCDR, and a partial domain-adaptation study by incrementally adding target-domain data. Results, evaluated with accuracy, balanced accuracy, and ROC AUC, indicate moderate in-domain performance (AUC ≈0.87 on BCDR) and significant cross-domain improvements when incorporating 10–20% of target data (AUC ≥ 0.75). This study highlights the critical importance of cross-dataset validation and demonstrates that minimal domain adaptation can substantially enhance model robustness for real-world clinical deployment.

Descripció

Treballs Finals de Grau d'Enginyeria Informàtica, Facultat de Matemàtiques, Universitat de Barcelona, Any: 2025, Director: Kaisar Kushibar

Citació

Citació

QUERALT AIXENDRI, Christian. Domain adaptation in breast cancer classification. [consulted: 22 of May of 2026]. Available at: https://hdl.handle.net/2445/228048

Exportar metadades

JSON - METS

Compartir registre