El CRAI romandrà tancat del 24 de desembre de 2025 al 6 de gener de 2026. La validació de documents es reprendrà a partir del 7 de gener de 2026.
El CRAI permanecerá cerrado del 24 de diciembre de 2025 al 6 de enero de 2026. La validación de documentos se reanudará a partir del 7 de enero de 2026.
From 2025-12-24 to 2026-01-06, the CRAI remain closed and the documents will be validated from 2026-01-07.
 
Carregant...
Miniatura

Tipus de document

Tesi

Versió

Versió publicada

Data de publicació

Tots els drets reservats

Si us plau utilitzeu sempre aquest identificador per citar o enllaçar aquest document: https://hdl.handle.net/2445/207062

Dimensionality reduction in multigroup data: applications in integrative omics

Títol de la revista

ISSN de la revista

Títol del volum

Recurs relacionat

Resum

[eng] The idea of this research is to propose dimensionality reduction methods considering multi- groups in a dataset. In multivariate analysis, there are many multigroup methods, but they have different objectives than the goals presented in this thesis. Classical principal component analysis (PCA) is considered in this research as it has some- thing similar to our objective which is the exploration and visualization of the dataset. However, this unsupervised method lacks in considering the multigroup configuration. The thesis presents two multivariate dimension reduction approaches under a multigroup configuration. Statistical simulation helps us better observe and control the parameters of interest with these new methods proposed in this research. Thus, in this way, it helps us to conclude how they contribute to the literature of multivariate techniques in the visualization and exploration of high-dimensional data analysis. The method, multigroup principal component analysis (mgPCA), is based on maximizing the interdistances between pairs of observations when the observations belong to different groups. The second method, multigroup dimension reduction (MDR), determines linear varieties that minimize overlap by comparing observations in one group with the rest of the observations in the other groups. It is worth mentioning that a package was created in the R statistical programming lan- guage called MultiGroupO containing our two dimensionality reduction methods, and with vignettes, for better explanation and visualization of our multivariate multigroup approaches on omics datasets or any data analysis.
[spa] La idea de esta investigación es proponer métodos de reducción de dimensionalidad considerando los multigrupos en un conjunto de datos. El análisis multivariado hay muchos métodos multigrupos, pero que tienen distintos objetivos a lo nuestro en esta tesis. El análisis de componentes principales (PCA) clásico se considera en esta investigación, ya que tiene algo similar en nuestro objetivo que es la exploración y visualización del conjunto de datos. No obstante, este método no supervisado carece en considerar la configuración multigrupo. La tesis presenta dos enfoques multivariantes de reducción de la dimensión bajo una configuración multigrupo. La simulación estadística nos ayuda a observar y controlar de mejor manera los parámetros de interés en estos nuevos métodos propuestos en esta investigación. Así de esta manera, nos ayuda a concluir de qué manera contribuyen en la literatura de técnicas multivariantes en la visualización y exploración del análisis de datos de alta dimensionalidad. El método, análisis de componentes principales multigrupo (mgPCA), se basa en la maximización de las interdistancias entre pares de observaciones cuando las observaciones pertenecen a distintos grupos. El segundo método, reducción de dimensión multigrupo (MDR), determina variedades lineales que minimizan la superposición al comparar las observaciones de un grupo con el resto de observaciones en los otros grupos. Cabe mencionar que se creó un paquete en el programa R llamado MultiGroupO que contiene nuestros dos métodos de reducción de dimensionalidad, y con viñetas, para una mejor explicación y visualización de nuestros enfoques multivariados multigrupos en conjuntos de datos ómicos o de cualquier análisis de datos.

Citació

Citació

MILLAPÁN TOLEDO, Carolina andrea. Dimensionality reduction in multigroup data: applications in integrative omics. [consulta: 2 de gener de 2026]. [Disponible a: https://hdl.handle.net/2445/207062]

Exportar metadades

JSON - METS

Compartir registre