Please use this identifier to cite or link to this item: http://hdl.handle.net/2445/207062
Title: Dimensionality reduction in multigroup data: applications in integrative omics
Author: Millapán Toledo, Carolina Andrea
Director/Tutor: Reverter Comes, Ferran
Vegas Lozano, Esteban
Keywords: Anàlisi multivariable
Dades de recerca
Multivariate analysis
Research data
Issue Date: 18-Dec-2023
Publisher: Universitat de Barcelona
Abstract: [eng] The idea of this research is to propose dimensionality reduction methods considering multi- groups in a dataset. In multivariate analysis, there are many multigroup methods, but they have different objectives than the goals presented in this thesis. Classical principal component analysis (PCA) is considered in this research as it has some- thing similar to our objective which is the exploration and visualization of the dataset. However, this unsupervised method lacks in considering the multigroup configuration. The thesis presents two multivariate dimension reduction approaches under a multigroup configuration. Statistical simulation helps us better observe and control the parameters of interest with these new methods proposed in this research. Thus, in this way, it helps us to conclude how they contribute to the literature of multivariate techniques in the visualization and exploration of high-dimensional data analysis. The method, multigroup principal component analysis (mgPCA), is based on maximizing the interdistances between pairs of observations when the observations belong to different groups. The second method, multigroup dimension reduction (MDR), determines linear varieties that minimize overlap by comparing observations in one group with the rest of the observations in the other groups. It is worth mentioning that a package was created in the R statistical programming lan- guage called MultiGroupO containing our two dimensionality reduction methods, and with vignettes, for better explanation and visualization of our multivariate multigroup approaches on omics datasets or any data analysis.
[spa] La idea de esta investigación es proponer métodos de reducción de dimensionalidad considerando los multigrupos en un conjunto de datos. El análisis multivariado hay muchos métodos multigrupos, pero que tienen distintos objetivos a lo nuestro en esta tesis. El análisis de componentes principales (PCA) clásico se considera en esta investigación, ya que tiene algo similar en nuestro objetivo que es la exploración y visualización del conjunto de datos. No obstante, este método no supervisado carece en considerar la configuración multigrupo. La tesis presenta dos enfoques multivariantes de reducción de la dimensión bajo una configuración multigrupo. La simulación estadística nos ayuda a observar y controlar de mejor manera los parámetros de interés en estos nuevos métodos propuestos en esta investigación. Así de esta manera, nos ayuda a concluir de qué manera contribuyen en la literatura de técnicas multivariantes en la visualización y exploración del análisis de datos de alta dimensionalidad. El método, análisis de componentes principales multigrupo (mgPCA), se basa en la maximización de las interdistancias entre pares de observaciones cuando las observaciones pertenecen a distintos grupos. El segundo método, reducción de dimensión multigrupo (MDR), determina variedades lineales que minimizan la superposición al comparar las observaciones de un grupo con el resto de observaciones en los otros grupos. Cabe mencionar que se creó un paquete en el programa R llamado MultiGroupO que contiene nuestros dos métodos de reducción de dimensionalidad, y con viñetas, para una mejor explicación y visualización de nuestros enfoques multivariados multigrupos en conjuntos de datos ómicos o de cualquier análisis de datos.
URI: http://hdl.handle.net/2445/207062
Appears in Collections:Tesis Doctorals - Departament - Genètica, Microbiologia i Estadística

Files in This Item:
File Description SizeFormat 
CAMT_PhD_THESIS.pdf5.95 MBAdobe PDFView/Open    Request a copy


Embargat   Document embargat fins el 18-6-2024


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.