Carregant...
Fitxers
Tipus de document
TesiVersió
Versió publicadaData de publicació
Llicència de publicació
Si us plau utilitzeu sempre aquest identificador per citar o enllaçar aquest document: https://hdl.handle.net/2445/225791
Development of a framework for data management, harmonisation, visualisation, and analytics of multi-omics clinical trials data in the context of autoimmune diseases
Títol de la revista
Autors
Director/Tutor
ISSN de la revista
Títol del volum
Recurs relacionat
Resum
[eng] (Multi-)omics technologies generate vast amounts of data that require proper organisation and storage for efficient analyses and interoperability. Historically research organisations managed data locally, but in today’s large-scale international collaborative projects, this hinders efficient data exchange. A case in point, is the use of SFTP file server for data sharing purposes, which requires familiarity with specific software or command-line tools. Commercial cloud storage (e.g., Dropbox or Google Cloud) offers an alternative but demands trust in black-box solutions and their providers. Open-source alternatives exist, each with specific strengths and limitations.
In this thesis, I evaluated the applicability of these existing open-source data warehouse solutions for the 3TR project (3tr-imi.eu). It is a public-private partnership tackling seven immune-mediated diseases across 15 European countries involving 69 partners. As none of the tested software solutions met the needs of the 3TR project consortium I developed OmicsDM, a web-based platform that facilitates data storage, sharing, visualisation, and analysis. In 3TR, diseases are analysed both independently and jointly. Regarding the latter, the heterogeneity of the pheno-clinical data across studies poses a major challenge. To address this, I participated in the development of Convert-Pheno, a software toolkit for the interconversion of common data models for phenotypic data. Thus, laying the foundation for the envisioned cross-disease analysis. Next, the consortium needed a method to group patients by phenotypic resemblance rather than diagnostic labels alone. Thus, enabling researchers to construct phenotype-based cohorts whose analysis can reveal shared mechanisms or treatment responses across diseases To aid in the grouping we built Pheno-Ranker. It leverages semantic similarity to compare phenotypic data stored in GA4GH standards and beyond. For both Convert-Pheno and Pheno-Ranker I built intuitive web user interfaces, each with its own public playground to let users explore the capabilities of each of the tools.
To sum it up, the developments in this thesis are an important contribution to the improvement of the biomedical data management, harmonisation, visualisation and analytics infrastructure in Europe and beyond.
[cat] Les tecnologies (multi)òmiques generen grans volums de dades que requereixen una organització i emmagatzematge adequats per tal de permetre anàlisis eficients i interoperabilitat. Històricament, els centres de recerca han gestionat les dades localment, però en els projectes col·laboratius internacionals a gran escala actuals, això dificulta l’intercanvi eficient de dades. Un exemple d’això és l’ús de servidors SFTP per compartir dades, que requereix coneixements específics de programari o eines de línia de comandes. L’emmagatzematge al núvol comercial (per exemple, Dropbox o Google Cloud) és una alternativa, però exigeix confiar en solucions opaques i els seus proveïdors. També existeixen alternatives de codi obert, cadascuna amb punts forts i limitacions específiques. En aquesta tesi, es va avaluar l’aplicabilitat d’aquestes solucions de magatzems de dades de codi obert per al projecte 3TR (3tr-imi.eu). El consorci 3TR és una associació públic-privada que aborda set malalties immunomediades en 15 països europeus amb la participació de 69 socis. Com que cap de les solucions provades satisfacia les necessitats del consorci 3TR, es va desenvolupar OmicsDM, una plataforma web que facilita l’emmagatzematge, compartició, visualització i anàlisi de dades. Al projecte 3TR, les malalties s’analitzen tant de manera independent com conjunta. Pel que fa a aquesta última, l’heterogeneïtat de les dades fenotípiques i clíniques entre estudis representa un repte important. Per fer-hi front, vaig participar en el desenvolupament de Convert-Pheno, un conjunt d’eines per a la interconversió de models de dades comuns per a dades fenotípiques, assentant així les bases per a l’anàlisi entre malalties. Seguint aquesta línia, el consorci necessitava un mètode per agrupar pacients segons la semblança fenotípica i no només per les etiquetes diagnòstiques, permetent així als investigadors construir cohorts basats en el fenotip, la qual cosa pot revelar mecanismes compartits o respostes terapèutiques comunes entre malalties. Per facilitar aquest agrupament, vam desenvolupar Pheno-Ranker, una eina que utilitza la similitud semàntica per comparar dades fenotípiques emmagatzemades en formats GA4GH i altres. Per a Convert-Pheno i Pheno-Ranker, vaig desenvolupar interfícies web intuïtives amb espais de proves públics perquè els usuaris poguessin explorar-ne les funcionalitats. En resum, els desenvolupaments d’aquesta tesi representen una contribució important a la millora de la infraestructura de gestió, harmonització, visualització i anàlisi de dades biomèdiques a Europa i més enllà.
[spa] Las tecnologías (multi)ómicas generan grandes cantidades de datos que requieren una organización y un almacenamiento adecuados para garantizar la eficiencia de los análisis y la interoperabilidad. Históricamente, los centros de investigación han sido los encargados de los datos a nivel local. Sin embargo, en los proyectos colaborativos internacionales a gran escala actuales, esto dificulta el intercambio eficiente de datos. Un ejemplo de ello es el uso del servidor de archivos SFTP para compartir datos, que requiere estar familiarizado con un software específico o con herramientas de línea de comandos. El almacenamiento comercial en la nube (por ejemplo, Dropbox o Google Cloud) ofrece una alternativa viable, pero exige confiar en soluciones de tipo “caja-negra” y en sus proveedores. Existen alternativas de código abierto, cada una con sus ventajas y limitaciones específicas. En esta tesis, se evaluó la aplicabilidad de estas soluciones de almacenamiento de datos de código abierto existentes para el proyecto 3TR (3tr-imi.eu). El proyecto 3TR es na asociación público-privada que aborda siete enfermedades inmunomediadas en 15 países europeos y en la que participan 69 socios. Dado que ninguna de las soluciones de software probadas satisfacía las necesidades del consorcio del proyecto 3TR, se desarrolló OmicsDM, una plataforma web que facilita el almacenamiento, el intercambio, la visualización y el análisis de datos. En 3TR, las enfermedades se analizan tanto de forma independiente como conjunta. En cuanto a esto último, la heterogeneidad de los datos feno-clínicos entre los distintos estudios supone un reto importante. Para abordarlo, participé en el desarrollo de Convert-Pheno, un conjunto de herramientas de software para la interconversión de modelos de datos comunes para datos fenotípicos. De este modo, se sentaron las bases para el análisis previsto entre enfermedades. Por otra parte, el consorcio necesitaba un método para agrupar a los pacientes por similitud fenotípica, en lugar de solo por etiquetas de diagnóstico. De este modo, los investigadores pueden construir cohortes basadas en fenotipos cuyo análisis puede revelar mecanismos compartidos o respuestas al tratamiento entre enfermedades. Para ayudar en este cometido, creamos Pheno-Ranker, éste aprovecha la similitud semántica para comparar los datos fenotípicos almacenados en los estándares GA4GH y otros. Tanto para Convert-Pheno como para Pheno-Ranker, se crearon interfaces de usuario web intuitivas, cada una con su propio entorno público para que los usuarios pudieran explorar las capacidades de cada una de las herramientas. En resumen, los avances de esta tesis son una importante contribución a la mejora de la infraestructura de gestión, armonización, visualización y análisis de datos biomédicos en Europa y más allá.
[cat] Les tecnologies (multi)òmiques generen grans volums de dades que requereixen una organització i emmagatzematge adequats per tal de permetre anàlisis eficients i interoperabilitat. Històricament, els centres de recerca han gestionat les dades localment, però en els projectes col·laboratius internacionals a gran escala actuals, això dificulta l’intercanvi eficient de dades. Un exemple d’això és l’ús de servidors SFTP per compartir dades, que requereix coneixements específics de programari o eines de línia de comandes. L’emmagatzematge al núvol comercial (per exemple, Dropbox o Google Cloud) és una alternativa, però exigeix confiar en solucions opaques i els seus proveïdors. També existeixen alternatives de codi obert, cadascuna amb punts forts i limitacions específiques. En aquesta tesi, es va avaluar l’aplicabilitat d’aquestes solucions de magatzems de dades de codi obert per al projecte 3TR (3tr-imi.eu). El consorci 3TR és una associació públic-privada que aborda set malalties immunomediades en 15 països europeus amb la participació de 69 socis. Com que cap de les solucions provades satisfacia les necessitats del consorci 3TR, es va desenvolupar OmicsDM, una plataforma web que facilita l’emmagatzematge, compartició, visualització i anàlisi de dades. Al projecte 3TR, les malalties s’analitzen tant de manera independent com conjunta. Pel que fa a aquesta última, l’heterogeneïtat de les dades fenotípiques i clíniques entre estudis representa un repte important. Per fer-hi front, vaig participar en el desenvolupament de Convert-Pheno, un conjunt d’eines per a la interconversió de models de dades comuns per a dades fenotípiques, assentant així les bases per a l’anàlisi entre malalties. Seguint aquesta línia, el consorci necessitava un mètode per agrupar pacients segons la semblança fenotípica i no només per les etiquetes diagnòstiques, permetent així als investigadors construir cohorts basats en el fenotip, la qual cosa pot revelar mecanismes compartits o respostes terapèutiques comunes entre malalties. Per facilitar aquest agrupament, vam desenvolupar Pheno-Ranker, una eina que utilitza la similitud semàntica per comparar dades fenotípiques emmagatzemades en formats GA4GH i altres. Per a Convert-Pheno i Pheno-Ranker, vaig desenvolupar interfícies web intuïtives amb espais de proves públics perquè els usuaris poguessin explorar-ne les funcionalitats. En resum, els desenvolupaments d’aquesta tesi representen una contribució important a la millora de la infraestructura de gestió, harmonització, visualització i anàlisi de dades biomèdiques a Europa i més enllà.
[spa] Las tecnologías (multi)ómicas generan grandes cantidades de datos que requieren una organización y un almacenamiento adecuados para garantizar la eficiencia de los análisis y la interoperabilidad. Históricamente, los centros de investigación han sido los encargados de los datos a nivel local. Sin embargo, en los proyectos colaborativos internacionales a gran escala actuales, esto dificulta el intercambio eficiente de datos. Un ejemplo de ello es el uso del servidor de archivos SFTP para compartir datos, que requiere estar familiarizado con un software específico o con herramientas de línea de comandos. El almacenamiento comercial en la nube (por ejemplo, Dropbox o Google Cloud) ofrece una alternativa viable, pero exige confiar en soluciones de tipo “caja-negra” y en sus proveedores. Existen alternativas de código abierto, cada una con sus ventajas y limitaciones específicas. En esta tesis, se evaluó la aplicabilidad de estas soluciones de almacenamiento de datos de código abierto existentes para el proyecto 3TR (3tr-imi.eu). El proyecto 3TR es na asociación público-privada que aborda siete enfermedades inmunomediadas en 15 países europeos y en la que participan 69 socios. Dado que ninguna de las soluciones de software probadas satisfacía las necesidades del consorcio del proyecto 3TR, se desarrolló OmicsDM, una plataforma web que facilita el almacenamiento, el intercambio, la visualización y el análisis de datos. En 3TR, las enfermedades se analizan tanto de forma independiente como conjunta. En cuanto a esto último, la heterogeneidad de los datos feno-clínicos entre los distintos estudios supone un reto importante. Para abordarlo, participé en el desarrollo de Convert-Pheno, un conjunto de herramientas de software para la interconversión de modelos de datos comunes para datos fenotípicos. De este modo, se sentaron las bases para el análisis previsto entre enfermedades. Por otra parte, el consorcio necesitaba un método para agrupar a los pacientes por similitud fenotípica, en lugar de solo por etiquetas de diagnóstico. De este modo, los investigadores pueden construir cohortes basadas en fenotipos cuyo análisis puede revelar mecanismos compartidos o respuestas al tratamiento entre enfermedades. Para ayudar en este cometido, creamos Pheno-Ranker, éste aprovecha la similitud semántica para comparar los datos fenotípicos almacenados en los estándares GA4GH y otros. Tanto para Convert-Pheno como para Pheno-Ranker, se crearon interfaces de usuario web intuitivas, cada una con su propio entorno público para que los usuarios pudieran explorar las capacidades de cada una de las herramientas. En resumen, los avances de esta tesis son una importante contribución a la mejora de la infraestructura de gestión, armonización, visualización y análisis de datos biomédicos en Europa y más allá.
Matèries
Matèries (anglès)
Citació
Col·leccions
Citació
LEIST, Ivo christopher. Development of a framework for data management, harmonisation, visualisation, and analytics of multi-omics clinical trials data in the context of autoimmune diseases. [consulta: 24 de gener de 2026]. [Disponible a: https://hdl.handle.net/2445/225791]