Tipus de document

Tesi

Versió

Versió publicada

Data de publicació

Llicència de publicació

cc by (c) Ake, Franz Arnold, 2025
Si us plau utilitzeu sempre aquest identificador per citar o enllaçar aquest document: https://hdl.handle.net/2445/229876

Characterization of alternative polyadenylation sites at single cell resolution and its impact on Alzheimer Disease

Títol de la revista

ISSN de la revista

Títol del volum

Recurs relacionat

Resum

[eng] Alternative polyadenylation (APA) is a widespread mechanism of gene regulation that that affects more than 70% of human genes. mRNA isoforms generated though APA have distinct 3ʹ ends, which can affect mRNA regulation as well as the resulting proteins. APA is well known to be regulated during cell differentiation and it is a major source of gene regulation in the brain. Yet, it is not known till which extend APA contributes to the transcriptomic variability across individual cell populations. While bulk RNA sequencing has provided important insights into APA, it does not provide the resolution needed to resolve the cell-type-specific dynamics essential for understanding development and disease. The rapid development of 3’ tagged-based single-cell RNA sequencing (scRNA-seq) has enabled the study of gene expression and the implementation of methods for describing isoform usage at single cell resolution. However, challenges such as dropout effects or technical biases arising from the experimental setup have to be surmonted. In this thesis, we developed a novel computational approach to characterize isoform diversity at single-cell resolution using 3'-tagged scRNA-seq data, thereby enhancing the understanding of APA dynamics at single-cell resolution. First, I systematically evaluated the impact of various single-cell transcriptomics sample preservation methods on neural and glial cells derived from induced pluripotent stem cells. Secondly, I implemented and benchmarked SCALPEL, a novel computational Nextflow workflow designed for quantifying isoforms using standard 3′-tagged scRNA-seq data. Our results show that while DMSO provides the highest cell quality in terms of RNA molecules and genes detected per cell, it strongly affects the cellular composition and induces the expression of stress and apoptosis genes. In contrast, methanol fixed samples display a cellular composition similar to fresh samples and provide a good cell quality and little expression biases, indicating that methanol fixation is the method of choice for performing droplet-based single-cell transcriptomics experiments on neural cell populations. Furthermore, SCALPEL demonstrated high sensitivity and precision in quantifying isoforms, and the ability to detect differential isoform usage (DIU) in both synthetic and experimental datasets. In real datasets, SCALPEL predictions have a high agreement with other tools and can be experimentally validated. The use of SCALPEL on real datasets reveals novel cell populations undetectable using single-cell gene expression data, confirms known 3’ UTR length changes during cell differentiation, and identifies cell-type specific miRNA signatures regulating isoform expression. Additionally, we show that SCALPEL improves isoform quantification using paired long- and short-read scRNA-seq data. Overall, SCALPEL expands the current scRNA-seq toolkit to explore post-transcriptional gene regulation across species, tissues, and technologies, advancing our understanding of gene regulatory mechanisms at the single-cell level.
[cat] La poliadenilació alternativa (APA) és un mecanisme estès de regulació gènica que afecta més del 70% dels gens humans. Els isoformes d’ARNm generats mitjançant APA tenen extrems 3ʹ diferents, fet que pot influir tant en la regulació de l’ARNm com en la proteïna resultant. L’APA és ben coneguda per estar regulada durant la diferenciació cel·lular i constitueix una font important de regulació gènica al cervell. Tot i això, encara no se sap fins a quin punt l’APA contribueix a la variabilitat transcriptòmica entre poblacions cel·lulars individuals. Encara que el RNA-seq a granel ha proporcionat informació rellevant sobre l’APA, no ofereix la resolució necessària per captar les dinàmiques específiques de cada tipus cel·lular, essencials per comprendre el desenvolupament i les malalties. El desenvolupament accelerat del RNA-seq de cèl·lula única basat en etiquetatge 3’ ha permès estudiar l’expressió gènica i implementar mètodes per descriure l’ús d’isoformes a nivell de cèl·lula individual. No obstant això, cal superar desafiaments com els efectes de dropout o els biaixos tècnics derivats del disseny experimental. En aquesta tesi, hem desenvolupat un nou enfocament computacional per caracteritzar la diversitat d’isoformes a resolució de cèl·lula única utilitzant dades de RNA-seq de cèl·lula única etiquetades al 3’, amb l’objectiu de millorar la comprensió de les dinàmiques d’APA a aquest nivell. En primer lloc, vaig avaluar sistemàticament l’impacte de diversos mètodes de preservació de mostres en transcriptòmica de cèl·lula única aplicats a cèl·lules neurals i glials derivades de cèl·lules mare pluripotents induïdes (iPSC). En segon lloc, vaig implementar i avaluar SCALPEL, un nou flux de treball en Nextflow per a la quantificació d’isoformes mitjançant dades convencionals de scRNA-seq etiquetades al 3’. Els nostres resultats mostren que, tot i que el DMSO proporciona una qualitat cel·lular elevada en termes de molècules d’ARN i gens detectats per cèl·lula, afecta fortament la composició cel·lular i indueix l’expressió de gens relacionats amb estrès i apoptosi. En canvi, les mostres fixades amb metanol mostren una composició cel·lular similar a les mostres fresques i presenten una bona qualitat transcriptòmica i pocs biaixos d’expressió, indicant que la fixació amb metanol és el mètode preferible per a experiments de scRNA-seq basats en gotes per a poblacions cel·lulars neurals. A més, SCALPEL ha demostrat una gran sensibilitat i precisió en la quantificació d’isoformes i en la detecció d’ús diferencial d’isoformes (DIU) tant en conjunts de dades sintètics com experimentals. En dades reals, les prediccions de SCALPEL tenen una alta concordança amb altres eines i poden ser validades experimentalment. L’ús de SCALPEL en dades reals revela poblacions cel·lulars noves no detectables mitjançant dades d’expressió gènica de cèl·lula única, confirma canvis coneguts en la longitud dels 3’ UTR durant la diferenciació cel·lular i identifica signatures específiques de miARN que regulen l’expressió d’isoformes segons el tipus cel·lular. Addicionalment, demostrem que SCALPEL millora la quantificació d’isoformes utilitzant dades aparellades de seqüenciació curta i llarga de cèl·lula única. En conjunt, SCALPEL amplia les capacitats actuals de la transcriptòmica de cèl·lula única per explorar la regulació gènica post-transcripcional en diferents espècies, teixits i tecnologies, i fa avançar la nostra comprensió dels mecanismes reguladors a nivell de cèl·lula individual.

Matèries (anglès)

Citació

Citació

AKE, Franz Arnold. Characterization of alternative polyadenylation sites at single cell resolution and its impact on Alzheimer Disease. [consulted: 28 of June of 2026]. Available at: https://hdl.handle.net/2445/229876

Exportar metadades

JSON - METS

Compartir registre