Treballs Finals de Grau (TFG) - Estadística UB-UPC
URI permanent per a aquesta col·leccióhttps://hdl.handle.net/2445/66467
Treballs Finals del Grau d'Estadística UB-UPC. Grau coordinat per la Facultat d'Economia i Empresa de la Universitat de Barcelona i de la Facultat de Matemàtiques i Estadística (UPC).
Examinar
Enviaments recents
Mostrant 1 - 20 de 178
Treball de fi de grau
Classification of medical images with convolutional networks(2024) Li, Shengnan; Reverter Comes, FerranThis study explores using Convolutional Neural Networks (CNN) to predict microsatellite instability (MSI) and stability (MSS) from histology images in gastrointestinal cancer. A deep learning model was developed with Keras and TensorFlow in R, applying advanced techniques to histology images. The results show that deep CNN architectures effectively predict MSI and MSS, providing clinicians with a reliable tool to identify the microsatellite stability of tumor tissues.Treball de fi de grau
Una visió holística de la Intel·ligència Artificial: Anàlisis estadístic i enfocament ètic(2024) Julià Galindo, Sonia; Pons Fanals, ErnestAquest treball és un espai de reflexió sobre la relació entre l’Estadística i la Intel·ligència Artificial, tenint en compte la vessant ètica. Pretén mostrar la necessitat d’una visió holística de la Intel·ligència Artificial, convertint-la en un camp multidisciplinari. L’escrit analitza els algorismes d’aprenentatge automàtic supervisat i els problemes que poden presentar des del punt de vista estadístics, i des d’un punt de vista moral. Finalment es presenta un plantejament ètic, manifestant la necessitat d’una formació ètica pels alumnes d’estadística.Treball de fi de grau
Advances in Diagnostic Imaging: Integrating Explainable AI to Optimize Convolutional Networks(2024) Guo, Xiuchao; Vegas Lozano, EstebanConvolutional neural networks (CNNs) are fundamental in deep learning, especially in computer vision tasks.They stand out for their ability to extract spatial features from data. However,their complexity has generated the need for explainability in artificial intelligence (XAI), which seeks to interpret and understand their predictions.This work is carried out with the purpose of knowing the applicability of convolutional networks in the classification of Medical images,specifically, endoscopi images already previously collected, and through fine-tunning we will explore architectures that present better performance. Afterwards, we implement the AI explainability techniques,together with the Language model we will assess the process of automating the creation of the medical report through the graphic representations created.Treball de fi de grau
Disseny i aplicació de tècniques d’aprenentatge automàtic en el futbol femení(2024) Garcia Fernandez, Montse; Sierra Martínez, Francisco JavierL’objectiu d’aquest projecte de final de grau és explorar un conjunt de dades relacionades amb el futbol femení; recollir les dades, visualitzar-les i aplicar algoritmes d’aprenentatge automàtic amb la finalitat de classificar les jugadores per similitud. La contextualització i el marc teòric es poden dividir en dues parts. La primera es centra en introduir conceptes més informàtics i/o estadístics: Big Data o aprenentatge automàtic, per exemple. La segona part introdueix el futbol femení i les tres lligues les quals fan referència les dades tractades. Totes les tècniques utilitzades han sigut implementades amb el llenguatge de programació R, llenguatge utilitzat durant el transcurs de tot el grau. En concret, les tècniques utilitzades, a més de les descriptives (gràfics i taules), han sigut dues: Anàlisi de Components Principals i Clustering. Per acabar, s’han plantejat un parell de casos pràctics, situacions que ens podríem trobar en la vida real i on que ens podria ser d’utilitat l’aplicació d’aquests algoritmes. S’ha pogut concloure que els algoritmes són útils per determinar jugadores amb característiques semblants.Treball de fi de grau
Modelització i anàlisi de les prediccions d’Alexandre Deulofeu(2024) Fortuny Garrido, Nil; García Solera, Marcelino, 1960-Aquest treball de final de grau se centra en l'anàlisi estadística de la durada dels imperis al llarg de la història, amb les prediccions formulades per Alexandre Deulofeu. Deulofeu va proposar una teoria cíclica de la història basada en l'evolució dels imperis, suggerint que aquests passen per fases predeterminades amb una durada específica. Per validar aquesta teoria, s’ha realitza una anàlisi descriptiva de diverses variables recollides, com l’àrea, la població o les durades de les diferents fases dels imperis. El treball es divideix en diverses seccions. La primera secció introdueix la teoria de Deulofeu i en presenta les hipòtesis que es volen verificar. Es descriu la metodologia emprada i es procedeix en l’anàlisi de les variables. Aquesta part s’inicia amb l'anàlisi descriptiva. S’han usat diverses tècniques estadístiques per examinar les distribucions de les variables d'interès, així com gràfics i taules. Amb això, s’ha analitzat el comportament de les variables a utilitzar, trobant patrons de comportament, valors atípics i altres suposicions a tenir en compte. Posteriorment, el treball es focalitza en el desenvolupament de models estadístics per predir la durada dels imperis. S'han utilitzat fins a quatre models de regressió lineal i un model de predicció. Els quatre models de regressió tenen finalitats explicatives envers a cada fase imperial. Amb aquests es buscava poder donar explicació a què provocava que unes fases duressin més que unes altres. L’altre model, el predictiu, serveix per a fer les prediccions de la durada total. A partir de les dades usades, doncs, permet predir quan durarà un imperi qualsevol ponderant aquelles variables de més importància. Els resultats mostren que, tot i que es partia amb unes dades molt limitades, s’han trobat evidències que suporten la hipòtesi de Deulofeu dels cicles històrics. No obstant això, les limitacions del treball, amb pocs registres, així com una selecció de variables primària degut a les limitacions de temps, provoquen que les prediccions i anàlisis fetes només expliquin una petita part de totes aquelles variables que influencien la durada dels imperis. En conclusió, aquest treball final de grau ha estat capaç d’analitzar les prediccions de Deulofeu. Prediccions, algunes de les quals es van fer fa 80 anys, que, a dia d’avui i després d’aquest treball, segueixen tenint una increïble força de exactitud matemàtica. En cinc paraules: la matemàtica de la història.Treball de fi de grau
Search Engines in the use of Financial Sentiment Analysis(2024) Coroando Montoro, Ramon; Torra Porras, SalvadorFinancial market prediction often rely on historical and numerical data, but recent advancements in large Language models encourage the use of alternative datasets like fnancial news text. However, this methodology often faces limitations due to the scarcity of extensive datasets that combine both quantitative and qualitative sentiment analyses. To address this gap, we used the Bing Search API to build a dataset comprising over 100.000 financial news articlesfrom more than 90 websites. Our work aims to illuminate the process of Building a data set using search engines, demonstrating that the use of keywords to collect ”custom” data from the vast Internet is an effective alternative for data collection. We evaluated the dataset using a sentiment index, which we later compared with the S&P 500 stock index. We concluded that while news sentiment may not immediately reflect price variations, it can effectively indicate broader market trends.Treball de fi de grau
The Impact of ICT on International Trade: A Gravity Model Analysis(2024) Cao, Songrong; Ramos Lobo, RaúlThis thesis investigates the impact of Information and Communications Technology (ICT) on bilateral trade flows using data from 188 countries between 2010 and 2020, sourced from CEPII and World Development Indicators (WDI). Employing a fixed effect PPML gravity model for panel data, the study examines the influence of ICT indicators, such as mobile cellular subscriptions, internet servers, broadband connections, and internet usage, on trade flows. The analysis categorizes countries into four income groups based on World Bank classifications to explore the varying effects across different economic contexts. The findings indicate that traditional gravity model variables (GDP, distance, contiguity, and common language) are consistently significant predictors of trade flows and align well with established hypotheses. In contrast, the impact of ICT variables on trade flows presents mixed results. While internet usage shows a positive and significant effect in upper middle-income countries, most ICT indicators do not exhibit significant effects across the different income groups. Additionally, the interaction model reveals a weak but positive significant effect on trade flows when both trade partners invest in ICT simultaneously. However, the individual effects of ICT remain largely insignificant or negative. This highlights the need for further research to better understand the complex interplay between technological and economic factors in international trade.Treball de fi de grau
Anàlisi predictiu a 3 mesos de l'índex borsari Eurostoxx 50 mitjançant tècniques d'aprenentatge automàtic(2024) Carner Marsal, Clara; Pons Fanals, ErnestEn un context on la cultura de la immediatesa està cada cop més arrelada en la societat i la promesa d'inversions amb guanys instantanis ha guanyat popularitat, aquest treball proposa una alternativa d'inversió contrària a aquesta tendència , enfocada al mitjà termini. Utilitzant la intel·ligència artificial, s’avaluarà el rendiment de models d'aprenentatge automàtic en la predicció a 3 mesos de la taxa de variació de l'índex borsari Eurostoxx 50 mitjançant tres tècniques d’aprenentatge automàtic : k-nearest neighbors (KNN), random forest i gradient boosting machine (GBM). Per modelitzar les dades, aquestes seran preprocessades i s'hi afegiran variables macroeconòmiques per obtenir una base de dades òptima. Dels models resultants, s'escollirà el millor per a cada tècnica en base a una mètrica d’error, en concret l'arrel de l'error quadràtic mig (RMSE). D'entre aquests, es determinarà el model finalista per identificar quina tècnica i quin model específic funcionen millor per a prediccions a 3 mesos, un horitzó temporal menys comú en inversions.Treball de fi de grau
Anàlisi estadística del número de trucades a la Línia d’Atenció contra la Violència Masclista de la Generalitat de Catalunya(2024) Bolívar Rubia, Mireia; Moriña Soler, DavidLa violència de gènere s’ha mantingut gairebé invisible durant dècades, afectant greument dones i nenes a escala mundial. Aquest estudi se centra en la violència física o sexual per raó de gènere contra les dones adultes a Catalunya, abordant l’important subnotificació dels casos, sovint conegut com a l'"Iceberg de la violència de gènere". Utilitzant dades de la Línia d’Atenció Contra la Violència Masclista, comparem les estimacionsd’un model de subnotificació externamb els registres reals de les trucades per validar-ne la precisió. A més, examinem l’impacte de la pandèmia de la COVID-19 en la freqüència de trucades de la línia d’atenció reconeixent que les situacions de confinament agreugen la violència masclista. Els models ARIMA i la Xarxa Neural Artificial (ANN) s’utilitzen per generar prediccions de trucades mensuals. Les troballes confirmen la precisió del model de subnotificació i quantifiquen l’augment significatiu de la violència durant el confinament de la COVID-19. A més, s’identifica el model ANN com el millor model predictiu.Treball de fi de grau
Factors explicatius de la taxa de criminalitat de les regions espanyoles(2024) Bernal Aparicio, Alba; Pons Novell, JordiAquest projecte té com a objectiu comprendre la dinàmica delictiva i determinar els factors que expliquen la taxa de criminalitat de delictes menors i greus a Espanya. S'apliquen models de recomptes amb la introducció de l'offset per a obtenir la taxa de criminalitat. Inicialment, s'ajusta el model de Poisson i, a causa de la sobredispersió, es procedeix amb el model Binomial Negatiu, aplicant transformacions a les variables per a millorar la seva validació. S'identifiquen factors significatius per a cada tipus de delicte. En delictes menors, l'edat de la població, la presència d'estrangers i la pobresa són significatius, mentre que, en delictes greus, l'edat, la pobresa, l'educació superior i el nombre de divorcis són destacats.Treball de fi de grau
Índex d'Incertesa basat en els discursos inaugurals dels presidents dels Estats Units (1929-2021)(2024) Murtra i Sabaté, Pep; Torra Porras, SalvadorLa incertesa és present en el nostre dia a dia, però no disposem d'una mesura clara per avaluar-la. Sabem mesurar el risc, però la incertesa no compta amb regles establertes per determinar-ne el grau, cosa que impedeix associar-hi un valor numèric. En aquest context, entren en joc l’anàlisi de textos, el Processament del Llenguatge Natural -NLP- i l’aprenentatge automàtic. Els textos ens proporcionen una gran quantitat d’informació, i la incertesa pot manifestar-se en aquests. En particular, els discursos polítics, pel seu paper fonamental, poden revelar elevats graus d’incertesa, per això és d'especial interès analitzar-los. En aquest treball, es començarà analitzant diferents textos dels discursos inaugurals dels presidents dels Estats Units i s'acabarà desenvolupant un índex que mesurarà el grau d'incertesa. No obstant això, en l'estudi present, el procés de desenvolupament és molt important. Per tant, el "com" serà de gran importància. Això inclou el processament del llenguatge natural, la transformació de paraules a números amb l'aplicació del TF-IDF, la preparació del model escollit i, finalment, la creació de l'índex, que reflectirà, en certa manera, tots els passos anteriors i, consegüentment, pretendrà mesurarà el grau d'incertesa.Treball de fi de grau
Análisis de la Resistencia Bacteriana: Implementación de una Plataforma Shiny para la Valoración del Uso de Medicamentos(2024) Arroyo Luque, Oscar; Sánchez Espigares, Josep A.Actualmente nos enfrentamos a uno de los mayores desafíos de la medicina moderna: la creciente resistencia bacteriana provocada por el uso de antibióticos. En este trabajo abordamos esta problemática mediante el desarrollo de una interfaz interactiva Shiny, que permite a un experto en estadística realizar un estudio sobre las resistencias bacterianas mediante el ajuste de modelos MARS. Asimismo, a través del uso de la aplicación, hemos llevado a cabo un estudio sobre la bacteria Escherichia coli. En este análisis, hemos determinado que el uso de ampicilina promueve el fenómeno de las resistencias.Treball de fi de grau
Anàlisis predictiu de les senyes arbitrals al món del bàsquet(2024) Argemí Fernández, Ismael; Ramírez Mitjans, Sergi; Serrano, EnricA l’àmbit de l’analítica esportiva, la detecció precisa de les senyalitzacions dels àrbitres és crucial per a l’anàlisi del joc, l’entrenament i l’emissió. Aquest treball explora la teoria de les xarxes neuronals i aplica el model YOLOv8 per reconèixer i classificar les senyes dels àrbitres de bàsquet. En crear i anotar un conjunt de dades complet de senyalitzacions arbitrals, el model s’entrena mitjançant diferents combinacions de tècniques de preprocessament i d’augment de dades. L’estudi explica el funcionament de les xarxes neuronals i demostra la seva aplicació pràctica en l’analítica esportiva, destacant la seva utilitat potencial per millorar l’anàlisi mitjançant la intel·ligència artificial.Treball de fi de grau
La formació del futur professorat com a element clau per formar un alumnat competent en estadística i en probabilitat a l’ensenyament obligatori(2024) Aráiztegui Bacigalupe, Aránzazu; Rodero De Lamo, LourdesÉs un fet que una ciutadania competent en estadística i probabilitat és cada vegada més important al món actual. Per assegurar aquesta competència, cal un professorat d’educació primària i secundària amb una sòlida formació quant a conceptes i didàctica d’aquestes matèries. Això permetrà a aquests docents transmetre conceptes de forma clara i efectiva, i els ajudarà a dissenyar activitats i projectes que fomentin el pensament crític i l’anàlisi de dades en l’alumnat. És important incloure en els currículums del grau de formació del professorat de primària i en el màster de formació del professorat de secundària cursos específics en estadística i probabilitat que ajudin al professorat a identificar i corregir errors conceptuals comuns entre l’alumnat i invertir en cursos de formació continua i d’actualització de continguts per docents en actiu ja que la qualitat de la educació depèn en gran mesura de la preparació i competència d’aquests docents.Treball de fi de grau
Indicadores sintéticos de sostenibilidad de ciudades españolas(2024) Zhu, Zihan; Alemany Leira, RamonA partir de una revisión detallada de los antecedentes de la investigación y de la situación actual, este artículo se nutre del sistema de evaluación del Grupo de Investigación sobre Desarrollo Sostenible de las Naciones Unidas y propone un sistema de evaluación de las capacidades de desarrollo sostenible de las ciudades españolas. El artículo analiza y simplifica indicadores clave y enriquece la teoría y los métodos de evaluación de la capacidad de desarrollo sostenible. A través de la recopilación y organización de datos, se utilizó el software R para realizar análisis de componentes principales para análisis empíricos. Finalmente, se realizan cálculos económicos, sociales y ambientales a través del modelo DEA para determinar el valor final de las capacidades de desarrollo sostenible de las ciudades españolas, clasificando y haciendo recomendaciones.Treball de fi de grau
Anàlisi d’obertures dels jugadors d’escacs catalans(2024) Toquero Gracia, Pau; Subirana Cachinero, IsaacEls escacs és un esport de fa més de mil anys el qual ha anat evolucionant al llarg dels anys fins a arribar a tenir un total de 180.000 jugadors federats i més de 20 milions de jugadors en línia. Per a poder classificar a tots aquests jugadors, es va crear un sistema de puntuació denominat Elo on els millors jugadors tenen la puntuació més alta i els jugadors més fluixos la més baixa. Per això, l'objectiu d'aquest TFG consisteix a veure si a partir de les característiques d'una partida d'escacs, especialment la diferència d’Elo entre els dos jugadors, es pot predir el resultat d'una partida d'Escacs. Així que, hem agafat una base de dades de 5.014 partides descarregades d'internet de jugadors de la Federació Catalana d'Escacs. Després de classificar les diferents obertures, crear la diferència i la mitjana d’Elo de cada partida, creem dos models lineals multinomial, amb la variable resultat de la partida com a variable dependent. Un d'ells només amb la variable de diferència d’Elo i l'altre amb la diferència d’Elo, la mitjana d’Elo i el grup d'obertura que es juga a la partida. Amb els models, podem veure que no és possible predir al 100% el resultat d'una partida sobre la base de les seves característiques però ens dona una precisió de gairebé el 60% d'encertar el resultat.Treball de fi de grau
Anàlisi diferencial de xarxes des del punt de vista estadístic(2024) Serra Pons, Núria; Miñarro Alonso, Antonio; Vegas Lozano, EstebanL’anàlisi diferencial de xarxes és una eina per comparar xarxes gràfiques. S’ha aplicat en una àmplia gamma de camps i ha demostrat ser útil per identificar diferències en l’estructura i la funció de les xarxes construïdes sobre els mateixos nodes, és a dir, les mateixes variables, però en condicions diferents. Per exemple, es compararan xarxes d’associacions entre individus sans i aquells que pateixen una determinada patologia. Per analitzar aquest tipus de xarxes compararem les matrius d’adjacència que determinen la xarxa, però, també hi ha altres mètodes per seleccionar les mètriques que serveixin per capturar les diferències més importants entre aquestes. Per tant, el principal objectiu és utilitzar aquesta anàlisi diferencial de manera eficaç i realitzar una primera exploració per obtenir uns resultats preliminars.Treball de fi de grau
Selecció d'autoencoders amb validació creuada(2024) Segura Ramiro, Carlos; Reverter Comes, FerranAquest treball de fi de grau se centra en l'ús d autoencoders per a la reducció de dimensions i l'anàlisi de la reconstrucció de les dades. Els autoencoders són una tècnica d'aprenentatge automàtic que permet codificar i descodificar dades, preservant la informació essencial mentre se'n redueix la dimensió. L'estudi investiga la determinació del nombre òptim de nodes a la capa oculta mitjançant la validació creuada i compara diferents mètriques com ara són l'AIC, l'R2 i el SSE per a la selecció de models. Utilitzant diferents bases de dades, el treball avalua l'efectivitat dels autoencoders a la reconstrucció d'aquestes. S'implementa el model utilitzant el paquet Keras, destacant-ne la capacitat per crear xarxes neuronals avançades i entrenar-les eficientment. Els resultats mostren que és possible reduir significativament la dimensió de les dades sense una gran pèrdua d'informació, optimitzant el balanç entre variabilitat explicada i la suma dels errors quadràtics.Treball de fi de grau
Anàlisi de la severitat dels accidents de trànsit a la ciutat de Barcelona(2024) Ruiz Mascaró, Gemma; Bermúdez, LluísAquesta anàlisi té com a finalitat determinar els factors que incideixen en la gravetat dels accidents de trànsit a Barcelona durant el període comprés entre el 2020 i el 2023. Per aconseguir-ho, utilitzarem el conjunt de dades disponible a la plataforma Open Data Barcelona i emprarem models interpretables i d’altres de caixa negra. A través d'aquests models, serem capaços d'identificar les diferents causes i patrons subjacents als accidents, així com les característiques que defineixen els usuaris amb major risc d'estar implicats en ells. Amb aquest coneixement, l'objectiu és dissenyar estratègies efectives per reduir la severitat d'accidents i, per tant, millorar la seguretat viària a la ciutat.Treball de fi de grau
Análisis comparativo de valores religiosos, sociales, actitudes y estereotipos: estudio multivariante en países diversos(2024) Romero Sainz, Blanca; López-Mayán, CristinaEste Trabajo de Fin de Grado realiza un análisis comparativo de las diferencias en valores religiosos, sociales y estereotipos entre países con realidades distintas. Utilizando datos de la séptima ola de la Encuesta Mundial de Valores (WVS), recogidos entre 2017 y 2022, se centra en analizar las diferencias entre Irán, Alemania, Australia, Argentina y Japón. El estudio se focaliza en los bloques sobre "Valores sociales, actitudes y estereotipos" y "Valores religiosos". En definitiva, se elabora un estudio descriptivo seguido de un análisis de regresión multivariante, utilizando las características sociodemográficas de los encuestados e indicadores socio-económicos de los países como variables explicativas con fin de explicar los principales factores asociados a las diferencias observadas entre países.