Tipus de document
Treball de fi de grauData de publicació
Llicència de publicació
Si us plau utilitzeu sempre aquest identificador per citar o enllaçar aquest document: https://hdl.handle.net/2445/230452
A Data Analysis Pipeline for Running Training Profiling and Load Monitoring from Consumer Wearables
Títol de la revista
Autors
Director/Tutor
ISSN de la revista
Títol del volum
Recurs relacionat
Resum
[eng] Running is one of the most popular recreational sports, but the training data that consumer wearables generate is rarely used for anything beyond the individual athlete. This project builds a data analysis pipeline for running data collected through the MyAlbatross platform, covering the full process from raw Garmin FIT file parsing to athlete profiling and workload monitoring, with the aim of analysing training behaviour at group level and identifying runner profiles.
The pipeline processed 18,239 FIT files from 118 athletes, enriched them with platform metadata, and applied quality control to produce a clean dataset of 8,246 sessions from 102 athletes. It computes session-level features (training load (TRIMP), grade adjusted pace (GAP), heart rate zone distribution, and running dynamics) and aggregates them into athlete-level features over 8 week windows. K-means clustering was applied as a validation step. At session level it produced eight types whose profiles match the categories described in the endurance literature. At athlete level it produced two profiles: one high-volume, low-intensity and consistent, the other lower-volume, higher-intensity and less consistent. The Acute:Chronic Workload Ratio (ACWR) was computed for the 87 athletes with sufficient training history. The clusters separate athletes along volume and intensity, which shows that the features carry information beyond raw load.
The pipeline turns consumer wearable data into validated training features that can serve as the analytical foundation for a recommendation system within MyAlbatross.
[cat] Córrer és un dels esports recreatius més populars del món, però les dades d'entrenament que generen els dispositius portables (wearables) rarament s'utilitzen més enllà de l'atleta individual. Aquest projecte construeix un flux de treball (pipeline) d'anàlisi de dades per a dades de running recollides a través de la plataforma MyAlbatross. Cobreix el procés complet des del processament de fitxers FIT bruts de Garmin fins als perfils d'atletes i el monitoratge de la càrrega d'entrenament, amb l'objectiu d'analitzar el comportament d'entrenament a nivell de grup i identificar perfils de corredors. El flux de treball ha processat 18.239 fitxers FIT de 118 atletes, els ha enriquit amb dades de la plataforma i ha aplicat control de qualitat per obtenir un conjunt de dades net de 8.246 sessions de 102 atletes. Calcula característiques a nivell de sessió (càrrega d'entrenament (TRIMP), ritme ajustat al pendent (GAP), distribució de zones de freqüència cardíaca i dinàmica de carrera) i les agrega en característiques a nivell d'atleta en finestres de 8 setmanes. L’agrupament (clustering) K-means es va aplicar com a pas de validació. A nivell de sessió va produir vuit tipus els perfils dels quals coincideixen amb les categories descrites a la literatura d'esports de resistència. A nivell d'atleta va produir dos perfils: un d'alt volum, baixa intensitat i consistent, i un altre de menor volum, major intensitat i menys consistent. La relació càrrega
aguda:crònica (ACWR) es va calcular per als 87 atletes amb historial d'entrenament suficient. Els clústers separen els atletes per volum i intensitat, cosa que mostra que les característiques contenen informació més enllà del volum d'entrenament. El flux de treball converteix les dades de dispositius portables de consum en característiques d'entrenament validades que poden servir de base analítica per a un sistema de recomanació dins de MyAlbatross.
Descripció
Treballs Finals de Grau d'Enginyeria Biomèdica. Facultat de Medicina i Ciències de la Salut. Universitat de Barcelona. Curs: 2025-2026. Tutor/Director: Roser Sala Llonch, Ricardo Marco Pascual
Matèries (anglès)
Citació
Citació
NICOLAU RIVAS, Víctor. A Data Analysis Pipeline for Running Training Profiling and Load Monitoring from Consumer Wearables. [consulted: 5 of July of 2026]. Available at: https://hdl.handle.net/2445/230452