Entrenament d’un model de IA per a la generació de prediccions meteorològiques en llenguatge natural

[ca] Aquest Treball de Fi de Grau presenta el disseny, la implementació i l’avaluació d’un sistema de generació de textos meteorològics automatitzat basat en intel·ligència artificial, concretament mitjançant el model de llenguatge Qwen2 afinat amb la tècnica LoRA. El procés comença amb la recollida i preparació de dades històriques proporcionades per Troposferica –temperatura, humitat, precipitacions, vent, etc.–, a les quals s’aplica un exhaustiu preprocessat (normalització, codificació de valors atípics i selecció de variables). A continuació, s’entrena Qwen2-LoRA per generar descripcions textuals de les condicions meteorològiques futures a partir d’aquests valors ajustant hiperparàmetres com la mida de lot, el nombre d’èpoques i la temperatura de mostreig. La generació automàtica produeix butlletins meteorològics que resumeixen previsions de temperatura, probabilitat de pluja i vent, incorporant un llenguatge clar i comprensible gràcies a l’entrenament amb textos reals de l’empresa. Per validar la seva fiabilitat, es comparen quantitativament les prediccions amb els butlletins de referència (groundtruth) mitjançant mètriques com ROUGE i BLEU, i s’avalua la qualitat semàntica del text generat amb BERTScore i una anàlisi qualitativa realitzada per una meteoròloga experta. Els resultats mostren que el sistema assoleix puntuacions elevades en totes les mètriques. Aquest treball demostra la viabilitat d’utilitzar models de llenguatge adaptats per a la predicció meteorològica, ressaltant avantatges com l’automatització de la redacció, la personalització de butlletins i l’estalvi de temps als meteoròlegs, al mateix temps que es manté un nivell de precisió adequat per a aplicacions pràctiques. [en] This Bachelor’s Thesis presents the design, implementation, and evaluation of an automated weather bulletin generation system powered by artificial intelligence, specifically using the Qwen2 language model fine-tuned with the LoRA technique. The process begins with the collection and preprocessing of weather data provided by Troposferica—temperature, humidity, precipitation, wind, etc.—including normalization, outlier encoding, and feature selection. Next, Qwen2-LoRA is trained to generate textual descriptions of future meteorological conditions from these inputs, tuning hyperparameters such as batch size, number of epochs, and sampling temperature. The automation produces weather bulletins summarizing temperature forecasts, precipitation probability, and wind conditions, using clear and understandable language thanks to training with real company texts. To assess reliability, generated predictions are quantitatively compared against reference bulletins using metrics such as ROUGE and BLEU, and semantic quality is evaluated with BERTScore and expert qualitative analysis. The results demonstrate that the system achieves relatively high scores across all evaluated metrics. This work proves the feasibility of leveraging adapted language models for weather forecasting, highlighting benefits such as automated report writing, bulletin customization, and significant time savings for meteorologists, while maintaining the precision required for practical deployment. [es] Este Trabajo de Fin de Grado presenta el diseño, la implementación y la evaluación de un sistema de generación automática de textos meteorológicos basado en inteligencia artificial, concretamente mediante el modelo de lenguaje Qwen2 afinado con la técnica LoRA. El proceso comienza con la recopilación y limpieza de datos históricos proporcionados por Troposferica —temperatura, humedad, precipitaciones, viento, etc.— a los que se aplica un exhaustivo preprocesamiento (normalización, eliminación de valores atípicos y selección de variables). A continuación, se entrena Qwen2-LoRA para generar descripciones textuales de las condiciones meteorológicas futuras a partir de estos datos, ajustando hiperparámetros como el tamaño de lote, el número de épocas y la temperatura de muestreo. La generación automática produce boletines meteorológicos que resumen previsiones de temperatura, probabilidad de lluvia y viento, con un estilo coherente y comprensible gracias al entrenamiento con textos reales de la empresa. Para validar su fiabilidad, las predicciones se comparan cuantitativamente con los boletines de referencia (ground truth) mediante métricas como ROUGE y BLEU, y la calidad semántica del texto generado se evalúa con BERTScore y un análisis cualitativo realizado por una meteoróloga experta. Los resultados muestran que el sistema alcanza puntuaciones relativamente altas en todas las métricas consideradas. Este trabajo demuestra la viabilidad de utilizar modelos de lenguaje adaptados para la predicción meteorológica, resaltando ventajas como la automatización de la redacción, la personalización de boletines y el ahorro de tiempo para los meteorólogos, al mismo tiempo que se mantiene un nivel de precisión adecuado para aplicaciones prácticas.

Descripció

Treballs Finals de Grau d'Enginyeria Informàtica, Facultat de Matemàtiques, Universitat de Barcelona, Any: 2025, Director: Albert Clapés Sintes

Matèries

Temps (Meteorologia), Previsió del temps, Meteorologia sinòptica, Aprenentatge automàtic, Programari, Treballs de fi de grau, Daniel Ramos Pérez

Matèries (anglès)

Weather, Weather forecasting, Synoptic meteorology, Machine learning, Computer software, Bachelor's theses

Col·leccions

Treballs Finals de Grau (TFG) - Enginyeria Informàtica
Programari - Treballs de l'alumnat

Pàgina completa de l'ítem

Citació

RAMOS PÉREZ, Daniel. Entrenament d’un model de IA per a la generació de prediccions meteorològiques en llenguatge natural. [consulted: 22 of June of 2026]. Available at: https://hdl.handle.net/2445/228053

Estadístiques

Exportar metadades

JSON - METS

Fitxers

Tipus de document

Data de publicació

Llicència de publicació

Entrenament d’un model de IA per a la generació de prediccions meteorològiques en llenguatge natural

Títol de la revista

Autors

Director/Tutor

ISSN de la revista

Títol del volum

Recurs relacionat

Resum

Descripció

Matèries

Matèries (anglès)

Citació

Col·leccions

Citació

Exportar metadades

Fitxers

Tipus de document

Data de publicació

Llicència de publicació

Entrenament d’un model de IA per a la generació de prediccions meteorològiques en llenguatge natural

Títol de la revista

Autors

Director/Tutor

ISSN de la revista

Títol del volum

Recurs relacionat

Resum

Descripció

Matèries

Matèries (anglès)

Citació

Col·leccions

Citació

Exportar metadades

Compartir registre