Tipus de document
Treball de fi de grauData de publicació
Llicència de publicació
Si us plau utilitzeu sempre aquest identificador per citar o enllaçar aquest document: https://hdl.handle.net/2445/228053
Entrenament d’un model de IA per a la generació de prediccions meteorològiques en llenguatge natural
Títol de la revista
Autors
Director/Tutor
ISSN de la revista
Títol del volum
Recurs relacionat
Resum
[ca] Aquest Treball de Fi de Grau presenta el disseny, la implementació i l’avaluació d’un sistema de generació de textos meteorològics automatitzat basat en intel·ligència artificial, concretament mitjançant el model de llenguatge Qwen2 afinat amb la tècnica LoRA. El procés comença amb la recollida i preparació de dades històriques proporcionades per Troposferica –temperatura, humitat, precipitacions, vent, etc.–, a les quals s’aplica un exhaustiu preprocessat (normalització, codificació de valors atípics i selecció de variables). A continuació, s’entrena Qwen2-LoRA per generar descripcions textuals de les condicions meteorològiques futures a partir d’aquests valors ajustant hiperparàmetres com la mida de lot, el nombre d’èpoques i la temperatura de mostreig.
La generació automàtica produeix butlletins meteorològics que resumeixen previsions de temperatura, probabilitat de pluja i vent, incorporant un llenguatge clar i comprensible gràcies a l’entrenament amb textos reals de l’empresa. Per validar la seva fiabilitat, es comparen quantitativament les prediccions amb els butlletins de referència (groundtruth) mitjançant mètriques com ROUGE i BLEU, i s’avalua la qualitat semàntica del text generat amb BERTScore i una anàlisi qualitativa realitzada per una meteoròloga experta. Els resultats mostren que el sistema assoleix puntuacions elevades en totes les mètriques.
Aquest treball demostra la viabilitat d’utilitzar models de llenguatge adaptats per a la predicció meteorològica, ressaltant avantatges com l’automatització de la redacció, la personalització de butlletins i l’estalvi de temps als meteoròlegs, al mateix temps que es manté un nivell de precisió adequat per a aplicacions pràctiques.
[en] This Bachelor’s Thesis presents the design, implementation, and evaluation of an automated weather bulletin generation system powered by artificial intelligence, specifically using the Qwen2 language model fine-tuned with the LoRA technique. The process begins with the collection and preprocessing of weather data provided by Troposferica—temperature, humidity, precipitation, wind, etc.—including normalization, outlier encoding, and feature selection. Next, Qwen2-LoRA is trained to generate textual descriptions of future meteorological conditions from these inputs, tuning hyperparameters such as batch size, number of epochs, and sampling temperature.
The automation produces weather bulletins summarizing temperature forecasts, precipitation probability, and wind conditions, using clear and understandable language thanks to training with real company texts. To assess reliability, generated predictions are quantitatively compared against reference bulletins using metrics such as ROUGE and BLEU, and semantic quality is evaluated with BERTScore and expert qualitative analysis. The results demonstrate that the system achieves relatively high scores across all evaluated metrics.
This work proves the feasibility of leveraging adapted language models for weather forecasting, highlighting benefits such as automated report writing, bulletin customization, and significant time savings for meteorologists, while maintaining the precision required for practical deployment.
[es] Este Trabajo de Fin de Grado presenta el diseño, la implementación y la evaluación de un sistema de generación automática de textos meteorológicos basado en inteligencia artificial, concretamente mediante el modelo de lenguaje Qwen2 afinado con la técnica LoRA. El proceso comienza con la recopilación y limpieza de datos históricos proporcionados por Troposferica —temperatura, humedad, precipitaciones, viento, etc.— a los que se aplica un exhaustivo preprocesamiento (normalización, eliminación de valores atípicos y selección de variables). A continuación, se entrena Qwen2-LoRA para generar descripciones textuales de las condiciones meteorológicas futuras a partir de estos datos, ajustando hiperparámetros como el tamaño de lote, el número de épocas y la temperatura de muestreo. La generación automática produce boletines meteorológicos que resumen previsiones de temperatura, probabilidad de lluvia y viento, con un estilo coherente y comprensible gracias al entrenamiento con textos reales de la empresa.
Para validar su fiabilidad, las predicciones se comparan cuantitativamente con los boletines de referencia (ground truth) mediante métricas como ROUGE y BLEU, y la calidad semántica del texto generado se evalúa con BERTScore y un análisis cualitativo realizado por una meteoróloga experta. Los resultados muestran que el sistema alcanza puntuaciones relativamente altas en todas las métricas consideradas. Este trabajo demuestra la viabilidad de utilizar modelos de lenguaje adaptados para la predicción meteorológica, resaltando ventajas como la automatización de la redacción, la personalización de boletines y el ahorro de tiempo para los meteorólogos, al mismo tiempo que se mantiene un nivel de precisión adecuado para aplicaciones prácticas.
Descripció
Treballs Finals de Grau d'Enginyeria Informàtica, Facultat de Matemàtiques, Universitat de Barcelona, Any: 2025, Director: Albert Clapés Sintes
Matèries (anglès)
Citació
Citació
RAMOS PÉREZ, Daniel. Entrenament d’un model de IA per a la generació de prediccions meteorològiques en llenguatge natural. [consulted: 21 of May of 2026]. Available at: https://hdl.handle.net/2445/228053