*********************************** READ-ME ****************************************

Este proyecto se ha desarrollado sobre todo con Google Colab. Así que la práctica
recomendable es descargarse "codi.zip" e introducir su contenido en Google Drive.

Separamos el código por los Datasets usados, EXIST 2021 y EXIST 2023. La estructura de cada directorio es la misma, contendrá los siguientes subdirectorios o files:

1. /support_data
Diccionarios, pickles del vocabulario y matrices Doc-Term comprimidas para su uso.

2. /dataset
Directorios a cada uno de los Datasets (EXIST2021, EXIST2023).

3. /logs(logs_without_translation, logs_with_translation)
Ficheros log con los resultados de los entrenos y validaciones con los modelos para
cada Dataset, separado por los resultados obtenidos por dataset con datos traducidos o sin traducidos.

4. /results
Metadata y copias de los resultados obtenidos al preprocesar los datos para su uso
reiterado sin crearlos desde cero y ahorrar recursos.

Además, hay 2 notebooks dedicados cada uno a un Dataset en concreto.
____________________________________________________________________________________

EL TEMA DE LAS INSTALACIONES SE LLEVA A CABO AL PRINCIPIO DE CADA NOTEBOOK. 

En el caso de tener todas las librerías instaladas, se puede obviar estas celdas.
Si se usa en Google Colab/Kaggle, son necesarias cada vez que se conecte al servidor.
Para mayor información, mirad la memoria, Capítulo 3.1 Setup.

Aviso: es posible que Google Colab te banee la sesión unos días porque piensa que 
estas minando cryptomonedas o por sobreexplotación de resursos si estas en la versión 
free. Es normal, usa otra cuenta de Google hasta que te vuelvan a dejar acceder :)
____________________________________________________________________________________

**NOTA: de usarse en local, ciertas celdas deberán modificarse y quitar las
redirecciones a Google Colab y parte de los paths. 