Carregant...
Miniatura

Tipus de document

Treball de fi de grau

Data de publicació

Llicència de publicació

cc-by-nc-nd (c) Arnau Finol Peñalver, 2022
Si us plau utilitzeu sempre aquest identificador per citar o enllaçar aquest document: https://hdl.handle.net/2445/186485

Aprenentatge per reforç aplicat a un cas de recursos compartits

Títol de la revista

ISSN de la revista

Títol del volum

Recurs relacionat

Resum

[en] This thesis explores the theoretical concepts needed to generate an ethical embedding, as well as the development of prior theoretical knowledge for understanding. Ethical embedding involves generating a Markow decision process where optimal policies are ethical based on a multi-objective Markow decision process where at least one of them follows an ethical criterion. Finally, it includes the implementation of the knowledge through the adaptation of the Common Game problem proposed by the company DeepMind and its subsequent resolution through the algorithms previously seveloped in a theoretical way.

Descripció

Treballs Finals de Grau de Matemàtiques, Facultat de Matemàtiques, Universitat de Barcelona, Any: 2022, Director: Maite López Sánchez

Citació

Citació

FINOL PEÑALVER, Arnau. Aprenentatge per reforç aplicat a un cas de recursos compartits. [consulta: 25 de febrer de 2026]. [Disponible a: https://hdl.handle.net/2445/186485]

Exportar metadades

JSON - METS

Compartir registre