A multimodal deep learning approach for food tray recognition

[en] Food recognition, object detection and classification applied to the food domain, is the main topic of this work. We have studied the problem of recognising food instances in tray images of self-service restaurants and have proposed a novel multimodal deep learning approach. From images and daily menus, the model presented uses two state of the art models in object detection and classification and a multimodal neural network to make significantly refined predictions compared to the baseline object detection model, achieving a class weighted average F1-score of 0.862. An ensemble model built from the proposed and the baseline models, also presented in this work, improves the results achieving a class weighted average F1-score of 0.877.

Descripció

Treballs Finals de Grau d'Enginyeria Informàtica, Facultat de Matemàtiques, Universitat de Barcelona, Any: 2020, Director: Marc Bolaños i Petia Radeva

Matèries

Xarxes neuronals (Informàtica), Aprenentatge automàtic, Programari, Treballs de fi de grau, Processament digital d'imatges, Visió per ordinador, Aliments

Matèries (anglès)

Neural networks (Computer science), Machine learning, Computer software, Digital image processing, Computer vision, Bachelor's theses, Food

Col·leccions

Treballs Finals de Grau (TFG) - Enginyeria Informàtica
Programari - Treballs de l'alumnat
Treballs Finals de Grau (TFG) - Matemàtiques

Pàgina completa de l'ítem

Citació

PERACAULA PRAT, Joan. A multimodal deep learning approach for food tray recognition. [consulta: 18 de març de 2026]. [Disponible a: https://hdl.handle.net/2445/173728]

Estadístiques

Exportar metadades

JSON - METS

Fitxers

Tipus de document

Data de publicació

Llicència de publicació

A multimodal deep learning approach for food tray recognition

Títol de la revista

Autors

Director/Tutor

ISSN de la revista

Títol del volum

Recurs relacionat

Resum

Descripció

Matèries

Matèries (anglès)

Citació

Col·leccions

Citació

Exportar metadades

Fitxers

Tipus de document

Data de publicació

Llicència de publicació

A multimodal deep learning approach for food tray recognition

Títol de la revista

Autors

Director/Tutor

ISSN de la revista

Títol del volum

Recurs relacionat

Resum

Descripció

Matèries

Matèries (anglès)

Citació

Col·leccions

Citació

Exportar metadades

Compartir registre