Action generalization in humanoid robots through artificial intelligence with learning from demonstration

  1. Fernández Fernández, Raúl
Supervised by:
  1. Carlos Balaguer Bernaldo de Quirós Director
  2. Juan Carlos Gonzalez Victores Co-director

Defence university: Universidad Carlos III de Madrid

Fecha de defensa: 22 September 2021

Committee:
  1. Alessandro Saffiotti Chair
  2. Santiago Martínez de la Casa Secretary
  3. Fernando Torres Medina Committee member

Type: Thesis

Abstract

La capacidad de Generalización de Acciones es la habilidad de adaptar una acción a diferentes contextos y entornos. En humanos, esta habilidad se da por supuesta. En robótica, todavía se está lejos de alcanzar el nivel de Generalización de Acciones presente en humanos. Los robots actuales son sistemas limitados que solamente son capaces de trabajar en los entornos específicos para los que son diseñados. Una de las razones por las que todavía no tenemos robots en nuestras casas es porque cada casa es diferente. En esta tesis, se presentan dos enfoques diferentes para incrementar la capacidad de Generalización de Acciones en robótica. El primer enfoque plantea un estudio de los diferentes métodos existentes para mejorar el algoritmo de generalización de tareas "Continuous Goal-Directed Actions". Este algoritmo permite el aprendizaje de nuevas acciones mediante el uso de aprendizaje por demostración usando las características del entorno para definir estas nuevas acciones. Esto permite al sistema no depender de información cinemática del demostrador o el robot resolviendo así el problema de correspondencia cinemático presente en robótica. La segunda propuesta se basa en introducir el algoritmo "Neural Policy Style Transfer". El objetivo de este algoritmo es conseguir la Generalización de Acciones dando al robot la habilidad de introducir diferentes estilos en sus acciones. De esta manera, el robot puede adaptar una acción que ya conoce mediante la introducción de diferentes estilos. "Neural Policy Style Transfer" se basa en la idea propuesta por el algoritmo "Neural Style Transfer". Este algoritmo plantea la transferencia de estilos entre imágenes usando redes neuronales. En esta tesis, "Neural Policy Style Transfer" se introduce como una forma de producir transferencias de estilos entre acciones robóticas. Este documento se ha diseñado con el objetivo de transmitir al lector la línea de trabajo que se ha seguido durante el transcurso de esta tesis. Cada vez que una nueva solución es planteada, las razones por las que está solución se consideró la mejor opción a seguir son proporcionadas. Cada uno de los enfoques planteados se estudian de manera separada y a la vez se presentan como parte de el proyecto de investigación del que son parte. Resolver el problema de la Generalización de Acciones en robótica es de momento un objetivo demasiado ambicioso para cualquier proyecto de investigación. El objetivo de esta tesis es hacer que encontrar esta solución este un paso más cerca.