Ghouti L
La integración del aprendizaje por refuerzo (RL) y la robótica se ha aplicado con éxito en diversos entornos industriales. Uno de estos entornos implica el despliegue de sensores sísmicos en amplios yacimientos de petróleo y gas. El problema de despliegue de sensores se puede formular como un problema de optimización desafiante en el que se pueden utilizar de manera eficiente los procesos de decisión de Markov (MDP). Nuestro robot basado en RL puede desplegar sensores sísmicos en áreas blandas y rugosas que cubren amplios yacimientos de petróleo y gas. Nuestro prototipo de robot es el resultado de un trabajo de innovación que actualmente está protegido por dos patentes estadounidenses publicadas [1, 2]. Se puede encontrar una demostración de las capacidades del robot en [3, 4].