Ingenieros desarrollan un marco innovador para que los robots compartan habilidades de forma autónoma
Un grupo de ingenieros ha creado un marco innovador que permite a los robots compartir habilidades entre distintos modelos de manera autónoma.
Llamado RoVi-Aug, este sistema elimina la necesidad de intervención humana en el proceso de aprendizaje, simplificando la capacitación de los robots. Las pruebas físicas muestran que RoVi-Aug se entrena con datos mejorados para funcionar de inmediato con nuevos robots, sin importar los ángulos de las cámaras. A diferencia de otros métodos, evita pasos adicionales durante las pruebas, adapta políticas y aprende tareas multi-robot, lo que aumenta la eficiencia del traspaso de habilidades y eleva la tasa de éxito hasta un 30%.
Según el equipo de la Universidad de California en Berkeley, este enfoque representa un avance significativo hacia robots más independientes y adaptables.
Escalado adaptativo de datos
Las investigaciones demuestran que ampliar la cantidad de datos mejora la capacidad de los robots para aprender habilidades generales y fiables. Sin embargo, los datos robóticos son mucho más limitados que los utilizados en modelos avanzados de IA para visión y lenguaje. Recoger datos diversos y útiles del mundo real es lento, requiere mucho trabajo y es difícil de equilibrar para un entrenamiento adaptable.
Modelos existentes, como el proyecto Open-X Embodiment (OXE), combinan datos de 60 conjuntos robóticos para mejorar el aprendizaje cruzado entre robots. Esto les permite compartir experiencias y mejorar sus capacidades. No obstante, los investigadores señalan que el conjunto de datos está desequilibrado, dominado por robots específicos como Franka y xArm, y carece de diversidad en los ángulos de las cámaras, lo que provoca sobreajustes y la necesidad de ajustes al usar robots o perspectivas diferentes.
Para resolverlo, el algoritmo Mirage adapta robots desconocidos mediante “cross-painting”, haciéndolos parecerse a los utilizados en el entrenamiento. Aunque es eficaz para aprendizaje sin datos previos, Mirage presenta inconvenientes: necesita modelos de robots precisos, no permite ajustes finos y tiene problemas con cambios significativos en las cámaras.
El trabajo de UC Berkeley presenta a RoVi-Aug como una solución avanzada para superar las limitaciones de las técnicas actuales de aprendizaje robótico.
Avances en la capacitación robótica
RoVi-Aug enseña a los modelos a comprender explícitamente la interacción entre los robots y las tareas dentro de los datos, en contraste con métodos convencionales que co-entrenan ingenuamente datos fusionados de múltiples robots.
Este marco genera demostraciones visuales sintéticas que varían según el tipo de robot y los ángulos de cámara, haciendo el entrenamiento más versátil. Está compuesto por dos módulos principales: Ro-Aug, que genera demostraciones con distintos sistemas robóticos, y Vi-Aug, que simula demostraciones desde diversas perspectivas de cámara.
Al combinar estos módulos, se obtiene un conjunto de datos más diverso, lo que permite a los robots aprender de una amplia gama de escenarios, transfiriendo habilidades de manera eficiente entre modelos y tareas, reduciendo la necesidad de recopilar datos del mundo real.
Según los investigadores, este enfoque mejora la robustez y la generalización de las políticas, eliminando la dependencia de ajustes precisos durante las pruebas, como las canalizaciones de cross-painting. A diferencia de Mirage, RoVi-Aug no requiere matrices de cámaras conocidas y permite ajustes finos, mejorando significativamente el rendimiento en tareas complejas. Además, RoVi-Aug facilita el aprendizaje de políticas multi-robot y multi-tarea al co-entrenar tanto datos originales como aumentados.
Aunque RoVi-Aug logra un puente entre conjuntos de datos robóticos y mejora la transferencia de habilidades, los investigadores reconocen ciertas limitaciones. Futuras investigaciones podrían abordar cambios de fondo, mejorar la síntesis de perspectivas, unificar modelos de pares de robots y manejar mejor los artefactos.
La generalización podría fortalecerse ampliando el sistema a diferentes tipos de pinzas, como manos multifuncionales, e integrando la ampliación de objetos y tareas.
Los detalles de la investigación fueron publicados previamente en ArXiv.
Vía | Nueva Tecnología Robótica Aumenta Éxito en Tareas Multi-Robot – Tecnología con Juancho