El aprendizaje por imitación es una técnica clave para entrenar robots y agentes autónomos. Este artículo explica dos algoritmos fundamentales: Behavior Cloning, que aprende de demostraciones de expertos mediante aprendizaje supervisado, y DAgger, que recopila iterativamente nuevos datos bajo la política actual para corregir el cambio de distribución. Cubre los mecanismos centrales, los errores comunes como los errores compuestos y las ventajas de eficiencia de datos. Si bien no introduce nuevas investigaciones, sirve como un recurso sólido para ingenieros que construyen tuberías de aprendizaje robótico.
Una comparación técnica de los algoritmos Behavior Cloning y DAgger para el aprendizaje por imitación en robótica.