L'apprentissage par imitation est une technique clé pour former des robots et des agents autonomes. Cet article explique deux algorithmes fondamentaux : le Behavior Cloning, qui apprend à partir de démonstrations d'experts via l'apprentissage supervisé, et DAgger, qui collecte itérativement de nouvelles données sous la politique actuelle pour corriger les décalages de distribution. Il couvre les mécanismes de base, les pièges courants comme les erreurs de compounding, et les avantages en termes d'efficacité des données. Bien qu'il n'introduise pas de nouvelles recherches, il constitue une référence solide pour les ingénieurs construisant des pipelines d'apprentissage robotique.
Une comparaison technique des algorithmes Behavior Cloning et DAgger pour l'apprentissage par imitation en robotique.