@InProceedings{Supelec772,
author = {Jérémy Fix and Matthieu Geist},
title = {Optimisation de contrôleurs par essaim de particules},
year = {2012},
booktitle = {Actes de la Conférence Francophone sur l'Apprentissage Automatique (Cap 2012)},
pages = {1-14},
month = {may},
address = {Nancy, France},
url = {http://cap2012.loria.fr/pub/Papers/10.pdf},
abstract = {Trouver des contrôleurs optimaux pour des systèmes stochastiques est un problème particulièrement difficile abordé dans les communautés d'apprentissage par renforcement et de contrôle optimal. Le paradigme classique employé pour résoudre ces problèmes est celui des processus décisionnel de Markov. Néanmoins, le problème d'optimisation qui en découle peut être difficile à résoudre. Dans ce papier, nous explorons l'utilisation de l'optimisation par essaim de particules pour apprendre des contrôleurs optimaux. Nous l'appliquons en particulier à trois problèmes classiques: le pendule inversé, le mountain car et le double pendule.}
}