@InProceedings{Supelec771,
author = {Lucie Daubigney and Matthieu Geist and Olivier Pietquin},
title = {Optimisation d'un tuteur intelligent à partir d'un jeu de données fixé},
year = {2012},
booktitle = {Actes des Journées d'Etudes de la Parole (JEP 2012)},
pages = {241-248},
month = {June},
address = {Grenoble (France)},
url = {http://aclweb.org/anthology-new/F/F12/F12-1031.pdf},
abstract = {Dans cet article, nous présentons une méthode générale pour optimiser un tuteur intelligent dans le domaine de l’acquisition d’une seconde langue. Plus particulièrement, le processus d’optimisation a pour but de trouver une stratégie qui propose la meilleure séquence de phases d’évaluation et d’enseignement afin de maximiser l’augmentation des connaissances de l’apprenant. La principale caractéristique de la méthode proposée est qu’elle est capable d’apprendre la meilleure stratégie à partir d’un jeu fixe de données, collectées à partir d’une stratégie définie à la main. Ainsi, aucun modèle, ni cognitif ni probabiliste de l’apprenant, n’est nécessaire. Seules sont requises des observations du comportement de l’apprenant alors qu’il interagit avec un système non-optimal. Pour ce faire, un algorithme de programmation dynamique approchée en mode hors-ligne est utilisé : l’algorithme LSPI (Least Square Policy Iteration). Des résultats obtenus avec des données simulées semblent prometteurs.}
}