Richard Sutton

Richard Sutton est un informaticien canadien, enseignant en informatique à l'université de l'Alberta. Il est considéré comme l'un des fondateurs de l'apprentissage par renforcement, domaine auquel il a apporté plusieurs contributions majeures telles que le temporal difference learning et les méthodes de gradient.

Richard S. Sutton

Richard Sutton, le 27 octobre 2016

Données clés
Domicile	Canada
Domaines	Intelligence artificielle, apprentissage par renforcement
Institutions	Université de l'Alberta
Diplôme	Ph. D; (Temporal credit assignment in reinforcement learning)
Directeur de thèse	Andrew Barto (en)
Étudiants en thèse	Doina Precup, David Silver, Hamid Maei, Adam White
Renommé pour	Temporal difference learning, Dyna, Options, GQ(λ)
Distinctions	AAAI Fellow (2001) President's Award (INNS) (2003)

Formation

Sutton a reçu son B.A. en psychologie à l'université Stanford en 1978, et ses M.Sc. et Ph.D en informatique à l'université du Massachusetts à Amherst en 1980 et 1984, sous la direction d'Andrew Barto (en). Sa thèse, « Temporal Credit Assignment in Reinforcement Learning », introduisait en particulier des idées de temporal difference learning.

Publications

(en) Sutton, R. S., Barto, A. G., Reinforcement Learning: An Introduction. MIT Press, 1998. 2e édition MIT Press en 2018.
(en) Miller, W. T., Sutton, R. S., Werbos, P. J. (Eds.), Neural Networks for Control. MIT Press, 1991.
(en) Sutton, R. S. (Ed.), Reinforcement Learning. Reprinting of a special issue of Machine Learning Journal. Kluwer Academic Press, 1992

Références

(en) Richard Sutton, « Brief Biography for Richard Sutton » (consulté le 3 janvier 2009)
(en) « University of Massachusetts Amherst School of Computer Science Outstanding Achievement and Advocacy Award - 2013 » (consulté le 13 janvier 2015)

Liens externes

(en) Cet article est partiellement ou en totalité issu de l’article de Wikipédia en anglais intitulé « Richard S. Sutton » (voir la liste des auteurs).

(en) Richard Sutton's Homepage

Notices d'autorité :

Portail de l’informatique

Cet article est issu de Wikipedia. Le texte est sous licence Creative Commons - Attribution - Partage dans les Mêmes. Des conditions supplémentaires peuvent s'appliquer aux fichiers multimédias.