Réalisations - Elaboration d'IAs

Dans le contexte d'une SAE (Situation d'Apprentissage et Évaluation), j'ai suivis durant une partie de l'année, des cours de Stanford (disponibles ici) sur le reinforcement learning et les algorithmes qui le permettent. Ces différents algorithmes ont ensuite été implémentés en Python sur des environnements de la librairie Gymnasium (qui se base sur la libraire Gym d'OpenAI).

Les connaissances acquises ont ensuite été regroupées dans un document devant servir de cours pour introduir les concepts à des élèves.

De plus, le projet a été réalisé en applicant une méthode agile de développement, avec une revue de sprint (= phase) effectuée en présentiel chaque semaine.

Ce projet a été fait en équipe de 6, avec l'aide de:

linkedin-hicham Hicham Ferhani
linkedin-damien Damien Rostaing
linkedin-evan Evan Nunes
linkedin-mattéo Mattéo Benhalima
linkedin-mattéo Mattéo Tordeux

Galerie

ia-policy-evaluation ia-mountain-car ia-sarsa ia-sarsa2

Contribution / Apprentissage

Il est important à noter que chacun d'entre nous a travaillé des méthodes / environnements différents. Actuellement, ma contribution principale à ce projet doit être l'algorithme de policy evaluation (image 1). Sinon, en terme d'implémentations j'ai fait un Q-Learning basique puis un SARSA sur MoutainCar.

(le projet est toujours en cours)

Retour en haut