Réalisations - Elaboration d'IAs

Dans le contexte d'une SAE (Situation d'Apprentissage et Évaluation), j'ai suivis durant une partie de l'année, des cours de Stanford (disponibles ici) sur le reinforcement learning et les algorithmes qui le permettent. Ces différents algorithmes ont ensuite été implémentés en Python sur des environnements de la librairie Gymnasium (qui se base sur la libraire Gym d'OpenAI).

Les connaissances acquises ont ensuite été regroupées dans un document devant servir de cours pour introduir les concepts à des élèves.

De plus, le projet a été réalisé en applicant une méthode agile de développement, avec une revue de sprint (= phase) effectuée en présentiel chaque semaine.

Ce projet a été fait en équipe de 6, avec l'aide de:

Hicham Ferhani

Damien Rostaing

Evan Nunes

Mattéo Benhalima

Mattéo Tordeux

Galerie

Contribution / Apprentissage

Il est important à noter que chacun d'entre nous a travaillé des méthodes / environnements différents. Actuellement, ma contribution principale à ce projet doit être l'algorithme de policy evaluation (image 1). Sinon, en terme d'implémentations j'ai fait un Q-Learning basique puis un SARSA sur MoutainCar.

(le projet est toujours en cours)

Retour en haut