Contenu du renducontact(at)guillaumelevieux.com :: « Home

Claudia Caillet

Programmeur Enjmin



** Technologie **
Dans ce projet, je me suis initiée au Machine Learning sur Unity.
J'ai suivi un tutoriel (https://github.com/Unity-Technologies/ml-agents/blob/master/docs/Learning-Environment-Create-New.md) sur le Proximal Policy Optimization.

** Projet **
Le projet est divisé en 6 scènes indépendantes qui sont chacune composées d'un agent qui essaie d'accomplir sa tâche.
L'agent est la sphère violette, et sa tâche est de rouler jusqu'au cube bleu.
Dès qu'elle l'atteint ou qu'elle tombe de la plateforme, la scène se reset.

** Machine Learning **
Sur la vidéo, vous pouvez voir les agents évoluer et s'améliorer progressivement.
Leurs décisions sont basées sur les récompenses / punitions qu'ils reçoivent.
En l'occurrence, ils reçoivent une récompense dès qu'ils atteingnent le cube bleu.