Обучение игрового ИИ Pac-Man
Обучение с подкреплением

В этом проекте создан агент, который учится играть в классический Pac-Man с помощью метода обучения с подкреплением REINFORCE (градиент стратегии). Агент постепенно улучшает свои действия на основе получаемых вознаграждений.
🔹 Агент осваивает управление персонажем в динамичной среде с редкими наградами
🔹 Изучено влияние отсутствия дополнительных стабилизирующих механизмов (baseline)
🔹 Наблюдается постепенная эволюция поведения по мере увеличения числа эпизодов
Результат: после серии тренировок агент начал действовать более осмысленно и иногда достигал положительных результатов, но обучение оставалось нестабильным. Эксперимент показал, что чистый метод градиента стратегии полезен для понимания принципов RL, но требует улучшений для сложных игр.
Видеодемонстрация:
✖
◀
▶