deephack.game rock band team
TRANSCRIPT
Reinforcement Learning – что это?
Данные
Алгоритм
Profit
Данные
Алгоритм
…………….Profit
Supe
rvis
ed L
earn
ing
Rein
forc
emen
t Lea
rnin
g
Настольные игры
Компьютерные игры
Аналитика динамический процессов
Обучение роботов простым действиям
Reinforcement Learning – зачем это нужно?
Q-learning – пытаемся предсказать будущееКартинка с экрана
(как её видит человек) Нейронная сеть Предсказание действия, которое принесет больше очков
Prioritized Sampling
Random Sampling (by Google DeepMind) Prioritized Sampling (based on Prioritized Sweeping 1993)
Для обучения выбираются случайные игры в прошлом
Выбираются самые «интересные игры» - те, в которых результат был
неожиданным для алгоритма