Добро пожаловать в эру опыта: почему обучение с подкреплением изменит мир
Исследователи из Google DeepMind опубликовали интересную статью "Welcome to the Era of Experience"
Глубокое Q-обучение (DQN)
вкалывают роботы...Немного контекстаПодходит к завершению серия моих заметок про использование идей искусственного интеллекта для решения задачи коммивояжера (TSP). Я последовательно разобрал некоторые классические решения TSP и далее рассказал
А не пора ли нам подкрепиться?
Краткое содержание предыдущих серийВ заметке про Pointer Network было много всего: нетривиальная архитектура кодировщика (энкодера) и декодера, механизм внимания, а также совсем немного про обучение с подкреплением. В общем, много-много всякого, нужного для охвата пазла целиком. Далее, в следующей заметке
Исследователи из Стэнфорда обучили ИИ играть в Among Us: их агенты выигрывают людей уже в 45% случаев
Исследователи из Стэнфорда выпустили статью про то, как обучили модель играть в Among Us, при этом не используя вообще никаких размеченных людьми данных. Вместо этого они применяли только обучение с подкреплением и несколько этапов файнтюнинга, в ходе которых агенты учились общаться, убеждать, лгать или предсказывать предателя (импостера).
ИИ на путях: как решить задачу перепланирования расписания движения поездов
Привет, Хабр. Я Артур Саакян, главный специалист по анализу данных и машинному обучению в ПГК Диджитал. Мы разрабатываем уникальные цифровые продукты для железнодорожных перевозок, такие как оптимизация ЖД перевозок, навигатор, ЖД карты, цифровой вагон и так далее.В этой статье опишу подход к оптимизации расписания поездов в реальном времени при помощи обучения с подкреплением (RL), который применим и к российским грузовым ж/д перевозкам, но пока не используется. Тезисы статьи:Перепланирование расписания движения поездов (Train Timetable Rescheduling)Коротко об RL и Q-learningМоделирование железнодорожной среды
Внимание — это все, что нужно коммивояжеру
Говорят, человеческое внимание ходит по треугольнику на картине великого голландцаГде начинается ИИ в задаче коммивояжера?Заголовок отсылает к знаменитой работе Attention Is All You Need
Практическое обучение с подкреплением: от забав с MuJoCo’м до битв на арене
Добрый день, уважаемые хабровчане! Я хочу поделиться с вами очень интересным проектом, над которым работал в последнее время. В первой статье я не буду сильно углубляться в технические подробности, а вместо этого постараюсь провести вас по пути, который я прошел при реализации своего пайплайна для обучения нейросеток, сражающихся друг с другом на арене. Весь код доступен на моем GitHub и готов к использованию, поэтому вы сразу сможете обучить чемпиона и поучаствовать в сражении!Готовы? Тогда - вперед!