Размер шрифта: A A A
Цвет сайта: A A A A
Контакты

РОБОТ ОБЫГРЫВАЕТ ЧЕЛОВЕКА В КЁРЛИНГ

08.10.2020

Керлинг можно считать хорошей экспериментальной площадкой для изучения взаимодействия систем искусственного интеллекта и реального мира. При игре в керлинг свойства окружающей среды постоянно меняются, и каждый бросок влияет на исход матча. Кроме того, нет времени на обучение во время матча из-за ограничения времени игры. Корейские и немецкие учёные в статье в Science сообщают о разработке робота для игры в керлинг, который может достичь показателей человеческого уровня, используя адаптивную структуру обучения. Робот для керлинга, который учёные назвали «Curly», смог выиграть три из четырех официальных матчей у опытных команд (главной женской сборной Кореи по керлингу и корейской национальной сборной по керлингу на колясках). Эти результаты показывают, что разрыв между симуляторами, основанными на физике, и реальным миром можно сократить, а робототехника и современные технологии всё больше укореняются в спорт.

В керлинг играют на льду, который может меняться в течение матча. Неустойчивые условия ледяного покрова делают игру очень сложно. Помимо необходимости точно бросать и стратегически мыслить, нужно ещё и учитывать постоянные изменения свойств льда, делая этот вид спорта сложным для освоения и сложной задачей для роботов и робототехников.

curling01.jpg

В исследовании учёные рассматривают керлинг как модель для демонстрации взаимодействия между системой искусственного интеллекта (ИИ) и реальным миром с постоянно меняющимися условиями. С точки зрения ИИ, керлинг – часто называемый «шахматами на льду» - отличается от настольных игры, шахмат или го. Кёрлинг имеет значительно большее количество разрешенных ходов, потому что игра развивается в непрерывной среде. Из-за столкновений камней моделирование керлинга требует сложного и трудоемкого процесса моделирования на основе физики. Кроме того, игра в керлинг ведется на льду, покрытым мелкой галькой. Галька меняет свое состояние в зависимости от таких факторов, как температура, влажность, свойства ледовых машин, времени, прошедшего с момента завершения технического обслуживания, траектории камней, брошенных до этого, и, наконец, количества перемещений, выполняемых во время игр - ни один из них не находится под контролем и не может быть точно измерен. Количество ошибок может быть увеличено и вследствие стратегических просчётов игроков. Вся игра ведётся в «доме», в радиусе 1,83 метра, а также в 40 метра от «дома», где игрок выпускает камень из руки.

curling02.png

Рисунок – робот, обыгравший людей в кёрлинг

Лёд имеет различные свойства (даже в краткосрочных отрезках), поэтому неопределенность и непостоянность внешних факторов по своей природе непредсказуемы, потому что трение льда существенно меняется с каждым броском. В этой неопределенной среде становится необходимо (после обучения) адаптировать объект обучения в режиме реального времени для выполнения задач, чтобы он мог обеспечить высокие показатели. Онлайн-адаптация к изменениям в среде, выполняемая роботом «Curly», использует последние траектории камней и статистику от места останови камня. Так как делается всего несколько бросков за игру (в одном матче по керлингу в общей сложности 160 бросков, а продолжительность игры около 120 мин), адаптацию нужно проводить с помощью эффективного способа обработки данных.

Чтобы изучить пределы точности предлагаемых различных систем ИИ, учёные проводили систематические тестовые броски на льду сравнения. К сожалению, «Curly» требуется от 1 до 2 мин на один бросок, так как ему нужно проанализировать траекторию камня, распознать собственные координаты, спланировать стратегию и бросить. Учёные разработали эксперимент с 45 бросками за одну тренировку (15 бросков для каждого метода обучения) для измерения статистики успеха; учёные повторили каждую сессию трижды и, таким образом, получили три сессии, выполнив 45 × 3 бросков. Вышеупомянутые 45 бросков были нацелены на случайные позиции возле дома (зона очков) для получения не зависящей от цели оценки качества броска.

Наилучшая средняя точность была около 1,3 м у «Curly». Это результат того же порядка, что показывали национальные сборные по керлингу на колясках на Зимних Паралимпийских Играх 2018 г. При свиповании дальнейшее улучшение составляет от 0,2 до 0,8 м на Зимних Олимпийских играх 2018 г. (https://curlit.com/PDF/PWG2018_ ResultsBook.pdf).

curling03.png

Рисунок – момент матча между роботом и людьми

Однако точная причина конкурентоспособности «Curly» против человеческих команд не ясна. В принципе существуют три возможности для объяснения этого эффекта: (1) человеческая команда слишком расслаблена по отношению к исходу матча против робота-соперника; (2) люди обычно нервничают во время матчей, тогда как роботы нет; и (3) компонент стратегии ИИ превосходит человеческое стратегическое понимание игры.

Учёные провели интересный матч, в котором «Curly» играл за людей. Люди сыграли свиперов в команде «Curly» вместо подметающих роботов (youtu.be/1rocA7SLl2Y). Робот показал людям визуализацию его бросковой стратегии. Это привело к интересному матчу между смешанными командами роботов и людей.

Источники:

1.  Won, Dong-Ok, Klaus-Robert Müller, and Seong-Whan Lee. "An adaptive deep reinforcement learning framework enables curling robots with human-like performance in real-world conditions." Science Robotics 5.46 (2020).

2. Матч между роботами и людьми - youtu.be/1rocA7SLl2Y


Комментарии:

Возврат к списку