Третий матч корейского профессионала в го Ли Седоля и нейросети AlphaGo закончился очередной победой искусственного интеллекта. Таким образом, AlphaGo окончательно и бесповоротно победила виртуоза современности по одной из наиболее популярных настольных игр.
Го — древнекитайская игра, которая зародилась от двух до пяти тысяч лет назад. В игре участвуют два человека (по крайней мере, так было на протяжении веков), каждый из которых получает камни своего цвета — белые или черные. Перед игроками ставится расчерченная линиями доска 19х19 (гобан). Игроки поочередно ставят по одному из своих камней на одну из точек пересечения; в начале игры доступна 361 точка для первого хода. Задача каждого — захватить как можно больше территории. Однако правила игры весьма утонченны и имеют массу оговорок.
Перед создателями AlphaGo — компанией DeepMind, принадлежащей Google, — встала задача научить игре искусственный интеллект, не объясняя ей правила. Этот процесс потребовал массу времени и технических возможностей. В конечном итоге они добились своего — нейросеть обыграла очередного чемпиона.
Ли Седоль был сражен. «Я искренне извиняюсь перед всеми людьми за то, что не оправдал их надежд», — произнес Ли Седоль после третьего матча. Также он попросил не терять интереса к следующим двум запланированным играм, которые, в сущности, уже не смогут повлиять на результат.
Перед началом серии матчей сам корейский профи был уверен в победе, причем со счетом 5-0 или в крайнем случае 4-1. По его словам, через пару лет он бы сыграл с AlphaGo вновь, когда бы она стала чуточку «поумнее».
Но Седоль просчитался — AlphaGo окончательно одержала верх над его мастерством и многолетним опытом.
Как заметил специалист «Яндекса» по искусственному интеллекту и компьютерному «зрению» Александр Крайнов, Ли Седоль сделал поспешные выводы после просмотра матча нейросети с чемпионом Европы Фэнь Хуэйем. Кроме того, после турнира у AlphaGo было время, чтобы скрупулезно готовиться к серьезному матчу. И это время нейронная сеть не потратила даром.
Триумф нейросети значит очень многое. Однако один из самых главных моментов заключается в том, что для победы над человеком в игре, где количество возможных ходов превышает количество атомов во Вселенной, AlphaGo не потребовалось перебирать все возможные ходы до победного конца, поскольку это практически невозможно. Она научилась играть иначе.
AlphaGo не является, однако, нейросетью в строгом понимании. Это настоящая система, в которой для обучения использовалось сразу нескольку стратегий. Во-первых, в AlphaGo был загружен целый массив уже записанных сыгранных игр профессионалов. Из этой информации AlphaGo научилась выявлять, какие ходы человек вероятнее всего сделает из той или иной позиции. Далее сеть, пропустив через себя весь полученный опыт, начала играть сама с собой. Здесь ее интересовало уже то, какой ход из какой точки будет наиболее «сильным» и вероятнее приведет к победе. Александр Крайнов также отмечал, что в последних играх AlphaGo показала себя так, что самый «слабый» ход ее был недалек от самого «сильного».
В игре нет как таковой затяжной стратегии, которые, например, могут быть описаны в учебниках по шахматам или шашкам. В го необходимо решать конкретные, насущные задачи. Этим и занималась AlphaGo, перебирая близкие возможные ходы, используя и метод Монте-Карло, и оценочные, и предсказательные возможности.
Но AlphaGo научилась и удивлять. В первой партии против комплексной нейросети, которая состоялась 9 марта, до 102 хода не было сюрпризов. В каком-то смысле AlphaGo находилась в догоняющем положении, комментаторы отмечали напряженную игру, но сильный перевес не был на чьей-то стороне. Однако 102-е движение переломило весь ход игры. AlphaGo неожиданно перешла в наступление в другой части доски, чего Ли Седоль никак не ожидал. В дальнейшем оборонялся уже корейский мастер, пока на 186-м ходу не принял решение сдаться. Тогда он отметил, что его шансы на победу — 50-50. Как выяснилось, это было опрометчивым заявлением.
Очевидно, что искусственному интеллекту оказались по зубам даже те игры с полной информацией, где количество вариантов ходов неисчислимо велико. Одна из первых значимых побед ИИ над человеком состоялась в 1997 году, когда основанный на алгоритмах суперкомпьютер DeepBlue обыграл Гарри Каспарова. Тогда Каспаров усомнился в том, что некоторые ходы были сделаны машиной.
Наконец, очередной бастион — древнейшая игра го — пал на пути к господству искусственного интеллекта.
Основатель DeepMind Дэмис Хассабис назвал победу AlphaGo над Ли невероятно значимой, но отметил, что судить об этом придется истории. Он также уверен, что система в случае победы в дальнейшем сможет научиться диагностировать болезни быстрее докторов, а также предсказывать изменения климата. Все это — на основе «больших данных», загруженных в нее. В одном из сообщений в Twitter Хассабис также выразил свое восхищение игрой Седоля и работой команды AlphaGo.
Но глобальное соревнование в го еще не окончено. Не так давно сообщалось, что и Facebook разрабатывает собственную нейросеть для игры. Возможно, что состязание будет проходить уже между алгоритмами и методами обучения — машина против машины. Человеку уже не будет места за доской среди «бесчеловечных профессионалов».
Искусственный интеллект умнеет все более стремительно. Однако вряд ли у него появится свой разум. Специалист «Яндекса» Александр Крайнов отметил, что ИИ в любом случае нужна заданная цель. Цель же задается человеком. Без нее машина, к сожалению или к счастью, «мыслить» не будет.