Максим Солохин (palaman) wrote,
Максим Солохин
palaman

Categories:

Драма, которая изменила мою реальность.

Игра Го - одна из моих тайных страстей. Я стараюсь не играть в Го и бывает, годами воздерживаюсь от этого, но потом она снова берет надо мною верх.

Уф! Признался.
И теперь, признавшись в этом тайном пороке, я расскажу с огромным запозданием историю о том, как мой мир перевернулся, опрокинулся и разбился. [Spoiler (click to open)]Это случилось, когда AlfaGo победила великого Ли Седола, живую легенду современного Го.

Популярнейшее введение в тему для тех, кто не понимает, о чем идет речь.

... А дело было так ...

В течение недель, предшествовавших первой игре, команда DeepMind выражает смиренный оптимизм относительно шансов AlphaGo на победу. Ли Седол же уверен в себе; на пресс-конференции с Демисом Хасабисом, основателем DeepMind, он утверждает, что для него задача заключается не в том, победит ли он АльфаГо, но и победит ли он со счетом 5/0 или 4/1.

И это не пустое высокомерие. Ли объективно оценивает шансы, основываясь на игре AlphaGo против Фань Хуэй. Фань Хуэй и Ли Седол несопоставимы по силе. В мире Го, Ли Седол это - бог с маленькой буквы. Он является одним из тех редких виртуозов, которые делают эпоху, которые устанавливают мерку для остального мира. Он на порядок более талантливый, чем Фань Хуэй, тоже великий мастер. Между Фань Хуэй задал AlphaGo жару на неофициальном матче. Он выиграл две из пяти игр.

Другие корейские профессионалы на пресс-конференции шутят, что они завидуют Ли, ведь DeepMind Challenge Match - это самый простой способ срубить миллион долларов для игрока такого уровня как Ли.

* * *

Через несколько минут после начала первой игры все ожидания меняются. Сразу видно, что Ли Седол играет не с той же AlphaGo, что и Фань Хуэй в Лондоне. Та версия AlphaGo играла неплохо, но слишком пассивно, мирно. Нынешняя AlphaGo в Сеуле любит атаковать, ей нравится агрессивный бой. Ли сыграл нетрадиционный дебют, пытаясь сбить AlphaGo с толку, но это не работает.

У AlphaGo было почти пять месяцев на улучшение - а она постоянно улучшается, играя сама с собой миллионы раз, накапливая опыт и постепенно пересматривая свои алгоритмы в зависимости от того, какие последовательности игры приводят к более высокому проценту выигрыша. Ей не нужны перерывы на отдых. У неё не бывает дней, когда ей просто не хочется тренироваться. Ежедневно изо дня в день AlphaGo продвигается к превосходству, и результаты ошеломляют.

Ли продолжает проигрывать в первой игре, и сдается после 186 хода. Переломный момент, похоже, наступил на 102 ходу белых. Это было резкое, неожиданное вторжение, агрессивный ход нейросети, который резко усложнил боевые позиции. Но по правде говоря, это именно тот стиль, который более всего понятен для Ли. Он сам любит такие ходы. В этот момент полный спектр эмоций виден на лице Ли: удар, удивление, принятие и, наконец, мрачное разрешение. Его челюсть падает, и через несколько секунд он садится на стул и улыбается удивленно, затем он ошеломлен. Наконец его эмоции усиливаются настолько, что он дает себе подзатыльник, что бывает лишь когда он крайне напряженно думает или нервничает.

Он начинает пересматривать ходы, он перебирает на доске альтернативные варианты, экспериментирует с иными путями, которые не были использованы. Мы видим, как он работает, пытаясь точно определить, как и почему он проиграл.

Теперь Ли понял меру машины. Входя в вторую игру, он уже понимает, с чем он имеет дело. Следующий вечер станет настоящим испытанием. Но на пресс-конференции, следующей за первой игрой, он понижает свои предполагаемые шансы на победу до 50 процентов.

* * *

Во второй игре Ли демонстрирует другой стиль, пытаясь играть более осторожно. Он ждет случая, который можно будет использовать, но нейросеть продолжает удивлять. На ходу 37 AlphaGo делает неожиданный ход. Такой ход в данной позиции никогда не видели в профессиональных играх, но его смысл скоро становится очевидным. Позже Фань Хуэй сказал: "Я никогда не видел, чтобы человек сыграл таким образом. Как это было прекрасно!"

Что же Ли? Он встает и выходит из комнаты. В это мгновение неясно, что происходит, но затем он снова входит в игровой зал, вновь садится и играет свой ответ. Далее следует гораздо более удачная игра, чем игра номер один, однако финал прежний. Ли Седол сдается после 211 хода.

В ту ночь Ли и группа его коллег сидят до 6:00, пытаясь нащупать возможную стратегию в мозговых штурмах. Они ищут серебряную пулю, ахиллесову пяту, чтобы обеспечить победу. Теперь ему нужно три победы, три победы подряд, чтобы выиграть матч.

* * *

Игра 3 заканчивается очередным поражением - после четырех часов изнурительной игры Ли Седоль сдается. Это одна из лучших партий в его жизни, но он просто не может пробить броню ИИ. Теперь становится ясно, что настоящая сила AlphaGo превосходит даже то, что было показано на первых двух играх. Позже американский комментатор Дэвид Ормерод, напишет, что просмотр третьей партии Ли с AlphaGo заставил его почувствовать себя «физически нездоровым».
В конце концов, не найдя никаких вариантов, которые дали бы ему шанс на победу, Ли начинает делать бессмысленные ходы.

На пост-игровой конференции Ли выглядит на 10 лет старше. Среди огненных ламп и вспышек камер он извиняется перед всем миром. «Я прошу прощения за то, что не в состоянии удовлетворить ожидания человечества», - говорит он. «Я чувствовал себя бессильным». Даже исследователи DeepMind, которые глубоко восхищаются Ли, кажутся более мрачными, чем ликующими по поводу их собственной победы. Есть ощущение, что мир изменился изменился, и изменился к худшему. Гу Ли, один из давних друзей и соперников Ли Седола, комментирует на китайском телевидении, что Ли от лица всего человечества «в полном одиночестве ведет битву против незримого врага».

* * *

Ли уже проиграл матч, но в четвертой игре у него новая цель - выиграть хотя бы один раз.

Ли, играя белым против черных AlphaGo, пробует еще один новый стиль - ещё более рискованную стратегию под названием amashi . Перед этим страшным непобедимым противником-роботом человек предельно обнажен, и мы видим, как некоторые магические фокусы великого Ли Седола выходят на поверхность. До сих пор AlphaGo выигрывала, позволяя Ли взять небольшую прибыль в обмен на свои собственные дополнительные преимущества, и ее превосходные возможности расчета позволяли ей каждый раз навязывать человеку невыгодную сделку. Теперь Ли заставляет AlphaGo сражаться в стиле "все или ничего".

И вот Ли совершает 78-й ход, о котором скажут потом «рука Бога». Это блестящая тактическая игра, которую AlphaGo не смогла учесть. В течение следующих нескольких шагов последовательность становится катастрофической для AlphaGo, которая, по-видимому, «понимает» - что бы это ни значило - что её перехитрили. Её стратегия начинает рушиться.

В конце концов, не найдя никаких ходов, которые бы дали шансы на победу, она начинает играть бессмысленные ходы - ходы, которые фактически лишь уменьшают её очки. Наконец, нейросеть сдаётся.

После матча сотни людей скандируют имя Седола, когда он выходит на сцену. Ликующий мастер благодарит всех участников, говоря, что тепло, которое он испытывает в этот момент, обращает в ничто горечь трёх предыдущих поражений.

Однако остался еще один один сюрприз для этого вечера. На пресс-конференции Ли указывает, что как в этой игре, так и в игре 2 (самой удачной для него) AlphaGo играл в черными. Ли просит удалить это возможное преимущество в финальной игре. Кажется, что, вскарабкавшись на Эверест после трех неудачных попыток, Ли решил еще раз попробовать, только с завязанными глазами.

В игре 5 Ли использует стратегию, похожую на игру 4. Какое-то время игра идет на равных, но AlphaGo еще раз доказывает, что она нащупывает даже самые небольшие возможности и немедленно цементирует любые преимущества, которые она получила. И стоит ей хоть чуточку выйти вперед, как она будет очень хорошо защищать своё лидерство. Ли вынужден сдаться в последний раз, закончив матч четырьмя потерями и одной победой. На этот раз не было руки Бога.

* * *

Что всё это значит для нас? Не так уж много. Если бы AlphaGo проиграла Ли в марте, было бы лишь вопросом времени для неё улучшиться настолько, чтобы превзойти его. Го постоянно развивается. То, что считается оптимальным, быстро меняется. Люди оттачивают наши коллективные знания об игре более чем на 2500 лет - но разница в том, что AlphaGo может делать то же самое много, намного быстрее.

Важно не то, что ИИ DeepMind может научиться побеждать в игре Го, а в опасности, что он может научиться побеждать во всем, что угодно. Возможности применения этих революционных достижений в машинном обучении - в неожиданной способности машин имитировать человеческое творчество и интуицию.

[Для справки. Осторожно, много цифр.]Количество допустимых позиций на доске при игре Го на доске разного размера.

1x1 1
2x2 57
3x3 12675
4x4 24318165
5x5 414295148741
6x6 62567386502084877
7x7 83677847847984287628595
8x8 990966953618170260281935463385
9x9 103919148791293834318983090438798793469
10x10 96498428501909654589630887978835098088148177857
11x11 793474866816582266820936671790189132321673383112185151899
12x12 57774258489513238998237970307483999327287210756991189655942651331169
13x13 37249792307686396442294904767024517674249157948208717533254799550970595875237705
14x14 212667732900366224249789357650440598098805861083269127196623872213228196352455447575029701325
15x15 10751464308361383118768413754866123809733788820327844402764601662870883601711298309339239868998337801509491
16x16 4813066963822755416429056022484299646486874100967249263944719599975607459850502222039591149331431805524655467453067042377
17x17 19079388919628199204605726181850465220151058338147922243967269231944059187214767997105992341735209230667288462179090073659712583262087437
18x18 669723114288829212892740188841706543509937780640178732810318337696945624428547218105214326012774371397184848890970111836283470468812827907149926502347633
19x19 208168199381979984699478633344862770286522453884530548425639456820927419612738015378525648451698519643907259916015628128546089888314427129715319317557736620397247064840935

Профессионалы играют 19x19, а доски более маленького размера используются лишь для обучения игре, так как там быстрее становятся видными последствия того или иного хода. Не через двадцать ходов, а через десять или пять :)


И цитата из философской статьи по этому поводу:

[Spoiler (click to open)]До настоящего момента изобретением, которое, пожалуй, сильнее прочих повлияло на ход новой истории, был печатный пресс (XV век). Он позволил эмпирическому знанию постепенно вытеснить церковные доктрины, и эпоха разума пришла на смену эпохе религии. Личностное постижение и научное знание сменили веру в качестве основного критерия человеческого сознания. Информация начала скапливаться и систематизироваться в библиотеках. Век разума породил идеи, из которых прямо проистекает весь современный порядок вещей.

Нейросеть AlphaGo нанесла поражение чемпионам мира по игре в го, поскольку совершал стратегически немыслимые ходы — ходы, которые люди не могли предвидеть и не научились успешно отражать. Находятся ли такие ходы за пределами возможностей человеческого мозга? Или же люди тоже смогут им научиться под руководством нового наставника?

До того, как в го начал играть ИИ, игра преследовала сложные цели: игрок старался не только выиграть, но и изучить новые стратегии, которые потенциально были бы применимы и в других областях жизни. Напротив, ИИ руководствуется единственной целью: победить. Он «учится» не в рамках концепций, а строго математически, внося небольшие изменения в собственные алгоритмы. Таким образом, учась выигрывать в го с целью, отличной от человеческих, ИИ может повлиять и на сам характер этой игры. Можно ли утверждать, что эта узкая направленность на победу характерна для ИИ вообще?

Другие ИИ работают над изменением человеческого мышления, разрабатывая устройства, которые могут давать веер ответов на запросы людей. Если не принимать во внимание сугубо практические вопросы («какая температура на улице?»), то определённые опасения внушают вопросы о природе нашей реальности и смысле жизни. Хотим ли мы, чтобы наши дети постигали жизненные ценности, общаясь с алгоритмами? Не следует ли нам защитить свою конфиденциальность, ограничив возможность ИИ изучать тех, кто задаёт ему вопросы? Если да, то как этого достичь?

Если ИИ способен учиться неизмеримо быстрее людей, то мы можем ожидать, что методом проб и ошибок, который обычно используют люди для принятия решений, он тоже будет пользоваться неизмеримо быстрее: ИИ будет делать ошибки чаще и масштабнее, чем люди. Возможно, мы не сумеем ограничить эти ошибки, как предлагают исследователи в области ИИ, включая в программу «этические» и «рациональные» требования. Из-за того, что человечество не смогло предельно чётко описать данные категории, возникли целые академические дисциплины. Станет ли ИИ судьёй над ними?

В-третьих, ИИ может достичь необходимых целей, но не сумеет объяснить принцип своих решений. В определённых областях — распознавание образов, анализ больших данных, игры — способности ИИ могут превосходить человеческие. Если вычислительные мощности будут быстро расти, ИИ вскоре научится оптимизировать различные ситуации способами, которые будут несколько отличаться, а возможно радикально отличаться от способов оптимизации, характерных для людей. Но если до этого дойдёт, то сможет ли ИИ объяснить людям, почему его решения оптимальны? Или же процесс принятия таких решений окажется за пределами человеческого языка и разумения? На протяжении всей человеческой истории различные цивилизации старались различными способами объяснять мир вокруг себя: в Средневековье — религией, в эпоху Просвещения — разумом, в XIX веке — историей, в XX веке — идеологией. Сложнейшим, но и важнейшим вопросом о том новом мире, в который мы идём, является следующий: что случится с человеческим сознанием, если ИИ превзойдёт его объяснительные способности, и наше общество больше не сможет описывать мир, в котором живёт, в понятных для себя терминах?

Как будет определяться сознание в мире машин, которые переведут человеческий опыт в математические данные, выраженные через собственную память? Кто будет нести ответственность за действия ИИ? Как определять сферу ответственности за ошибки ИИ? Сможет ли созданная людьми правовая система поспеть за действиями ИИ, который в состоянии молниеносно отыскивать увёртки и лазейки в ней?

Просвещение началось тогда, когда философские концепции сделались общедоступными благодаря новым технологиям. Сейчас мы движемся в обратном направлении. Мы изобрели могущественную технологию, но не нашли для неё философских принципов. Другие страны сделали создание ИИ общенациональным проектом. Соединённые Штаты на правительственном уровне пока не приступили к полномасштабному изучению ИИ и возможных последствий его применения. Этот вопрос следует сделать приоритетным, и прежде всего с точки зрения связи ИИ с гуманистическими традициями.

Разработчики ИИ, столь же неискушённые в политике и философии, как я сам в технологиях, должны задать себе ряд вопросов, которые я упомянул выше, чтобы встроить ответы в своё детище. Американскому правительству следует учредить президентскую комиссию из числа выдающихся мыслителей, чтобы выработать национальную политику по отношению к ИИ. Одно можно утверждать со всей уверенностью: если мы не приступим к этой задаче как можно скорее, то уже в ближайшем будущем обнаружим, что стало слишком поздно.
Tags: го, футуризм
Subscribe
  • Post a new comment

    Error

    default userpic

    Your reply will be screened

    Your IP address will be recorded 

    When you submit the form an invisible reCAPTCHA check will be performed.
    You must follow the Privacy Policy and Google Terms of use.
  • 59 comments