Уловки машины, которая идеально играет в покер

Несколько исследователей с факультета наук Канадского университета Альберты создали программу, «способную всегда выигрывать в Техасский холдем, самый популярный из вариантов. покера ». Вот как эта новость была опубликована в различных СМИ, включая ABC, в отличной статье Хосе Мануэля Ньевеса . Об этом также сообщила и New York Times , но менее осторожный заголовок, как это ни парадоксально, — это заголовок журнала Science, в котором говорится о «решенной» игре. Собственно, в этом есть хитрость. Решены дамы и четверо подряд. Для покера у нас есть время.

Авторы программы считают свою веху сопоставимой с победой Deep Blue над Каспаровым в шахматах, в другой партии, еще далекой от решенной (только концовки с несколькими в пьесах можно играть идеально благодаря информатике, как вы можете прочитать здесь), несмотря на неоспоримые достижения искусственного интеллекта.

Сначала изобретательность Альберты играет только в ограниченном режиме , где ставки гораздо более контролируемы (одна из причин его меньшинства), и он используется только для противостояний с одним игроком, известного как «хедз-ап», также менее популярный. В обзорах также не подчеркивается, насколько это непрактично из-за времени, которое требуется программе для принятия каждого решения. В статье говорится о 61 минуте.

Компьютер учится на своих ошибках, используя теорию Нэша , которая была определена как «минимизация контрфактических сожалений» (CFR), которая в основном состоит из программа обнаруживает постфактум (как и любой другой), какие решения были неправильными, чтобы избежать их повторения. Как игра с неполной информацией, в покер нельзя просто играть идеально.

Все эти детали можно почерпнуть, прочитав полный текст, включая мелкий шрифт, опубликованной статьи «Наука». Авторы программы Майкл Боулинг , Нил Берч , Майкл Йохансо и Оскари Таммелин утверждают, что HULHE ( сокращение от Heads Up Limit Hold’em) «существенно и слабо разрешено» (уже нюанс), поскольку они считают, что для всех практических целей никто не может победить их машину в долгосрочной перспективе. Конечно, любой может выиграть у вас несколько раздач и даже сессию, но после тысяч раздач они считают, что их программа способна свести к минимуму их ошибки до такой степени, что они будут считаться непобедимыми, что и есть у хороших кэш-игроков (игра с деньгами) они стараются. Но правда в том, что даже компьютер имеет предел уязвимости, ничтожный в реальной игре, который его менеджеры оценивают в одну тысячную слепого. Блайнды — это обязательные минимальные ставки на каждую покерную руку. Это действительно ничтожная разница.

Чтобы оправдать медлительность программы, авторы объясняют огромную техническую сложность компании, хотя они также признают, что по количеству возможных ходов она находится между четырьмя подряд и шашками, все еще очень далеко от непостижимого шахматная глубина. По этой причине им нужна была машина с огромной емкостью памяти 262 Терабайта (проблема, которую они частично решили с помощью новых алгоритмов сжатия) и высокой скоростью вычислений.

Здесь много нюансов и мало объяснений, но прогресс в худшем случае захватывающий. Также было бы интересно узнать, как ведет себя программа, когда сталкивается с игроком, который постоянно меняет свою стратегию. Если кто-то хочет попробовать или узнать больше об этой программе, он может перейти по этой ссылке.

Что мы можем узнать из программы

Одна из самых интересных вещей в программе, на мой взгляд, — это новое видение, которое она предлагает для оптимального выбора играемых рук. Как видно на прилагаемом графике, программа разыгрывает практически любую пару карт, используя стратегию, которая противоречит основным учениям экспертов, а также не вызывает отвращения к факту «лимпа» или видению только большого блайнда. без необходимости повышать ставки — практика, которая, за редким исключением, часто считается еще одной «книжной» ошибкой. Возможно, это поможет кому-то пересмотреть свою игру.

Все это не означает, что в Интернете больше нет машин ( ботов на сленге), которые проводят нечеловеческие рабочие дни, в то время как их владельцы богатеют, не поднимая пальца, — практика, которая для конечно незаконно. Потому что для того, чтобы покер стал прибыльным, необязательно играть идеально. Вам даже не нужно быть лучшим. Просто сделайте это лучше, чем те, кто сидит за вашим столом.

Если кто-то хочет узнать больше о компьютерах и шахматах, несколько дней назад закончился чемпионат мира по машинам, о котором я говорил здесь, и на котором победил Комодо , зверь, которого также нельзя было победить на практике.

На следующий день мы обсудили фантастические применения всех этих программ в военной стратегии, анализе фондового рынка или даже в области медицины, хотя статья заканчивается цитатой из Тьюринга , одного из отцы искусственного интеллекта, ставшего модным благодаря кино: «Было бы неискренне скрывать тот факт, что главной причиной нашей работы было простое развлечение ».

 

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *