Гемини от Google запаниковал во время игры в Покемонов.

Вот готовый блог-пост для WordPress на тему “Google’s Gemini panicked when playing Pokémon”:

Google’s Gemini запаниковал, играя в покемона: как ИИ справился с вызовом

В мире искусственного интеллекта не утихают эксперименты, в ходе которых нейросети пытаются выполнять задачи, которые кажутся простым людям привычными. Недавним событием стало успешное прохождение культовой игры Pokémon Blue языковой моделью Gemini от Google. Однако за красочными заголовками и поздравлениями скрывается куда более любопытная история: оказывается, для Gemini покемоны стали настоящим вызовом.

В рамках независимого проекта Gemini Plays Pokémon, созданного инженером Джоэлом З., крупнейшая языковая модель Google вышла в прямой эфир на Twitch и попыталась одолеть игру, выпущенную почти тридцать лет назад. В ходе трансляции зрители наблюдали, как ИИ с переменным успехом принимает решения, совершает ошибки и порой действительно «западает», пытаясь понять логику геймплея или найти правильный путь.

В отличие от человека, Gemini не взаимодействует с игрой напрямую, а получает визуальные данные и ключевую игровую информацию, которую интерпретирует для выбора следующего действия. Этот процесс далеко не всегда проходит гладко — иногда искусственный интеллект теряется, повторяет одни и те же действия или принимает решения, которые не приводят к прогрессу.

Инженер проекта не скрывает, что периодически приходилось вмешиваться, чтобы скорректировать ход мысли модели, но речь всегда шла именно о помощи ИИ в выборе более эффективных стратегий, а не о подсказках или читерстве. Благодаря специальной системе, так называемому «харнесу», Gemini получала дополнительную информацию о контексте происходящего, обобщала предыдущие действия и получала инструменты для навигации.

Важно понимать, что победа над Pokémon Blue не стала беспрецедентным доказательством превосходства Google над другими ИИ-разработчиками. Использовались уникальные инструменты и фреймворки, недоступные другим моделям, поэтому сравнивать результаты напрямую не совсем корректно. Например, конкурент Google, модель Claude от Anthropic, тоже пыталась пройти Pokemon Red, но пока не смогла достичь такого же успеха.

Такой необычный эксперимент в очередной раз показывает, что современные языковые модели справляются уже с действительно сложными задачами, но и сами не застрахованы от паники и растерянности — особенно когда сталкиваются с неожиданными ситуациями или некорректными данными. Пока что внешние инструменты и поддержка человека играют большую роль, чем «чистый» искусственный интеллект.

Gemini Plays Pokémon — это эффектный эксперимент и своеобразный тест на адаптивность крупных языковых моделей, который, несмотря на все успехи, напоминает нам о том, что путь к искусственному разуму по-прежнему тернист. И похоже, что покемоны по-прежнему могут ставить ИИ в тупик!

Автор bmlabs

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *