Работа
19 февраля, 2025
Техника

Grok-3 Илона Маска — это прорыв?

Разбираемся, чем хорош «самый умный ИИ на планете»

Grok-3 Илона Маска — это прорыв?

Photo by Shutterstock

Времена «убийц айфона» прошли. Теперь новые технологические продукты штурмуют другую планку — стараются превзойти Chat GPT. Очередной претендент на роль самого умного ИИ на планете — Grok-3, который недавно представила созданная Илоном Маском компания xAI. 

В чем сила, Grok? 

Для успеха на переполненном предложениями рынке искусственного интеллекта важно предъявить пользователю что-то уникальное. Китайская ИИ-модель DeepSeek привлекает бесплатным доступом, Claude от Anthropic славится философским подходом, Gemini от Gogle умеет работать с видео. А что насчет Grok? У него сразу три козыря. 

  • Во-первых, в нем принципиально нет цензуры. Если Deepseek следует заветам китайской компартии, а Chat GPT, Claude, Gemini и Copilot — правилам политкорректности, то Grok демонстративно их нарушает. Ирония в том, что при этом модель часто подвергается критике за распространение дезинформации. 
  • Во-вторых, Grok, по заявлению самого Илона Маска, будет использоваться в космических полетах на Марc. Это выглядит, скорее, как приятный психологический бонус для любителей SpaceX. 
  • И в-третьих, если вернуться с неба на землю, он обладает вычислительной мощностью, превышающей своего предшественника (Grok 2) более чем в 10 раз. В переводе с маркетингового на человеческий это означает, что для обучения модели использовался суперкомпьютер с 200 тысячами графических процессоров вместо прежних 20 тысяч. 

По данным xAI, Grok-3 превосходит GPT-4o, Google Gemini и DeepSeek V3 при выполнении задач по математическим вычислениям, естественным наукам и программированию. И это звучит вполне правдоподобно. Ведь предыдущая версия Grok уже демонстрировала выдающиеся результаты в визуальном математическом анализе — это способность модели понимать и решать задачи, в которых необходимо анализировать графики, диаграммы и уравнения. 

Что нового в третьей версии 

Новый Grok-3 — это на самом деле не одна, а целых четыре модели. 

  • Grok-3 — основная модель с базовым набором функций; 
  • Grok-3 Mini — облегченная версия, обеспечивающая более быструю работу с некоторой потерей точности;
  • Grok-3 Reasoning  модель, специально разработанная для углубленного анализа, превосходящая другие модели в тестах по математике и программированию;
  • Grok-3 Mini Reasoning — облегченная версия модели с расширенными аналитическими возможностями.

Все модели доступны в мобильном приложении Grok и предлагают пользователям два новых режима работы. 

Think предназначен для стандартных запросов и повседневного использования, активирует функцию рассуждений для более глубокого анализа. 

Big Brain оптимизирован для сложных вычислений, научных исследований и программирования; обеспечивает более высокую точность ответов за счет привлечения дополнительных вычислительных ресурсов. 

Оба режима доступны во всех четырех вариантах модели, что призвано обеспечить более тонкие настройки и помочь адаптировать работу ИИ под конкретные задачи. 

  • Например, если вам нужно просто узнать новости или получить быстрый ответ на конкретный вопрос, можно выбрать Grok-3 Mini в режиме Think. 
  • Если требуется сложный анализ данных или решение математической задачи, можно включить Grok-3 Reasoning в режиме Big Brain и потратить больше времени и ресурсов на обработку запроса. 
  • А если нужен оптимальный баланс между затратами ресурсов и качеством, можно использовать Grok-3 в режиме Think. 

В ближайшее время компания планирует добавить в приложение голосовой режим, аналогичный Advanced Voice Mode в ChatGPT, который позволит пользователям давать ИИ команды голосом и получать голосовые ответы. 

Цена вопроса 

Тут ситуация довольно запутанная. Во-первых, приложение Grok пока доступно только в США. Во-вторых, для получения доступа к функционалу Grok 3 нужна платная подписка X Premium+. Стоимость ее недавно увеличилась и теперь составляет от $40 до $50 в месяц в зависимости от региона. Российской картой оплатить не получится.

От Reminder. О том, как скачать в AppStore приложения, недоступные для вашего региона, и оплатить подписку на них из России, мы описывали здесь

Кроме того, xAI анонсировала новый тариф SuperGrok ($30 в месяц или $300 в год), который предоставит «самые продвинутые возможности» и «самый ранний доступ к новым функциям». Какие именно — пока не уточняется. Неопределенности добавляет и то, что компания так и не сообщила, будет ли SuperGrok дополнительным платежом к подписке X Premium+ или отдельным тарифом. 

Полевые испытания 

Обзоры новой модели опубликовали многие онлайн-издания. Наиболее близким к реальным запросам рядового пользователя нам показался тест, который провела обозревательница технопортала Tom’s Guide Аманда Кэсвелл. Вот его результаты. 

Квантовая физика на пальцах 

  • Режим Think
  • Стандартная модель Grok-3 

Чтобы проверить способность Grok 3 понимать и объяснять сложные понятия, Аманда задала модели вопрос: «Объясни понятным языком, что такое квантовая запутанность». 

Полный ответ Grok 3 на вопрос о квантовой запутанности с примерами и описанием механизма квантовой криптографии для создания защищенных каналов связи.
Полный ответ Grok 3 на вопрос о квантовой запутанности с примерами и описанием механизма квантовой криптографии для создания защищенных каналов связи.

Насколько просто и понятно умеет объяснять Grok 3 — судите сами. Вот перевод первой части его ответа: 

«Квантовая запутанность — одно из самых удивительных и сложных явлений квантовой механики. Она возникает, когда две или более частиц становятся связанными так, что их состояния больше не являются независимыми, даже если они находятся на огромном расстоянии друг от друга. Это означает, что свойства одной частицы (например ее позиция, импульс или спин) напрямую связаны со свойствами другой независимо от расстояния между ними». 

Для наглядности Grok 3 даже сравнивает запутанные частицы с сиамскими близнецами, которые мгновенно реагируют друг на друга — «вне зависимости от расстояния». Но это, скорее, мистика, чем наука. Гораздо гармоничнее выглядела бы стандартная аналогия с двумя синхронизированными часами: глядя на одни, вы точно знаете, сколько времени показывают другие, даже если они находятся в другой галактике. Кроме того, в ответе Grok 3 нет ссылок на источники. 

Глубокий поиск 

  • Режим Think
  • Модель Grok-3 Reasoning 

Вторая опция на тестировании — DeepSearch. Глубокий поиск — еще одна ключевая инновация Grok 3. Задача этого инструмента — конкурировать с поисковыми системами конкурентов, выполняя интеллектуальный поиск по открытым источникам в интернете, анализируя большие объемы информации и предоставляя сжатые аналитические сводки. 

В тесте Grok-3 c включенной опцией DeepSearch получил такой запрос: «сделай краткий обзор свежих исследований в области возобновляемых источников энергии, опубликованных за последний месяц». 

Grok 3 отвечает на вопрос о свежих исследований в области возобновляемых источников энергии, опубликованных за последний месяц.
Grok 3 отвечает на вопрос о свежих исследований в области возобновляемых источников энергии, опубликованных за последний месяц.

Grok-3 быстро собрал информацию из разных источников и представил ответ, охватывающий несколько направлений исследований, включая стратегии интеграции ИИ в энергосистему. Такая широта охвата демонстрирует глубокое понимание контекста, отмечает обозревательница. 

Но не обошлось без упущений. В ответе отсутствуют ссылки на конкретные исследования, публикации или данные, относящиеся к последнему месяцу (с середины января по середину февраля 2025 года). Вместо этого ИИ использует обтекаемые фразы типа «исследования продолжились» и «судя по всему, разработаны новые методы». 

Мозговой штурм

  • Режим Big Brain
  • Модель Grok-3 Reasoning 

Для проверки аналитических способностей Grok 3 был выбран запрос: «проанализируй экономические последствия введения базового дохода в развитых странах». 

Grok 3 анализирует экономические последствия введения базового дохода.
Grok 3 анализирует экономические последствия введения базового дохода.

Grok-3 справился с задачей довольно неплохо: рассмотрел плюсы и минусы подхода, привел ссылки на исследования и пилотные программы. Но сделал акцент на краткосрочных эффектах введения базового дохода, оставив без внимания долгосрочные последствия. 

Генерация изображений 

  • Режим Big Brain 
  • Модель Grok-3 

За создание изображений в Grok 3 отвечает встроенная нейросеть Aurora, которая тоже получила ряд обновлений. Прежде всего это улучшенная фотореалистичность, особенно при создании детализированных пейзажей. И — сюрприз — «этические рамки». Впервые в Aurora появились ограничения на создание изображений, связанных с насилием, сексом и другими «деликатными темами». 

Что ж, тестовый запрос не касался таких тем. Grok 3 попросили создать фотореалистичное изображение футуристического города на закате. 

Футуризм без летающих машин — как тебе такое, Илон Маск? Созданные Grok 3 футуристические городские пейзажи отличаются впечатляющей фотореалистичностью, правдоподобными световыми эффектами, разнообразием ракурсов и перспектив. Но лишены креативности и интеллектуальной смелости.
Футуризм без летающих машин — как тебе такое, Илон Маск? Созданные Grok 3 футуристические городские пейзажи отличаются впечатляющей фотореалистичностью, правдоподобными световыми эффектами, разнообразием ракурсов и перспектив. Но лишены креативности и интеллектуальной смелости.

Модель выдала несколько красивых изображений с хорошей детализацией, правдоподобными световыми и атмосферными эффектами. Однако, пишет автор обзора, при всей технической безупречности изображениям не хватает по-настоящему футуристических элементов. Такое впечатление, как будто система намеренно придерживается консервативного видения будущего. 

Это прорыв? 

Скорее, хороший задел на будущее. Grok-3 действительно справляется с анализом сложных вопросов и умеет доступно объяснять научные концепции. Его сильные стороны — логичная структура ответов, обширный контекст и способность к глубокой проработке тем. Есть и слабости, вроде недостатка ссылок на авторитетные источники, однобокости в подходе и проблем с креативностью при генерации изображений. Но дело даже не в них. 

Grok 3 демонстрирует тот же принципиальный изъян, что и его конкуренты. Как бы убедительно и умно он ни отвечал, вам все равно придется потратить время на самостоятельную перепроверку информации, а это с высокой вероятностью сведет выигрыш от использования интеллектуального помощника к минимуму. Так что заявления Илона Маска о «пугающем интеллекте» новой модели пока кажутся преждевременными.

Вы уже оценили материал
Продолжайте читать

Рассылка Reminder «15 полезных ссылок»: выпуск 75

Парадокс усилий, тренировка «12-3-30» и час со смартфоном в постели
Сознание
1 апреля, 2025
Новое

Может ли ИИ заменить психотерапевта? Новое исследование дает ответ

Общение с искусственным интеллектом снижает проявления депрессии на 51%

Общение с искусственным интеллектом снижает проявления депрессии на 51%

Может ли ИИ заменить психотерапевта? Новое исследование дает ответ
SPECIAL
10 марта, 2025

Обучение для взрослых: как начать и не бросить

14 приемов, проверенных наукой и лабораторией Яндекс Практикума

14 приемов, проверенных наукой и лабораторией Яндекс Практикума

Обучение для взрослых: как начать и не бросить