xAI представляет Grok-2, бросая вызов иерархии ИИ

15.08.2024

xAI представляет Grok-2, бросая вызов иерархии ИИ

Компания xAI объявила о выпуске Grok-2 – крупного обновления, которое может похвастаться улучшенными возможностями в области чата, программирования и рассуждений.

Наряду с Grok-2, xAI представила Grok-2 mini – меньшую, но способную версию основной модели. В настоящее время обе находятся в бета-версии на X и будут доступны через корпоративный API xAI позже в этом месяце.

Ранняя версия Grok-2 была протестирована в рейтинге LMSYS под псевдонимом “sus-column-r”.

На момент анонса xAI утверждает, что она превосходит как Claude 3.5 Sonnet от Anthropic, так и GPT-4-Turbo от OpenAI. Однако стоит отметить, что GPT-4o в настоящее время занимает первое место как лучший ИИ-ассистент с точки зрения общих возможностей, за ним следует Gemini 1.5 от Google.

Внутренний процесс оценки xAI использует AI Tutors для оценки моделей по различным реальным задачам. Компания заявляет, что “Grok-2 показал значительные улучшения в рассуждениях с извлеченным контентом и в возможностях использования инструментов, таких как правильное определение недостающей информации, рассуждение через последовательности событий и отбрасывание нерелевантных постов”.

Результаты тестов, опубликованные xAI, показывают, что как Grok-2, так и Grok-2 mini демонстрируют существенные улучшения по сравнению с Grok-1.5. Модели показывают конкурентоспособные результаты в таких областях, как научные знания на уровне выпускников, общие знания и задачи математических олимпиад. Особенно Grok-2 преуспевает в задачах, связанных со зрением, демонстрируя передовые результаты в визуальных математических рассуждениях и ответах на вопросы на основе документов.

Новый опыт работы с Grok на X включает обновленный интерфейс и новые функции. Подписчики Premium и Premium+ получат доступ как к Grok-2, так и к Grok-2 mini. xAI описывает Grok-2 как “более интуитивный, управляемый и универсальный в широком диапазоне задач, будь то поиск ответов, совместная работа над текстами или решение задач программирования”.

xAI также сотрудничает с Black Forest Labs для экспериментов с их моделью FLUX.1, чтобы расширить возможности Grok на X.

Для разработчиков xAI запускает корпоративную API-платформу в конце этого месяца. Компания обещает улучшенные функции безопасности, богатую статистику трафика и продвинутую аналитику биллинга. Также будет доступен API управления для интеграции управления командами, пользователями и биллингом в существующие инструменты и сервисы.

В будущем xAI планирует внедрить мультимодальное понимание как основную часть опыта работы с Grok как на X, так и в API. Быстрый прогресс компании с момента анонса Grok-1 в ноябре 2023 года приписывается “небольшой команде с самой высокой плотностью талантов”.

xAI по-прежнему фокусируется на развитии ключевых способностей рассуждения с помощью своего нового вычислительного кластера, стремясь сохранить свои позиции на переднем крае разработок ИИ. Однако недавно компания согласилась прекратить использование определенных данных из ЕС для обучения своих моделей.

Хотя выпуск Grok-2 знаменует собой значительную веху для xAI, очевидно, что ландшафт ИИ остается высококонкурентным. С ChatGPT-4o и Gemini 1.5 от Google, лидирующими в этой области, и другими крупными игроками, такими как Anthropic, продолжающими делать успехи, гонка за превосходство в области ИИ далека от завершения.