Анонимная модель с кодовым названием sus-column-r недавно показала отличные результаты на арене крупных языковых моделей, что вызвало множество предположений. Вчера Маск наконец раскрыл загадку - это новая модель Grok2, которую вскоре выпустит xAI.
Grok2 показала хорошие результаты в официально опубликованных данных соревнований, достигнув высокого процента побед над другими популярными моделями, такими как GPT-4o и Claude 3.5 Sonnet, за исключением Gemini 1.5 Pro от Google. В различных эталонных тестах способности Grok2 также оказались сопоставимы с ведущими ИИ-моделями.
Одним из главных улучшений Grok2 стало добавление функций работы с изображениями, реализованное в сотрудничестве с FLUX.1. Тесты показали, что Grok2 более смела в генерации изображений, способна создавать некоторый спорный контент, например, пародии на публичных личностей. Это может привести к определенным юридическим рискам.
В практическом использовании Grok2 хорошо справляется с некоторыми базовыми задачами, такими как сравнение десятичных дробей и счет - типичные задачи, в которых ИИ часто ошибается. Ее ответы обычно довольно подробны. Однако в вопросах, требующих глубокого понимания, GPT-4o все еще имеет преимущество.
В целом, Grok2 действительно демонстрирует заметное улучшение возможностей, особенно в таких областях, как математика. Однако по сравнению с другими ведущими ИИ-моделями у нее все еще есть недостатки, требующие дальнейшего совершенствования. Этот релиз демонстрирует амбиции и прогресс xAI в области искусственного интеллекта.