Амбиции Маска в сфере ИИ: секретное сочетание чипов Tesla и данных 𝕏

Анонимная модель с кодовым названием sus-column-r недавно показала отличные результаты на арене крупных языковых моделей, что вызвало множество предположений. Вчера Маск наконец раскрыл загадку - это новая модель Grok2, которую вскоре выпустит xAI.

Grok2 показала хорошие результаты в официально опубликованных данных соревнований, достигнув высокого процента побед над другими популярными моделями, такими как GPT-4o и Claude 3.5 Sonnet, за исключением Gemini 1.5 Pro от Google. В различных эталонных тестах способности Grok2 также оказались сопоставимы с ведущими ИИ-моделями.

Одним из главных улучшений Grok2 стало добавление функций работы с изображениями, реализованное в сотрудничестве с FLUX.1. Тесты показали, что Grok2 более смела в генерации изображений, способна создавать некоторый спорный контент, например, пародии на публичных личностей. Это может привести к определенным юридическим рискам.

В практическом использовании Grok2 хорошо справляется с некоторыми базовыми задачами, такими как сравнение десятичных дробей и счет - типичные задачи, в которых ИИ часто ошибается. Ее ответы обычно довольно подробны. Однако в вопросах, требующих глубокого понимания, GPT-4o все еще имеет преимущество.

В целом, Grok2 действительно демонстрирует заметное улучшение возможностей, особенно в таких областях, как математика. Однако по сравнению с другими ведущими ИИ-моделями у нее все еще есть недостатки, требующие дальнейшего совершенствования. Этот релиз демонстрирует амбиции и прогресс xAI в области искусственного интеллекта.

Амбиции Маска в сфере ИИ: секретное сочетание чипов Tesla и данных 𝕏

Маск, похоже, проявил определенную степень предвзятости.