Um modelo anônimo com o codinome sus-column-r tem se destacado recentemente na arena de grandes modelos de linguagem, gerando muitas especulações. Ontem, Musk finalmente revelou o mistério - este é o novo modelo Grok2 que a xAI está prestes a lançar.
O Grok2 teve um desempenho impressionante nos dados de competição oficialmente divulgados, alcançando altas taxas de vitória contra outros modelos populares como GPT-4o e Claude 3.5 Sonnet, exceto contra o Gemini 1.5 Pro da Google. Nos vários testes de referência, as capacidades do Grok2 também se mostraram comparáveis aos modelos de IA de ponta.
Uma grande atualização do Grok2 é a adição de funcionalidades de imagem, implementadas através de uma colaboração com FLUX.1. Os testes revelaram que o Grok2 é mais ousado na geração de imagens, podendo produzir conteúdo controverso, como paródias de figuras públicas. Isso pode trazer alguns riscos legais.
No uso prático, o Grok2 teve um bom desempenho em algumas questões básicas, como comparação de decimais e contagem, que são problemas comuns em que a IA costuma errar. Suas respostas geralmente são bastante detalhadas. No entanto, em questões que requerem compreensão mais profunda, o GPT-4o ainda mantém uma vantagem.
No geral, o Grok2 realmente demonstrou uma melhoria significativa em suas capacidades, especialmente em áreas como matemática. Contudo, ainda há uma lacuna em comparação com outros modelos de IA de ponta, necessitando de mais aprimoramentos. Este lançamento demonstra a ambição e o progresso da xAI no campo da IA.