"O progresso do Grok é como um foguete." Musk anunciou entusiasticamente a chegada do Grok-2 no X.
No dia 14 de agosto, horário local, a xAI lançou versões de teste de dois modelos de IA, Grok-2 e Grok-2mini. O Grok-2 é o modelo de linguagem mais poderoso da empresa em termos de capacidade de raciocínio, enquanto o Grok-2mini, um modelo leve, é um "produto irmão" do Grok-2, tentando alcançar funcionalidades poderosas com um número menor de parâmetros.
A xAI afirmou em uma postagem de blog que a versão prévia do Grok-2 representa um avanço significativo em relação ao Grok-1.5, com recursos de ponta em conversação, codificação e raciocínio.
A empresa alega que uma versão inicial do Grok-2, testada sob o nome "sus-column-r", superou o Claude 3.5 Sonnet da Anthropic e o GPT-4-Turbo da OpenAI no ranking LMSYS. O ranking LMSYS é determinado por "duelos" um-a-um anônimos e aleatórios entre modelos de linguagem grandes, baseados no sistema de classificação ELO.
O sus-column-r (versão inicial do Grok 2) está agora disponível publicamente e, com mais de 12.000 votos da comunidade, alcançou o 3º lugar no ranking geral, empatado com o GPT-4o. Ficou em 2º lugar em codificação, 4º em prompts difíceis e 2º em matemática.
A xAI também testou a interação do Grok com os novos modelos através de um sistema de tutoria de IA, avaliando as capacidades do Grok-2 em duas áreas-chave: seguir instruções e fornecer informações precisas e verdadeiras. O Grok-2 demonstrou melhorias significativas na capacidade de raciocinar sobre conteúdo recuperado e no uso de ferramentas, como identificar corretamente informações ausentes, raciocinar através de sequências de eventos e descartar postagens irrelevantes.
Além disso, a xAI avaliou o modelo Grok-2 em uma série de benchmarks acadêmicos, incluindo raciocínio, compreensão de leitura, matemática, ciência e codificação. A empresa afirma que "o desempenho em áreas como conhecimento científico de nível de pós-graduação, senso comum e problemas de competição matemática é comparável a outros modelos de ponta."
Musk está integrando profundamente a xAI com a plataforma de mídia social "X" que ele adquiriu - Grok-2 e Grok-2mini suportarão recursos de busca aprimorados, compreensão aprofundada de postagens e funcionalidades de resposta melhoradas no X, embora a xAI tenha enfrentado oposição anteriormente por treinar usando dados de usuários do X.
Um destaque desta atualização é que o modelo Grok-2 pode gerar imagens no X, usando o modelo Flux.1 recentemente popular para geração de imagens, mas atualmente limitado a usuários Premium e Premium+ no X.
Como a função de geração de imagens do Grok não tem restrições, muitos usuários já a utilizaram para criar imagens de figuras políticas. Por exemplo, um usuário usou o Grok-2 para gerar uma imagem do primeiro presidente dos EUA, George Washington, que foi até repostada por Musk. No entanto, o ChatGPT da OpenAI recusaria gerar tais imagens para evitar riscos políticos.
É importante notar que Grok-2 e Grok-2mini ainda estão em fase de teste. A empresa espera disponibilizar ambos os modelos para desenvolvedores através de sua API empresarial no final deste mês. A próxima API é construída sobre uma nova pilha tecnológica personalizada, permitindo implantação de inferência multi-regional para acesso global de baixa latência, ao mesmo tempo que oferece recursos de segurança aprimorados como autenticação multifator obrigatória, estatísticas de tráfego e análises avançadas de faturamento.
Após se separar da OpenAI, Musk previu que a inteligência artificial geral seria alcançada em 2029, e o objetivo final da xAI que ele fundou é tornar produtos de IA acessíveis a consumidores, empresas e até todos, transformando-os em ferramentas úteis. Espera-se que a IA ajude as pessoas a resolver problemas complexos de ciência e matemática e "compreenda" o universo.
As ações da xAI também estão se acelerando. A empresa realizou sua primeira rodada de financiamento em janeiro de 2024, levantando $135 milhões; em maio, concluiu uma rodada de financiamento Série B de $6 bilhões, com a avaliação da empresa saltando de $18 bilhões para $25 bilhões, tornando-se mais um unicórnio de IA nos Estados Unidos.
Em julho, Musk afirmou que a equipe da xAI começou a treinar no "supercluster Memphis". Este cluster consiste em 100.000 GPUs H100 resfriadas a líquido, com o objetivo de treinar "a IA mais poderosa do mundo em todas as métricas" até dezembro deste ano.
Suas ambições vão além disso, tendo revelado planos da xAI para construir uma "superfábrica de poder computacional", prevista para ser quatro vezes maior que a do concorrente mais poderoso do mercado.
Como um "recém-chegado" no campo dos grandes modelos, Musk acredita que a xAI pode trazer novos avanços e inovações na área de inteligência artificial, enfatizando que a competição é benéfica para impulsionar o progresso em toda a indústria, evitando um mundo unipolar dominado por uma única empresa no campo da IA.
No entanto, com base nos dois modelos recém-lançados, não demonstraram inovação que supere a indústria, ainda desempenhando o papel de perseguidores. Para que o Grok-2 se destaque na competição com empresas de tecnologia como OpenAI e Google, será necessário apresentar produtos mais poderosos.