NVIDIA une forças com Mistral AI para lançar nova potência, modelo compacto de 12 bilhões de parâmetros estreia impressionante, superando o desempenho do Llama 3, pode ser executado em uma única placa de vídeo 4090

A Mistral lançou um novo modelo de inteligência artificial, o NeMo 12B, que supera produtos similares em desempenho.

A Mistral AI e a NVIDIA lançaram conjuntamente o Mistral NeMo, um novo modelo de linguagem pequeno de 12B parâmetros que supera o Gemma 2 9B e o Llama 3 8B em vários benchmarks.

Principais características do Mistral NeMo:

  • 12 bilhões de parâmetros
  • Janela de contexto de 128K
  • Treinado na plataforma NVIDIA DGX Cloud AI
  • Otimizado com NVIDIA TensorRT-LLM e framework NeMo
  • Lançado sob licença Apache 2.0
  • Usa formato de dados FP8 para inferência eficiente
  • Projetado para casos de uso empresarial

Desempenho:

  • Supera o Gemma 2 9B e o Llama 3 8B em conversas de múltiplos turnos, matemática, raciocínio de senso comum, conhecimento do mundo e benchmarks de codificação
  • Ligeiramente atrás do Gemma 2 9B no benchmark MMLU

Principais capacidades:

  • Suporte multilíngue para 11 idiomas
  • Novo tokenizador Tekken baseado no Tiktoken, mais eficiente que o SentencePiece
  • Ajuste avançado de instruções para melhor seguimento de instruções, raciocínio e geração de código

Implantação:

  • Pode ser executado em uma única GPU NVIDIA L40S, GeForce RTX 4090 ou RTX 4500
  • Compatível com sistemas existentes que usam o Mistral 7B
  • Facilmente implantável em minutos em várias plataformas

A colaboração aproveita a experiência da Mistral AI em dados de treinamento e o ecossistema otimizado de hardware/software da NVIDIA. O Mistral NeMo visa fornecer às empresas uma solução de IA poderosa, mas prática, que pode ser prontamente integrada em aplicações comerciais.

Link para Mistral AI Link para NVIDIA