A Meta anunciou no sábado (5) o Llama 4, nova geração do seu modelo de linguagem de grande escala (LLM) que chega com três versões, incluindo uma ainda em desenvolvimento, apontadas como as mais poderosas lançadas pela empresa até o momento. Cada uma delas é focada em tarefas diferentes.
Uma das estreias, o Llama 4 Scout usa Combinação de Especialistas (MoE) com 17 bilhões de parâmetros ativos e foi treinado com 16 especialistas. Ele oferece janela de contexto de 10 milhões de tokens, pode ser usado com a GPU Nvidia H100 e supera modelos como o Gemma 3 e Gemini 2.0 Flash Lite, do Google, e Mistral 3.1, segundo a big tech.
Já o Llama 4 Maverick traz os mesmos 17 bilhões de parâmetros ativos, porém contou com 128 especialistas no treinamento. A dona do Facebook afirma que ele supera o GPT-4o e o Gemini 2.0 Flash em uma ampla gama de benchmarks aceitos, apresentando resultados comparáveis ao DeepSeek v3 em codificação e raciocínio, mesmo tendo metade dos parâmetros ativos.
O terceiro integrante da nova geração de modelos Llama 4 da Meta é o Llama 4 Behemoth. Ainda em treinamento, ele tem obtido resultados superiores ao GPT-4.5, Claude Sonnet 3.7 e Gemini 2.0 Pro em benchmarks focados em STEM, como explicou a gigante da tecnologia.
O que é um modelo de IA multimodal?

Sistemas de IA multimodais são aqueles com capacidade para trabalhar com diferentes tipos de dados, combinando e analisando variadas formas de entrada para uma compreensão mais abrangente, gerando resultados robustos. Por sua vez, os modelos convencionais lidam com apenas um tipo.
Ao compartilhar uma foto com a versão multimodal, por exemplo, ela consegue criar um resumo textual descrevendo o que vê na imagem e também pode fazer o contrário, analisando um prompt de texto com a solicitação da criação de uma imagem para gerá-la. Vídeo e áudio são outros formatos compatíveis, dependendo da versão.
Na nova geração de modelos da Meta, o Llama 4 Scout é uma opção dedicada aos usuários interessados em trabalhar com textos e imagens, como explicou a empresa liderada por Mark Zuckerberg. Considerado uma versão mais básica, ele atende profissionais e empresas em busca de ferramentas inteligentes para tarefas menos complexas.
Mais avançado, o Llama 4 Maverick possui capacidade para trabalhar com atividades que exijam maior desempenho, como processamento de grandes quantidades de informações para resumos de vários documentos, sendo indicado para usuários corporativos de médio e grande porte. Já o Llama 4 Behemoth será destinado às empresas que queiram desenvolver seus próprios modelos.
Meta AI com Llama 4

As capacidades da nova geração de modelos Llama 4 podem ser testadas na Meta AI no WhatsApp, Messenger, Instagram e na versão web da plataforma, de acordo com a gigante da tecnologia. A atualização será lançada em mais de 40 países e 13 idiomas.
Porém, os novos recursos multimodais estão restritos aos Estados Unidos e ao idioma inglês, neste primeiro momento. A Meta disse que disponibilizará a Meta AI com Llama 4 para mais pessoas ao redor do mundo ainda este ano, sem confirmar um prazo mais exato.
De código aberto, o Llama 4 Scout e o Llama 4 Maverick também podem ser baixados no site do modelo e na plataforma Hugging Face, permitindo que os desenvolvedores adicionem as novas ferramentas aos seus produtos.
Curtiu o conteúdo? Não se esqueça de compartilhar esta e outras notícias do TecMundo nas redes sociais.
Redirecionando…
Compartilhe isso:
- Clique para compartilhar no Facebook(abre em nova janela)
- Clique para compartilhar no X(abre em nova janela)
- Clique para enviar um link por e-mail para um amigo(abre em nova janela)
- Clique para compartilhar no Pinterest(abre em nova janela)
- Clique para compartilhar no Telegram(abre em nova janela)
- Clique para compartilhar no Threads(abre em nova janela)
- Clique para compartilhar no WhatsApp(abre em nova janela)