Conectando você ao futuro da tecnologia com informação, inovação e praticidade.

Home IA O mais recente modelo de IA aberta DiffusionGemma do Google vem com um aumento de velocidade de 4x

O mais recente modelo de IA aberta DiffusionGemma do Google vem com um aumento de velocidade de 4x

tecnotudoUpdated 3 semanas Ago1 Mins read64.6k Views

Outro dia, outro modelo de IA do Google. Desta vez, o Google DeepMind lançou um novo membro da família de modelos abertos Gemma 4, mas é fundamentalmente diferente do resto da linha. DiffusionGemma não gera resultados linearmente como a maioria dos modelos de IA. Em vez disso, pode produzir um bloco inteiro de texto em paralelo. Google diz isso o torna mais rápido e eficiente ao executar em hardware local, como uma Nvidia DGX ou uma humilde GPU para jogos.

A maioria dos modelos de IA são projetados para serem autoregressivos – eles geram texto da esquerda para a direita, um token por vez. DiffusionGemma tem mais em comum com modelos de geração de imagens, que começam com estática e depois eliminam o ruído para criar o conteúdo desejado. Este modelo utiliza um campo de tokens de espaço reservado que percorrem a tela várias vezes para gerar tokens prováveis e usá-los para melhorar a estimativa de outros. No final do processo, o modelo finaliza suas saídas de token em um grande bloco – a tela de texto “sem ruído”.

DiffusionGemma é bastante grande no domínio dos modelos abertos do Google. É um modelo Mixture of Experts (MoE) com um total de 26 bilhões de parâmetros, mas apenas 3,8 bilhões são ativados durante a inferência. Isso significa que ele deve caber na cota de 18 GB de RAM de uma GPU de última geração. Ao testar com um RTX 5090, o DiffusionGemma emite cerca de 700 tokens por segundo. Com um único acelerador Nvidia H100 AI, DiffusionGemma pode produzir mais de 1.000 tokens por segundo. Isso é cerca de quatro vezes a produção dos modelos Gemma autoregressivos de tamanho semelhante.

Leia o artigo completo

Comentários

Previous post Conseguimos colher alguns detalhes interessantes sobre a missão Artemis III

Next post O Mobi Fold da Logitech dobra-se para viagens, mas prefiro um mouse portátil diferente

O mais recente modelo de IA aberta DiffusionGemma do Google vem com um aumento de velocidade de 4x

Leave a comment

Deixe um comentário Cancelar resposta

O seu SUV Purosangue não é afiado o suficiente? A Ferrari tem tudo para você.

A Toyota construiu uma utopia privada de US$ 10 bilhões – o que está acontecendo aí?

F1 em Miami: é assim que parece quando uma atualização funciona

A aposta de Musk na Europa: Será que outros seguirão os holandeses e aprovarão o FSD?

O novo modelo de imagem Nano Banana 2 Lite do Google é o mais rápido e barato até agora

O plano de Trump de redesenhar todos os sites .gov leva a horrores projetados pela IA

SpaceX pode doar ações para contas poupança de Trump para crianças, diz relatório

Coreia do Sul gastará US$ 1 trilhão em mais produção de chips de memória e robôs humanóides

Há muito entusiasmo sobre os EVs chineses – algo disso é verdade?

O seu SUV Purosangue não é afiado o suficiente? A Ferrari tem tudo para você.

A Toyota construiu uma utopia privada de US$ 10 bilhões – o que está acontecendo aí?