O boom generativo da IA elevou o custo da memória para a estratosfera, e o Google é uma parte fundamental dessa tendência. Portanto, é justo que o Google ofereça alguns modelos de IA locais com menos consumo de RAM. A empresa anunciou o lançamento de um novo modelo Gemma 4 isso preenche uma lacuna na programação lançada no início deste ano. O novo modelo é eficiente o suficiente para que você possa executá-lo em um laptop de consumo médio.
Em abril, o Google lançou quatro modelos da família Gemma 4, o que também marcou a mudança para uma licença Apache 2.0 mais aberta. Os modelos iniciais incluíam duas opções otimizadas para dispositivos móveis (E2B e E4B), juntamente com um par de modelos para trabalhos mais sérios (26B Mixture of Experts e 31B Dense). Isso deixou um grande espaço não atendido no meio, exatamente onde o novo modelo se enquadra.
O Gemma 4 12B é consideravelmente mais capaz do que as versões móveis, mas não exigirá um acelerador de IA de US$ 20.000 para funcionar localmente. O Google afirma que o Gemma 4 12B é o único que pode ser executado em muitos laptops de consumo sem sacrificar a qualidade. Contanto que você tenha um computador com 16 GB de RAM de sistema ou VRAM, o modelo de 12 bilhões de parâmetros funcionará. Isso é cerca de metade do consumo total de memória do Gemma 4 26B MoE, e o Google afirma que o novo modelo é quase tão capaz, pelo menos no que diz respeito aos benchmarks.
Leia o artigo completo
Comentários
Leave a comment