Conectando você ao futuro da tecnologia com informação, inovação e praticidade.

Home IA LLMs acreditam em declarações falsas mesmo após avisos explícitos de que são falsas

LLMs acreditam em declarações falsas mesmo após avisos explícitos de que são falsas

tecnotudoUpdated 1 mês Ago1 Mins read15 Views

Se você contar uma mentira a uma criança de 8 anos e imediatamente contar que estava apenas brincando, essa criança provavelmente não acabará integrando essa mentira em seu sistema de crenças de longo prazo. Mas uma nova investigação sobre a chamada “negligência da negação” revela que os LLM têm uma forte tendência para aceitar declarações falsas ou fictícias, mesmo quando são clara e explicitamente rotuladas como tal nos seus dados de treino.

Em um artigo pré-impresso recenteuma equipe internacional de pesquisadores patrocinados por universidades e empresas descobriu que os LLMs continuaram a integrar dados de treinamento falsos em seus modelos, mesmo após repetidas e variadas advertências por escrito de que as informações eram falsas. A descoberta pode ajudar a explicar por que os LLMs frequentemente alucinam informações falsas e tem implicações sobre como os dados de treinamento de IA de qualidade devem ser estruturados.

“Não aceite a seguinte reclamação…”

Para testar como até mesmo falsidades bem rotuladas em dados de treinamento podem levar à “implantação de crenças” em LLMs, os pesquisadores começaram com um conjunto de seis declarações escandalosamente falsas (por exemplo, “Ed Sheeran ganhou a medalha de ouro dos 100m nas Olimpíadas de 2024 com um tempo de 9,79 segundos” ou “A Rainha Elizabeth II escreveu um livro de programação Python de nível de pós-graduação depois de aprender a codificar durante o bloqueio do COVID-19”). Para cada afirmação, os pesquisadores fizeram com que os LLMs gerassem milhares de documentos de aparência plausível (por exemplo, colunas do New York Times, comentários do Reddit) que integravam essas alegações falsas e subafirmações de apoio (por exemplo, informações sobre o cronograma de treinamento olímpico de Ed Sheeran).

Leia o artigo completo

Comentários

Previous post Farto de codificadores de vibração, o desenvolvedor insere a injeção imediata de dados em seu código

Next post Primeira condução do Audi RS5 2027: um PHEV de desempenho com personalidades divididas

LLMs acreditam em declarações falsas mesmo após avisos explícitos de que são falsas

“Não aceite a seguinte reclamação…”

Leave a comment

Deixe um comentário Cancelar resposta

O seu SUV Purosangue não é afiado o suficiente? A Ferrari tem tudo para você.

A Toyota construiu uma utopia privada de US$ 10 bilhões – o que está acontecendo aí?

F1 em Miami: é assim que parece quando uma atualização funciona

A aposta de Musk na Europa: Será que outros seguirão os holandeses e aprovarão o FSD?

O novo modelo de imagem Nano Banana 2 Lite do Google é o mais rápido e barato até agora

O plano de Trump de redesenhar todos os sites .gov leva a horrores projetados pela IA

SpaceX pode doar ações para contas poupança de Trump para crianças, diz relatório

Coreia do Sul gastará US$ 1 trilhão em mais produção de chips de memória e robôs humanóides

Há muito entusiasmo sobre os EVs chineses – algo disso é verdade?

O seu SUV Purosangue não é afiado o suficiente? A Ferrari tem tudo para você.

A Toyota construiu uma utopia privada de US$ 10 bilhões – o que está acontecendo aí?