IA que raciocina mais alucina mais: novos modelos da OpenAI "viajam" bastante

Apesar de serem considerados modelos de inteligência artificial (IA) de última geração, o o3 e o o4-mini, lançados recentemente pela OpenAI, estão enfrentando um problema peculiar: eles inventam muitas coisas (alucinam).

Foto de Meu Quadradinho Por Meu Quadradinho
20/04/2025 às 20:06:54 - Atualizado há

Foto: Olhar Digital
Foto: Olhar Digital

Apesar de serem considerados modelos de inteligência artificial (IA) de última geração, o o3 e o o4-mini, lançados recentemente pela OpenAI, estão enfrentando um problema peculiar: eles inventam muitas coisas (alucinam). E o pior, fazem isso mais do que seus antecessores.

As chamadas "alucinações" são um dos maiores desafios na evolução da IA. Elas acontecem quando os modelos geram informações falsas ou inventadas, mesmo quando parecem confiantes em suas respostas. Historicamente, cada nova versão melhorava nesse aspecto, alucinando menos. Mas, surpreendentemente, o o3 e o o4-mini estão indo na direção oposta.

Alucinação preocupante

Testes da OpenAI revelaram que o o3 alucina em 33% das vezes ao responder perguntas sobre pessoas no PersonQA, o benchmark interno da startup. Já o o4-mini foi ainda pior, "viajando" 48% da vezes. Para comparação, modelos anteriores como o o1 e o o3-mini tinham taxas de erro de apenas 16% e 14,8%, respectivamente.

Pesquisadores independentes também notaram comportamentos estranhos. Em testes do Transluce, um laboratório de pesquisa de IA sem fins lucrativos, o o3 afirmou executar código em um MacBook Pro 2021 fora do ChatGPT, algo que ele não pode fazer. Além disso, usuários relataram links quebrados fornecidos pelo modelo em tarefas de codificação. Esses erros podem parecer pequenos, mas têm grande impacto em setores onde a precisão é crucial, como escritórios de advocacia ou empresas de saúde.

Leia também:

Por outro lado, esses modelos continuam impressionando em áreas como matemática e programação. O problema é que, enquanto buscam respostas mais detalhadas e criativas, as chances de inventar informações aumentam. A OpenAI admitiu que ainda não sabe por que isso está acontecendo e reconheceu que encontrar uma solução será essencial para o futuro da IA.

Uma possível saída é permitir que os modelos consultem a internet em tempo real. Testes internos da OpenAI mostram que o GPT-4o com pesquisa na web alcança 90% de precisão em algumas tarefas. No entanto, essa solução levanta questões de privacidade, já que os prompts dos usuários podem ser expostos a terceiros.

Via TechCrunch

Comentários

Notícias sobre Ciência&Tecnologia

ChatGPT passa a ser uma das marcas mais valiosas do mundo

ChatGPT

ChatGPT passa a ser uma das marcas mais valiosas do mundo

O ChatGPT estreou no ranking 100 das marcas mais valiosas do mundo elaborado pela consultoria Kantar.

Veja voo que pode nos levar à era hipersônica

Avião Hipersônico

Veja voo que pode nos levar à era hipersônica

A startup estadunidense Venus Aerospace, sediada em Houston (EUA), atingiu marco histórico ao realizar o primeiro voo de teste com um motor-foguete de...

Entrevista: Microsoft promete deixar a IA mais presente no seu dia a dia!

Microsoft

Entrevista: Microsoft promete deixar a IA mais presente no seu dia a dia!

O Microsoft Build 2025, a conferência anual da big tech voltada para desenvolvedores, começou nesta segunda-feira (22).

Lotofácil 3395: veja resultado de hoje, segunda-feira (19)

Aposta

Lotofácil 3395: veja resultado de hoje, segunda-feira (19)

O sorteio do concurso 3395 da Lotofácil, com prêmio de R$ 5 milhões, foi realizado na noite desta segunda-feira (19), direto do Espaço da

Criador da bomba termonuclear escondeu segredo por décadas

bomba

Criador da bomba termonuclear escondeu segredo por décadas

Richard Garwin, reconhecido como o “pai” da bomba termonuclear (também chamada de bomba de hidrogênio ou bomba H), faleceu na última

Tecnologia ajudou a mudar debate sobre OVNIs, afirma ex-Pentágono

ovni

Tecnologia ajudou a mudar debate sobre OVNIs, afirma ex-Pentágono

A crescente disseminação da tecnologia e o acesso facilitado à informação têm desempenhado um papel fundamental na...

Leia estas Notícias

Fiocruz é homenageada na abertura da Assembleia Mundial da Saúde

Assembleia Mundial da Saúde

Fiocruz é homenageada na abertura da Assembleia Mundial da Saúde

A Fundação Oswaldo Cruz (Fiocruz) foi destaque nesta segunda-feira (19), na 78ª Assembleia Mundial da Saúde, em Genebra, na...

Ex-coordenador da PRF confirma ações para barrar eleitores em 2022

Golpe de Estado

Ex-coordenador da PRF confirma ações para barrar eleitores em 2022

O ex-coordenador de inteligência da Polícia Rodoviária Federal (PRF) Adiel Pereira Alcântara confirmou nesta segunda-feira (19) a...

Gripe aviária não deve impactar preço da carne de frango, diz ministro

Gripe Aviária

Gripe aviária não deve impactar preço da carne de frango, diz ministro

O ministro da Agricultura e Pecuária, Carlos Fávaro, afirmou nesta segunda-feira (19) que os focos detectados de gripe aviária no Rio Grande do

Ibama

Ibama aprova plano da Petrobras sobre fauna na Foz do Amazonas

O Instituto Brasileiro do Meio Ambiente e dos Recursos Naturais Renováveis (Ibama) aprovou o conceito do Plano de Proteção e Atendimento...

Como vitória da direita pode afetar imigrantes brasileiros em Portugal

extrema direita

Como vitória da direita pode afetar imigrantes brasileiros em Portugal

A vitória da coligação de centro-direita e o aumento de 383% no número de assentos ocupados pela extrema direita no parlamento de...

Ednaldo desiste de recurso no Supremo para voltar ao comando da CBF

CBF

Ednaldo desiste de recurso no Supremo para voltar ao comando da CBF

O ex-presidente da Confederação Brasileira de Futebol (CBF) Ednaldo Rodrigues desistiu do recurso protocolado no Supremo Tribunal Federal (STF) para...

Blogs & Colunas
Horóscopo
Camarão entre os mais saborosos do mundo tem mais de 30 cm e custa R$ 400 por quilo: 'Raridade'

Camarão entre os mais saborosos do mundo tem mais de 30 cm e custa R$ 400 por quilo: 'Raridade'

Sugerida para você

Camarão entre os mais saborosos do mundo tem mais de 30 cm e custa R$ 400 por quilo: 'Raridade'