A IA que mente com confiança — e não sabe que está a mentir

Em 2023, um advogado nova-iorquino chamado Steven Schwartz apresentou num tribunal federal um documento jurídico que citava seis precedentes judiciais relevantes para o caso do seu cliente. O juiz, ao tentar localizar os casos, não encontrou nenhum. Não existiam. Schwartz tinha usado o ChatGPT para a pesquisa jurídica, e o modelo tinha inventado os precedentes — com nomes de juízes plausíveis, números de processo credíveis, ementas convincentes. Quando confrontado, o advogado perguntou ao próprio ChatGPT se os casos eram reais. O modelo confirmou que sim.

Schwartz foi sancionado. O caso tornou-se uma das primeiras histórias virais sobre o fenómeno que a indústria chama de “alucinações” — e que, desde então, tem gerado um debate crescente sobre o que são, porque acontecem, e se alguma vez podem ser verdadeiramente eliminadas.

A resposta honesta a esta última pergunta é incómoda: provavelmente não. E a razão vai muito mais fundo do que a maioria das comunicações corporativas está disposta a admitir.

O que é, exactamente, uma alucinação

O termo foi importado da psicologia e aplicado à IA de forma que alguns investigadores consideram enganosa — porque sugere que os modelos estão a “ver” algo que não existe, quando a realidade é mais banal e mais perturbadora.

Os grandes modelos de linguagem (LLMs) — o tipo de sistema que alimenta o ChatGPT, o Gemini, o Claude e os seus equivalentes — não armazenam factos como uma base de dados. Funcionam através da previsão estatística: dado um conjunto de palavras, qual é a sequência mais provável a seguir? Este processo é treinado em vastas quantidades de texto humano, e o modelo aprende padrões de linguagem, estruturas de argumentação, formatos de citação, estilos de resposta.

O problema central é que este sistema é optimizado para produzir texto plausível, não texto verdadeiro. A plausibilidade e a verdade são conceitos diferentes. Um texto pode ser linguisticamente fluente, estruturalmente coerente, tonalmente apropriado — e factualmente falso. E o modelo não tem forma de distinguir entre os dois, porque não tem acesso a uma representação do mundo externo que possa usar para verificar as suas afirmações antes de as fazer.

Como um investigador descreveu: o modelo “lança uma ponte fluente sobre um abismo de suporte inexistente”. E porque as probabilidades não estão calibradas para a verdade, pode soar absolutamente certo simplesmente porque a sequência é estatisticamente típica — não porque corresponda à realidade.

A confiança como característica, não como defeito

Aqui está o aspecto mais contraintuitivo do problema: a confiança com que os modelos apresentam informação falsa não é um bug acidental. É, em grande medida, o resultado directo de como estes sistemas são treinados.

Investigação da OpenAI publicada em setembro de 2025 mostrou que os objectivos de treino de previsão do próximo token e os rankings competitivos em benchmarks recompensam as apostas confiantes em detrimento da incerteza calibrada — portanto, os modelos aprendem a blefar. O sistema de treino por reforço com feedback humano (RLHF), que é usado para tornar os modelos mais “úteis” e “inofensivos”, tem um efeito colateral documentado: os avaliadores humanos tendem a preferir respostas confiantes e completas a respostas que admitem não saber. O modelo aprende a resposta que agrada, não necessariamente a resposta correcta.

Esta não é uma questão de intencionalidade. O modelo não “decide” mentir. Não tem consciência de que está a inventar. Está a fazer exactamente o que foi treinado para fazer: produzir a continuação mais plausível, dado o contexto. Quando o contexto é escasso, quando a pergunta vai além do que está solidamente representado nos dados de treino, o modelo preenche a lacuna com o que parece certo. E parece certo porque a estrutura — o formato da citação, o estilo do argumento, a lógica da conclusão — está correcta. Apenas o conteúdo foi inventado.

Uma análise académica captou isto com precisão: os LLMs são “motores de coerência” optimizados para a plausibilidade estatística, sem mecanismos estruturais para ancorar as afirmações geradas em evidência verificável. A questão mais reveladora, escreveu um grupo de investigadores, não é “porque é que os modelos alucinam?” mas sim: “porque é que algo que parece raciocínio alguma vez emerge de um sistema que simplesmente prevê o próximo token?”

Os números que a indústria não anuncia em comunicados de imprensa

As taxas de erro documentadas são mais altas do que a maioria dos utilizadores imagina.

Um benchmark de 2026 que avaliou 37 modelos reportou taxas de alucinação entre 15% e 52%, dependendo do modelo e do tipo de tarefa. Em resumos de casos médicos, as alucinações atingiram 64,1% sem intervenções de mitigação. Em consultas jurídicas, a Stanford documentou taxas entre 58% e 88% em testes adversariais. A fabricação de citações em testes adversariais atingiu 94%.

Modelos de raciocínio mais avançados — os sistemas de última geração que as empresas apresentam como a solução para os problemas dos modelos anteriores — mostram frequentemente taxas de alucinação mais altas, não mais baixas, em determinadas tarefas. O o3 e o o4-mini da OpenAI alucinaram entre 30% e 50% do tempo em testes internos. A razão é um compromisso arquitectural: os modelos que “pensam mais” estão a gerar mais passos intermédios, e cada passo é uma oportunidade adicional para introduzir erros que se propagam.

Quando a plausibilidade entra na literatura científica

O caso do advogado Schwartz foi chocante em 2023. Mas o que está a acontecer na literatura científica é potencialmente mais grave — porque os erros entram num arquivo que a humanidade usa para construir conhecimento.

Nos primeiros sete meses de 2026, investigadores encontraram um em cada 277 artigos biomédicos a conter pelo menos uma referência inexistente gerada por IA. Em 2023, a taxa era de um em 2.828. O crescimento é de doze vezes em três anos.

Em janeiro de 2026, a plataforma de detecção GPTZero analisou mais de quatro mil artigos aceites na NeurIPS 2025 — uma das conferências de aprendizagem automática mais prestigiadas do mundo. Encontrou citações alucinadas em pelo menos 53 artigos, apesar de cada artigo ter sido revisto por três ou mais especialistas. As referências inventadas passaram pelo escrutínio de pares porque o formato estava correcto e os títulos soavam plausíveis no contexto.

Em novembro de 2025, o The Independent revelou que um Plano de Recursos Humanos de Saúde no valor de 1,6 milhões de dólares canadianos, preparado pela Deloitte para o governo de Newfoundland, continha pelo menos quatro citações falsas para artigos de investigação inexistentes. Uma consultora a facturar sete dígitos entregou evidências fabricadas a um departamento governamental de saúde.

O problema é que a ciência constrói-se sobre si própria. Uma referência falsa num artigo publicado pode ser citada por artigos subsequentes, amplificando o erro e tornando-o progressivamente mais difícil de detectar e erradicar.

A medicina: onde as consequências são irreversíveis

Se na ciência o dano é ao arquivo do conhecimento, na medicina o dano é ao corpo humano.

Quando um LLM afirma com “a dose de metotrexato para a artrite reumatoide é 25mg diários” — sendo a resposta correcta 7,5-25mg semanais — a fluência da resposta torna-o mais difícil de detectar, não mais fácil. O modelo não hesita. Não qualifica. Não diz “não tenho certeza”. Gera uma resposta que soa autoritária e que está errada de uma forma que pode matar.

Uma avaliação larga publicada em 2025 testou onze modelos de base em sete tarefas de alucinação médica. Os resultados foram perturbadores em múltiplas dimensões: os erros surgiam de falhas de raciocínio, não de lacunas de conhecimento; e, de forma contraintuitiva, modelos de uso geral alcançaram proporções mais elevadas de respostas sem alucinação do que modelos especificamente treinados para uso médico. O ajuste fino especializado pode, em certas condições, aumentar determinados riscos de alucinação.

Numa consulta com um médico, existe um conjunto de salvaguardas: formação, experiência, responsabilidade legal, a possibilidade de dizer “não sei, preciso de verificar”. Num chatbot de IA, não existe nenhuma destas salvaguardas — e a apresentação confiante da resposta errada é indistinguível da apresentação confiante da resposta certa.

O problema estrutural que as soluções actuais não resolvem

A indústria desenvolveu uma série de abordagens para reduzir as alucinações. A mais promissora é o RAG — Retrieval-Augmented Generation — que ancora o modelo em documentos externos antes de gerar a resposta, em vez de depender exclusivamente do que foi memorizado durante o treino. Funciona bem em domínios fechados com bases de conhecimento bem estruturadas. É menos eficaz quando as perguntas são abertas, quando o contexto é ambíguo, ou quando o documento recuperado está ele próprio incorrecto.

O problema mais profundo é que nenhuma das soluções actuais aborda a causa raiz. A arquitectura de previsão do próximo token, com os seus incentivos de treino para a confiança em detrimento da calibração, continua intacta. Alguns investigadores argumentam que a alucinação é uma consequência inevitável desta arquitectura — não um bug a corrigir, mas uma propriedade emergente do sistema. Um artigo académico de 2024 demonstrou formalmente que a alucinação é inevitável porque os LLMs, enquanto funções computáveis, não conseguem aprender comprovadamente todas as outras funções computáveis que representam a verdade sobre o mundo.

Isto não significa que o problema não possa ser mitigado. Significa que não pode ser eliminado através de ajustes incrementais ao sistema actual.

O paradoxo da confiança do utilizador

Existe uma ironia cruel nos dados sobre o comportamento humano perante respostas de IA. Um estudo de 2026 da UC San Diego descobriu que resumos gerados por IA alucinavam 60% do tempo — e que, ainda assim, influenciavam decisões de compra. Os utilizadores são 30% mais propensos a confiar em respostas erradas da IA do que a contestá-las.

O mecanismo é compreensível: a IA escreve de forma fluente, estruturada, sem as hesitações e qualificações que os humanos usam quando não têm a certeza. Paradoxalmente, os sinais que usamos para avaliar a credibilidade humana — confiança, fluência, estrutura — são precisamente aqueles que a IA está optimizada para exibir, independentemente da precisão do conteúdo.

Isto cria um problema que é simultaneamente técnico, psicológico e institucional. As empresas que desenvolvem estes sistemas têm incentivos comerciais para apresentar os modelos como capazes e confiáveis. Os utilizadores que adoptaram a tecnologia têm incentivos cognitivos para confiar nas suas ferramentas. E a IA em si não tem qualquer interesse em admitir incerteza — foi treinada para o contrário.

O que muda agora

Nada nesta análise sugere que os LLMs são inúteis — seriam abandonados se o fossem, e não o estão a ser. O argumento é mais preciso: são ferramentas com uma classe específica de falha que é difícil de detectar, que tende a acontecer precisamente nas situações onde mais importa (domínios especializados, perguntas sem resposta clara, tópicos recentes ou de nicho), e que é amplificada pela forma como os utilizadores interagem com os sistemas.

A resposta não é deixar de usar IA. É usar IA com um modelo mental mais rigoroso — entendendo que a confiança exibida pelo sistema não é um indicador de precisão factual, que a verificação independente não é opcional em contextos de consequência, e que “parece correcto” é exatamente o critério que o sistema foi optimizado para satisfazer, independentemente de estar ou não certo.

O advogado Schwartz cometeu o erro de tratar a IA como uma base de dados verificada. A Deloitte cometeu o erro de tratar a IA como um assistente de investigação de confiança. As revistas científicas estão a cometer o erro de assumir que o processo de revisão por pares é robusto contra um tipo de falsificação que não existia quando esse processo foi desenhado.

Em todos estes casos, o problema não foi a IA. Foi a ausência de um modelo mental adequado para o que a IA é — e para o que, estruturalmente, não pode ser.

A IA que mente com confiança — e não sabe que está a mentir

Published by Cidade Viva on May 21, 2026May 21, 2026

O que é, exactamente, uma alucinação

A confiança como característica, não como defeito

Os números que a indústria não anuncia em comunicados de imprensa

Quando a plausibilidade entra na literatura científica

A medicina: onde as consequências são irreversíveis

O problema estrutural que as soluções actuais não resolvem

O paradoxo da confiança do utilizador

O que muda agora

Tecnologia

O valor do tempo do cliente: Como o atendimento de excelência impulsiona a sua margem de lucro

Tecnologia

Cibersegurança em Portugal: os Riscos que as PMEs Ainda Ignoram em 2026

Tecnologia

Social Commerce em Portugal: Como Vender Diretamente pelas Redes Sociais

A IA que mente com confiança — e não sabe que está a mentir

Published by Cidade Viva on May 21, 2026May 21, 2026

O que é, exactamente, uma alucinação

A confiança como característica, não como defeito

Os números que a indústria não anuncia em comunicados de imprensa

Quando a plausibilidade entra na literatura científica

A medicina: onde as consequências são irreversíveis

O problema estrutural que as soluções actuais não resolvem

O paradoxo da confiança do utilizador

O que muda agora

Related Posts

Tecnologia

O valor do tempo do cliente: Como o atendimento de excelência impulsiona a sua margem de lucro

Tecnologia

Cibersegurança em Portugal: os Riscos que as PMEs Ainda Ignoram em 2026

Tecnologia

Social Commerce em Portugal: Como Vender Diretamente pelas Redes Sociais