"Cita as fontes" cabe num bullet point de uma página de produto. Mas é, talvez, a parte mais difícil de todo o sistema — e a que separa uma assistente de operações de um gerador de respostas plausíveis.
Fazer um LLM ancorar cada resposta num dado real — e, mais importante, recusar quando não consegue — não é uma definição que se liga. É retrieval (ir buscar o dado certo), grounding (obrigar a resposta a assentar nesse dado), recusa (dizer "não sei" em vez de inventar), e um audit log imutável de cada interação: input, contexto, output, modelo, custo. Nada disto dá um vídeo bonito. É a engenharia aborrecida onde mora o valor.
A Sofia v1 era um wrapper sobre um modelo genérico. A v2 não é — e reescrevê-la para deixar de ser foi metade do trabalho. O princípio que a governa não muda: a Sofia propõe com a fonte agarrada, a pessoa decide, o sistema regista. Em operações e em compliance, onde a resposta vai parar a um relatório auditado ou a um slide de board, o erro confiante custa mais do que a ausência de resposta.
O caveat honesto: o grounding reduz drasticamente a alucinação — não a elimina ao 100%. Por isso a aprovação humana fica, em cada escrita. Quem te promete uma IA que "nunca erra" está a vender-te a alucinação seguinte. Nós preferimos uma IA que sabe dizer "não tenho dados para isto".
O teste serve para qualquer IA que te queiram vender: pede um número, depois pergunta "de onde veio?". Se não te mostrar a linha de origem, está a adivinhar — e numa folha que alguém assina, adivinhar é o pior modo de falha que há.