"Cita las fuentes" cabe en un bullet point de una página de producto. Pero es, quizá, la parte más difícil de todo el sistema — y la que separa una asistente de operaciones de un generador de respuestas plausibles.
Hacer que un LLM ancle cada respuesta en un dato real — y, más importante, que se niegue cuando no puede — no es un ajuste que se enciende. Es retrieval (ir a buscar el dato correcto), grounding (obligar a la respuesta a asentarse en ese dato), recusa (decir "no lo sé" en vez de inventar), y un audit log inmutable de cada interacción: input, contexto, output, modelo, coste. Nada de esto da un vídeo bonito. Es la ingeniería aburrida donde está el valor.
Sofia v1 era un wrapper sobre un modelo genérico. La v2 no lo es — y reescribirla para que dejara de serlo fue la mitad del trabajo. El principio que la gobierna no cambia: Sofia propone con la fuente agarrada, la persona decide, el sistema registra. En operaciones y compliance, donde la respuesta va a parar a un informe auditado o a un slide del comité, el error con seguridad cuesta más que la ausencia de respuesta.
El caveat honesto: el grounding reduce drásticamente la alucinación — no la elimina al 100%. Por eso la aprobación humana se queda, en cada escritura. Quien te promete una AI que "nunca se equivoca" te está vendiendo la siguiente alucinación. Nosotros preferimos una AI que sabe decir "no tengo datos para esto".
El test sirve para cualquier AI que te quieran vender: pide un número, después pregunta "¿de dónde sale?". Si no te enseña la línea de origen, está adivinando — y en una hoja que alguien firma, adivinar es el peor modo de fallo que hay.