El mercado está inundado de "AI para edificios" y "AI para sustainability". La mayoría es una capa fina por encima de un LLM genérico, con tu logo en la esquina. Le pides el Scope 3 y te devuelve un número convencido, plausible y equivocado.
En una demo de marketing, una alucinación es un mal rato. Aquí va a parar a un informe auditado o a un slide para el comité. En operaciones y compliance, el peor modo de fallo no es "no lo sé". Es "lo sé", dicho con seguridad, sobre algo que se inventó. Porque alguien firma debajo.
Cómo lo pensamos, y cómo nos hemos partido la cara aprendiéndolo: Sofia cita la fuente en cada respuesta. La tabla, la métrica, el documento del que sale el número. Si no puede anclar la respuesta en un dato real, dice que no puede — en vez de adivinar. Guardrails por rol definen qué puede y qué no puede hacer cada agente. Aprobación humana en cada escritura. Y un audit log inmutable de cada interacción: input, contexto, output, modelo, coste.
La parte difícil — y la parte aburrida donde está casi toda la ingeniería — es enseñar a un modelo a decir "no lo sé". Retrieval, grounding, recusa, logging: nada de esto da un vídeo bonito. Sofia v1 era un wrapper sobre GPT-4. La v2 no lo es, y reescribirla para que dejase de serlo fue la mitad del trabajo de los últimos meses.
Te dejamos un test para cualquier AI que te quieran vender. Pídele un número. Después pregunta: "¿de dónde sale?". Si no te enseña la línea de origen, está adivinando.
La pregunta correcta nunca es "¿qué sabe hacer esta AI?". Es "¿qué hace cuando no sabe?". Si la respuesta es "se lo inventa", márchate.