Documentation Index
Fetch the complete documentation index at: https://docs.fhiron.cl/llms.txt
Use this file to discover all available pages before exploring further.
TL;DR. Pedirle a un LLM que valide un recurso FHIR contra CL Core es como pedirle a un compilador que sea probabilístico: si la respuesta cambia entre dos ejecuciones idénticas, no es validación. Fhiron MCP separa ese contrato. El LLM compone, el motor valida. La verdad de si un Patient cumple
CorePacienteCl la dicta HAPI FHIR 8.8.0 cargado con hl7.fhir.cl.clcore 1.9.3, no el modelo. El resultado es una OperationOutcome reproducible, en español, auditable bajo Ley 21.719.1. El problema: alucinación FHIR no se ve a primera vista
Un LLM moderno produce JSON FHIR sintácticamente impecable. Si le pides un Patient chileno con identificador RUT, te entrega algo así:- El
codedel tipo de identificador en CL Core 1.9.3 no es"RUN". Es"01"(CSTipoIdentificador). El LLM eligió el string que parecía más natural. - El
systemdel NamingSystem oficial chileno para RUT no eshttps://hl7chile.cl/fhir/ig/clcore/NamingSystem/RUN. Eshttps://www.minsal.cl/sid/run. La URL inventada se ve plausible. - El
value"12.345.678-5"no cumple el formato esperado por el slice de identificador chileno (sin puntos, dígito verificador en mayúscula cuando es K). - El
dv(dígito verificador)"5"puede o no ser correcto para12345678— el LLM no calculó el módulo 11, lo eligió.
2. Por qué validación probabilística no aplica acá
Un LLM es, por construcción, un sistema de muestreo sobre una distribución de probabilidad. Tres cosas lo descalifican como validador de un estándar clínico: No es reproducible. Aun contemperature: 0, dos despliegues con cuantización distinta, dos versiones del modelo, o dos providers detrás de la misma API pueden dar respuestas levemente distintas. Para validación esto es un dealbreaker: si llamo validar(recurso) dos veces seguidas y obtengo dos OperationOutcome distintas, no validé nada.
Confunde lookalikes. Los LLMs son extraordinariamente buenos generando texto que se parece al que ya vieron. Para datos clínicos esto es exactamente lo que no quieres: el modelo produce mg/dL en una unidad UCUM cuando el estándar pide mg/dl, o invierte los slices de un identificador porque la mayoría de ejemplos de internet están en otro formato. El error está en la apariencia, no en la estructura.
No tiene fuente de verdad. El estándar CL Core v1.9.3 es un paquete NPM con artefactos versionados. Existe una versión exacta de CorePacienteCl. El LLM no carga ese paquete; carga una mezcla difusa de las miles de versiones que vio durante entrenamiento. Pedirle que sea autoridad sobre un perfil específico es pedirle que recuerde algo que nunca tuvo.
La conclusión no es que los LLMs sean malos. Es que validar un estándar es un trabajo determinístico, y la herramienta para trabajos determinísticos es código determinístico.
3. Arquitectura: separar composición de verificación
Fhiron MCP implementa una frontera explícita de tool-use:fhiron_validate_fhir_resource con el JSON que produjo. El connector reenvía el recurso al motor, el motor responde con una OperationOutcome, y el connector se la entrega al modelo como tool_result.
El modelo entonces tiene tres caminos:
- El motor dijo OK — continuar la conversación.
- El motor reportó issues — leer las
OperationOutcome.issue, identificar elexpressionque falló, corregir el recurso, llamar de nuevo. - El motor no pudo procesar el input (JSON malformado, recurso truncado) — reformular.
4. Las herramientas que cruzan la frontera
@fhiron/mcp-connector 0.4.5 expone siete tools al LLM. Todas tienen idempotentHint: true y la mayoría readOnlyHint: true:
| Tool | Qué hace | Determinístico |
|---|---|---|
fhiron_validate_fhir_resource | Valida contra CL Core v1.9.3, devuelve OperationOutcome en español | Sí — motor HAPI |
fhiron_fhir_lint_local | Linter offline para reglas estructurales rápidas | Sí — reglas estáticas |
fhiron_fhir_lint_run | Verifica RUT con módulo 11 chileno | Sí — algoritmo determinístico |
fhiron_fhir_apply_quickfix | Aplica un fix sugerido por el linter al recurso | Sí — transformación pura |
fhiron_get_example | Devuelve un ejemplo válido del perfil pedido (precargado) | Sí — payload constante |
fhiron_search_terminology | Busca en CodeSystems chilenos cargados localmente | Sí — lookup |
fhiron_explain_code | Explica un código de error de validación en español | Sí — diccionario |
/api/validate, linter local, catálogos de terminología) corre el mismo código sin importar quién llame. Mismo input → mismo output. Es el contrato que un LLM no puede ofrecer.
5. Garantías que se ganan al hacer este corte
Determinismo. Si auditas dos llamadas idénticas afhiron_validate_fhir_resource con el mismo JSON, las dos OperationOutcome son byte-a-byte iguales (modulo timestamps que se anotan fuera del payload validado).
Idempotencia. Reintentar una validación es seguro. Esto importa cuando el agente compone, falla, corrige y reintenta múltiples veces dentro de una misma sesión.
Audit trail real. Cada validación produce un registro en validations_log con: tenant, recurso enviado (hash), perfil aplicado, OperationOutcome, timestamp. La conversación del LLM es opcional como contexto humano; la evidencia de cumplimiento es el registro del motor.
Sin alucinación de perfiles. El motor solo conoce los StructureDefinitions, CodeSystems, ValueSets y NamingSystems publicados oficialmente: hl7.fhir.cl.clcore 1.9.3, hl7.fhir.r4.core, hl7.terminology.r4, más los estándares internacionales con URI canónica documentada. Si el recurso referencia un perfil que no existe, el motor lo rechaza explícitamente. Si CL Core no cubre un caso de uso, eso aparece como MISSING en el audit de cobertura, no se inventa un perfil propio que parezca oficial.
Errores en español. El motor traduce cada OperationOutcome.issue al español con referencia al perfil exacto que falló. El LLM no necesita “interpretar” el error: lo lee y lo aplica.
6. Comparación uno-a-uno
Mismo agente, misma tarea: producir un Patient chileno válido. Dos arquitecturas distintas.| Dimensión | Validación pura por LLM | Fhiron MCP (LLM + motor) |
|---|---|---|
| Input idéntico → output idéntico | No garantizado | Garantizado |
| Cobertura de CL Core 1.9.3 | ”Lo que recordó el modelo” | 11 perfiles oficiales + 28 SDs CL + 23 ValueSets + 20 CodeSystems |
| Validación de RUT módulo 11 | Aproximada | Algoritmo nativo |
| Mensajes de error en español | ”Lo que produzca el modelo” | Generados por el motor con referencia al perfil |
| Reproducibilidad para auditoría | No | Sí (registro validations_log) |
| Riesgo de inventar perfil/extensión | Alto | Bloqueado por construcción (regla canónico-only) |
| Persistencia de datos clínicos | Depende del provider | Stateless: el gateway descarta el recurso tras validar |
| Costo marginal por validación | Tokens del LLM | HTTP a motor local |
| Latencia | Variable según modelo | Predecible (p95 < 3s objetivo) |
7. El ángulo de cumplimiento: Ley 21.719
La Ley de Protección de Datos Personales chilena exige, entre otras cosas, demostrar trazabilidad sobre el tratamiento de datos sensibles. Para un sistema que valida recursos FHIR clínicos, esto se traduce en preguntas concretas:- ¿Se puede reproducir la validación que se hizo el 14 de junio a las 10:32 sobre el Patient X?
- ¿Bajo qué versión exacta del estándar se evaluó?
- ¿Quién (qué tenant, qué API key) ejecutó la validación?
- ¿Dónde quedó persistido el dato clínico? (Idealmente: en ningún lado controlado por nosotros).
- La OperationOutcome es función pura del input + versión del motor → reproducible.
- La versión del paquete CL Core (
hl7.fhir.cl.clcore@1.9.3) y de HAPI (8.8.0) están fijas y trazadas. - Cada llamada lleva tenant + API key, registradas en
validations_log. - El gateway es stateless: el
FhironGatewayInterceptorretornafalse, lo que indica a HAPI que no persista el recurso tras procesarlo.
8. Cuándo usar qué
La pregunta práctica para equipos de ingeniería: ¿dónde corto el LLM y dónde corto el motor? El LLM es muy bueno para:- Componer recursos FHIR a partir de descripciones en lenguaje natural (“crea un Patient de María González, RUT 12345678-5, vive en Ñuñoa”).
- Interpretar errores de validación y proponer correcciones.
- Orquestar conversaciones largas con múltiples idas y vueltas hasta llegar a un recurso válido.
- Documentar lo que hizo en lenguaje humano.
- Validar contra el perfil oficial.
- Resolver terminologías a códigos chilenos válidos.
- Calcular el dígito verificador de un RUT.
- Aplicar quickFixes idempotentes.
- Producir el registro auditable de qué pasó.
9. Conclusión
Construir agentes que toquen datos clínicos en Chile no es un problema de prompt engineering. Es un problema de definir bien dónde termina la opinión del modelo y dónde empieza el estándar. Mientras esa frontera no exista en el código, el agente puede parecer útil en una demo y ser inauditable en producción. Fhiron MCP es el contrato que hace esa frontera explícita. El LLM compone. El motor valida. Y para los equipos que necesitan integrarse con HIS, EHR o RNS chilenos en condiciones de Ley 21.719, esa diferencia no es estética: es la condición para que el agente exista.Recursos relacionados
@fhiron/mcp-connector
Paquete oficial en npm. Instalable en Claude Code, Cursor y Continue.
MCP — Overview
Cómo se conecta Fhiron MCP a tu IDE.
Bridge — Errores
Catálogo de errores de validación CL Core en español.
¿Qué es CL Core?
El estándar oficial chileno sobre el que valida Fhiron.