Harness Engineering

Los diplomas del tema "Harness Engineering" acreditan que su titular mantiene un nivel de competencia actualizado y verificable en la disciplina del diseño de arneses para agentes de IA, garantizando que los agentes empleados en su trabajo profesional produzcan resultados rigurosos, verificables y útiles, en lugar de salidas pulidas pero huecas.

Este diploma no evalúa "conocimientos teóricos" sobre frameworks de agentes, sino la capacidad profesional para construir arneses externos que recubran al modelo con guías y sensores efectivos, medir y mejorar el arnés mediante un bucle de dirección sostenido y decidir con criterio cuándo delegar en un agente y cuándo no hacerlo.

Competencias acreditadas

La posesión de estos diplomas actualizados acredita que el titular es capaz de:

1) Diagnóstico de la diferencia entre modelo y arnés

Distinguir con precisión entre la inteligencia entrenada por el fabricante y la agencia que el profesional construye a su alrededor, aplicando la ecuación canónica Agente = Modelo + Arnés para identificar la causa raíz cuando un agente entrega trabajo pulido pero hueco, y descartar la salida fácil de "cambiar de modelo" cuando lo que falta es arnés.

2) Aplicación del marco de Böckeler

Diseñar arneses externos diferenciando con claridad las guías (controles feedforward que orientan al agente antes de actuar) de los sensores (controles feedback que verifican su trabajo después), colocando cada control en su lugar del ciclo para maximizar la probabilidad de que el agente acierte a la primera y detecte sus propios errores cuando no lo hace.

3) Delimitación del arnés externo y las tres dimensiones de regulación

Reconocer la frontera entre el arnés interno (responsabilidad del fabricante de la plataforma) y el externo (responsabilidad del profesional que la usa), y operar simultáneamente sobre las tres dimensiones de regulación del arnés, concentrando el esfuerzo donde reside el 99 % del valor recuperable en el trabajo diario con agentes.

4) Preparación de entornos agent-legibles

Preparar el espacio de trabajo del agente con un pre-flight riguroso —materiales accesibles, gestión de la confidencialidad, contrato de bootstrap— de modo que una sesión nueva del agente, sin contexto previo, supere el cold-start test e identifique proyecto, progreso y siguiente paso en menos de tres minutos.

5) Diseño de guías de alta señal

Redactar los artefactos que el agente lee al arrancar y lleva consigo mientras opera —archivos de instrucciones del proyecto, convenciones, skills reutilizables, fixtures aprobados— produciendo guías que orienten al agente sin caer en la sobreespecificación que satura el contexto efectivo ni en la subespecificación que delega la decisión al modelo.

6) Diseño de sensores accionables

Diseñar el sistema de verificación combinando controles computacionales deterministas (linters, tests, verificadores procedimentales) con controles inferenciales tipo LLM-as-judge, asegurando que cada verificación produzca reportes accionables —y no un binario "falla / no falla"— sobre los que el agente y el humano puedan trabajar.

7) Operación del bucle de dirección

Mantener un journal del arnés donde se registra cada cambio y se itera el sistema sobre la base de evidencias, aplicando la regla operativa fundamental del Harness Engineer: cuando algo falla, se modifica el arnés, no se regaña al modelo, porque el modelo es lo único que el profesional no puede mejorar.

8) Configuración de permisos y políticas operativas

Definir el marco de delegación del agente mediante permisos explícitos, aislamiento adecuado al riesgo (sandbox) y políticas operativas estrictas como pass-state gating (pase verificado) y WIP=1, equilibrando la autonomía con la que opera el agente y el control humano sobre lo que puede tocar y cuándo.

9) Medición del arnés con KPIs propios

Evaluar el arnés con métricas específicas de la disciplina —rebuild cost, cold-start test, tasa de retrabajo, deriva detectada por garbage collection agéntica— y reconocer los antipatrones frecuentes antes de que erosionen la fiabilidad del sistema y la confianza del equipo en el agente.

10) Decisión sobre uso de agentes y rol humano

Determinar con criterio profesional cuándo NO es apropiado usar un agente, y delimitar con precisión el rol del humano como diseñador del arnés, revisor crítico en las puertas de aprobación y único responsable del criterio profesional sobre el entregable final, sin diluir responsabilidad en el sistema.

Competencias que acredita el diploma