Harness Engineering
Harness Engineering
En este tema practicarás Harness Engineering para dominar la disciplina que convierte un modelo de IA en un agente profesional fiable, recubriéndolo con las guías y sensores que sustituyen la oscilación entre lo deslumbrante y lo desesperante por trabajo verificable de calidad predecible.
Entrenarás 10 competencias clave:
- Distinguir inteligencia (lo que entrena el fabricante) de agencia (lo que tú construyes alrededor) y aplicar la ecuación canónica Agente = Modelo + Arnés para entender por qué un modelo sin arnés entrega trabajo pulido pero hueco.
- Aplicar el marco de Böckeler diferenciando guías (controles feedforward, antes del acto) y sensores (controles feedback, después del acto) como las dos columnas que vertebran cualquier arnés externo bien diseñado.
- Diferenciar el arnés interno (responsabilidad del fabricante) del externo (el tuyo) y operar sobre las tres dimensiones de regulación, concentrando el esfuerzo donde reside el 99 % del valor recuperable en el trabajo diario con agentes.
- Preparar el entorno (pre-flight, materiales accesibles, contrato de bootstrap) para que una sesión nueva del agente supere el cold-start test e identifique proyecto, progreso y siguiente paso en menos de tres minutos.
- Redactar guías de alta señal —archivos de instrucciones, convenciones, skills, fixtures aprobados— que orienten al agente antes de actuar sin caer ni en la sobreespecificación ni en la saturación del contexto efectivo.
- Diseñar sensores accionables combinando controles computacionales deterministas y controles inferenciales tipo LLM-as-judge, de modo que cada verificación produzca reportes útiles y no un binario "falla / no falla".
- Operar el bucle de dirección (steering loop) registrando cada cambio en un journal del arnés: cuando algo falla, iterar el arnés en lugar de regañar al modelo, porque el modelo es lo único que no puedes mejorar.
- Configurar permisos, aislamiento y políticas operativas —sandbox, pass-state gating, WIP=1— como marco que equilibra la autonomía del agente y el control humano sobre lo que puede tocar y cuándo.
- Medir el arnés con KPIs propios —rebuild cost, cold-start test, tasa de retrabajo, deriva detectada por garbage collection agéntica— y reconocer los antipatrones frecuentes antes de que erosionen la fiabilidad del sistema.
- Decidir cuándo NO usar un agente y delimitar con precisión el rol del humano como diseñador del arnés, revisor crítico y único responsable del criterio profesional sobre el entregable final.
Actividad para miembros del Club Agile. Identifícate o date de alta en el club si aún no eres miembro.
Desde tu área personal puedes generar un diploma de las evaluaciones realizadas para acreditación curricular.