Jump to content

Revisión humana de outputs de IA

From Scrum Manager BoK
⏱ 4 min de lectura  ·  📅 Actualizado en 2026

La revisión humana de outputs de IA es el proceso por el que un product builder verifica, valida y aprueba el trabajo generado por un agente de IA antes de que se integre como parte del incremento de producto. Es un componente obligatorio de la DoD reforzada para equipos con IA y se planifica explícitamente como tarea R&I en el sprint.

La revisión humana no es una opción o un "nice to have": es la condición que hace que el trabajo del agente sea confiable para producción. Sin revisión humana, la mayor velocidad de generación de la IA se convierte en mayor velocidad de acumulación de deuda técnica oculta.

Qué se revisa

La revisión humana del output de IA cubre cuatro dimensiones según la DoD reforzada:

  1. Análisis estático: el código pasa linters y herramientas de análisis automatizado sin errores críticos. Esta parte puede asistirse con herramientas automáticas.
  2. No-duplicación: el agente no ha introducido código duplicado. El umbral recomendado es que la duplicación de código generado por IA no supere el 5% del total del módulo.
  3. Seguridad: no se han introducido vulnerabilidades evidentes: inyecciones, exposición de secretos, validación insuficiente de entradas, manejo inseguro de datos.
  4. Lógica de negocio: la parte que solo puede hacer un humano. ¿El código hace lo que la spec pedía? ¿Los casos extremos están cubiertos? ¿La implementación es coherente con la arquitectura del sistema como un todo?

Qué NO es la revisión humana

La revisión humana no equivale a ejecutar los tests y aprobar si pasan. Los tests validan el comportamiento conocido; la revisión humana valida:

  • La coherencia con el sistema: si el agente introdujo lógica que funciona localmente pero que rompe invariantes del sistema más amplio.
  • La mantenibilidad: si el código es comprensible y modificable por el equipo, o si es un laberinto funcional.
  • Los casos que los tests no cubren: comportamientos en producción que el entorno de test no simula.

El automation bias es el riesgo específico de esta práctica: la tendencia a confiar en el output de un sistema automatizado más de lo justificado. La revisión humana efectiva requiere que el revisor ejercite juicio propio, no que valide lo que ya parece correcto.

Ratio de referencia

La guía CheatSheetScrumIA de Scrum Manager establece como indicador de salud un ratio de tiempo de revisión humana por tarea IA de 1:3 a 1:5. Si la revisión de una tarea generada por IA consume sistemáticamente más del tercio del tiempo que tardó en generarse, es señal de que o bien las specs no son suficientemente precisas o bien el cuello de botella está en la capacidad de revisión del equipo.

IA supervisando IA como complemento

La revisión automática por otro agente puede cubrir parte de las comprobaciones mecánicas (análisis estático, patrones de duplicación, vulnerabilidades conocidas), liberando al revisor humano para concentrarse en la lógica de negocio y la coherencia del sistema. Este mecanismo es complementario, no sustituto, de la revisión humana.

Error frecuente

Delegar la revisión en "si compila y los tests pasan, está bien". La IA produce código que compila y que frecuentemente pasa los tests pero que tiene errores sutiles en la lógica de negocio, duplicación no visible o vulnerabilidades de seguridad que solo el contexto humano detecta. La revisión efectiva requiere que alguien lea el código, entienda qué hace y valide que es lo que debería hacer, no solo que el sistema de CI lo acepte.

Recursos

🏦 Scrum en equipos con IASkill Arena · Scrum Manager

📊 Guía didáctica Scrum en equipos con IARecursos · Scrum Manager

Véase también

¿Quieres avanzar en agilidad? Puedes buscar convocatorias de cursos y exámenes o ir a tu ritmo haciéndote miembro del Club Agile. Esta membresía incluye recursos exclusivos, aulas e-learning y acceso a Skill Arena: un espacio para practicar y medir tus habilidades ágiles a tu ritmo.