Estimación en tres niveles

⏱ 3 min de lectura · 📅 Actualizado en 2026

La estimación en tres niveles es el sistema de clasificación de tareas en equipos que trabajan con IA generativa, que distingue entre tareas automatizables por agentes (nivel 1), tareas que requieren juicio humano (nivel 2) y tareas de revisión e integración del trabajo de los agentes (nivel 3). Es la base de la atribución humano/IA en el sprint planning.

A diferencia de la estimación tradicional en puntos de historia o tiempo ideal, la estimación en tres niveles no busca cuantificar el esfuerzo sino clasificar el tipo de inteligencia necesaria para cada tarea. Esta clasificación determina quién hace qué en el sprint y qué capacidad de revisión hay que reservar.

Los tres niveles

Nivel 1 — Tarea automatizada

Tarea que un agente de IA puede ejecutar de forma autónoma con supervisión mínima, siempre que la spec esté completa y se hayan definido los boundaries adecuados.

Características: requisitos claros y formalizables, comportamiento determinista esperado, sin dependencias de contexto organizativo no documentable, con tests que pueden verificar el resultado.

Ejemplos: generación de código a partir de una spec Given/When/Then, scaffolding de componentes con patrones establecidos, refactorización siguiendo reglas definidas, generación de tests unitarios para una función documentada.

Nivel 2 — Tarea humana

Tarea que requiere juicio humano, contexto organizativo, creatividad, decisión estratégica o comprensión del problema real que la IA no puede aportar.

Características: implica ambigüedad que requiere negociación humana, afecta a decisiones arquitectónicas de alto impacto, requiere comprensión del usuario real y de sus necesidades, o implica responsabilidad legal o ética directa.

Ejemplos: definir el objetivo del sprint, priorizar el backlog, diseñar la arquitectura del sistema, entrevistar a usuarios, tomar decisiones de producto bajo incertidumbre.

Nivel 3 — Tarea R&I (revisión e integración)

Trabajo humano sobre el output del agente: verificar que lo generado es correcto, integrarlo con el resto del sistema, y asegurarse de que cumple la DoD reforzada. Es la tarea R&I.

Características: siempre acompaña a las tareas de nivel 1, consume capacidad real del sprint que debe planificarse explícitamente, no puede delegarse en otro agente por completo.

Por qué los tres niveles importan en el sprint planning

Sin esta clasificación, los equipos tienden a planificar el sprint como si todas las tareas fueran nivel 1 (que la IA genera) y olvidan el nivel 3 (que los humanos revisan). El resultado: al final del sprint hay mucho código generado pero poco código revisado, integrado y aprobado. El incremento no puede declararse "done".

La regla de referencia: por cada hora de trabajo de nivel 1, reservar entre 12 y 20 minutos de nivel 3. Ratio saludable: 1:3 a 1:5.

Error frecuente

Clasificar como nivel 1 tareas que en realidad son nivel 2. Una tarea parece automatizable hasta que el agente empieza a generarla y aparece la complejidad oculta: dependencias no documentadas, reglas de negocio implícitas, comportamientos esperados que nadie escribió en la spec. El equipo para el agente, documenta lo que falta, refina la spec y vuelve a ejecutar. Si este ciclo ocurre con frecuencia, es señal de que el proceso de refinamiento previo al sprint no está identificando bien qué tareas están realmente listas para el nivel 1.

Recursos

🏦 Scrum en equipos con IASkill Arena · Scrum Manager

📊 Guía didáctica Scrum en equipos con IARecursos · Scrum Manager

Véase también

Atribución humano/IA Tarea R&I Planificación del sprint Revisión humana de outputs de IA Spec-Driven Development (SDD) Definición de hecho

¿Quieres avanzar en agilidad? Puedes buscar convocatorias de cursos y exámenes o ir a tu ritmo haciéndote miembro del Club Agile. Esta membresía incluye recursos exclusivos, aulas e-learning y acceso a Skill Arena: un espacio para practicar y medir tus habilidades ágiles a tu ritmo.

Buscar convocatorias

Club Agile