La idea es sencilla: evaluar sirve para regular la enseñanza y el aprendizaje; calificar certifica un nivel de logro con consecuencias externas. Cuando ambas funciones se comprimen en el mismo instante, la nota eclipsa todo y anula gran parte del potencial del feedback. Separarlas en el tiempo es una decisión de diseño didáctico con efectos tangibles, que a mí me ha ayudado mucho, y creo que repercute en la calidad de lo que ocurre en el aula.

Por qué conviene desacoplar calificar y evaluar
- Distinción funcional. Ya Scriven (1967) separó la evaluación formativa (para mejorar) de la sumativa (para certificar). Formalizar esa distinción en el tiempo minimiza interferencias: el alumnado atiende a la retroalimentación cuando no hay nota de por medio, y el profesorado certifica según pide la administración y clarificando al alumnado y sus familias cuándo y cómo.
- Cómo aprende la gente. La retroalimentación es útil solo si llega en el momento justo, anclada a criterios claros y con pistas accionables (Sadler, 1989; Hattie & Timperley, 2007). Si la acompañamos de una calificación inmediata, el procesamiento cognitivo se desplaza a la cifra y se reduce la disposición a revisar.
- Equidad y validez. Black & Wiliam (1998) mostraron indicios de que la evaluación formativa bien implementada beneficia especialmente a quienes más lo necesitan. Desacoplar la calificación permite múltiples oportunidades, mejora la validez de la inferencia (menos dependencia de un único momento) y reduce el sesgo de velocidad o “primer borrador”.
En suma, no es una “moda” o que yo me crea muy guay. Es el resultado de alinear entre lo que sabemos de aprendizaje y lo que exigimos a la evaluacion cuando hace su función: sostener decisiones del día a día.
Qué significa en términos de didáctica
A continuación, os dejo un repertorio de estrategias que puede adaptar sin necesidad de rehacer tu centro educativo. Son modestos, pero consistentes con lo ya dicho sobre el aprendizaje y la evaluación..
1) Diagnóstico sin nota
Comienza cada unidad con una pequeña evaluación, como ya dijimos aquí: dos problemas tipo, un párrafo explicativo, un mapa rápido. Registra tendencias, comenta en términos de criterios y, sobre todo, evita la calificación. El objetivo es ajustar la enseñanza, no inaugurar el cuaderno de notas del trimestre.
2) Borrador → feedback → revisión (x2) → entonces, quizá, nota
Estructura tareas de producto (ensayo, informe de laboratorio, pieza audiovisual) en varias versiones:
- Versión 1 (formativa): el alumnado recibe comentarios específicos alineados a una rúbrica sin números (una rúbrica de un solo punto funciona bien).
- Versión 2 (sumativa): tras la revisión, se aplica la rúbrica completa (con niveles) y se califica el desempeño final. Ya hablamos de ello aquí.
Si el contexto lo permite, la calificación puede diferirse 24–48 horas, pidiendo antes una metaevaluación del alumno: “qué criterio mejoré, qué evidencia lo muestra y qué haría distinto”.
3) Práctica con “peso cero”
Integra pequeñas pruebas y ejercicios con corrección inmediata que no cuentan para la nota. Sí cuentan para aprender: clarifican expectativas, destapan malentendidos y orientan reenseñanzas. La condición para que funcionen es que su estructura se parezca a las prácticas de evocación.
4) Portafolio con hitos definidos
Recoge evidencias variadas (borradores, productos, auto/coevaluaciones). Señala hitos formativos (revisión, realimentación entre pares) y pocos momentos sumativos: al final de la secuencia, el conjunto se califica con una lista de cotejo criterial. Menos momentos de nota, más visibilidad del progreso.
5) Autoevaluación y coevaluación antes de la nota
Autoevaluar y coevaluar no tiene que implicar poner ninguna nota. Por eso, ofrece plantillas breves:

6) Rúbricas bifásicas
La misma rúbrica, dos usos:
- Fase A (formativa): se marcan descriptores, se subraya lo que falta, se sugieren acciones. No hay niveles numéricos.
- Fase B (sumativa): se muestran niveles y se asigna el desempeño final. El camino queda documentado.
7) Moderación entre docentes
Antes de calificar en firme, revisa muestras anónimas en equipo. El juicio cualitativo (evaluación) se afina; la calificación se emite después, ya calibrada. Ganaremos consistencia y reduciremos la variabilidad no deseada.
Recomiendo leer
Tweet
Riesgos previsibles
- “Si no cuenta, no lo hacen”. Vincula la práctica a beneficios visibles: sustitución de una parte de la sumativa por evidencias, acceso a reintentos en la prueba para quien completó la práctica.
- Sobrecarga de corrección. Usa bancos de comentarios, plantillas tipo “lo que va / lo que falta / siguiente paso” y rúbricas de un solo punto.
- Opacidad. Publica la rúbrica antes, muestra ejemplos con anotaciones (“qué los hace competentes”) y haga visibles los criterios de éxito en el aula.
- Equidad. Ofrece múltiples oportunidades de mostrar dominio del mismo criterio, minimice la penalización por tiempo cuando el objetivo es la competencia y no la velocidad, y cuide la accesibilidad de formatos (texto, oral, visual).
Referencias
- Black, P., & Wiliam, D. (1998). Assessment and Classroom Learning. Assessment in Education, 5(1), 7–74.
- Brookhart, S. (2017). How to Use Grading to Support Learning. ASCD.
- Guskey, T. R. (2015). On Your Mark: Challenging the Conventions of Grading and Reporting. Solution Tree.
- Hattie, J., & Timperley, H. (2007). The Power of Feedback. Review of Educational Research, 77(1), 81–112.
- Sadler, D. R. (1989). Formative Assessment and the Design of Instructional Systems. Instructional Science, 18, 119–144.
- Scriven, M. (1967). The methodology of evaluation. En R. Tyler et al. (Eds.), Perspectives of Curriculum Evaluation. Rand McNally.
- Stiggins, R. (2005). From Formative Assessment to Assessment FOR Learning: A Path to Success in Standards-Based Schools. Phi Delta Kappan, 87(4), 324–328.





Deja un comentario