https://doi.org/10.4438/1988-592X-RE-2025-409-687
Rubén Fernández-Alonso
Universidad de Oviedo
https://orcid.org/0000-0002-7011-0630
Laura M. Cañamero
Universidad de Oviedo
https://orcid.org/0000-0001-5828-004X
Álvaro Postigo
Universidad de Oviedo
https://orcid.org/0000-0003-4228-8965
José Carlos Núñez
Universidad de Oviedo
https://orcid.org/0000-0002-9187-1201
La relación entre repetición y nivel socioeconómico y cultural ha sido ampliamente estudiada en España, sin embargo, las estimaciones ofrecidas son variadas, incluso discordantes. Una razón de estas divergencias puede ser la dificultad de neutralizar dos tipos de sesgos inherentes a los estudios sobre repetición: el sesgo de selección y el control de covariables. El objetivo de esta investigación fue estimar la probabilidad de repetir en tres grupos de estatus social: bajo, medio y alto. Se manejó una muestra de 5999 estudiantes evaluados en dos momentos (T1 = 4º EP; y T2 = 2º ESO). En T1 la muestra era del mismo grado y misma edad: el alumnado no habían repetido previamente y las primeras repeticiones no se produjeron hasta finalizar 6º EP. El trabajo combinó dos aproximaciones analíticas: en T1 los grupos (repetición-promoción) fueron equiparados mediante un análisis de propensión para controlar el sesgo de selección pre-repetición. En T2, las estimaciones equiparadas se ajustaron a modelos logísticos multinivel, lo que añade el control de covariables post-repetición. En concreto se compararon las predicciones de tres modelos, definidos por el grado de control incluido en su diseño: (1) descriptivo, sin variables de control ni grupos equivalentes; (2) transversal, solo con control de covariables en T2; y (3) longitudinal, con doble control, es decir, grupos equivalentes pre-repetición más variables de ajuste post-repetición. Los resultados evidenciaron que el modelo con mejor control de sesgos (longitudinal) presenta efectos más moderados y parcialmente significativos. Los datos ponen de manifiesto la necesidad de desarrollar, en nuestro país, investigaciones específicas sobre repetición que incluyan medidas repetidas pre y post-repetición con muestras equiparadas, o el uso alternativo de enfoques cuasi-experimentales. De este modo el debate sobre la repetición escolar se enriquecerá con la aportación de datos plenamente válidos.
repetición, educación, estatus socio-económico, modelos jerárquicos, análisis de propensión
The relationship between repetition and socioeconomic and cultural level has been widely studied in Spain; however, the estimates offered are varied, even conflicting. One reason for these divergences may be the difficulty in neutralizing two types of biases inherent in repetition studies: selection bias and covariate control. The aim of this research was to estimate the probability of repeating in three social status groups: low, middle and high. A sample of 5999 students was used, assessed at two times (T1 = 4th grade; and T2 = 8th grade). In T1 the sample was from the same grade and age: the students had not previously repeated and the first repetitions did not occur until the end of 6th grade. The study combined two analytical approaches: In T1, the groups (retention-promotion) were matched using a propensity analysis to control for pre-retention selection bias. In T2, the matched estimates were adjusted using multilevel logistic models, incorporating control for post-retention covariates. Specifically, the predictions of three models were compared, defined by the degree of control included in their design: (1) descriptive, with no control variables or equivalent groups; (2) cross-sectional, with control for covariates only in T2; and (3) longitudinal, with dual control—pre-retention equivalent groups plus post-retention adjustment variables. The results showed that the model with better bias control (longitudinal) presents more moderate and partially significant effects. The data highlight the need to develop, in our country, specific research on grade repetition that includes repeated measures before and after repetition with matched samples, or the alternative use of quasi-experimental approaches. In this way, the debate on grade repetition will be enriched with the contribution of fully valid data.
La repetición escolar es una medida decimonónica. La escuela
graduada posibilitó la escolarización masiva en los emergentes estados
liberales y la repetición fue la
Una segunda fuente explicativa de la repetición residiría en ciertas características socio-demográficas, familiares y contextuales, tales como: ser hombre; emigrante; más joven que sus iguales; provenir de hogares desestructurados, familias reconstruidas y más diversas; y disponer de menos estímulos y recursos culturales o económicos (Cordero et al., 2014; Organisation for Economic Co-operation and Development [OECD], 2016; Urbano y Álvarez, 2019; Xia & Kirby, 2009). El presente trabajo se centrará en analizar la relación entre repetición y esta segunda fuente de variación.
Por otro lado, varios hechos indican que la repetición está culturalmente condicionada. Por ejemplo, su alcance varía ampliamente entre países, reflejando el grado de aceptación o rechazo de las sociedades hacia la medida (v.g., OECD 2010, 2016). También hay diferencias en las normativas nacionales que regulan la repetición (European Education and Culture Executive Agency, 2011) y en el modo en cómo los países manejan la diversidad del alumnado, lo cual parece asociado a la eficacia de la medida (Goos et al., 2021). Finalmente, los efectos de la repetición parecen depender de las medidas paliativas previstas: en algunos sistemas educativos la repetición no se acompaña de apoyos adicionales, mientras que en otros se prevén acciones complementarias, alternativas o programas especiales (Fernández-Alonso et al., 2022¸Valbuena et al., 2021). Todo ello justifica centrar el resto de la revisión teórica en el contexto español.
Comparada con la tradición anglosajona, la investigación española sobre repetición es muy reciente y, en gran parte, se desarrolla gracias a los datos liberados por las evaluaciones a gran escala nacionales (v.g., López-Agudo et al., 2024) e internacionales (v.g., Agasisti y Cordero, 2017; Blanco-Varela & Amoedo, 2025). Las conclusiones sobre la relación entre repetición y estatus social no parecen unánimes. Duran-Bonavila et al. (2024) encuentran que el estatus social pierde su capacidad para predecir la repetición cuando se controlan las habilidades cognitivas; y Fernández y Rodríguez (2008) señalan que el nivel socioeconómico deja de ser estadísticamente significativo al considerar los resultados en PISA. En línea similar, Carabaña (2011) afirma que la repetición no es una medida clasista, y que repetir se explica por lo que razonablemente cabría esperar: el desempeño escolar, medido también como las puntuaciones en PISA.
No obstante, la investigación española ha concluido mayoritariamente que existe una relación inversa entre las medidas de estatus social y la probabilidad de repetir (Arroyo et al., 2019; Cabrera et al, 2019; Carabaña, 2013, 2015; Choi et al., 2018; Cobreros & Gortazar, 2023; Cordero et al., 2014; García-Pérez et al., 2014; González-Betancor y López-Puig, 2016; López-Rupérez et al., 2021). Sin embargo, dentro de este grupo las estimaciones de la fuerza de la relación son variadas. Por ejemplo, Arroyo et al. (2019, p. 85) afirman que en la repetición “la preponderancia de las variables socioeconómicas no es clara”, y Carabaña (2015, p. 24) señala que “los determinantes sociales son mucho menos importantes” para explicar la repetición. En el extremo contrario, Cobreros & Gortazar (2023) y OECD (2016) concluyen que, a igualdad de competencias escolares el 25% del alumnado de menor nivel socioeconómico tiene casi cuatro veces más probabilidades de repetir que el 25% del alumnado de mayor nivel socioeconómico. Los datos de Choi et al., (2018) permiten estimar que la probabilidad de repetir de un estudiante situado en la mediana del cuarto inferior de estatus social es 4,4 veces mayor que la del alumnado ubicado en la mediana del cuarto superior. Los informes de fuentes oficiales, que generalmente contienen análisis descriptivos, ofrecen estimaciones aún más sombrías y compatibles con un sistema altamente reproductor de las desigualdades de acceso a la escuela (Instituto Vasco de Evaluación e Investigación Educativa [IVEI], 2009). El Alto Comisionado contra la Pobreza Infantil (2020) advierte que uno de cada dos estudiantes en hogares situados en el primer cuartil de renta repite durante la escolaridad obligatoria, mientras que en los hogares con más recursos esta cifra no llega a uno de cada diez; y la Consejería de Educación del Principado de Asturias (2016) concluye que el 60% de las repeticiones se concentran en el 30% del alumnado del estrato social bajo.
Esta variabilidad de resultados, que es muy poco útil para el diseño de las políticas educativas, podría explicarse, al menos en parte, por la calidad del diseño de los estudios: las investigaciones con escaso control sobre el sesgo de selección y el ajuste de covariables tienden a sobrestimar los efectos adversos de la repetición (Allen et al., 2009; Jackson, 1975; Lorence, 2006). En España, salvo excepciones (López-Agudo et al., 2024; Rodríguez-Rodríguez, 2022), la mayoría de la investigación sobre repetición está basada en diseños transversales (Choi et al., 2018) donde la principal variable independiente (por lo general los resultados en una prueba externa) se mide después de la dependiente (Carabaña, 2015). Ello puede contaminar las conclusiones, al ser imposible garantizar la equivalencia de los grupos (repetidores y promocionados) antes de repetir, introduciendo, por tanto, un sesgo de selección en las estimaciones.
El presente trabajo tiene como finalidad estimar las probabilidades de repetir de tres grupos de estatus sociocultural. Si bien, el objetivo no es original, nuestra investigación aporta una perspectiva novedosa en un doble sentido. En primer lugar, lo hará con una base de datos que cumple todas las características exigibles a una investigación de calidad sobre repetición (Goos et al., 2021; Valbuena et al., 2021): maneja una muestra representativa; dispone de un conjunto de covariables sustantivas medidas pre y post-repetición; y ejecuta un análisis de propensión para minimizar el sesgo de selección antes de repetir.
En segundo lugar, las precitadas características de la base de datos permiten plantear un objetivo adicional y novedoso en la literatura sobre repetición en España: mostrar cómo variaciones en el plan de análisis de unos mismos datos ofrecerán estimaciones diferentes sobre la magnitud de la relación repetición-estatus sociocultural. Para ello se compararán los resultados de tres modelos que se enuncian a continuación:
Hasta donde alcanza nuestro conocimiento, no existe en España un trabajo que incluya el doble control ante-y post-repetición sobre una única muestra. A la vista de las evidencias previas (v.g., Allen et al., 2009) se espera que el modelo con menor control de sesgos muestre efectos mayores, es decir, que sobreestime la probabilidad de repetir del alumnado de estatus social bajo. Sin embargo, el arreglo con mejor control experimental ofrecerá efectos más moderados que, en ciertas condiciones, podrían llegar a diluir la significación estadística.
La muestra inicial era de 7479 estudiantes que, en la práctica, conformaban la población escolar de 4º de Educación Primaria del Principado de Asturias en año académico 2008/09. Todo el alumnado fue evaluado en dos ocasiones, en 4º EP y 2º ESO, que en adelante denominaremos respectivamente T1 y T2. Para disponer de una muestra lo más homogénea posible, de la base original se eliminaron los siguientes casos: estudiantes sin información suficiente antes de T1 (N = 100); quienes repitieron antes de T1 (N = 677); quienes repitieron al finalizar 4º curso, es decir, seis semanas después de T1 (N = 149); y quienes no participaron en T2 por traslado entre T1 y T2 o por ausencia en T2 (N = 554). La muestra final quedó compuesta por 5999 estudiantes nacidos en 1999, que en T1 eran de la misma edad y curso. De ellos, 762 repetirán entre T1 y T2.
La información manejada proviene de tres fuentes: registros administrativos, pruebas cognitivas y cuestionarios de contexto para el alumnado.
Variable dependiente
Variable de interés
Variables de ajuste
Se consideraron 8 variables sociodemográficas. Dos
de nivel individual procedentes de los registros administrativos:
género (1 =
La trayectoria escolar y el rendimiento
académico se definieron con 12 variables. La medida de
trayectoria fue
Finalmente, se consideraron dos variables
socioemocionales: autoconcepto y esfuerzo académico. El
alumnado respondió a un cuestionario de contexto que contenía
cinco afirmaciones del tipo: “aprendo las lecciones fácilmente”.
Cada afirmación fue valorada en una escala Likert de cuatro
puntos: nunca o casi nunca; a veces; habitualmente; siempre o casi
siempre. Con las respuestas se construyó la escala Autoconcepto
académico (
Finalmente, la variable del esfuerzo académico
(Z
El estudio es una explotación secundaria de la
Como se señaló, para mitigar los sesgos inherentes a todo estudio sobre repetición esta investigación implementa una estrategia de doble de control: la equiparación de puntuaciones y el ajuste de modelos multinivel.
Equiparación de puntuaciones en T1
La equiparación de puntuaciones se realizó mediante un análisis
de propensión (PSM, por la siglas en inglés:
Inicialmente se seleccionaron las siguientes variables de
emparejamiento en T1: (1) factores sociodemográficos:
En la fase de ejecución los estudiantes de cada grupo se
emparejan según sus puntuaciones de propensión, las cuales se
expresan como la probabilidad condicional de recibir un
tratamiento (v.g., repetir) dado el vector de covariables
especificadas (Zhao et al., 2021). Existen diversos métodos de
emparejamiento y la literatura recomienda comparar varios y elegir
el que ofrezca mejor balance (Austin, 2014). En este caso se
compararon dos tipos de algoritmos. Por un lado, métodos de
emparejamiento de casos uno a uno: vecino más próximo sin
reemplazo, emparejamiento óptimo por pares y emparejamiento
genético. Por otro, los algoritmos que emplean pesos no uniformes:
vecino más próximo con reemplazo, emparejamiento generalizado
completo y subclasificación. Para mejorar el balance de las
equiparaciones, y dependiendo de las posibilidades de cada método,
se incluyeron
Finalmente, .el método de emparejamiento se seleccionó en función de dos criterios: robustez del balance y alcance muestral.
Nótese que cada criterio minimiza un tipo de sesgo que, en
ocasiones, son contrapuestos: efecto del tratamiento y selección
muestral. Mejor balance indica una adecuada equiparación y, por
tanto, menor sesgo al estimar el efecto del tratamiento. Sin
embargo, si para lograr una equiparación robusta deben imponerse
fuertes restricciones (por ejemplo, emparejar solo los casos con
diferencias muy pequeñas en sus puntuaciones de propensión)
entonces aumenta la probabilidad de excluir casos del
emparejamiento, lo que introduce el sesgo de selección muestral o
por emparejamiento incompleto. En este estudio, se consideró
balance satisfactorio cuando las diferencias estandarizadas entre
los grupos y las diferencias en la función de distribución
acumulada empírica (eCDF) eran cercanas a cero; y las ratios de
varianza cercanas a uno. Por otro lado, el sesgo por
emparejamiento incompleto se valoró según el porcentaje de casos
descartados, no emparejados y el tamaño de la muestra efectiva
lograda por cada algoritmo. El emparejamiento se realizó con el
paquete
Modelos multinivel en T2
Los fenómenos escolares son de naturaleza multinivel y, lógicamente, cada nivel de jerarquía tiene una variabilidad distinta y los errores no son independientes (Gaviria & Castro, 2005). Los modelos jerárquicos o multinivel están específicamente desarrollados para analizar datos que tienen estructura anidada y corrigen el problema del “efecto del diseño” en los casos donde los errores no son independientes (Fernández-Alonso & Muñiz, 2019). Por otro lado, dado que la variable dependiente es binaria no es realista asumir el supuesto de normalidad. Por ello, se empleó el modelo logístico binario multinivel (Bernouilli), que permite emplear variables predictoras de distinto tipo (continuas, discretas, binarias…) en todos los niveles de análisis.
Según lo señalado al final de la Introducción, en este estudio
se ajustaron tres modelos. El modelo 1, que estima las
probabilidades de repetir de cada grupo ISEC sin variables de
control, tiene dos funciones: servir de comparación para el resto
de modelos y recrear las estimaciones brutas del análisis
descriptivo. El modelo 2 incluye las covariables
sociodemográficas, escolares, cognitivas y socioemocionales
medidas en T2 y reproduce las estimaciones del diseño
Los resultados de estos modelos se presentarán en términos
Valores perdidos
El volumen de datos perdidos osciló, según la variable, entre
0% y 12% y se recuperaron en un procedimiento de dos etapas:
cuando un caso tiene datos incompletos en una variable, los datos
faltantes se reemplazaron por la media del sujeto. Para los
valores completamente perdidos se empleó el algoritmo
Previo a presentar el resultado de los modelos ajustados es necesario ofrecer evidencias sobre la calidad del emparejamiento de los grupos en T1. Es un punto básico para interpretar la comparación de los modelos posteriores, especialmente el resultado del modelo 3, donde se asume que la correlación entre repetición y los predictores en T1 (ante repetición) es igual a 0.
Equiparación de los grupos en T1
Los dos procedimientos de emparejamiento con mejor balance fueron: el vecino más próximo sin reemplazo (NN) entre los algoritmos de equiparación uno-a-uno y el emparejamiento generalizado completo (GFM) entre los algoritmos con pesos no-uniformes. Finalmente el eligió el GFM porque, a diferencia del NN, permite usar todos los casos del grupo de control, criterio preferible cuando, como era este caso, dos procedimientos ofrecen un balanceo similar (Sävje et al., 2021). La muestra equiparada quedó compuesta por 762 repetidores y 5237 no-repetidores que equivalen a una muestra de control efectiva de 395 casos.
El Gráfico I representa las diferencias de medias estandarizadas entre los grupos antes y después de la equiparación. Antes de la equiparación, la posición de los círculos advierte de diferencias altamente significativas que favorecen al grupo de promocionados: por ejemplo, la diferencia de las calificaciones escolares está en torno a 1,5 desviaciones típicas. Con este desequilibrio en T1 será imposible dilucidar si las potenciales diferencias que se encuentren en T2 son fruto de haber repetido o sólo reflejan la discrepancia inicial.
GRAFICO I. Diferencia de medias (puntos Z) entre los grupos antes y después de la equiparación.

Nota . MGR = Media General de Rendimiento; ING = Inglés; AaA = Aprender a Aprender; SOC = Competencia Social y Ciudadana; AutoCon = Autoconcepto Académico; Esfuerzo = Esfuerzo Académico; ISEC = Índice Socioeconómico y Cultural.Fuente: elaboración propia
Los cuadrados reflejan las diferencias después de la equiparación: todas ellas son inferiores a |0,1| y, por ello, los marcadores oscilan sobre el valor Z = 0. Así, el emparejamiento estadístico configuró dos grupos que antes de repetir eran comparables en cuanto a rendimiento previo, rasgos socio-emocionales y características sociodemográficas. Ello permite descartar que las diferencias que potencialmente se encuentren en T2 estén relacionadas con las variables equiparadas en T1, minimizando el sesgo de selección de los grupos a comparar.
Comparación de modelos
La Tabla I muestra los resultados del modelo descriptivo. El intercepto (-1,94) corresponde al logit del ISEC_Medio, el cual tiene asociada una probabilidad de repetir baja (OR = 0,14) y bastante precisa dado el estrecho margen del intervalo de confianza. Por su parte, la OR del grupo ISEC_Alto (0,17) señala una probabilidad de repetir aproximadamente un 85% más baja que en el grupo de referencia, mientras que el alumnado del grupo bajo tiene más del doble de posibilidades de repetir que el grupo medio y casi unas 13 veces más (2,11 / 0,17) que el grupo alto.
TABLA I. Modelo sin covariables de ajuste: predicción de repetir
| Efectos Fijos | Coeficiente | Error típico | Odds Ratio | Intervalo de confianza |
|---|---|---|---|---|
| Intercepto (ISEC_Medio) | -1,943 | 0,074 | 0,143 | (0,124;0,166) |
| ISEC_Alto | -1,792 | 0,154 | 0,167 | (0,123;0,225) |
| ISEC_Bajo | 0,749 | 0,088 | 2,114 | (1,781;2,511) |
Fuente: elaboración propia |
||||
La Tabla II recoge las estimaciones del modelo transversal. Al incluir las variables de control, la probabilidad de repetir en el grupo ISEC_Medio se reduce en casi dos tercios (OR = 0,06). La OR del grupo alto prácticamente se duplica (0,30), señalando que la probabilidad de repetir se reduce al 70%, mientras que en el grupo ISEC_Bajo la probabilidad de repetir es aproximadamente un 66% más alta que en el grupo de referencia y unas 5,5 veces superior al grupo ISEC_Alto.
TABLA II. Modelo transversal: predicción de repetir
| Efectos Fijos | Coeficiente | Error típico | Odds Ratio | Intervalo de confianza | |
|---|---|---|---|---|---|
| Intercepto (ISEC_Medio) | -2,901 | 0,148** | 0,055 | (0,041,0,074) | |
| Variables de interés | |||||
| ISEC_Alto | -1,207 | 0,185** | 0,299 | (0,208;0,430) | |
| ISEC_Bajo | 0,505 | 0,113** | 1,657 | (1,327;2,069) | |
| Variables individuales | |||||
| Cambia de Centro | 0,985 | 0,198** | 2,677 | (1,816;3,947) | |
| Mujer | -0,266 | 0,098** | 0,766 | (0,632;0,929) | |
| Emigrante | 0,908 | 0,219** | 2,479 | (1,615;3,804) | |
| ZMGR_T2 | -1,389 | 0,103** | 0,249 | (0,204;0,305) | |
| ZAutoCon_T2 | -0,369 | 0,074** | 0,691 | (0,598;0,799) | |
| ZEsfuerzo_T2 | -0,388 | 0,062** | 0,678 | (0,600;0,766) | |
| Variables de centro | |||||
| yCentro_Público_T2 | -1,055 | 0,202** | 0,348 | (0,234;0,519) | |
| yEmigrante_T2 | 0,951 | 1,412 | 2,589 | (0,159;42,19) | |
| yZISEC_T2 | -0,756 | 0,149** | 0,469 | (0,350;0,630) | |
| yZMGR_T2 | -0,827 | 0,261** | 0,438 | (0,261;0,733) | |
| yZAutoCon_T2 | 0,004 | 0,436 | 1,004 | (0,424;2,380) | |
| yZEsfuerzo_T2 | 0,177 | 0,304 | 1,194 | (0,655;2,179) | |
Fuente: elaboración propia |
|||||
En el modelo longitudinal (Tabla III) el principal cambio ocurre con el alumnado de ISEC_Bajo: el coeficiente queda en el límite de la significación estadística y su probabilidad de repetir es solo un 3% mayor que la del grupo ISEC_Medio. En la comparación entre los grupos extremos el efecto también se reduce drásticamente, prácticamente a la mitad: la OR del grupo ISEC_Bajo es ahora 2,4 veces mayor que la del ISEC_Alto. Algunas covariables en T2 pierden su significación estadística por el efecto de la equiparación estadística en T1.
TABLA III. Modelo longitudinal: predicción de repetir
| Efectos Fijos | Coeficiente | Error típico | Odds Ratio | Intervalo de confianza | |
|---|---|---|---|---|---|
| Intercepto (ISEC_Medio) | -2,965 | 0,241** | 0,052 | (0,032;0,083) | |
| Variables de interés | |||||
| ISEC_Alto | -1,009 | 0,234** | 0,423 | (0,323;0,554) | |
| ISEC_Bajo | 0,410 | 0,172* | 1,030 | (0,872;1,217) | |
| Variables individuales | |||||
| Cambia de Centro | 0,554 | 0,272* | 0,807 | (0,443;1,468) | |
| Mujer | 0,146 | 0,134 | 0,364 | (0,230;0,577) | |
| Emigrante | -0,215 | 0,305 | 1,507 | (1,075;2,111) | |
| ZMGR_T2 | -0,861 | 0,138** | 0,509 | (0,442;0,587) | |
| ZAutoCon_T2 | 0,030 | 0,085 | 1,158 | (0,890;1,505) | |
| ZEsfuerzo_T2 | -0,675 | 0,073** | 0,807 | (0,443;1,468) | |
| Variables de centro | |||||
| yCentro_Público_T2 | -0,663 | 0,320* | 0,515 | (0,274;0,969) | |
| yEmigrante_T2 | -2,748 | 2,133 | 0,064 | (0,001;4,342) | |
| yZISEC_T2 | -0,224 | 0,301 | 0,800 | (0,441;1,449) | |
| yZMGR_T2 | -0,734 | 0,476 | 0,480 | (0,187;1,230) | |
| yZAutoCon_T2 | -0,678 | 0,751 | 0,508 | (0,115;2,239) | |
| yZEsfuerzo_T2 | 0,631 | 0,491 | 1,158 | (0,890;1,505) | |
Fuente: elaboración propia |
|||||
El gráfico II representa una forma alternativa de comparar las estimaciones de los modelos. Muestra la probabilidad de repetir en cada grupo según el modelo. Se observa cómo el modelo longitudinal rebaja drásticamente las posibilidades de repetición de los grupos medio y bajo, manteniendo bastante estable la probabilidad del grupo más favorecido.
GRAFICO II. Probabilidad de repetir por modelo y grupo de ISEC

Fuente: elaboración propia
Mayoritariamente, la investigación educativa ha identificado una asociación inversa entre los indicadores de estatus social y la probabilidad de repetir. No obstante, las conclusiones no son unánimes (v.g., Fernández & Rodríguez, 2008). Además, entre las investigaciones que encuentran relaciones significativas las estimaciones de la fuerza de la asociación son bastante variables (v.g., Carabaña, 2015; Cobreros & Gortazar, 2023). Una razón plausible de estas diferencias pudiera ser el diseño de los estudios, estando bien documentado que la falta de control de los sesgos tiende a sobrestimar los efectos negativos de la repetición (Lorence, 2006).
En este contexto, la presente investigación compara la probabilidad de repetir en función del estatus socioeconómico y cultural, ajustando sobre una misma base de datos tres modelos analíticos que simulan otros tantos diseños de investigación: (1) descriptivo, sin control de variables; (2) transversal, con control de covariables post-repetición; y (3) longitudinal, con doble control de sesgos ante- y post-repetición. Hasta donde alcanza nuestro conocimiento, se trata de un estudio inédito en la investigación española sobre la asociación repetición-estatus social. La comparación es posible porque se dispone de una base de datos de alta calidad que permite simular condiciones de análisis que incluyan paulatinamente mayores controles de los sesgos asociados a la repetición.
En coherencia con la mayor parte de la investigación previa (v.g., Choi et al., 2018; Cordero et al., 2014; García-Pérez et al., 2014; López-Rupérez et al., 2021) el estudio concluye que la repetición está afectada por la clase social. Esta evidencia también ha sido confirmada en estudios realizados en sistemas educativos muy diversos (v.g., Bastos & Ferrão, 2019; Ferrão et al., 2017; Klapproth & Schaltz, 2015; Salza, 2022; Xia & Kirby, 2009). Sin embargo, nuestros datos señalan que, al menos en el contexto español, la relación entre repetición y clase social debe ser matizada. Como era esperable en el modelo descriptivo el estatus socio-cultural tiene un fuerte impacto en la probabilidad de repetir. Los estudiantes de ISEC bajo enfrentan mayores probabilidades de repetir que su compañeros de ISEC medio, mientras que los estudiantes de ISEC alto están significativamente protegidos frente al riesgo de repetición. El modelo 2 reproduce las estimaciones de los análisis transversales, mayoritarios en la investigación española: todas las covariables en T2 son significativas y, una vez controladas, la probabilidad de repetir del grupo ISEC_Bajo es 5,5 veces mayor que la del ISEC_Alto, un valor similar al estimado para Asturias con los datos de los dos últimos PISA (6,2 veces, Cobreros & Gortazar, 2023).
En el tercer modelo se producen algunos cambios interesantes que se
resumen en tres conclusiones. En primer lugar, comparado con el modelo
transversal, el modelo longitudinal reduce la disparidad en la
probabilidad de repetir entre los grupos de ISEC extremos (bajo vs
alto) en un 56%, pasando de 5,5 a 2,4 veces. Ello parece confirmar que
un mayor control de sesgos produce estimaciones más conservadoras del
efectos negativos de la repetición (Allen et al., 2009). Aunque en
España hay trabajos que van más allá del ajuste de covariables en
diseños descriptivos
En segundo lugar, se observó que, en el modelo longitudinal la diferencia en las OR de los grupos de ISEC medio y bajo prácticamente desaparece. Ello introduce una matización a las conclusiones previas sobre la relación entre repetición y clase social. Existe cierto consenso (v.g., Carabaña, 2015; García-Pérez et al., 2014) al señalar que la repetición tiende a concentrarse en los hijos de madres con pocos estudios o en la minoría cuyos progenitores presentan niveles de instrucción muy bajos. Los datos actuales apuntan a una interpretación alternativa ya que las clases medias y bajas muestran probabilidades de repetición similares. En el contexto español, donde repite un tercio de la población escolar, este hallazgo tampoco parece tan sorprendente: con semejante alcance tampoco cabría esperar que la clase media salga indemne. Por tanto, a la vista de las estimaciones del modelo longitudinal bien parece que lo más correcto sería decir que en España puede repetir el hijo de cualquiera, salvo que provenga de un hogar de estatus socio-cultural alto.
Por último, al margen del efecto del estatus social, el modelo longitudinal ha identificado dos variables personales altamente significativas en T2: las calificaciones escolares y el esfuerzo académico, es decir, los dos criterios fundamentales empleados por los equipos docentes para proponer la medida de repetición. En ese sentido, el modelo ofrece una imagen coherente con lo esperado en el tema (Carabaña, 2011).
Las anteriores matizaciones no deben ocultar que la conclusión general de este trabajo es preocupante: en España, a igualdad de dificultades de aprendizaje, niveles de esfuerzo y otras características sociodemográficas, la clase social impacta diferencialmente en las propuestas de repetición de los equipos docentes. Ello invita a reflexionar sobre el contexto en que se toma la decisión y sus consecuencias sobre la equidad del sistema. La repetición está catalogada como una medida extraordinaria de atención a la diversidad. Sin embargo, un hecho que afecta al 30% no debiera considerarse tan extraordinario. Nuestras evidencias insisten en la necesidad de tomar la decisión con cautela para que no contribuya a incrementar las desigualdades de acceso y permanencia en el sistema educativo o, como señalan estos datos, para no reproducir la situación de privilegio de la minoría situada en el escalón más alto del estatus socio-cultural.
Finalmente, los datos de este estudio deben interpretarse a la luz de varias limitaciones. En primer lugar, las dos medidas están separadas por cuatro cursos. Disponer de una medida intermedia hubiera permitido tener mayor control de las trayectorias escolares: tal distancia entre las dos medidas ha podido introducir variaciones que afecten a los resultados (Kretschmann et al., 2019). Por otro lado, aunque el conjunto de variables de ajuste es bastante sustantivo, no se dispone de medidas específicas de habilidades cognitivas y de relaciones sociales y, por ello, no es posible saber cómo afectaría a los resultados contar con este tipo de variables que parecen modular la relación entre repetición y estatus social (Duran-Bonavila et al, 2024; Wu et al., 2010). Además, las medidas socioemocionales empleadas (autoconcepto y esfuerzo) fueron autoinformadas por el alumnado y todas las afirmaciones de los ítems estaban redactadas en sentido positivo. Por tanto, no puede descartarse que las puntuaciones socioemocionales empleadas incluyan sesgos de aquiescencia (Hernández-Dorado et al., 2025; Primi et al., 2019). Para superar estas limitaciones la investigación futura sobre repetición en España necesitará diseñar estudios específicos que incluyan el seguimiento de cohortes a lo largo de la escolarización y medidas repetidas pre- y post-repetición. Son necesarios, por tanto, diseños con muestras equiparadas o que alternativamente empleen algún enfoque cuasi-experimental (análisis de discontinuidad en la regresión, métodos basados en variables instrumentales o análisis de diferencias en diferencias) para controlar los sesgos y disponer de estimaciones ajustadas. Igualmente, convendría considerar un conjunto amplio de resultados educativos, más allá del rendimiento académico (v.g., esfuerzo, factores socio-afectivos y de ajuste social, etc.) y conectar la repetición con resultados a medio-largo plazo, tales como abandono educativo temprano de la educación y la formación o la incorporación al mercado de trabajo.
En países con alta tasa de repetición como España, impera la
Este artículo dispone de material suplementario online donde se
muestran los detalles del análisis PSM (comparación de los algoritmos
de equiparación, evaluación del balance y ejemplos de script):
Agasisti, T., & Cordero, J. M. (2016). The determinants of
repetition rates in Europe: Early skills or subsequent parents’ help?
Allen, C. S., Chen, Q., Willson, V. L., & Hughes, J. N. (2009).
Quality of research design moderates effects of grade retention on
achievement: A meta-analytic, multi-level analysis.
Alto Comisionado contra la Pobreza Infantil (2020).
Arroyo, D., Constante, I. A., & Asensio, I. (2019). La
repetición de curso a debate: Un estudio empírico a partir de PISA
2015.
Austin, P. C. (2014). A comparison of 12 algorithms for matching on
the propensity score.
Ayres, L. P. (1909).
Bastos, A., & Ferrão, M. E. (2019). Analysis of grade
repetition through multilevel models: A study from Portugal.
Biegler, C. D., & Green, V. P. (1993). Grade retention: A
current issue.
Blanco-Varela, B., & Amoedo, J. M. (2025). Efectos de la
repetición escolar según el perfil socioeconómico del
estudiante.
Cabrera, L., Pérez, C., Santana, F. & Betancort, M. (2019).
Desafección escolar del alumnado repetidor de segundo curso de
Enseñanza Secundaria Obligatoria.
Calderón-Garrido, C., Navarro-González, D., Lorenzo-Seva, U., &
Ferrando, P. J. (2019). Multidimensional or essentially
unidimensional? A multi-faceted factor-analytic approach for assessing
the dimensionality of tests and items.
Carabaña, J. (2011). Las puntuaciones PISA predicen casi toda la
repetición de curso a los 15 años en España.
Carabaña, J. (2013). Repetición de curso y puntuaciones PISA ¿cuál
causa cuál? En Ministerio de Educación, Cultura y Deporte (Ed.),
Carabaña, J. (2015). Repetir hasta 4º de Primaria: determinantes
cognitivos y sociales según PIRLS.
Choi, Á., Gil, M., Mediavilla, M., & Valbuena, J. (2018).
Predictors and effects of grade repetition.
Cobreros, L, & Gortazar, L. (2023).
Consejería de Educación del Principado de Asturias (2016). La
repetición escolar: hechos y creencias.
Cordero, J. M., Manchón, C., & Simancas, R. (2014). La
repetición de curso y sus factores condicionantes en España.
du Toit, M. (2003).
Duran-Bonavila, S., Rodríguez-Gómez, A., & Becerril-Galindo, M.
(2024). Determinants of grade repetition in Spain. Analysis of
cognitive and socio-economic, mediated by ethnic factors.
European Education and Culture Executive Agency. (2011).
Fernández, J. J., & Rodríguez, J. C. (2008). Los orígenes del
fracaso escolar en España: Un estudio empírico.
Fernández-Alonso, R., Suárez-Álvarez, J., & Muñiz, J. (2012).
Imputación de datos perdidos en las evaluaciones diagnósticas
educativas [Imputation methods for missing data in educational
diagnostic evaluation].
Fernández-Alonso, R., & Muñiz, J. (2019). Calidad de los
sistemas educativos: modelos de evaluación.
Fernández-Alonso, R., Postigo, Á., García-Crespo, F. J., Govorova,
E., & Ferrer, Á. (2022).
Ferrando, P. J., & Lorenzo-Seva, U. (2017). Program FACTOR at
10: Origins, development and future
directions.
Ferrão, M. E., Costa, P. M., & Matos, D. A. S. (2017). The
relevance of the school socioeconomic composition and school
proportion of repeaters on grade repetition in Brazil: A multilevel
logistic model of PISA 2012.
García-Pérez, J. I., Hidalgo-Hidalgo, M., & Robles-Zurita, J.
A. (2014). Does grade retention affect students’ achievement? Some
evidence from Spain.
Gaviria, J. L., & Castro, M. (2005).
González-Betancor, S. M., & López-Puig, A. J. (2016). Grade
retention in primary education is associated with quarter of birth and
socioeconomic status.
Goodlad, J. I. (1954). Some effects of promotion and non-promotion
upon the social and personal adjustment of children.
Goos, M., Pipa, J., & Peixoto, F. (2021). Effectiveness of
grade retention: A systematic review and meta-analysis.
Greifer, N. (2023).
Heffernan. H., Gilbertson, E., Greenblatt, E., & Hills, J. A.
(1952). What research says about nonpromotion.
Hernández-Dorado, A., Ferrando, P. J., & Vigil-Colet, A.
(2025). The impact and consequences of correcting for acquiescence
when correlated residuals are present.
Ho, D. E., Imai, K., King, G., & Stuart, E. A. (2011). MatchIt:
Nonparametric Preprocessing for Parametric Causal Inference.
Holmes, C. T. (1989). Grade level retention effects: A
meta-analysis of research studies. In L. A. Shepard, & M. L. Smith
(Eds.),
Holmes, C. T., & Matthews, K. M. (1984). The effects of
nonpromotion on elementary and junior high school pupils: A
meta-analysis.
Hong, G., & Yu, B. (2008). Effects of kindergarten retention on
children´s social-emotional development: an application of propensity
score method to multivariate, multilevel data.
Hunt, C. S., & Seiver, M. (2017). Social class matters: Class
identities and discourses in educational contexts.
Instituto Nacional de Evaluación Educativa (2019).
Instituto Vasco de Evaluación e Investigación Educativa (IVEI).
(2009)
Jackson, G. B. (1975). The research evidence on the effects of
grade retention.
Jimerson, S. R. (2001a). Meta-analysis of grade retention research:
Implications for practice in the 21st century.
Jimerson, S. R. (2001b). A synthesis of grade retention research:
Looking backward and moving forward.
Klapproth, F., & Schaltz, P. (2015). Who is retained in school,
and when? Survival analysis of predictors of grade retention in
Luxembourgish secondary school.
Kretschmann, J., Vock, M., Lüdtke, O., Jansen, M., & Gronostaj,
A. (2019). Effects of grade retention on students’ motivation: A
longitudinal study over 3 years of secondary school.
López-Agudo, L.A., Latorre, C.P. & Marcenaro-Gutierrez, O.D.
(2024). Grade retention in Spain: The right way?
López-Rupérez, F., García-García, I., & Expósito-Casas, E.
(2021). La repetición de curso y la graduación en Educación Secundaria
Obligatoria en España. Análisis empíricos y recomendaciones políticas.
Lorence, J. (2006). Retention and academic achievement research
revisited from a United States perspective.
Mejía-Rodríguez, A. M., Luyten, H., & Meelissen, M. R. (2021).
Gender differences in mathematics self-concept across the world: An
exploration of student and parent data of TIMSS
2015.
Méndez, I., & Cerezo, F. (2018). La repetición escolar en
Educación Secundaria y factores de riesgo asociados.
Michavila, F., & Narejos, A. (2021).
Mullis, I. V. S., von Davier, M., Foy, P., Fishbein, B., Reynolds,
K. A., & Wry, E. (2023).
OECD (2010).
OECD (2016).
Peña-Suárez, E., Fernández-Alonso, R., & Fernández, J. M.
(2009). Estimación del valor añadido de los centros escolares.
Postigo, Á., Cuesta, M., Fernández-Alonso, R., García-Cueto, E.,
& Muñiz, J. (2021a). Academic grit modulates school performance
evolution over time: A latent transition analysis.
Postigo, Á., Cuesta, M., Fernández-Alonso, R., García-Cueto, E.,
& Muñiz, J. (2021b). Temporal stability of grit and school
performance in adolescents: A longitudinal
perspective.
Primi, R., Santos, D., De Fruyt, F., & John, O. P. (2019).
Comparison of classical and modern methods for measuring and
correcting for acquiescence.
R Core Team (2023).
Raudenbush, S. W., Bryk, A. S., Cheong, Y. F., Congdon, R. T.,
& Du Toit, M. (2011).
Rodríguez-Rodríguez, D. (2022). Grade Retention, Academic
Performance and Motivational Variables in Compulsory Secondary
Education: A Longitudinal
Study.
Salza, G. (2022). Equally performing, unfairly evaluated: The
social determinants of grade repetition in Italian high schools.
Sävje, F., Higgins, M., & Sekhon, J. (2021). Generalized Full
Matching.
Sekhon, J. S. (2011). Multivariate and propensity score matching
software with automated balance optimization: The matching package for
R.
Shepard, L. A., & Smith, M. L. (1989).
Shepard, L. A., & Smith, M. L. (1990). Synthesis of research on
grade retention.
Stuart, E. A. (2010). Matching methods for causal inference: A
review and a look forward.
Timmerman, M. E., & Lorenzo-Seva, U. (2011). Dimensionality
assessment of ordered polytomous items with Parallel Analysis.
Urbano, A., & Álvarez, L. (2019). La repetición de curso en la
adolescencia: Influencia de variables sociofamiliares.
Valbuena, J., Mediavilla, M., Choi, Á., & Gil, M. (2021).
Effects of Grade Retention Policies: A Literature Review of Empirical
Studies Applying Causal Inference.
Wu, W., West, S. G., & Hughes, J. N. (2010). Effect of grade
retention in first grade on psychosocial outcomes.
Xia, N., & Kirby, S. N. (2009).
Zhao, Q. Y., Luo, J. C., Su, Y., Zhang, Y. J., Tu, G. W., &
Luo, Z. (2021). Propensity score matching with R: conventional methods
and new features.
Información de contacto / Contact info: Laura M. Cañamero. Universidad de Oviedo, Facultad de Psicología, Departamento de Psicología. E-mail: lauramcanamero@uniovi.es