Valor añadido en la educación: Mapeando las contribuciones de Portugal y España

Value-added in Education: Mapping the contributions from Portugal and Spain

https://doi.org/10.4438/1988-592X-RE-2025-409-700

Maria Eugénia Ferrão

Universidade da Beita Interior

https://orcid.org/0000-0002-1317-0629

Resumen

Este estudio examina las contribuciones de Portugal y España a la Investigación sobre la Eficacia Educativa (IEE) y a las medidas de valor añadido (VA) desde 2000 hasta 2024, mediante el análisis de 37 artículos de investigación publicados en español (51%), inglés (38%) o portugués (11%). El análisis aborda tres preguntas clave: el panorama de la producción de conocimiento, los autores y artículos influyentes, y la estructura temática en evolución del campo. Se utiliza el método de scoping review con el uso de análisis bibliométrico, análisis de contenido y de co-ocurrencia a través de palabras clave del autor. La revisión abarca a 73 autores, y el 32 % de los artículos presentan colaboraciones internacionales. Los resultados muestran que el 52 % de los estudios utiliza datos longitudinales y el 19 % se basa en evaluaciones internacionales. La mayoría de los artículos considera los resultados escolares en matemáticas, mientras que un 40% también trata los resultados en lectura. En cuanto al propósito, los modelos VA se emplean principalmente para la mejora y evaluación educativa, sin estudios sobre elección de escuelas o rendición de cuentas de alto impacto. El estudio enfatiza la necesidad de una mayor visibilidad e integración de la IEE en estas regiones y ofrece recomendaciones para investigaciones futuras, contribuyendo a políticas y prácticas educativas basadas en evidencia en el sur de Europa.

Palabras clave:

eficacia escolar, evaluación, mapeo científico, mejora educativa, modelo de valor añadido

Abstract

This study examines Portugal and Spain´s contributions to Educational Effectiveness Research (EER) and value-added (VA) measures from 2000 to 2024 by analyzing 37 research papers published in Spanish (51%), English (38%), or Portuguese (11%). The analysis addresses three key questions: the knowledge production landscape, influential authors and articles, and the field´s evolving thematic structure. The scoping review method is used with bibliometric analysis, content analysis, and co-occurrence analysis through author keywords.The review covers 73 authors, with 32% of articles featuring international collaborations. Results show that 52% of studies use longitudinal data, and 19% rely on international large scale assessments. The majority of the articles (65%) consider school performance in mathematics, while 40% also address reading performance. Regarding the purpose, VA models are mainly used for educational improvement and evaluation, with no studies on school choice or high-stakes accountability. The study emphasizes the need for greater visibility and integration of EER in these regions and offers recommendations for future research, contributing to evidence-based educational policy and practice in Southern Europe.

Keywords:

evaluation, mapping science, school effectiveness, school improvement, value added model

Introducción

Durante más de 50 años, la investigación educativa ha demostrado sistemáticamente que los profesores y las escuelas tienen un impacto profundo y duradero en el desarrollo de los niños. Esto es especialmente evidente en la investigación de la eficacia educativa (IEE), que se centra en la eficacia tanto de los profesores como de las escuelas en la configuración de los resultados educativos (AERA-American Educational Research Association, 2015; Longford, 2012; Morganstein & Wasserstein, 2014; Reynolds et al., 2014). El concepto de valor añadido (VA) en educación y el uso de medidas de valor añadido como base para la investigación de la eficacia educativa son esenciales (Sammons et al., 2016). El concepto de VA en educación surgió en la literatura motivado por el campo de la evaluación educativa. Apareció por primera vez en un estudio sobre la economía de la educación (Hanushek, 1971) que se centraba en la evaluación de la eficacia de los profesores, concretamente en la relación entre las características de los profesores y las ganancias de aprendizaje de los alumnos. Posteriormente se trató en un artículo sobre estadística educativa (Bryk y Weisberg, 1976), donde el concepto, su teoría y su modelización se presentaron como el enfoque metodológico más adecuado para evaluar el impacto de las intervenciones y los programas destinados a mejorar los resultados de aprendizaje de los alumnos.

Hanushek (1971) formula y explora tres cuestiones de investigación que siguen siendo pertinentes y oportunas para la política educativa en todo el mundo: "(1) ¿Los profesores marcan la diferencia? (2) ¿Funcionan eficazmente las escuelas? (3) ¿Cuáles son las características relevantes de los profesores y las aulas?". (Hanushek, 1971, p. 280). Reconociendo que el principal interés del modelo conceptual y estadístico a efectos de la política pública se centra en la influencia de las características de los centros escolares en los resultados de los alumnos, el autor explica la motivación del trabajo de la siguiente manera:

Los estudios anteriores han dado respuestas ambiguas a estas preguntas, en gran parte debido a la insuficiencia de datos. En concreto, no se ha dispuesto de ningún conjunto de datos que proporcione información histórica precisa sobre las aportaciones educativas a nivel individual (Hanushek, 1971, p. 280).

Estas tres preguntas de investigación pertinentes tuvieron resultados ambiguos hasta 1976 debido al uso de datos inadecuados. En otras palabras, hasta ese momento, ningún conjunto de datos había satisfecho simultáneamente dos condiciones esenciales: (1) uso de datos históricos precisos sobre aportaciones educativas; (2) considerar al alumno como unidad estadística de observación/análisis.

Bryk y Weisberg (1976), por su parte, presentan los fundamentos de la "Teoría de la estrategia de valor añadido",

En lugar de asumir un modelo estático de insumo-producto, preferimos pensar en un programa educativo como una intervención dinámica en un proceso de desarrollo continuo. [...] El efecto de cualquier programa innovador es cambiar la tasa de crecimiento del grupo de individuos expuestos a él. El objetivo de la evaluación es, pues, comparar el crecimiento real observado en el marco de una intervención con el que se habría producido en su ausência (Bryk & Weisberg, 1976, p. 130).

Las investigaciones sobre IEE y VA han interesado principalmente a la comunidad científica de los Estados Unidos de América (EE.UU.) y del Reino Unido (RU). Desde la década de 1990, se han producido notables avances en el tratamiento y la resolución de cuestiones de metodología estadística, lo que ha permitido un análisis más riguroso y una interpretación más precisa tanto del rendimiento individual de los alumnos como del rendimiento académico escolar (Saunders, 1999). La adopción de un modelo estadístico que incorpore la estructura multinivel de la población educativa (Plewis, 1997) se convirtió en un requisito metodológico en la IEE (Creemers, 2006; Goldstein, 1997). Aborda las características de los datos - el diseño longitudinal y la estructura multinivel - al tiempo que justifica teóricamente su necesidad para comprender la eficacia educativa y su impacto multinivel en el desarrollo de los estudiantes.

Se esbozan seis requisitos metodológicos clave frecuentemente referidos a la IEE (Goldstein, 1997; Mortimore, 1991; Strand, 2011, 2016): (1) Evaluación de los conocimientos previos y su inclusión como variable independiente: Esto se logra típicamente a través de la administración de pruebas estandarizadas para evaluar el conocimiento previo de los estudiantes con el fin de formar parte del componente determinista del modelo; (2) Análisis longitudinal de datos: Los estudios deben tener en cuenta la naturaleza longitudinal del aprendizaje utilizando datos que incluyan observaciones repetidas tanto de las variables de resultado (a menudo las puntuaciones de los exámenes estandarizados) como de las covariables relevantes para cada estudiante a lo largo del tiempo; (3) Estructura de población multinivel: Es esencial reconocer e incorporar la estructura jerárquica de los datos, como estudiantes anidados dentro de aulas o escuelas, para garantizar un análisis preciso; (4) Consideración de factores externos: Los estudios deben tener en cuenta los factores extraescolares que podrían influir en el aprendizaje de los alumnos, como la situación socioeconómica o los antecedentes culturales, que son determinantes clave de los resultados educativos. Además, los estudios centrados en la estabilidad de las puntuaciones de valor añadido o los cambios en el rendimiento escolar a lo largo del tiempo deben cumplir los siguientes criterios adicionales. (5) Datos longitudinales con múltiples cohortes: Se requiere un mínimo de tres cohortes para realizar un seguimiento de los cambios en el rendimiento y garantizar un análisis longitudinal sólido; (6) Análisis orientado al cambio: Para estimar el rendimiento escolar a largo plazo, es esencial centrarse en el análisis orientado al cambio (Gray et al., 1995), incluyendo métodos que capten los cambios en la eficacia escolar a lo largo del tiempo (Kyriakides & Creemers, 2008).

Además, en los últimos 50 años la literatura sobre VA incluye el debate sobre su definición (Arias & Soto, 2009; Braun, 2005; Saunders, 1999), sobre la modelización teórica, conceptual y estadística (Ballou et al., 2004; Ferrão & Goldstein, 2009; Goldstein, 1997; Ray et al., 2009), los requisitos metodológicos y la calidad de los datos (AERA, 2015; Morganstein & Wasserstein, 2014), o el propósito y uso de las medidas de valor añadido (Darling-Hammond, 2015; OCDE, 2008). El acusado desarrollo de la IEE se pone de manifiesto en los cientos de documentos o folletos publicados (Reynolds et al., 2014; Thomas et al., 2016). En Europa continental se hace referencia a estudios en Bielorrusia, Chipre, Hungría, Francia, Países Bajos, Noruega, Bélgica y Alemania (Creemers, 2007; Thomas et al., 2016). Otros países europeos como Grecia, Italia, Portugal y España son mencionados por Creemers, Stoll, Reezigt y el equipo ESI (2007; p.826-858) en relación con el proyecto Effective School Improvement (ESI), que se desarrolló entre 1998 y 2001. Murillo (2003) señala que la investigación en los países iberoamericanos se ha expandido con el tiempo, en gran parte debido al fuerte apoyo institucional. Además, se observa que en España se ha realizado un número significativo de estudios. En cuanto a Portugal, el autor se refiere a la participación en el proyecto ESI. Poco se sabe de los IEE realizados en España y Portugal.

Recientes revisiones bibliográficas (Everson, 2017; Levy et al., 2019) muestran de forma inequívoca los hallazgos sobre VA y/o IEE en muchos otros países, mostrando la densificación y globalización del conocimiento sobre el tema. Levy at al. (2019) destacan el fuerte aumento del número total de publicaciones empíricas sobre modelos de VA desde 2002. Entre los 370 artículos que forman el corpus, 253 (68%) se realizaron en los Estados Unidos, 46 (12%) en el Reino Unido y 71 (19%) en los 24 países restantes cubiertos por la revisión. De estos 71 estudios, 50 se realizaron en un país miembro de la Unión Europea (UE). Levy et al. (2019; Tabla A4) encontraron que el 14% de los estudios procedían de Alemania, Austria, Bélgica, República Checa, Chipre, Eslovaquia, España, Francia, Italia, Malta, Países Bajos, Polonia, Portugal y Suecia.

Solo tres artículos se centraron en Portugal o España. Everson (2017) examina la modelización de la EV para la rendición de cuentas educativa, centrándose en los retos metodológicos de la estimación de los efectos del profesor o de la escuela. El estudio destaca tres preocupaciones clave: (1) la investigación a menudo pasa por alto cuestiones críticas planteadas por teóricos y críticos, (2) las interacciones entre diferentes cuestiones y las violaciones de supuestos siguen sin estudiarse lo suficiente, y (3) persisten retos fundamentales en la modelización de la VA, que requieren una reflexión más profunda sobre sus fundamentos filosóficos. Entre los 82 estudios examinados, sólo tres abordan la IEE en Portugal o España, aunque la experiencia y las redes académicas sugieren la existencia de un corpus de investigación original mucho mayor.

Como se ha mostrado anteriormente, desde sus inicios, la IEE ha estado asociada al propósito de garantizar la calidad y la equidad en la educación. Sin embargo, más de 50 años después, sigue siendo un campo de investigación en gran medida desconocido en muchos países, incluidos Portugal y España. De hecho, incluso en Portugal y España, existe un conocimiento limitado del alcance, las características, los resultados y el potencial de los estudios sobre IEE y AV para la mejora, la política y la práctica educativas. Además, los retos y las limitaciones de estos estudios, que aún deben abordarse, ofrecen importantes oportunidades de investigación para la próxima generación de investigadores educativos. El conocimiento limitado es un obstáculo clave para el desarrollo de la ciencia en todos los campos, pero afecta especialmente a la educación, donde la ciencia para la política desempeña un papel crucial para lograr la justicia social.

Este artículo pretende llenar este vacío y contribuir a la literatura sobre IEE examinando el estado actual de la investigación científica sobre IEE o AV realizada por investigadores afiliados a instituciones españolas y portuguesas. Teniendo en cuenta el impacto de las redes de colaboración entre autores portugueses o españoles e investigadores de países de habla portuguesa o española, la difusión de conocimientos a través de este artículo también contribuye al avance de la IEE en países donde aún no ha adquirido relevancia. El análisis está diseñado para ayudar a los académicos, investigadores noveles y responsables políticos a comprender mejor la evolución del campo, identificar los hitos clave y reconocer los patrones de crecimiento y difusión del conocimiento a lo largo del tiempo. De este modo, también se pretende poner de relieve las tendencias para futuras investigaciones y proporcionar ideas basadas en pruebas para la política y la práctica. Para alcanzar estos objetivos, el estudio se guía por tres preguntas de investigación que trazan el mapa de las contribuciones científicas:

Para responder a la pregunta 1 hay que trazar y analizar la distribución, estructura y tendencias dentro del corpus. Se lleva a cabo un análisis descriptivo con el fin de analizar la distribución de las publicaciones a lo largo del tiempo, identificando los periodos de mayor o menor productividad; identificar las revistas más prolíficas dentro del corpus; identificar a los autores clave, sus contribuciones y las redes de colaboración. Responder a la pregunta 2 implica analizar los patrones de citación, es decir, identificar a los autores y artículos con mayor número de citas, ya que suelen ser los de mayor impacto. Para responder a la pregunta 3, es necesario desvelar los principales fundamentos conceptuales del corpus identificando los conceptos y modelos clave que lo sustentan. Para ello se analizan las obras clave de la pregunta 2, se siguen los cambios en la estructura intelectual, se identifican las tendencias y los cambios emergentes y se trazan los grupos de investigación y los contextos de estudio.

Métodos

Esta revisión de alcance examinó el corpus, lo que permite que el mapeo científico identifique patrones de producción de conocimiento a través de metadatos bibliográficos, a diferencia del metaanálisis o la síntesis cualitativa, que integran los resultados de la investigación (Arksey & O´Malley, 2005). El proceso de recopilación de artículos científicos que respondieran a los objetivos de este estudio se desarrolló del siguiente modo. En primer lugar, se llevó a cabo la selección automática realizada con la siguiente consulta en la base de datos indexada Scopus. Se seleccionó esta base de datos por tratarse de fuentes de datos bibliométricos fiables para evaluaciones de conocimientos a gran escala (Baas et al., 2020), que cubren ampliamente el tema.

TITLE-ABS-KEY ( "growth curve" OR "growth model" OR "value added" OR "value-added" OR "school effectiveness" OR "educational effectiveness" ) AND TITLE-ABS-KEY ( multilevel OR hierarchical ) AND PUBYEAR > 1999 AND SUBJAREA ( soci ) AND ( LIMIT-TO ( AFFILCOUNTRY , "Spain" ) OR LIMIT-TO ( AFFILCOUNTRY , "Portugal" ) ) AND ( LIMIT-TO ( DOCTYPE , "ar" ) )

Es decir, buscamos en el título, el resumen y las palabras clave artículos sobre "value added" o "value-added" o "growth curve" o "growth model" o “school effectiveness” o “educational effectiveness”, que también incluyen "multilevel" o "hierarchical", publicadas a partir de enero de 2000, cuyos autores estuvieran afiliados a organizaciones españolas o portuguesas, y cuya área temática fueran las ciencias sociales. Este proceso de selección automatizado dio como resultado 42 artículos de investigación. A continuación, tras examinar los resúmenes, cinco artículos se consideraron fuera de ámbito y se excluyeron. Un análisis del texto completo confirmó estas exclusiones, lo que dio como resultado un corpus final de 37 artículos. En este sentido, los artículos incluidos describen investigaciones científicas que, en conjunto, cumplen los siguientes criterios:

El diagrama I presenta un diagrama de flujo que resume el proceso de selección de los estudios. El archivo de datos en formato *.csv está disponible como material suplementario, lo que permite su reproducibilidad o la realización de nuevos análisis. En otras palabras, es posible volver a analizar estos datos, utilizando los mismos métodos para obtener los mismos resultados; lo que permite su replicabilidad y, potencialmente, la realización de un nuevo estudio.

DIAGRAMA I. Diagrama de flujo del proceso de selección de artículos


Fuente: Elaboración propia

Los análisis se llevaron a cabo en dos pasos secuenciales: en primer lugar, un enfoque bibliométrico; en segundo lugar, los análisis de contenido de los grupos de artículos. El análisis bibliométrico se realizó utilizando Bibliometrix, un paquete de software de mapeo científico integral para R (Aria & Cuccurullo, 2017). El análisis temático se realiza utilizando las palabras clave de los autores, con un tesauro de sinónimos habilitado. Por ejemplo, "valor añadido" se utiliza sistemáticamente en lugar de "valor añadido", y "modelo lineal jerárquico" se prefiere a variaciones como "modelos lineales jerárquicos", "modelización lineal jerárquica" o "modelización lineal jerárquica".

Resultados

Paisaje de la producción de conocimientos representado por el corpus

Aunque la búsqueda se realizó después de 1999, el corpus abarca desde 2006 hasta 2024 e incluye 37 artículos publicados en 24 títulos de fuentes diferentes. La producción anual varía de 0 a cuatro artículos (Figura I). El número total de autores es de 73, con un 32,4% de coautoría internacional. Por término medio, hay 2,8 autores por artículo y 4 trabajos son de autor único. El número de palabras clave de los autores es de 118.

FIGURA I. Tendencia anual del número de artículos


Fuente: Elaboración propia

FIGURA II. Fuentes más relevantes


Fuente: Elaboración propia

Seis títulos de fuentes publicaron el 51% del corpus, mientras que los 18 artículos restantes se publicaron en 18 títulos de fuentes diferentes. Según la ley de Bradford, las fuentes principales son Education Policy Analysis Archives, Revista de Educación, School Effectiveness y School Improvement (Figura II). Entre los seis títulos fuente más representativos del corpus, cuatro son multilingües o publican en dos idiomas, español e inglés. La mayoría de los artículos se publicaron en revistas que utilizan lenguas distintas del inglés, con un 10,8% en portugués y un 51,4% en español. El 37,8% de los artículos restantes se publicaron en inglés. En cuanto a la clasificación disciplinar de los títulos fuente, la Educación representa el 95% del corpus. Para fines de este estudio, se utilizó la clasificación de las revistas según el área/categoría Scopus.

FIGURA III. Red de colaboración entre países

Fuente: Elaboración propia

La red de colaboración entre países (Figura III) muestra dos grupos distintos de autores sin conexiones entre ellos. El grupo de la izquierda está formado por autores portugueses que colaboran con investigadores de Estados Unidos, Canadá, Italia, Brasil y Reino Unido, mientras que el de la derecha está formado por autores españoles que trabajan con colegas de Finlandia, México, Francia y Chile. Estos dos grupos no tenían conexiones, lo que indica que no existe una red de colaboración entre Portugal y España.

Autores y artículos con mayor impacto académico

Siete autores han escrito o coescrito al menos tres artículos en el corpus (Figura IV). De los 73 autores, solo tres tienen publicaciones de más de cinco años. La mayoría de los autores contribuyen esporádicamente al campo o colaboran principalmente dentro de diferentes redes de coautoría y temas de investigación (Figura V).

FIGURA IV. Autores más relevantes


Fuente: Elaboración propia

FIGURA V. Producción de los autores a lo largo del tiempo


Fuente: Elaboración propia

Como muestra la Figura VI, aproximadamente el 90% de los autores han contribuido como máximo a dos artículos del corpus. Las demás redes de colaboración están formadas por menos de ocho miembros cada una. Este gráfico ilustra la ley de Lotka, que describe la distribución de la productividad científica entre los autores. La ley establece que un pequeño número de autores contribuye con un número desproporcionadamente grande de artículos, mientras que la mayoría de los autores contribuyen con pocos. En la Figura 6 puede observarse que el número de trabajos escritos por un autor oscila entre 1 y 9, con un número de trabajos que aumenta a medida que se desplaza hacia la derecha en el eje horizontal. A su vez, el eje Y (% de autores) muestra el porcentaje de autores que contribuyen a un determinado porcentaje de artículos. Cuanto mayor sea el porcentaje en el eje Y, mayor será el grupo de autores que contribuyen con ese número de artículos. El gráfico se caracteriza por un pronunciado descenso al principio, ya que comienza muy alto a la izquierda (cerca del 90%) y desciende bruscamente, lo que significa que la mayoría de los autores (en torno al 80-90%) han escrito muy pocos artículos del corpus - probablemente 1 ó 2. A continuación, la curva se aplana, lo que significa que, a medida que la curva se desplaza hacia la derecha, representando a los autores que han escrito más artículos, el porcentaje de autores que contribuyen disminuye constantemente y se estabiliza cerca del 0%. Esto sugiere que sólo un pequeño porcentaje de autores (6%) ha contribuido con tres o más artículos, y un número aún menor ha producido un cuerpo sustancial de trabajo.

La red de colaboración (Figura VII) revela un clúster fuerte, resaltado en azul, centrado en Hernández L.L., que tiene conexiones científicas directas o indirectas con 23 autores, la mayoría de ellos formados por tres clústeres resaltados en rojo, verde y rosa.

FIGURA VI. Productividad del autor mediante la ley de Lotka


Fuente: Elaboración propia

FIGURA VII. Red de colaboración (Autores)


Fuente: Elaboración propia

Figura VIII. Artículos más citados


Fuente: Elaboración propia

El análisis de contenido de los 10 artículos más citados a nivel mundial (Figura VIII) muestra que, en conjunto, investigan diversos factores que influyen en la eficacia escolar, el rendimiento de los alumnos y la satisfacción laboral de los profesores, utilizando diversas metodologías como los modelos multinivel, los árboles de decisión y los enfoques de frontera.

El contenido y la estructura intelectual del conocimiento

El corpus abarca varios contextos educativos y sociales, como la Comunidad Autónoma del País Vasco, Brasil, Chile, Italia, México, Portugal y España. También incluye artículos que permiten caracterizar y comparar la educación en países latinoamericanos (Martínez-Garrido, 2017; Murillo & Martínez-Garrido, 2013; Murillo & Román, 2011) como Argentina, Bolivia, Brasil, Colombia, Cuba, Chile, Honduras, México, Panamá, República Dominicana y Venezuela. Algunos estudios que utilizan datos de evaluaciones internacionales a gran escala (ILSA) analizan múltiples países, centrándose principalmente en los miembros de la OCDE. Existe un número impresionante de artículos sobre la Comunidad Autónoma del País Vasco (Blanco et al., 2009; Hernández et al., 2016; Larrea et al., 2021, 2023; Morales et al., 2019). Al analizar el contenido del corpus, se seleccionaron características específicas para los fines de este estudio, agrupadas en seis categorías principales: (1) Requisitos metodológicos y de calidad de los datos; (2) El nivel educativo al que se dirige el estudio; (3) La unidad estadística utilizada para la inferencia; (4) El propósito del enfoque de VA; (5) Los análisis de clústeres de red de co-ocurrencia; (6) Estructura intelectual del conocimiento a lo largo del tiempo.

Métodos y requisitos de calidad de los datos

Según el diseño de la búsqueda, todos los trabajos utilizan modelos multinivel y/o de crecimiento. Aproximadamente el 19% de los estudios utilizan datos ILSA de las encuestas PISA, TIMSS o TALIS. Entre los estudios restantes, el 52% emplea datos longitudinales, algunos de ellos con escalas de resultados estandarizadas o alineadas verticalmente. La mayoría de los artículos proporcionan una descripción detallada de los instrumentos y las propiedades de las escalas utilizadas o citan otros trabajos en los que estas descripciones se desarrollan en profundidad. Aproximadamente el 65% de los estudios consideran el rendimiento en matemáticas como variable de resultado, el 40% el rendimiento en lectura y el 35% ambos. Algunos estudios consideran variables no cognitivas de los resultados de los estudiantes (Murillo y Hernández-Castilla, 2011; Santos et al., 2020) y a menudo se aplican modelos estadísticos que tienen en cuenta variables como el rendimiento previo (en estudios con datos longitudinales) y el estatus socioeconómico (SES) o proxies similares. El corpus incluye artículos con enfoques metodológicos innovadores como el AV basado en curvas de crecimiento con términos polinómicos (López-Martín et al., 2014), modelos de AV ajustados por errores de medida (Ferrão & Goldstein, 2009), o rendimiento educativo basado en métodos de frontera no paramétricos (Thieme et al., 2013).

Nivel educativo objeto del estudio

La mayoría de los artículos se refieren a la enseñanza primaria (CINE 1) o elemental (CINE 2). En su mayoría son estudios con bases empíricas obtenidas a partir de una muestra representativa de una población objetivo claramente definida. Por ejemplo, Murillo y sus colegas (Murillo y Hernández-Castilla, 2011; Murillo y Román, 2011) estudiaron la educación primaria en varios países de América Latina y demostraron que, si bien las infraestructuras y los recursos influyen en el rendimiento en matemáticas y lectura, su impacto varía de un país a otro, lo que subraya el papel fundamental del contexto local. También Thieme et al. (2013) destacan el papel de los recursos en la educación primaria chilena. Primi et al. (2010) realizaron un seguimiento de alumnos de Cova da Beira de entre 11 y 14 años durante dos años, sometiéndolos a cuatro pruebas de matemáticas para examinar el papel de la inteligencia fluida en el crecimiento académico a lo largo de la educación secundaria básica. Otros artículos basados en el estudio longitudinal de Cova da Beira (Ferrão, 2009, 2012; Ferrão & Couto, 2014; Ferrão & Goldstein, 2009) incluyen participantes de varios cursos desde la educación primaria hasta el primer ciclo de secundaria (CINE 3). En el estudio longitudinal realizado por Lopes et al. (2015) participan alumnos de 2º y 3º de primaria. El modelo multinivel de crecimiento VA para la comprensión lectora propuesto por López-Martín et al. (2014) se prueba con éxito en alumnos de educación primaria y secundaria en Madrid. Los estudios basados en PISA (Arroyo-Resino et al., 2024; Gamazo et al., 2018; López & Gamazo, 2020; Martínez-Abad et al., 2020; Miguel, 2009; Miguel & Castro-Morera, 2006) se centran en alumnos de 15 años, la mayoría de educación secundaria. El estudio de Travitzki et al. (2016) se refiere a candidatos brasileños a estudios superiores.

Centrarse en el profesor o en la unidad escolar

El porcentaje de trabajos que aplican regresión multinivel o modelos lineales jerárquicos es del 95%, con los alumnos como unidad de análisis, anidados en aulas o centros escolares. El profesorado y las prácticas docentes son fundamentales para los objetivos de investigación de Murillo y Martínez-Garrido (2013), que utilizan el enfoque del valor añadido para evaluar la influencia de los deberes, y Lopes y Oliveira (2020), Martínez-Garrido (2017), que examinan la satisfacción laboral del profesorado. Los artículos centrados en la Comunidad Autónoma del País Vasco (Blanco et al., 2009; Hernández et al., 2016; Larrea et al., 2021, 2023; Morales et al., 2019) tratan temas que abordan la relación entre la eficacia escolar y la igualdad de género, los centros escolares como organizaciones de aprendizaje y el enfoque en la formación del profesorado, y la relación entre la educación en valores y la eficacia escolar. Con la excepción de Primi et al. (2010) y Lopes at al. (2015), los artículos de Portugal están directamente relacionados con temas comunes de la EV en Europa. Abordan temas como la selección de variables predictoras y las consecuencias de esa selección, el uso del modelo de VA para mejorar la educación, el impacto del error de medición en las estimaciones de VA o las características de la investigación sobre la eficacia escolar en los países de habla portuguesa, comparando el modelo de valor añadido con el modelo de resultados contextualizados. En este sentido, podemos afirmar que el corpus analizado sugiere que el modelo VA, en sus múltiples especificaciones, ha sido investigado en la Península Ibérica con un enfoque primordial en la mejora de los sistemas educativos y en la responsabilización de la escuela por inferencia.

Finalidad y objetivo del modelo VA

Sobre la base del análisis anterior, los estudios destacan predominantemente la relevancia del modelo de AV para la mejora escolar (que incluye la mejora del aprendizaje y el desarrollo de los estudiantes) y para la evaluación del sistema educativo, proporcionando contribuciones al sistema de evaluación educativa. En general, la metodología de AV está diseñada para fines de diagnóstico y mejora educativa (Ferrão, 2014; Ferrão & Couto, 2013; González et al., 2018; Zúñiga et al., 2018), así como para analizar la eficacia diferencial, la calidad educativa y la equidad (Ferrão, 2022; Ferrão et al., 2018; Ferrer-Esteban, 2016), incluyendo propuestas que clasifican a las escuelas como de alto o bajo rendimiento (Castro-Morera & Pedroza-Zuñiga, 2015; García-Jiménez et al., 2022; López-González et al., 2021; Martínez-Abad et al., 2017). Ninguno de los artículos aboga por la adopción de la AV con fines de alta exigencia para docentes o centros educativos.

Agrupaciones de la red de co-ocurrencia

El término "estructura intelectual" suele referirse a la organización subyacente, las relaciones y los temas o conceptos clave que surgen del corpus analizado. Lo hicimos analizando los clústeres de la red de co-ocurrencias que se basa en las palabras clave de los autores. El diagrama resultante se presenta en la Figura IX, y muestra varios clusters distintos interconectados dentro del corpus de investigación, cada uno centrado en temas clave relevantes para la IEE. Para este estudio, seleccionamos los tres clústeres con mayor número de nodos: el clúster de Eficacia Escolar (rojo), el clúster de Modelo Multinivel (marrón) y el clúster de Calidad Educativa (verde).

Grupo de eficacia escolar (rojo): Este grupo gira en torno a conceptos destinados a mejorar el rendimiento y la calidad de los centros escolares. Palabras clave como "mejores prácticas", "investigación sobre escuelas eficaces", "efectos contextuales", "sentido de pertenencia", "rendimiento académico", "evaluación educativa", "enseñanza", "formación del profesorado" apuntan a estrategias para mejorar la enseñanza y el aprendizaje. La inclusión de "evaluaciones a gran escala", "PISA", "modelo de valor añadido" y "modelo de crecimiento lineal y cuadrático" indica una conexión con puntos de referencia y metodologías internacionales para medir la eficacia educativa. Las palabras clave como "coherencia", "estabilidad", "evaluación escolar", "efectos escolares" y "responsabilidad escolar" ponen de relieve el enfoque central del grupo de eficacia escolar, haciendo hincapié en temas relacionados con la evaluación y la mejora del rendimiento y los resultados de los centros escolares. Estas palabras clave sugieren un fuerte énfasis en la medición de la eficacia institucional, la garantía de la responsabilidad y el mantenimiento de estándares educativos estables. Este grupo refleja un compromiso con la identificación y aplicación de prácticas educativas eficaces, especialmente en contextos diversos como América Latina (Chile y México).

Grupo de modelos multinivel (marrón): Este grupo hace hincapié en los complejos marcos analíticos utilizados para evaluar los resultados educativos. Palabras clave como "medida del rendimiento" y "eficacia diferencial" ponen de relieve el interés por medir el éxito de los estudiantes en varias dimensiones, mientras que términos como "desigualdad educativa", "equidad social", "estudio longitudinal" y "modelo de crecimiento" sugieren un interés por comprender cómo influyen los distintos factores en la equidad y el rendimiento educativo a lo largo del tiempo. Esta agrupación indica un enfoque matizado de la evaluación de las intervenciones educativas y su impacto en poblaciones diversas. En concreto, la inteligencia fluida, a través de las capacidades cognitivas (Razonamiento Numérico, Abstracto, Verbal y Espacial), está estrechamente relacionada con el rendimiento inicial en matemáticas y con el ritmo de mejora a lo largo del tiempo. El tema de la evaluación educativa y su finalidad están presentes a través de las palabras clave "evaluation", "school/teacher effectiveness", "school/teacher accountability", "school/teacher improvement". Las palabras clave "variable latente multidimensional", "teoría de respuesta al ítem", "error de medición", "errores de medición correlacionados" y "fiabilidad" ocupan un lugar central en el grupo Modelo multinivel, lo que indica un enfoque en técnicas estadísticas avanzadas utilizadas para analizar datos educativos complejos. Estos términos sugieren un fuerte énfasis en la precisión y fiabilidad de los modelos de medición, sobre todo a la hora de evaluar rasgos latentes y abordar errores en la interpretación de datos dentro de estructuras jerárquicas o multinivel. Grupo de Calidad Educativa (verde): Centrado en los aspectos sociales y emocionales de la educación, este clúster incluye palabras clave como "calidad educativa", "control del rendimiento", "eficacia educativa", "evaluación educativa", "institutos", "éxito escolar" y "evaluación de los alumnos". Estos términos ponen de relieve el interés por evaluar y mejorar diversas dimensiones de la educación, como la eficacia de los centros, el rendimiento de los alumnos y el impacto de los factores cognitivos y socioemocionales en el éxito académico, sobre todo en los centros de enseñanza secundaria.

En general, la diversidad de temas abordados contribuye a una comprensión más completa de los factores del éxito educativo en distintos sistemas educativos y entornos culturales.

FIGURA IX. Red de co-ocurrencia (palabras clave del autor)


Fuente: Elaboración propia

Estructura intelectual del conocimiento a lo largo del tiempo

Una vez identificados los autores y artículos influyentes que dan forma al campo, los conceptos fundacionales de la IEE, los temas marco y cómo están interconectados, presentaremos y describiremos el mapa de la red de evolución temática con el fin de proporcionar una comprensión global de cómo evolucionan los temas de investigación a lo largo del tiempo. El periodo de estudio se divide en dos franjas temporales distintas (periodo 1 - 2006 a 2014; periodo 2 -2015 a 2024) para observar los cambios. La evolución temática incluye cuatro grupos principales en cada periodo, cada uno de ellos fuertemente relacionado con los grupos presentados anteriormente.

FIGURA X. Evolución temática, 2006-2014


Fuente: Elaboración propia

Como se observa en la Figura X, el primer periodo de investigación está marcado por temas como el modelo multinivel, el valor añadido y el estudio longitudinal como temas motores, también incluye el rendimiento escolar como tema nicho. Mientras que en el periodo 2, incluye la evaluación de la calidad educativa, clima escolar y efecto escolar evaluado por Prova Brasil. La evolución temática de la IEE muestra un cambio de enfoque. En el primer periodo (2006-2014), temas como los modelos multinivel, los enfoques de valor añadido y los estudios longitudinales ocuparon un lugar central, con un fuerte énfasis en el rendimiento escolar. En el segundo período (2015-2024), la atención se desplazó hacia la evaluación de la calidad educativa, el clima escolar y evaluaciones como Prova Brasil, lo que indica un enfoque más amplio en los factores académicos y ambientales que influyen en los resultados educativos. En última instancia, la estructura intelectual de la IEE ha evolucionado, y los conceptos fundamentales se han vuelto más interconectados y diversos. El campo ha pasado de centrarse principalmente en el rendimiento escolar y los modelos estadísticos a una consideración más matizada de la calidad educativa, la responsabilidad y los factores socioemocionales, lo que refleja la naturaleza dinámica de la investigación educativa a lo largo del tiempo.

Figura XI. Evolución temática, 2015-2024


Fuente: Elaboración propia

Conclusión

Este documento hace una contribución significativa al campo de la Investigación de la Eficacia Educativa (IEE) mediante la cartografía de las contribuciones de Portugal y España al valor añadido en la educación desde 2000 hasta 2024. Utilizando análisis bibliométricos avanzados y métodos de co-citación, el estudio proporciona una visión general de la producción de conocimiento, revelando las tendencias temáticas y metodológicas que han surgido en las últimas dos décadas.

Al responder a las preguntas de la investigación, el documento identifica a los autores clave y los artículos fundamentales que han dado forma al discurso sobre los modelos de valor añadido en la educación, destacando su impacto en las conversaciones académicas tanto regionales como internacionales. El corpus presenta un 32% de autoría internacional, con un 9% de autores que contribuyen con tres o más artículos. Este patrón sugiere una falta de continuidad en las redes internacionales a lo largo del tiempo. Además, aclara la estructura intelectual del conocimiento dentro del campo, trazando cómo los marcos conceptuales y las metodologías de investigación han evolucionado con el tiempo.

Esta investigación mejora la comprensión de cómo se perciben e implementan los enfoques de valor añadido en los contextos educativos de Portugal y España. También contribuye a la literatura más amplia de la Investigación de la Eficacia Educativa (IEE) proporcionando ideas de publicaciones españolas (51%), inglesas (38%) y portuguesas (11%), destacando las contribuciones regionales que a menudo se han pasado por alto. Esta revisión consolida y analiza la investigación existente, incorporando estudios en portugués (11%) y español (51%). Cabe destacar que el 89% de estos artículos permanecen sin citar en revisiones recientes en lengua inglesa. De la selección de 37 artículos, solo cuatro han sido citados en artículos de revisión recientes sobre el campo (Everson, 2017; Levy et al., 2019). Teniendo en cuenta que la revisión bibliográfica más reciente (Levy et al., 2019) menciona 26 países con una producción científica de 370 artículos, y solo el 14% se refiere a países de la Unión Europea (UE27), los 37 artículos aquí estudiados suponen una contribución decisiva al desarrollo de la temática como agenda científica.

En la mayoría de los estudios, las matemáticas son la dimensión elegida para cuantificar el desarrollo cognitivo de los alumnos. La mayoría (95%) de los estudios basados en la recopilación de datos específicos del IEE demuestran un alto grado de rigor en el cumplimiento de los criterios de validación de instrumentos y ajuste de escalas para los resultados académicos, lo que indica un profundo conocimiento de los requisitos metodológicos específicos de los estudios de eficacia escolar. En general, los modelos estadísticos incluyen el rendimiento previo de los alumnos y el estatus socioeconómico (SES) o un proxy, así como otros predictores. Estas características difieren de la mayoría de los estudios realizados en otras regiones. Por ejemplo, Levy (2019) refiere que el 85% del corpus analizado incluye el rendimiento previo como covariable, mientras que solo el 2% incluye predictores no cognitivos del rendimiento. La evidencia empírica de algunos artículos se basa en encuestas internacionales a gran escala, como PISA, TALIS y TIMSS, que utilizan datos transversales por diseño. En estos casos, el rendimiento previo como variable de control está ausente de los modelos IEE. El nivel educativo CINE 1 es el más estudiado. Tal vez debido a los exigentes requisitos metodológicos, ninguno de los estudios representa plenamente el universo en juego en los dos países, lo que sugiere una importante oportunidad para la futura agenda de investigación educativa.

Nuestros resultados también sugieren que el modelo de AV, en sus diversas especificaciones, ha sido investigado en la Península Ibérica con un enfoque principal en la mejora del sistema educativo, el refuerzo de la autonomía escolar y la potenciación del papel de la evaluación educativa en el ciclo de las políticas públicas. Ninguno de los artículos aboga por la adopción de la evaluación de competencias con fines de alta exigencia. Los profesores y las prácticas docentes marcan la diferencia. La evidencia de la eficacia diferencial entre centros escolares apoya la promoción de programas y medidas dirigidos a mejorar los centros y el sistema educativo en general. Sin embargo, el corpus sugiere un consenso general sobre el hecho de que responsabilizar a los profesores o a las escuelas utilizando metodologías que no evalúan con precisión su calidad puede hacer más daño que bien (Everson, 2017). Nuestros hallazgos sirven como base para futuras investigaciones, fomentando una exploración más matizada de la eficacia educativa que integre perspectivas tanto locales como globales. Además, sigue habiendo una necesidad sustancial de más investigación científica en la Península Ibérica para identificar las características clave de las prácticas docentes eficaces y los factores que contribuyen a la eficacia educativa.

El corpus revela un ritmo más lento de desarrollo y publicación en Portugal y España en comparación con otras regiones (Murillo y Martínez-Garrido, 2019; Scheerens, 2014). Destaca el vínculo entre la evaluación educativa y la mejora escolar, junto con cuestiones clave de calidad y equidad en la educación. Aunque destaca los conocimientos y la capacidad existentes en la región, también revela la falta de inversión en proyectos a gran escala. Sin embargo, la aplicación de un sistema de indicadores de valor añadido depende de la calidad y la cantidad de las variables utilizadas en el modelo, por lo que la colaboración gubernamental es esencial (Ferrão, 2012b). Desde la década de 1990, se han producido avances significativos en el tratamiento de las cuestiones de metodología estadística, lo que permite un análisis más riguroso y una interpretación más clara de los logros académicos tanto de los estudiantes individuales como de las escuelas (Saunders, 1999).

Estos avances han arrojado luz sobre la complejidad intrínseca de los retos que plantea la evaluación de la eficacia educativa que, de acuerdo con la estructura intelectual del conocimiento del corpus, en menos de 20 años de investigación de la EV llevada a cabo por académicos portugueses y españoles, se han abordado y resuelto eficazmente los principales retos metodológicos. Nuestras conclusiones indican que, con el paso del tiempo, la estructura intelectual de la IEE ha evolucionado, con conceptos fundacionales cada vez más interconectados y diversos. El campo ha pasado de un fuerte énfasis en el rendimiento escolar y los modelos estadísticos a un enfoque más integral que considera la calidad educativa, la responsabilidad de la mejora y los factores socioemocionales, lo que pone de relieve la naturaleza dinámica de la investigación educativa.

Por último, la perspectiva internacional de esta investigación pone de relieve las fuertes conexiones globales que han fomentado los académicos portugueses y españoles, aunque por separado. Este compromiso internacional tan diverso pone de manifiesto el creciente reconocimiento de la IEE llevada a cabo en Iberia a escala mundial. También muestra cómo tanto Portugal como España han pasado a formar parte de ecosistemas de investigación más amplios, colaborando entre continentes. Sin embargo, a pesar de estos vínculos globales, la ausencia de colaboración entre investigadores portugueses y españoles supone una oportunidad perdida para el intercambio regional de conocimientos. Reforzar las redes transfronterizas dentro de la Península Ibérica podría integrar aún más a ambos países en la comunidad investigadora mundial y fomentar soluciones adaptadas a sus retos educativos comunes. Así pues, para mejorar el impacto de las medidas de IEE y VA en Portugal y España, es crucial establecer redes de colaboración más sólidas entre los investigadores de ambos países. La ausencia de un vínculo de colaboración entre académicos portugueses y españoles limita el intercambio de ideas, buenas prácticas e innovaciones en este campo, lo que puede obstaculizar el desarrollo de políticas educativas basadas en pruebas. Los responsables políticos deben dar prioridad a la creación de asociaciones formales de investigación, programas académicos conjuntos y oportunidades de financiación transfronteriza. Al fomentar la colaboración entre estos dos grupos, los investigadores pueden abordar colectivamente los retos educativos compartidos, mejorar la calidad de la investigación y desarrollar soluciones específicas para la región que mejoren los resultados educativos en ambos países. Esto también conducirá a una mayor integración de las perspectivas del sur de Europa en el diálogo global sobre la IEE, garantizando políticas y prácticas educativas más inclusivas y eficaces.

Este estudio tiene la limitación de mapear el tema basándose únicamente en artículos indexados en Scopus, que, a pesar de tener el mayor número de títulos fuente en portugués y español en comparación con el Education Resources Information Center (ERIC) y Web of Science, todavía puede excluir estudios relevantes de otras fuentes.

Agradecimientos y financiación

Maria Eugénia Ferrão agradece a los árbitros anónimos sus valiosos comentarios y sugerencias, y a la Escuela Bristol de Covilhã la traducción profesional del inglés al español. La autora recibió apoyo parcial de CEMAPRE/REM-UIDB/05069/2020 FCT/MCTES a través de fondos nacionales.

Referencias bibliográficas

Las referencias al corpus están marcadas con un asterisco.

AERA-American Educational Research Association. (2015). AERA Statement on use of value-added models (VAM) for the evaluation of educators and educator preparation programs. Educational Researcher, 44(8), 448–452. https://doi.org/10.3102/0013189X15618385

Aria, M., & Cuccurullo, C. (2017). Bibliometrix: An R-tool for comprehensive science mapping analysis. Journal of Informetrics, 11(4), 959–975. https://doi.org/10.1016/j.joi.2017.08.007

*Arias, R. M., & Soto, J. G. (2009). Concepto y evolución de los modelos de valor añadido en educación. Revista de Educación, 348, 15–45.

Arksey, H., & O’Malley, L. (2005). Scoping studies: towards a methodological framework. International Journal of Social Research Methodology, 8(1), 19–32. https://doi.org/10.1080/1364557032000119616

*Arroyo-Resino, D. A., Constante-Amores, A., Castro, M., & Navarro, E. (2024). School effectiveness and high reading achievement of Spanish students in PISA 2018: A machine learning approach. Educación XX1, 27(2), 223–251. https://doi.org/https://doi.org/10.5944/educxx1.38634

Baas, J., Schotten, M., & Plume, A. (2020). Scopus as a curated, high-quality bibliometric data source for academic research in quantitative science studies. Quantitative Science Studies, 1(1), 377–386.

Ballou, D., Sanders, W., & Wright, P. (2004). Controlling for student background in value-added assessment of teachers. Journal of Educational and Behavioral Statistics, 29(1), 37–65. https://doi.org/10.3102/10769986029001037

*Blanco, Á. B., Barberá, C. G., & Ordóñez, X. G. (2009). Patrones de correlación entre medidas de rendimiento escolar en evaluaciones longitudinales: Un estudio de simulación desde un enfoque multinivel. Revista de Educacion, 348, 195–215.

Braun, H. (2005). Value-added modeling: What does due diligence require? In R. Lissitz (Ed.), Value-added models in education: Theory and applications (pp. 19–38). JAM Press Books.

Bryk, A. S., & Weisberg, H. I. (1976). Value-Added analysis: A dynamic approach to the estimation of treatment effects. Journal of Educational Statistics, 1(2), 127–155.

*Castro-Morera, M., & Pedroza-Zuñiga, L. H. (2015). Escuelas de Alto y Bajo Valor Añadido. Perfiles Diferenciales de las Secundarias en Baja California. Education Policy Analysis Archives, 23(67), 1–25. https://doi.org/http://dx.doi.org/10.14507/epaa.v23.1917

Creemers, B. P. M. (2006). The importance and perspectives of international studies in educational effectiveness. Educational Research and Evaluation, 12(6), 499–511. https://doi.org/10.1080/13803610600873978

Creemers, B. P. M. (2007). Educational Effectiveness and Improvement: The Development of the Field in Mainland Europe. Springer International Handbooks of Education, 17(1979), 223–242. https://doi.org/10.1007/978-1-4020-5747-2_12

Darling-Hammond, L. (2015). Can value added add value to teacher evaluation? Educational Researcher, 44(2), 132–137. https://doi.org/10.3102/0013189X15575346

Everson, K. C. (2017). Value-added modeling and educational accountability: Are we answering the real questions? Review of Educational Research, 87(1), 35–70. https://doi.org/10.3102/0034654316637199

Ferrão, M. E. (2009). Sensibilidad de las especificaciones del modelo de valor añadido: Midiendo el estatus socioeconómico [Sensitivity of value-added model specifications: Measuring socioeconomic status]. Revista de Educación, 348, 137–152.

*Ferrão, M. E. (2012a). On the stability of value added indicators. Quality & Quantity, 46(2), 627–637. https://doi.org/10.1007/s11135-010-9417-6

Ferrão, M. E. (2012b). Avaliação educacional e modelos de valor acrescentado: tópicos de reflexão. Educação & Sociedade, 33(119), 455–469. https://doi.org/10.1590/S0101-73302012000200007

*Ferrão, M. E. (2014). School effectiveness research findings in the Portuguese speaking countries: Brazil and Portugal. Educational Research for Policy and Practice, 13(1), 3–24. https://doi.org/10.1007/s10671-013-9151-7

*Ferrão, M. E. (2022). Longitudinal study on differential effectiveness and social equity in Brazil. REICE. Revista Iberoamericana Sobre Calidad, Eficacia y Cambio En Educación, 20(1), 57–72. https://doi.org/10.15366/reice2022.20.1.004

*Ferrão, M. E., Barros, G. T. F., Bof, A. M., & Oliveira, A. S. (2018). Estudo longitudinal sobre eficácia educacional no Brasil: Comparação entre resultados contextualizados e valor acrescentado [Longitudinal study on educational effectiveness in Brazil: Comparing contextualised results and value added]. Dados, 61(4), 265–300. https://doi.org/10.1590/001152582018160

*Ferrão, M. E., & Couto, A. (2013). Value-added indicator and topics on consistency and stability: An application to Brazil. Ensaio, 21(78). https://doi.org/10.1590/S0104-40362013000100008

*Ferrão, M. E., & Couto, A. P. (2014). The use of a school value-added model for educational improvement: A case study from the Portuguese primary education system. School Effectiveness and School Improvement, 25(1), 174–190. https://doi.org/10.1080/09243453.2013.785436

*Ferrão, M. E., & Goldstein, H. (2009). Adjusting for measurement error in the value added model: Evidence from Portugal. Quality & Quantity, 43(6), 951–963. https://doi.org/10.1007/s11135-008-9171-1

*Ferrer-Esteban, G. (2016). Trade-off between effectiveness and equity? An analysis of social sorting between classrooms and between schools. Comparative Education Review, 60(1), 151–183. www.journals.uchicago.edu/toc/cer/2016/60/1

*Gamazo, A., Martínez-Abad, F., Olmos-Migueláñez, S., & Rodríguez-Conde, M. J. (2018). Assessment of factors related to school effectiveness in PISA 2015. A multilevel analysis. Revista de Educación, 379, 56–84. https://doi.org/10.4438/1988-592X-RE-2017-379-369

*García-Jiménez, J., Torres-Gordillo, J.-J., & Rodríguez-Santero, J. (2022). Factors associated with school effectiveness: Detection of high- and low-efficiency schools through hierarchical linear models. Education Sciences, 12(1), 59. https://doi.org/10.3390/educsci12010059

Goldstein, H. (1997). Methods in school effectiveness research. School Effectiveness and School Improvement, 8(4), 369–395. https://doi.org/10.1080/0924345970080401

*Gonzalez, L., Ramirez, C., Hernández, L. L., & Garcia-Medina, A. (2018). Eficacia escolar y aspiraciones educativas en el bachillerato. Revista Mexicana de Investigación Educativa, 23(78), 687–709.

Gray, J., Jesson, D., Goldstein, H., Hedger, K., & Rasbash, J. (1995). A multi-level analysis of school improvement: Changes in schools’ performance over time. School Effectiveness and School Improvement, 6(2), 97–114.

Hanushek, E. (1971). Teacher characteristic and gains in student achievement: Estimation using micro data. American Economic Review, 61(2), 280–288. https://doi.org/https://www.jstor.org/stable/1817003

*Hernández, L. L., Bereziartua, J., & Bartau, I. (2016). Pre-primary and primary teacher training and education Inservice teacher education in highly effective schools. Bordon, 68(2), 199–218. https://doi.org/10.13042/Bordon.2016.68213

Kyriakides, L., & Creemers, B. P. M. (2008). A longitudinal study on the stability over time of school and teacher effects on student outcomes. Oxford Review of Education, 34, 521–545.

*Larrea, V. A., Rojas, I. B., Barabdiaran, A. A., & Intxausti, N. (2021). Teacher training and professional development in accordance with level of school effectiveness. Revista de Educacion, 393, 147–171. https://doi.org/10.4438/1988-592X-RE-2021-393-489

*Larrea, V. A., Rojas, I. B., & Hernández, L. L. (2023). Mejora escolar y coeducación en centros de secundaria de la comunidad autónoma vasca: Implicaciones para la orientación educativa [A school improvement and coeducation in secondary schools in the basque autonomous community]. Revista Española de Orientacion y Pedagogia, 35(1), 45–62. https://doi.org/https://doi.org/10.5944/reop.vol.35.num.1.2024.40754

Levy, J., Brunner, M., Keller, U., & Fischbach, A. (2019). Methodological issues in value-added modeling: An international review from 26 countries. Educational Assessment, Evaluation and Accountability, 31(3), 257–287. https://doi.org/10.1007/s11092-019-09303-w

Longford, N. T. (2012). A revision of school effectiveness analysis. Journal of Educational and Behavioral Statistics, 37(1), 157–179. https://doi.org/https://doi.org/10.3102/1076998610396898

*Lopes, J., & Oliveira, C. (2020). Teacher and school determinants of teacher job satisfaction: A multilevel analysis. School Effectiveness and School Improvement, 31(4), 641–659. https://doi.org/10.1080/09243453.2020.1764593

*Lopes, J., Silva, M. M., Moniz, A., Spear-swerling, L., & Zibulsky, J. (2015). Prosody growth and reading comprehension: A longitudinal study from 2nd through the end of 3rd grade. Revista de Psicodidactica, 20(1), 5–23. https://doi.org/10.1387/RevPsicodidact.11196

*Lopez-Gonzalez, E., Navarro-Asencio, E., Pedro, M., Hernández, L. L., & Tourón, J. (2021). A study of school effectiveness in primary schools using hierarchical linear models. Bordón Revista de Pedagogía, 73(1), 59–80. https://doi.org/10.13042/Bordon.2021.80530

*Lopez-Martin, E., Kuosmanen, T., & Gaviria, J. L. (2014). Linear and nonlinear growth models for value-added assessment: an application to Spanish primary and secondary schools’ progress in reading comprehension. In Educational Assessment, Evaluation and Accountability (Vol. 26, Issue 4). https://doi.org/10.1007/s11092-014-9194-1

*Lopez, A., & Gamazo, A. (2020). Multilevel study about the explanatory variables of the results of Mexico in PISA 2015. Education Policy Analysis Archives, 28(26), 1–23. https://doi.org/https://doi.org/10.14507/epaa.28.4620

*Martínez-Abad, F., Gamazo, A., & Rodriguez-Conde, M.-J. (2020). Educational data mining: Identification of factors associated with school effectiveness in PISA assessment. Studies in Educational Evaluation, 66, 100875 Contents. https://doi.org/10.1016/j.stueduc.2020.100875

*Martínez-Abad, F., Hernández, L. L., & Morera, M. C. (2017). Selección de escuelas de alta y baja eficacia en Baja California (México). Revista Electronica de Investigación Educativa, 19, 38–53. https://doi.org/https://doi.org/10.24320/redie.2017.19.2.960

*Martínez-Garrido, C. (2017). Satisfacción Laboral de los Docentes en América Latina. Archivos Analíticos de Políticas Educativas, 25(80), 1–23. https://doi.org/http://dx.doi.org/10.14507/epaa.25.2851

*Miguel, C. R. (2009). Las escuelas eficaces: Un estudio multinivel de factores explicativos del rendimiento escolar en el área de matemáticas. Revista de Educación, 348, 355–376.

*Miguel, C. R., & Castro-Morera, M. (2006). Un estudio multinivel basado em PISA 2003: Factores de eficacia escolar en el area de matemáticas. Education Policy Analysis Archives, 14(29), 1–24.

*Morales, A., Hernandez, L. L., & Rojas, I. B. (2019). Hábitos y valores del alumnado en centros de primaria de alta eficacia escolar. Estudios Sobre Educación, 37, 199–222. https://doi.org/10.15581/004.37.199-222

Morganstein, D., & Wasserstein, R. (2014). ASA Statement on Value-Added Models. Statistics and Public Policy, 1(1), 108–110. https://doi.org/10.1080/2330443X.2014.956906

Mortimore, P. (1991). The nature and findings of research on school effectiveness in the primary sector. In S. Riddell & S. Brown (Eds.), School effectiveness research: Its messages for school improvement (pp. 9–19). HMSO.

Murillo, F. J. (2003). Una panorámica de la investigación iberoamericana sobre eficacia escolar. REICE. Revista Iberoamericana Sobre Calidad, Eficacia y Cambio En Educación, 1(1), 1–14. https://doi.org/10.15366/reice2003.1.1.003

*Murillo, F. J., & Hernandez-Castilla, R. (2011). School factors associated with socio-emotional development in Latin american countries. Revista ELectrónica de Investigacion y Evaluación Educativa, 17(2), 1–21. http://www.uv.es/RELIEVE/v17n2/RELIEVEv17n2_2eng.htm

Murillo, F. J., & Martinez-Garrido, C. (2019). Una mirada a la investigacion educativa em América Latina a partir de sus artículos [A look at educational research in Latin America from its papers]. REICE - Revista Electrónica Iberoamericana Sobre Calidad, Eficacia Y Cambio En Educación, 17(2), 5–25. https://doi.org/10.15366/reice2019.17.2.001

*Murillo, F. J., & Martínez-Garrido, C. (2013). Incidencia de las tareas para casa en el rendimiento académico. Un estudio con estudiantes iberoamericanos de Educación Primaria. Revista de Psicodidactica, 18(1), 157–171. https://doi.org/10.1387/RevPsicodidact.6156

*Murillo, F. J., & Román, M. (2011). School infrastructure and resources do matter: analysis of the incidence of school resources on the performance of Latin American students. School Effectiveness and School Improvement, 22(1), 29–50. https://doi.org/10.1080/09243453.2010.543538

OECD. (2008). Higher Education to 2030, Volume 1, Demography. OECD Publishing. https://doi.org/10.1787/9789264040663-en

Plewis, I. (1997). Terminology and definition in multilevel models analysis. Multilevel Modelling Newsletter, 9(1), 2–4.

*Primi, R., Ferrão, M. E., & Almeida, L. S. (2010). Fluid intelligence as a predictor of learning: A longitudinal multilevel approach applied to math. Learning and Individual Differences, 20(5), 446–451. https://doi.org/10.1016/j.lindif.2010.05.001

Ray, A., McCormack, T., & Evans, H. (2009). Value added in english schools. Education Finance and Policy, 4(4), 415–438. https://doi.org/10.1162/edfp.2009.4.4.415

Reynolds, D., Sammons, P., De Fraine, B., Van Damme, J., Townsend, T., Teddlie, C., & Stringfield, S. (2014). Educational effectiveness research (EER): a state-of-the-art review. School Effectiveness and School Improvement, 25(2), 197–230. https://doi.org/10.1080/09243453.2014.885450

Sammons, P., Davis, S., & Gray, J. (2016). Methodological and scientific properties of school effectiveness research. In The Routledge International Handbook of Educational Effectiveness and Improvement (p. 539).

*Santos, A. J., Daniel, J. R., Antunes, M., Coppola, G., Trudel, M., & Vaughn, B. E. (2020). Changes in preschool children ’ s social engagement positively predict changes in social competence : A three ‐ year longitudinal study of portuguese children. Social Development, 29, 544–563. https://doi.org/10.1111/sode.12411

Saunders, L. (1999). A brief history of educational “value added”: How did we get to where we are? School Effectiveness and School Improvement, 10(2), 233–256. https://doi.org/10.1076/sesi.10.2.233.3507

Scheerens, J. (2014). School, teaching, and system effectiveness: Some comments on three state-of-the-art reviews. School Effectiveness and School Improvement, 25(2), 282–290. https://doi.org/10.1080/09243453.2014.885453

Strand, S. (2011). The limits of social class in explaining ethnic gaps in educational attainment. British Educational Research Journal, 37(2), 197–229. https://doi.org/10.1080/01411920903540664

Strand, S. (2016). Do some schools narrow the gap? Differential school effectiveness revisited. Review of Education, 4(2), 145–148. https://doi.org/10.1002/rev3.3059

*Thieme, C., Prior, D., & Tortosa-ausina, E. (2013). A multilevel decomposition of school performance using robust nonparametric frontier techniques. Economics of Education Review, 32, 104–121. https://doi.org/https://doi.org/10.1016/j.econedurev.2012.08.002

Thomas, S., Kyriakides, L., & Townsend, T. (2016). Educational effectiveness research in new, emerging, and traditional contexts. In C. Chapman, D. Muijs, D. Reynolds, P. Sammons, & C. Teddlie (Eds.), The Routledge International Handbook of Educational Effectiveness and Improvement (pp. 220–245).

*Travitzki, R., Ferrão, M. E., & Couto, A. P. (2016). Educational and socio-economic inequalities of pre-university Brazilian population: A view from the ENEM data. Education Policy Analysis Archives, 24. https://doi.org/10.14507/epaa.24.2199

*Zúñiga, L. P., Cetzal, R., & Hernandez, L. (2018). Criterios para la identificación y selección de escuelas eficaces de nivel medio superior [Criteria for the Identification and Selection of Effective High Schools]. Revista Electronica de Investigación Educativa, 20(1).

Información de contacto / Contact info: Maria Eugénia Ferrão. Universidade da Beita Interior, Faculdade de Ciências, Departamento de Matemática. E-mail: meferrao@ubi.pt