jueves, 16 de febrero de 2012

EVALUACIONES ESTANDARIZADAS


UNA VISIÓN GLOBAL, CON UN EJEMPLO PARTICULAR: SIMCE Y PSU
Por  Paulina González Muñoz

Las evaluaciones estandarizadas han sido el foco de muchas polémicas, y fuertes críticas, sin embargo, su implementación a nivel mundial se ha visto favorecida en el transcurso del tiempo. No cabe duda que ellas han sido herramientas útiles para la obtención de información respecto de los conocimientos, habilidades cognitivas y competencias de los estudiantes (aptitudes y logros), que permitan saber cómo se posiciona un estudiante respecto de otros, y que permiten procesar una gran cantidad de información, a un bajo costo. Pero así mismo, presentan muchas limitaciones, cuando se les define como herramientas para la mejora en la calidad de la educación o en  la selección de estudiantes para el ingreso a nuevos procesos educativos.


UN POCO DE HISTORIA

La implementación de evaluaciones estandarizadas parte en la década del 80, durante la cual las políticas educativas se enfocaron en cambiar el paradigma de cantidad de contenidos al de calidad de los sistemas educativos, pero con el inconveniente de que nunca se llegó a definir el concepto de calidad, entonces, “calidad se interpretó como siendo equivalente a un puntaje en una prueba estandarizada” (Cassasus, 2007). El tiempo mostró que todas las falencias de estas nuevas políticas no generaron cambios y de allí en adelante se han hecho esfuerzos por lograr superar el abismo entre calidad ideal y calidad real, utilizando como instrumentos de medida las pruebas estandarizadas, que tras dos décadas de aplicación, no han mostrado cambios de superación en sus resultados e incluso algunos países han mostrado bajas en los aprendizajes.

“A pesar de todos los esfuerzos desplegados mundialmente desde hace 20 años, los puntajes no suben en ningún país donde se mida el rendimiento académico. Las pruebas de los estudios comparativos internacionales (TIMSS, LLECE, PISA) así como las mediciones nacionales, que se basan en evaluaciones puntuales entregan resultados decepcionantes. De acuerdo a estos criterios, la educación parece estar estancada. Si aceptamos este principio, la evidencia empírica indica que los esfuerzos desplegados no  han rendido los frutos esperados: en algunos países, como es el caso de Brasil, Chile, España, Francia o EEUU los puntajes han bajado y la desigualdad persiste”. (Cassasus, 2007)

En definitiva, calidad no puede ser equivalente a puntajes. Una educación de calidad es lo que puede llamarse una buena educación. Una educación de calidad tiene esencialmente que ver con la capacidad que tiene la institución escolar, de facilitar a que las personas se transformen en mejores personas, para que la sociedad se transforme en una mejor sociedad. Es una actividad de conocimiento transformativo.

LIMITACIONES DE LAS EVALUACIONES ESTANDARIZADAS

Las limitaciones de este tipo de evaluaciones se pueden entender al analizar lo que ellas no incluyen por una parte y los riesgos que se asocian a una aplicación en donde se dé más énfasis a los resultados que al aprendizaje real.
Popham (1999), plantea que las evaluaciones estandarizadas no miden la formación personal, social ni cívica de los estudiantes, tampoco miden cuán acertados son los profesores en su enseñanza y en sus metodologías, ni menos cuánto de arte, música, filosofía u otros conocimientos han adquirido los estudiantes, y lo que no se evalúa estandarizadamente tiende a no existir. El peligro de extinción de asignaturas como filosofía, artes y educación física es una realidad. Tampoco se considera en las evaluaciones estandarizadas cuán bueno es el clima de convivencia al interior del aula y de la escuela, ni los contextos particulares de desarrollo del proceso educativo, en desmedro absoluto de la equidad.
La implementación de evaluaciones estandarizadas estatales, en las cuales los “puntajes” adquieren un  rol preponderante, se puede generar consecuencias importantes para la escuela, no sólo vinculadas a su financiamiento, sino también a su prestigio. Esto a su vez puede provocar una peligrosa tentación de hacer todo lo posible por elevar los resultados de las evaluaciones. Existen muchas estrategias que pueden ser implementadas, que pueden ser cuestionables, pero en lo cual no se profundizará. Por ejemplo se pueden realizar cambios administrativos para generar cursos especiales dentro de la escuela dedicadas a la preparación específica de estos exámenes; se puede promover la incorporación a estudios particulares de preparación fuera de la escuela; se pueden ofrecer incentivos o sanciones asociados a los resultados e incluso algunas otras, que lleven a corromper ilegalmente los resultados, cuando las presiones familiares, culturales o institucionales, son muy grandes, como se sufre en algunas culturas asiáticas, en las cuales las presiones por el rendimiento puede llegar a límites peligrosos.

CRITICADAS, PERO MUY UTILIZADAS EN EL MUNDO

A pesar de todas sus limitaciones, las evaluaciones estandarizadas están utilizándose en todo el mundo ejemplo de ello son los siguientes. En China se aplica un examen llamado “gaokao” para la admisión a los colleges, cuyo rendimiento genera no sólo una presión individual, sino también familiar, pues la aprobación de estos exámenes involucra el honor de la familia.   En Japón también existe un examen estandarizado cuyos resultados permite a los estudiantes el ingreso a las universidades, por lo cual se ha desarrollado un tipo de colegios suplementarios pagados llamados “juku”, que preparan a los estudiantes para rendir dichos exámenes. En Inglaterra, los estudiantes de 16 años deben rendir una evaluación estandarizada para entrar al “A-Level” (nivel avanzado) y al finalizar la secundaria otra, cuyos resultados determinarán a la universidad que pueden ingresar. En  Turquía las evaluaciones estandarizadas para el ingreso a la universidad son muy importantes, pues existe una alta cantidad de estudiantes postulantes sin embargo, los cupos que ofrecen las universidades no supera al 20% de los aspirantes, por lo cual requieren de un sistema que permita discriminar entre el universo de postulantes. En Estados Unidos todo el sistema educativo se mide a través de evaluaciones estandarizadas, que permiten separar a los niños desde muy temprana edad de acuerdo a su nivel de habilidades, en contraste con muchos países de Europa en los cuales este tipo de separaciones está prohibido hasta que los niños cumplan los 14 años.  Por otra parte, en América Latina se aplican evaluaciones estandarizadas en varios países, como Perú, Bolivia, Colombia, Chile, entre otros. (Barrenechea, 2010:2). A todos estos ejemplos de evaluaciones estandarizadas nacionales, se deben sumar las internacionales, que cada día adquieren mayor relevancia como son PISA, TIMSS, PIRLS, ALL.

UN EJEMPLO PARTICULAR: SIMCE Y PSU

En el caso de Chile, se hacen menciones especiales en varios trabajos, por la situación histórica y política, que ha influenciado fuertemente las políticas de educación. Durante los 80 bajo el gobierno dictatorial se introdujo una política de descentralización profunda, que implicó mucho más que la mera provincialización o munipalización que existió en otros países latinoamericanos como en Argentina, pues involucró también un proceso de privatización, que generó profundas diferencias en educación. Por otra parte a pesar de esta “descentralización”, el estado mantuvo el rol de  evaluador del rendimiento de los estudiantes, ya sea de aquellos que asisten a escuelas públicas o privadas subvencionadas o no subvencionadas por el Estado, situación que pese a los cambios de gobierno, aún persiste hoy en día. (Barrenechea, 2010)
Otra cuestión importante de destacar es que se ha estimado que hasta el año 2010 se rinden en Chile 10 pruebas estandarizadas: 3 nacionales y 7 internacionales (cuadro adjunto), lo cual indica una peligrosa tendencia a la estandarización educativa, impulsada por una autoexigencia de alcanzar estándares internacionales y por las exigencias internas de regular el mercado educativo.

FUENTE: Revista Educativa N°38, 2009. http://www.revistadocencia.cl/pdf/20100730184208.pdf

Las pruebas estandarizadas en Chile, tienen un carácter nacional. Estas son las pruebas SIMCE y PSU. El Sistema Nacional de Medición de la Calidad de la Educación, SIMCE, corresponde a evaluaciones censales que se aplican en educación básica y en educación secundaria, cuyo objetivo es medir justamente la calidad y equidad de la educación.  
El actual sistema de selección para el ingreso a las universidades chilenas es el de la Prueba de Selección Universitaria (PSU), válida desde el Proceso de Admisión 2004. La PSU es un conjunto de cuatro pruebas de razonamiento, de carácter objetivo, y con un énfasis en contenidos y en habilidades cogni­tivas. Las cuatro pruebas que componen la PSU son: Lenguaje y Comunicación, y Matemática, ambas obligatorias;  Historia y Ciencias Sociales y Ciencias, son electivas. Sin embargo, los postulantes deben rendir, al menos, una de las dos pruebas electivas, dependiendo de los requisitos de ingreso de cada Universidad. Estas pruebas nacen a partir del nuevo Marco Curricular de 1990, que define Objetivos Fundamentales y Contenidos Mínimos Obligatorios para los distintos niveles de enseñanza. (DEMRE, 2012)

Estas pruebas han sido sometidas a estudios y críticas fuertes, al considerar los objetivos que idealmente persiguen y las consecuencias que se han generado en la educación tras su implementación.

El año 1997, el Colegio de Profesores de Chile, hace una fuerte crítica del SIMCE y la PSU, en el marco del Primer Congreso Nacional de Educación, concluyen que la aplicación de estas pruebas involucran riesgos en los procesos educativos debido a:
a) omiten la diversidad cultural y las capacidades de los estudiantes, discriminando a los más pobres y menos integrados a la “modernidad”;
b) sancionan y estigmatizan a la educación pública, que es la que recibe en su mayoría a los alumnos y alumnas con mayor atraso educativo, familias con bajos niveles escolares y socioeconómicos, y baja inversión por parte del Estado;  
c) se aplican de modo homogéneo, negando las necesidades educativas de los alumnos/as; y
d) promueven la competencia por alcanzar los premios de excelencia académica, en vez de instancias de intercambio y colaboración intra e interescuelas.
En términos generales, se rechazan estos instrumentos por ser: restrictivos, al medir sólo contenidos; punitivos, al establecer premios y castigos; y estigmatizadores o segregadores, al distinguir escuelas “buenas” y “malas”. (Revista Docencia, 2009)

Otra crítica fuerte al SIMCE, la hace el Doctor en Economía de la Educación, Juan Casassus, quien afirma que es una forma de descontextualización educativa que beneficia a ciertos grupos  privilegiados en el marco de un sistema educativo segregado (Revista Docencia, 2009). Es paradójico que un sistema que promueve la mejora y equidad en la educación, lo que está provocando es discriminación y agudizando las diferencias, al no considerar los contextos de los estudiantes.

Por otra parte la PSU, es un sistema de selección que presenta limitaciones al momento de considerar otras características de los postulantes, como su situación académica durante la enseñanza secundaria, su contexto o sus niveles de preparación adicional, lo cual puede generar ingresos equivocados, vale decir ingreso de estudiantes que puedan fracasar posteriormente,  o bien dejar fuera a estudiantes con potencial académico que podrían ser exitosos en la universidad.
Esta prueba no asegura la equidad evaluativa, por ejemplo: los resultados de la PSU 2008 muestran que el 43% de los jóvenes más pobres no alcanzaron el puntaje mínimo para postular, mientras esto le ocurra sólo al 5% de los jóvenes de las familias más adineradas, lo cual habla de la fuerte segregación socioeconómica que valida esta prueba. Es innegable que con recursos se puede optar a mejores colegios y estudios de preparación preuniversitaria, lo cual pone en ventaja  (no considerada) a los estudiantes que pueden optar a estas alternativas adicionales. De esta forma también se elimina el factor potencial educativo, ya que el no alcanzar los puntajes mínimos en la PSU no es indicador de futuro fracaso en el estudio universitario.

Después de mencionar algunas de las principales críticas a estos sistemas de evaluación estandarizados en Chile, SIMCE y PSU, cómo se explica que ellos sigan desarrollándose. Lo que sucede es que tras estos sistemas de evaluación existe una compleja red de articulación de incentivos, evaluación del sistema, y mercado educativo, que las sostienen en el tiempo, aún cuando las evidencias indican que ellos no representan instancias de mejora ni equidad en la educación.


En síntesis, las evaluaciones estandarizadas son útiles, pero requieren de criterios claros de aplicación para extraer de ellas su potencial al evaluar el nivel académico, con la posibilidad de acceder a resultados de una población extensa a bajo costo, procurando no caer en los riesgos que involucra como son el disminuir los aprendizajes, promover malas prácticas y aumentar la desigualdad.


“Los educadores deben ser, definitivamente, responsabilizados. La enseñanza de los hijos de una nación es demasiado importante como para no darle seguimiento. Pero evaluar la calidad educativa mediante el uso de instrumentos de evaluación erróneos es una subversión de la sensatez. Aunque los educadores necesitan producir evidencia válida respecto a su eficacia, las pruebas estandarizadas de logros son herramientas equivocadas para esa tarea.” ( Popham, J. 1999: 10)





Referencias
Barrenechea, I. (2010). Evaluaciones estandarizadas: seis reflexiones críticas. Archivos Analíticos de Políticas Educativas, 18 (8). Recuperado de http://epaa.asu.edu/ojs/article/751 (Consulta: 2012, Febrero 14)
Casassus, J. (2007). “El precio de la evaluación estandardizada: pérdida de calidad y segmentación social”. Revista Brasileira de Política e Administraçao da Educaçao. Recuperado dehttp://www.manifiestoporlaeducacion.cl/articulos/juan_casassus_ evaluacion.pdf  (Consulta: 2012, Febrero 14)
DEMRE (2012) Compendio Estadístico Proceso de Admisión Año Académico 2011.
OCDE (2004): Revisión Políticas nacionales de Educación: Chile, Organización para la Cooperación y el Desarrollo Económico.
Popham, J. (1999) ¿Por qué las pruebas estandarizadas no miden la calidad educativa? Grupo de Trabajo sobre Estándares y Evaluación, PREAL-Perú y GRADE (Grupo de análisis para el desarrollo). Perú. Recuperado de http://www.preal.org/ Publicacion.asp (Consulta: 2012, Febrero 15)
Rosas, R. (2007) Sistemas Complementarios de Admisión a la Universidad. Un estado del Arte y algunas reflexiones en torno a la equidad.  Recuperado de http://www.uc.cl/webpuc/piloto/pdf/evidencias3.pdf (Consulta: 2012, Febrero 15)
….   (2009): Estandarización educativa en Chile: un peligroso hábito, Revista Docencia Nº 38, Colegio de Profesores de Chile A.G., Santiago, Chile. Recuperado de http://www.revistadocencia.cl/pdf/20100730184208.pdf (Consulta: 2012, Febrero 15)