La revista Psicothema fue fundada en Asturias en 1989 y está editada conjuntamente por la Facultad y el Departamento de Psicología de la Universidad de Oviedo y el Colegio Oficial de Psicología del Principado de Asturias. Publica cuatro números al año.
Se admiten trabajos tanto de investigación básica como aplicada, pertenecientes a cualquier ámbito de la Psicología, que previamente a su publicación son evaluados anónimamente por revisores externos.
Psicothema, 2002. Vol. Vol. 14 (nº 4). 870-871
A.J. Rojas y C. Pérez Meléndez
Promolibro, Valencia, 2001, 214 pp.
REVISION DE LIBROS/BOOK REVIEW
No hay mucha literatura en castellano sobre la Teoría de la Respuesta al Ítem (TRI), pero aún hay menos sobre los modelos politómicos desarrollados en el marco de la TRI. En los últimos años parece que están despertando más interés, como muestran, por ejemplo, las tesis doctorales de Espejo (1998), Revuelta (2000) y Abad (2001).
La TRI para ítems dicotómicos se ha ido abriendo camino en nuestras universidades y en la investigación psicométrica. Para la medición de buena parte de los rasgos de personalidad, actitudes… se utilizan ítems con varias categorías (ítems politómicos). La TRI para ítems politómicos permite sacar partido de su solidez y ventajas a la hora de medir estos rasgos. El libro trata de la medición de rasgos mediante ítems en los que las categorías de respuesta son más de dos y están ordenadas; es decir, básicamente, si bien no exclusivamente, de los ítems tipo Likert. Los modelos politómicos para variables nominales no son estudiados en el libro. De los distintos modelos propuestos para el análisis de los ítems con categorías ordenadas, los que van a recibir atención son el modelo de crédito parcial (MCP) y el de escalas de clasificación (MEC). Ambos pertenecen a la familia de modelos de Rasch. Una revisión de estos y otros modelos politómicos puede encontrarse en van der Linden y Hambleton (1997).
Los autores, Antonio Rojas y Cristino Pérez, son profesores de Metodología de las Ciencias del Comportamiento, de las universidades de Almería y Granada, respectivamente. Conocen bien a nuestros estudiantes y el libro va dirigido a ellos. Tiene una orientación más aplicada que teórica. En sus propias palabras: «Este trabajo muestra una mayor preocupación por los aspectos psicométricos que por los matemáticos-estadísticos, queriendo esto decir que nos centraremos más en el significado psicológico-psicométrico que en el desarrollo de los algoritmos matemáticos que los sustentan» (p. 15).
El libro consta de ocho capítulos y una introducción. El primer capítulo, además de exponer algunos conceptos básicos (constructo, variable…), trata de los requisitos métricos de los modelos de la TRI. En particular, se expone la relación entre estos modelos y dos teorías de la medición: la representacional y la medida conjunta. El capítulo no resulta fácil de leer y quizás se debiera advertir al lector de la conveniencia de que lo lea al final, pues su contenido no es necesario para entender los capítulos que siguen.
El segundo capítulo resulta más familiar a todos los interesados en el estudio de las actitudes, pues trata de los distintos formatos de ítems y sus correspondientes normas de cuantificación . Se comentan las principales características de los ítems tipo Likert. Se introduce el importante concepto de «paso». Un ítem con «n» categorías ordenadas, supone «n-1» pasos (de la primera a la segunda, de la segunda a la tercera,..). El lector puede echar en falta alguna reflexión o referencia bibliográfica sobre el número recomendable de categorías, la conveniencia o no de la categoría central, la importancia de las etiquetas asignadas a las categorías… Si tiene paciencia, encontrará respuesta a su inquietud en el capítulo 4.
El capítulo tercero lleva por título «modelos basados en la TRI y la familia de modelos de Rasch». Comienza introduciendo el concepto de «invarianza» o «medida objetiva», que es una de las principales ventajas de la TRI: El cumplimiento del principio de invarianza nos asegura que los parámetros de los ítems no dependen de las personas a las que se han aplicado, y que sus niveles de rasgo tampoco dependen de los ítems que han resuelto. A continuación, se hace referencia a las ventajas adicionales (por ejemplo, en relación a las propiedades de los estimadores) que tienen los modelos que pertenecen a la familia de modelos de Rasch, como les ocurre al MCP y MEC. Resulta ilustrativa la tabla en la que se muestran los principales modelos clasificados por el tipo de ítem y por su pertenencia o no la familia de Rasch, así como la discusión sobre las características de unos y otros. El capítulo acaba con los siguientes cinco contenidos: a) los supuestos de los modelos de Rasch, b) el modelo de Rasch para ítems dicotómicos, c) los conceptos de curva característica de los pasos del ítem y curva característica de las categorías de respuestas, d) la expresión general del modelo politómico de Rasch, y e) un primer acercamiento al significado de los parámetros de los ítems en dicho modelo.
El capítulo cuarto se ocupa de la exposición de los modelos de crédito parcial (MCP) y de escalas de clasificación (MEC). Del primero se comentan dos ejemplos que muestran bien las consecuencias de que los parámetros de los pasos del ítem estén o no ordenados. A lo largo del texto se exponen muchas gráficas, que facilitan su comprensión. Este el caso de las mostradas en este tema. A continuación, se introduce el MEC como un caso particular del MCP, que es especialmente indicado para tests en los que el formato de respuesta es común para todos los ítems. De hecho, mientras en el MCP se estima en cada ítem un parámetro para cada paso, en el MEC los parámetros de umbral (diferencias entre los parámetros del cada paso y el parámetro del ítem) han de ser los mismos en todos los ítems del test, por lo que en este modelo se ha de estimar un parámetro por ítem y otro por cada paso. Por cierto, no queda del todo claro si en cada ítem la suma de los parámetros de umbral ha de ser cero, o si, como se indica en el siguiente capítulo, en la estimación se fija arbitrariamente el valor de uno de ellos. El capítulo termina con la descripción de las regiones de respuesta más probable y la puntuación esperada. A partir de los parámetros de los pasos del ítem (o de los parámetros de umbral) se puede obtener fácilmente cual es la categoría de respuesta más probable y la categoría de respuesta esperada para cada nivel de rasgo. Esta información resulta muy útil para conocer si las categorías establecidas en los ítems están funcionando de manera correcta o no.
Los capítulos primero y quinto han sido escritos por los profesores González Gómez y Padilla García. El quinto se ocupa de la estimación de parámetros. El lector queda algo impresionado, y teme lo peor, cuando lee que en la TRI «la estimación de parámetros es un paso ineludible pero lamentablemente escabroso» (p. 93). No es fácil explicar con palabras, casi sin fórmulas, los diferentes procedimientos de estimación, y no es especialmente clara la exposición de los procedimientos de máxima-verosimilitud conjunta, condicionada y marginal. Sin embargo, se explica bien el sentido de la estimación máximo-verosímil. Tampoco se describe claramente la relación que guarda la estimación «PROX» con los procedimientos de estimación ordinarios, comentados en las páginas precedentes. Se entiende mejor la explicación del error de estimación, los procedimientos de bondad de ajuste y el concepto de función de información, especialmente este último.
El siguiente capítulo, «Aplicación de los modelos», describe detalladamente todo el proceso conducente a determinar los ítems que han de componer la prueba, y es probablemente el capítulo más útil para el lector interesado en aplicar los modelos politómicos a la construcción de pruebas psicológicas. Se explica, con datos reales, en varios pasos, cómo eliminar los ítems y sujetos que no se ajustan bien al modelo. Es bien conocido que v arios estadísticos de ajuste dependen del tamaño muestral. Por ello, los autores aplican un procedimiento consistente en decidir los ítems a retener tras la comparación simultánea de varias submuestras, de distinto tamaño, extraídas de la muestra total, y no solo, como es habitual, a partir de los resultados de la muestra total. Es también reseñable el extenso y cuidadoso estudio sobre el ajuste del test final, en el que se analizan varios índices de ajuste de manera simultánea. Se describe con especial cuidado y acierto a qué se debe el desajuste de ítems y personas. Calibrado el banco, el siguiente paso es obtener información sobre los ítems y el test en su conjunto, a partir de sus parámetros, y medir a las personas. Los autores muestran detenidamente la información que ofrece el programa BIGSTEPS tras la calibración de cada ítem y el significado de cada elemento de la salida. Para la interpretación de las puntuaciones de las personas, BIGSTEPS ofrece la tabla de equivalencias entre las puntuaciones directas en el test y el nivel de rasgo que corresponde a cada puntuación directa. También informa del correspondiente error de estimación. Termina el capítulo mostrando dos gráficas: la que relaciona las puntuaciones directas con las puntuaciones en el rasgo y la que ubica en el continuo del rasgo conjuntamente a las personas y a los ítems.
En el capítulo 7 se describen varias aplicaciones de los modelos TRI politómicos, como la construcción de tests, la creación de bancos de ítems, los tests a medida y el estudio del sesgo. Los comentarios se hacen en relación a los modelos MCP y MEC, pero lo dicho vale para otros modelos politómicos e incluso dicotómicos. Se explica con detalle la selección de ítems cuando se pretende satisfacer una función de información del test objetivo y se comenta brevemente las complicaciones que pueden derivarse de tal proceder; por ejemplo, las relativas al incumplimiento del plan de especificaciones, con su consiguiente riesgo para la validez del test. En un breve capítulo final se citan los programas de ordenador disponibles y se comenta con algo más de detalle el programa BIGSTEPS. No se entra a fondo en las ventajas y desventajas de cada uno.
Coincido plenamente con José Muñiz, en sus palabras del Prólogo, en dar la bienvenida al libro sin reservas. El libro tienes varios méritos a destacar: La presencia de este libro en nuestras las librerías va a permitir el acercamiento a los modelos politómicos de la TRI de personas que muy probablemente nunca a lo harían a los escritos originales en inglés y de tratamiento más teórico. Otro mérito del libro es que resulta realmente motivador e incita al uso de los modelos estudiados, pues muestra muy bien lo útil que son para conocer cómo está funcionando un ítem, sus categorías de respuesta, tal o cual sujeto, para interpretar el nivel de desajuste… Otro aspecto positivo es que está en general bien escrito, aunque tiene algunas erratas. También hay que destacar el esfuerzo que los autores han hecho por hacer comprensibles al lector los contenidos tratados, que no son especialmente fáciles de explicar. Entre los aspectos menos positivos, ya hemos señalado algunos asuntos que no parecen especialmente bien explicados. Se echa en falta una adecuada explicación de los «logits». Se observa también alguna inconsistencia en notación entre el capítulo quinto y los demás.
La aparición, entre otros, de los libros de Muñiz (1990), Santisteban (1990) y López Pina (1995) impulsó el estudio de la TRI en modelos dicotómicos. El libro de Rojas y Pérez debe tener un papel similar en lo relativo a los modelos politómicos.
Referencias
Abad, F.J. (2001). Algunas soluciones para la estimación del modelo de elección múltiple de Thissen y Steinberg. Tesis doctoral. Universidad Autónoma de Madrid.
Espejo, B. (1998). Escalas de respuesta y sistemas de puntuación: un análisis mediante modelos politómicos de la Teoría de la Respuesta al Ítem. Tesis doctoral. Universidad de Valencia.
López-Pina, J.A. (1995). Teoría del Respuesta al Ítem: Fundamentos. Barcelona: PPU.
Muñiz, J. (1990). Teoría de Respuesta a los Ítems. Madrid: Pirámide.
Revuelta, J. (2000). A psychometric model for múltiple choice items. Tesis doctoral. Universidad Autónoma de Madrid.
Santisteban, C. (1990). Psicometría. Madrid: Norma.
Van der Linden, W. J. y Hambleton, R.K. (1997). Handbook of modern Item Response Theory. New York: Springer-Verlag.