La revista Psicothema fue fundada en Asturias en 1989 y está editada conjuntamente por la Facultad y el Departamento de Psicología de la Universidad de Oviedo y el Colegio Oficial de Psicología del Principado de Asturias. Publica cuatro números al año.
Se admiten trabajos tanto de investigación básica como aplicada, pertenecientes a cualquier ámbito de la Psicología, que previamente a su publicación son evaluados anónimamente por revisores externos.
Psicothema, 2005. Vol. Vol. 17 (nº 1). 96-100
Fàbia Morales-Vives, Maria Josep Codorniu-Raga y Andreu Vigil-Colet
Universidad Rovira i Virgili
El cuestionario de agresividad de Buss y Perry (1992) es una de las herramientas más ampliamente utilizadas en el estudio de la conducta agresiva. No obstante, distintas investigaciones han señalado la posibilidad de que no presente un ajuste adecuado al modelo de cuatro factores propuesto originalmente por dichos autores. Cabe señalar que la mayoría de dichos estudios fueron llevados a cabo en muestras homogéneas, formadas por estudiantes universitarios, lo cual podría explicar las dificultades para replicar la estructura factorial del cuestionario. El presente estudio analiza el ajuste a dicho modelo y la consistencia interna de este cuestionario y de dos de las versiones reducidas que se han desarrollado para solucionar los problemas detectados en el mismo. Con este fin se administró el cuestionario de agresividad a una muestra heterogénea de 237 sujetos. Los resultados indican que las tres versiones estudiadas presentan tanto un ajuste aceptable al modelo de cuatro factores como una consistencia interna adecuada.
Psychometric properties of the reduced versions of Buss and Perry’s aggression questionnaire. The aggression questionnaire developed by Buss and Perry (1992) has been one of the most commonly used tools in the study of aggressive behavior. Nevertheless, several researchers have pointed out that its fit to the four-factor model originally proposed by the authors may be unsatisfactory. It is important to note that most of this studies used homogeneous samples of university undergraduates which may explain the difficulties to replicate the factorial structure of the questionnaire. Our study analyzes this fit as well as the internal consistency of the questionnaire and the two reduced versions that have been developed to solve the problems detected. With this purpose we administered the aggression questionnaire to a heterogeneous sample of 237 participants. The results show that the fit of the three analyzed versions to the four-factor model is reasonable and that their internal consistency is adequate.
El cuestionario de agresividad de Buss y Perry (1992) ha sido uno de los instrumentos más utilizados en los últimos años en la investigación de la conducta agresiva. Este cuestionario se desarrolló a partir del Hostility Inventory, elaborado por Buss y Durkee en 1957. Buss y Durkee (1957) diseñaron el Hostility Inventory con el fin de medir el nivel de agresividad de los individuos. Este instrumento estaba formado por 75 ítems distribuidos en las siguientes escalas: ataque, agresividad indirecta, negativismo, irritabilidad, resentimiento, desconfianza y agresividad verbal. Proporcionaba una medida general de la agresividad, a partir de la puntuación total en el cuestionario, y una medida para cada una de las escalas. A pesar de que diferentes autores mostraron que las puntuaciones en este cuestionario permitían predecir la conducta agresiva de los individuos (Gunn y Gristwood, 1975; Maiuro, Cahn, Vitaliano, Wagner y Zegree, 1988), se obtuvieron resultados contradictorios sobre su estructura factorial debido a que los ítems que formaban cada una de las escalas se habían asignado a partir de criterios únicamente conceptuales, sin verificación empírica posterior (Bendig, 1962; Edmunds y Kendrick, 1980).
Con el fin de subsanar los déficits de este instrumento Buss y Perry (1992) diseñaron el Agression Questionnaire (AQ). El AQ incluye ítems de The Hostility Inventory (algunos se han mantenido intactos, pero los que inicialmente eran ambiguos o confusos se redactaron de nuevo) e ítems nuevos. De esta manera se obtuvo un cuestionario inicial formado por 52 ítems con un formato de respuesta de tipo Likert, donde 1 equivalía a «extremadamente incaracterístico en mí» y 5 era «extremadamente característico en mí». Inicialmente se pretendía que los ítems se distribuyeran en las siguientes seis escalas: resentimiento, hostilidad, agresividad indirecta, agresividad verbal, agresividad física e ira. Pero el análisis factorial exploratorio realizado por los autores a partir de las puntuaciones de 406 estudiantes proporcionó un máximo de cuatro factores interpretables: agresividad física, agresividad verbal, hostilidad e ira que se corresponden con los aspectos instrumentales, cognitivos y emocionales de la agresividad. Una vez eliminados los ítems con saturaciones bajas o ambiguas, el cuestionario quedó reducido a 29 ítems (ver Tabla 1). Posteriormente, se realizó un análisis factorial confirmatorio en una muestra formada por 448 estudiantes con el fin de verificar la estructura de 4 factores. Los datos mostraron que la estructura podía ser explicada por un modelo de cuatro factores o por un modelo con cuatro factores de primer orden y un factor general de segundo orden. Los autores escogieron el modelo que proponía únicamente cuatro factores porque estaba más en consonancia con su marco teórico.
Diversos autores han realizado estudios sobre el AQ con el fin de confirmar la estructura factorial propuesta por Buss y Perry (1992). Dichos estudios han utilizado principalmente análisis factoriales confirmatorios, obteniendo en algunos casos resultados contradictorios. En este sentido, algunos investigadores concluyeron que el ajuste al modelo de cuatro factores propuesto por Buss y Perry (1992) es pobre (Archer, Kilpatrick y Bramwell, 1995; Williams, Boyd, Cascardi y Poythress, 1996), mientras que otros autores obtuvieron un ajuste aceptable después de eliminar algunos ítems. Así, Harris (1995) o Meesters, Muris, Bosma, Schouten y Beuving (1996) —este último en holandés— obtuvieron un ajuste aceptable después de eliminar los ítems 6 y 8 de la escala de hostilidad. Nakano (2001), por su parte, obtuvo un ajuste aceptable en la versión japonesa del cuestionario tras eliminar el ítem 7 de la escala agresividad física y el ítem 4 de la escala ira. Por lo que respecta a los estudios en lengua castellana, Rodríguez, Peña y Graña (2002) obtuvieron la solución de cuatro factores propuesta por Buss y Perry (1992), aunque el ítem 6 de la escala hostilidad, el ítem 9 de la escala agresividad física y el ítem 5 de la escala ira mostraban un mal ajuste al modelo. García-León, Reyes, Vila, Pérez, Robles i Ramos (2002), por su parte, encontraron una solución de cuatro factores distinta a la propuesta inicialmente por Buss y Perry (1992) formada por los factores agresividad física, agresividad verbal, ira con resentimiento y desconfianza.
Las inconsistencias detectadas en las distintas investigaciones que han intentado replicar la estructura factorial del AQ llevaron a Bryant y Smith (2001) al desarrollo de un cuestionario reducido que presentara un mejor ajuste a la estructura de 4 factores. Con este fin llevaron a cabo un análisis de componentes principales sobre el cuestionario original y eliminaron todos los ítems con saturaciones bajas (menores de 0,40) o con saturaciones complejas (mayores que 0,40 en al menos dos factores). El cuestionario resultante presentó un ajuste adecuado al modelo de cuatro factores en distintas muestras, estando formado por tan solo tres ítems por escala: los ítems 2, 6 y 8 de agresividad física; los ítems 2, 4 y 5 de agresividad verbal; los ítems 1, 6 y 7 de la escala ira y, finalmente, los ítems 2, 3 y 4 de la escala hostilidad (ver Tabla 1). Cabe señalar que todas las muestras utilizadas en este estudio fueron de origen anglosajón.
Una segunda aproximación al estudio de la estructura factorial del cuestionario AQ y a su refinamiento fue aportada por Vigil-Colet, Lorenzo-Seva, Codorniu-Raga y Morales-Vives (en prensa). En este caso se partió del hecho que las distintas adaptaciones del AQ en distintas culturas y lenguas apuntaban al mal ajuste de algunos ítems en cada caso particular, lo cual podía apuntar hacia el hecho que algunos de los ítems del AQ fueran sensibles a diferencias culturales, hecho bastante habitual en el estudio de la agresión (Ramírez, Andreu y Fujihara, 2001). Partiendo de la falta de acuerdo entre las distintas estructuras factoriales se trató de establecer si realmente existía una estructura factorial común en los resultados obtenidos a partir de muestras procedentes de diferentes países y con diferentes idiomas, y si era necesario eliminar algunos ítems para mejorar la congruencia entre las muestras.
Con este fin se utilizó el método Consensus Direct Oblimin con γ= 0 desarrollado por Lorenzo-Seva, Kiers y Ten Berge (2002) sobre los resultados obtenidos en cinco muestras procedentes de los siguientes estudios: la muestra norteamericana de Buss y Perry (1992), la muestra japonesa de Nakano (2001), la muestra española y la muestra japonesa de Ramírez et al. (2001) y la muestra española de García-León et al. (2002).
El método consensus direct oblimin está especialmente recomendado en aquellos casos —como el que nos ocupa— en que no existe un acuerdo óptimo entre las estructuras factoriales encontradas por distintos autores, pero dichas soluciones aún muestran un relativo nivel de acuerdo desde el punto de vista de estructura simple. De forma resumida, este método lleva a cabo una rotación conjunta de las matrices factoriales con el propósito de obtener un compromiso entre simplicidad y acuerdo óptimo entre todas ellas. Este procedimiento permite evaluar tanto el índice de congruencia de las distintas soluciones como detectar aquellos ítems problemáticos, cuya eliminación facilita la obtención de una estructura común congruente (Chico, Tous, Lorenzo-Seva y Vigil-Colet, 2003).
La aplicación de este método dio como resultado un índice de congruencia general de Tucker de 0.87. Dicho valor puede considerarse insatisfactorio según los criterios al uso (MacCallum, Widaman, Zhang y Hong, 1999). Por este motivo, se eliminaron los nueve ítems que presentaban una baja congruencia entre las distintas muestras: los ítems 4 y 7 de la escala agresividad física, el ítem 3 de la escala agresividad verbal, los ítems 4, 5 y 7 de la escala ira y los ítems 2, 3 y 6 de la escala hostilidad. Una vez eliminados estos ítems se repitió el procedimiento Consensus Direct Oblimin con γ= 0 sobre los ítems restantes. El nuevo índice de congruencia general fue de 0.91, valor que se puede considerar apropiado. Por lo tanto, se puede considerar que, reduciendo el cuestionario a 20 ítems, se obtiene una estructura factorial congruente a diferentes muestras procedentes de diversos países y con diferentes idiomas (ver Tabla 1).
Partiendo de las versiones reducidas que se han desarrollado a partir del AQ, el presente estudio se plantea el objetivo de analizar la consistencia interna y la bondad de ajuste al modelo de cuatro factores tanto de la versión completa como de las dos versiones reducidas del AQ con el fin de valorar la aplicabilidad de las mismas y las posibles ventajas o inconvenientes derivadas de su uso.
Por otra parte, uno de los posibles problemas que afecta a los distintos estudios que se han llevado a cabo sobre la estructura del AQ es el hecho de que la práctica totalidad de muestras utilizadas han estado formadas por estudiantes universitarios, lo cual implica un sesgo en el rango de edades de las mismas, así como posibles problemas derivados de la excesiva homogeneidad de los sujetos. Con el fin de solventar este posible problema el presente estudio ha intentado utilizar una muestra lo más heterogénea posible, tanto por lo que se refiere al rango de edades, como en relación al nivel de estudios de los individuos.
Método
Sujetos
Con el fin de obtener una muestra no procedente de estudiantes universitarios, 20 encuestadores llevaron a cabo un muestreo por accesibilidad entre las personas de su entorno. Aunque este proceso no garantiza una total aleatoriedad de la muestra, permite obtener una muestra mucho más heterogénea que las utilizadas habitualmente en este tipo de estudios. La muestra obtenida mediante este proceso estuvo compuesta por 237 sujetos (93 hombres y 145 mujeres) con un rango de edad comprendido entre los 16 y los 84 años, y una media de 27,63 años (DT= 11,14). Había 93 hombres y 145 mujeres. Respecto al nivel educativo de los sujetos, 25 individuos habían cursado estudios primarios, 190 habían cursado estudios secundarios y 22 habían cursado estudios universitarios.
Instrumentos
Se administró la versión española del Agression Questionnaire, adaptada por Rodríguez, Peña y Graña (2002). Este instrumento está compuesto por 29 ítems en escala Likert (1= Muy pocas veces; 5= Muchas veces). Por otra parte, los análisis estadísticos se realizaron tanto con el cuestionario completo como con los 20 ítems que componen la versión reducida del cuestionario de Vigil-Colet et al. (en prensa) y los 12 de la versión reducida de Bryant y Smith (2001). El análisis de datos se llevó a cabo utilizando los programas LISREL 8.3 y SPSS 11.0.
Procedimiento
Los cuestionarios fueron administrados individualmente a sujetos reclutados de forma voluntaria por un grupo de encuestadores. En todos los casos se garantizó a los participantes el total anonimato de los datos recogidos.
Resultados
La tabla 2 muestra los índices de bondad de ajuste al modelo de cuatro factores tanto para el cuestionario completo como para las dos versiones reducidas. Puede observarse que las tres versiones del AQ presentan un ajuste aceptable al modelo propuesto. En primer lugar podemos ver cómo para los tres casos el índice χ2 dividido por los grados de libertad presenta un valor inferior a 2, lo que indica un buen ajuste del modelo (Hoelter, 1983). Del mismo modo, el índice RMSEA se sitúa por debajo del valor 0,08, lo cual indica un ajuste adecuado de los tres modelos (Browne y Cudeck, 1993). Por otra parte podemos comprobar cómo el intervalo de confianza para dicho indicador en ningún caso supera tampoco dicho valor.
Finalmente, los índices GFI y AGFI tan solo presentan un buen ajuste para la versión reducida de Bryant y Smith, al situarse por encima de 0,9. No obstante hay dos consideraciones a hacer respecto a estos valores. En primer lugar, el modelo para esta versión presenta un número menor de ítems, lo cual podría explicar el mejor ajuste de la misma dado que al comparar distintos ajustes a un mismo modelo cuanto menor es el número de ítems mejor tiende a ser el ajuste del modelo (Ferrando y Lorenzo-Seva, 2000). En segundo lugar, en muestras inferiores a 400 sujetos estos dos índices tienden a infraestimar el ajuste del modelo, siendo preferible en muestras de menor tamaño el índice CFI (Finch y West, 1997). Tal y como podemos ver en la tabla 2 las dos versiones reducidas presentan unos valores aceptables en este índice, presentando la versión completa del AQ un ajuste menos satisfactorio.
Por lo que se refiere a los coeficientes estructurales, en ambas versiones reducidas todos los ítems presentaron coeficientes superiores a 0,35. En el caso de la versión completa, tres ítems presentaron coeficientes estructurales inferiores a dicho punto, siendo éstos los ítems 7 de la escala de agresividad física, el 4 de la escala de ira y el 6 de la escala de hostilidad. Dichos ítems, como puede comprobarse en la tabla 1, no fueron retenidos por ninguna de las versiones reducidas del cuestionario.
Finalmente, en la tabla 3 pueden observarse las matrices de correlación entre los cuatro factores encontradas para la versión completa y las versiones reducidas del cuestionario; como puede comprobarse, en la mayoría de los casos los valores obtenidos para las tres versiones son similares, lo que puede señalar la equivalencia de los factores extraídos en cada una de las adaptaciones.
En relación a la consistencia interna podemos comprobar en la tabla 4 que tanto para el total de la escala como para la escala de agresividad física las tres versiones presentan unos valores satisfactorios, mientras que el resto de escalas presentan unos valores aceptables. Cabe resaltar que en algunos casos, a pesar de la reducción en el número de ítems, las versiones reducidas presentan una fiabilidad superior a la versión original del AQ. Por otra parte, al estimar la consistencia interna de las versiones reducidas suponiendo que tuvieran el mismo número de ítems que la completa vemos cómo las consistencias internas de las mismas son superiores, con la excepción de la escala de agresividad verbal.
Discusión
Los resultados obtenidos en el presente estudio parecen indicar que tanto la versión completa del AQ, como las versiones reducidas del mismo presentan un ajuste aceptable al modelo de cuatro factores propuesto inicialmente por Buss y Perry (1992) en una muestra que, a diferencia de las utilizadas habitualmente, presenta un mayor grado de heterogeneidad. En términos generales, a pesar de las discrepancias existentes entre los distintos estudios que han verificado la bondad de ajuste de este modelo, los resultados obtenidos parecen confirmar su validez.
En este sentido, cabe destacar que el ajuste para la escala completa es mejor que el obtenido en los estudios anteriores en lengua castellana por Rodríguez et al. (2002) y García-León et al. (2002). Existen dos elementos que podrían explicar este efecto. En primer lugar, ambos estudios definieron la estructura factorial del cuestionario llevando a cabo una extracción de componentes principales, a diferencia de la extracción por ejes principales, método más adecuado para el caso que nos ocupa y fue el utilizado originalmente por Buss y Perry (1992). En segundo lugar, las muestras utilizadas en ambos estudios estuvieron formadas principalmente por estudiantes universitarios, con la consiguiente restricción en el rango de edades.
Teniendo en cuenta que las tres versiones analizadas presentan un ajuste similar al modelo de cuatro factores, resulta difícil recomendar una de ellas a partir de este criterio, debiendo entonces considerar otras propiedades de las mismas. En primer lugar, las dos versiones reducidas presentan un menor tiempo de aplicación al reducir levemente (20 ítems) o sustancialmente (12 ítems) la longitud del test. Por otra parte, la versión de Vigil-Colet et al. (en prensa), debido al procedimiento utilizado para su desarrollo, garantiza una mayor validez transcultural, que permite una mejor comparación de los resultados obtenidos en distintos ámbitos y lenguajes.
Un aspecto a destacar es las discrepancias existentes entre los ítems que configuran las dos versiones reducidas analizadas. De este modo, tres de los doce ítems que forman la versión de Bryant y Smith (2001) no están presentes en la versión de Vigil-Colet et al. (en prensa). Este hecho puede ser debido al procedimiento utilizado por los autores para desarrollar las versiones reducidas. En este sentido, Bryant y Smith (2001) llevaron a cabo un análisis de componentes principales sobre el cuestionario AQ para, posteriormente, retener aquellos ítems con saturaciones superiores a 0,40 en su componente y que no presentaran ninguna otra saturación superior a este valor en ningún otro componente. Este procedimiento puede tender a incluir ítems que, a pesar de no presentar una elevada comunalidad, aporten una elevada varianza única. Por otra parte, el procedimiento empleado por Vigil-Colet et al. (en prensa) se basa en el análisis factorial, con lo cual tiende a retener aquellos ítems con una elevada comunalidad. Partiendo de todo ello, sería interesante llevar a cabo estudios de validez predictiva de ambos cuestionarios con el fin de evaluar hasta qué punto los distintos métodos utilizados para su desarrollo pueden afectar la validez de los mismos.
Desde el punto de vista de la consistencia interna, las versiones reducidas no presentan una considerable merma de la misma, aún más si consideramos que la reducción en la longitud del test podría afectar a la consistencia interna de los mismos. De hecho podemos comprobar cómo en algunos casos las versiones reducidas presentan una consistencia interna más elevada que la versión completa del AQ, lo cual puede ser un criterio que las haga preferibles a la versión original. No obstante, los resultados obtenidos en la escala de hostilidad muestran una pobre consistencia interna de la misma en ambas versiones reducidas, lo cual implica que los resultados obtenidos con las mismas deban interpretarse con cierta prudencia.
Como conclusión los resultados aportados parecen señalar que las versiones reducidas del AQ presentan unas propiedades desde el punto de vista de su consistencia interna (con la excepción de la escala de hostilidad) y de su estructura factorial que hacen recomendable su aplicación. No obstante, y como paso previo a su aplicación, son necesarios nuevos estudios que garanticen la validez de las mismas en comparación con la versión original. En este sentido, Bryant y Smith (2001), al desarrollar su versión reducida, llevaron a cabo un estudio de validez de constructo de las escalas resultantes, llegando a la conclusión de que el proceso que siguieron al modificar la composición de las escalas no alteró la naturaleza conceptual de las mismas. No obstante, en la bibliografía actual no hay otros estudios que repliquen con posterioridad estos resultados.
Agradecimientos
Esta investigación ha sido subvencionada por el Ministerio de Ciencia y Tecnología, proyecto número SEC2001-3821-C05-C02, con la colaboración del Fondo Europeo para el Desarrollo de las Regiones.
Archer, J., Kilpatrick, G. y Bramwell, R. (1995). Comparison of two aggression inventories. Aggressive Behavior, 21, 371-380.
Bendig, A.W. (1962). Factor analytic scales of covert and overt hostility. Journal of Consulting Psychology, 26, 200.
Bryant, F.B. y Smith, B.D. (2001). Refining the architecture of aggression: a measurement model for the Buss-Perry aggression questionnaire. Journal of Research on Personality, 35, 138-167.
Buss, A.H. y Durkee, A. (1957). An inventory for assessing different kinds of hostility. Journal of Consulting Psychology, 21, 343-349.
Buss, A.H. y Perry, M.P. (1992). The aggression questionnaire. Journal of Personality and Social Psychology, 63, 452-459.
Chico, E., Tous, J.M., Lorenzo-Seva, U. y Vigil-Colet, A. (2003). Spanish adaptation of Dickman’s impulsivity inventory: its relationship to Eysenck’s personality questionnaire. Personality and Individual Differences, 35, 1.883-1.892.
Edmunds, G. y Kendrick, D.C. (1980). The measurement of human aggressiveness. New York: Wiley.
Ferrando, P.J. y Lorenzo-Seva, U. (2000). Unrestricted versus restricted factor analysis of multidimensional test items: some aspects of the problem and some suggestions. Psicológica, 21, 301-323.
Finch, J.F. y West, S.G. (1997). The investigation of personality estructure: statisitical models. Journal of Research in Personality, 31, 439-485.
García-León, A., Reyes, G.A., Vila, J., Pérez, N., Robles, H. y Ramos, M.M. (2002). The aggression questionnaire: a validation study in student samples. The Spanish Journal of Psychology, 5, 45-53.
Gunn, J. y Gristwood, J. (1975). Use of the Buss-Durkee Hostility Inventory among british prisoners. Journal of Consulting and Clinical Psychology, 43, 590.
Harris, J.A. (1995). Confirmatory factor analysis of the aggression questionnaire. Behavioral Research and Therapy, 8, 991-993.
Hoelter, J.W. (1983). Factorial invariance and self-esteem: reassessing race and sex differences, Social Forces, 61 (3), 835-846.
Lorenzo-Seva, U., Kiers, H.A.L. y Ten Berge, J.M.F. (2002). Techniques for oblique factor rotation of two or more loading matrices to a mixture of simple structure and optimal agreement. British Journal of Mathematical and Statistical Psychology, 55, 337-360.
Maiuro, R.D., Cahn, T.S., Vitaliano, P.P., Wagner, B.C. y Zegree, J.B. (1988). Anger, hostility, and depression in domestically violent versus generally assaultive men and nonviolent control subjectes. Journal of Consulting and Clinical Psychology, 56, 17-23.
MacCallum, R.C., Widaman, K.F., Zhang, S. y Hong, S. (1999). Sample size in factor analysis. Psychological Methods, 4, 84-99.
Meesters, C., Muris, P., Bosma, H., Schouten, E. y Beuving, S. (1996). Psychometric evaluation of the dutch version of the aggression questionnaire. Behavioral Research and Therapy, 34, 839-843.
Nakano, K. (2001). Psychometric evaluation on the Japanese adaptation of the aggression questionnaire. Behavioral Research and Therapy, 39, 853-858.
Ramírez, J., Andreu, J.M. y Fujihara, T. (2001). Cultural and sex differences in aggression: a comparison between japanese and spanish students using two different inventories. Aggressive behavior, 27, 313-322.
Rodríguez, J.M., Peña, E. y Graña, J.L. (2002). Adaptación psicométrica de la versión española del Cuestionario de Agresión. Psicothema, 14 (2), 476-482.
Vigil-Colet, A., Lorenzo-Seva, U., Codorniu-Raga, M.J. y Morales, F. (en prensa). Factor structure of the aggression questionnaire among different samples and languages. Aggressive Behavior.
Williams, T.Y., Boyd, J.C., Cascardi, M.A. y Poythress, N. (1996). Factor structure and convergent validity of the aggression questionnaire in an offender population. Psychological Assessment, 4, 398-403.