La revista Psicothema fue fundada en Asturias en 1989 y está editada conjuntamente por la Facultad y el Departamento de Psicología de la Universidad de Oviedo y el Colegio Oficial de Psicología del Principado de Asturias. Publica cuatro números al año.
Se admiten trabajos tanto de investigación básica como aplicada, pertenecientes a cualquier ámbito de la Psicología, que previamente a su publicación son evaluados anónimamente por revisores externos.
Psicothema, 2002. Vol. Vol. 14 (nº 1). 181-184
Guillermo Vallejo y José Ramón Escudero
Universidad de Oviedo
El diseño de bloques al azar capacita al investigador para reducir la varianza del error y obtener estimaciones más precisas de los efectos de los tratamientos. En la mayoría de los experimentos el tamaño de los bloques debe ser reducido para lograr la homogeneidad de las unidades experimentales e incrementar la precisión del diseño. En estos casos es posible seguir utilizando diseños de bloques en los cuales una parte de los tratamientos es asignada a los bloques conforme algún patrón especificado de antemano. Estos diseños son conocidos como diseños de bloques incompletos equilibrados. Sin embargo, también puede ocurrir que por accidente o cualquier otra razón los investigadores se vean en la obligación de emplear diseños de bloques incompletos, pero carentes de equilibrio. En el presente trabajo se muestra el proceso a seguir en este último caso, para determinar qué funciones y contrastes son estimables y cuáles de las hipótesis son de interés por resultar interpretables.
Testing of hypotheses in unbalanced incomplete block designs. The randomized complete block design enables an experimenter to reduce the error variance and obtain more precise estimates of treatment effects. In many experiments the size block must be small to obtain homogeneity of the experimental units, and increase the precision of the design. In this case it is possible to use randomized block design s in which every treatment it not present in every block, although if are presented according to some specified pattern. These designs are known as balanced o partially balanced incomplete block designs. However, it may happen by accident or some other reason, that the investigators is forced to use incomplete block designs, but unbalanced. The purpose of this work is to show a method that allows determining the functions and contrasts that are estimable and the associated hypotheses that are of general interest.
El método más eficaz para soslayar la heterogeneidad de las unidades experimentales en todo tipo de experimentación, a la vez que pilar fundamental en la que se asienta el diseño experimental moderno, se conoce con el nombre de modelo de bloques al azar. Como resulta conocido, dicho diseño implica replicar el experimento, al menos, tantas veces como niveles tenga la variable de bloqueo. Sin embargo, en ciertas situaciones los investigadores son incapaces de asignar todos los tratamientos a cada uno de los bloques. En principio, esta situación puede acontecer por razones de índole muy diversa, no obstante, los problemas más frecuentes surgen por limitaciones en los aparatos y, sobre manera, por no disponer del adecuado número de unidades experimentales para lograr que la homogeneidad dentro de los bloques sea la mayor posible. Para resolver estas cuestiones, y otras de carácter similar, es factible usar diseños de bloques al azar en los cuales cada tratamiento no se encuentre presente a lo largo de todas las dimensiones de la variable de bloqueo. Estos diseños son conocidos como diseños de bloques incompletos al azar. Y si bien es cierto que en la investigación psicológica su empleo es prácticamente nulo, no es menos cierto que en ocasiones constituirían la opción más adecuada para abordar la cuestión reseñada. Trabajos con un agradable sabor aplicado donde se pueden encontrar estos diseños son los de Lentner y Bishop (1986) y John y Quenouille (1977). Por su parte, el libro de Das y Giri (1979) da buena cuenta de los principales diseños de bloques incompletos, de su análisis y de los métodos más relevantes utilizados en su construcción.
Por regla general, la mayoría de los textos especializados recomiendan reducir el tamaño de los bloques utilizando los diseños de bloques incompletos equilibrados introducidos por Yates (1936) y los diseños de bloques incompletos parcialmente equilibrados introducidos por Bose y Nair (1939). Tanto unos como otros, requieren que las unidades experimentales sean asignadas a los bloques conforme algún patrón convenientemente especificado con anterioridad a la realización del experimento. En concreto, el equilibrio propio del primer grupo de diseños consiste en que cada par de tratamientos ocurra el mismo número de veces a lo largo de los diferentes niveles de la variable de bloqueo (λ). Supongamos que la variable de tratamiento consta de p niveles y que en cada bloque sólo podemos manejar exactamente k (k<p) tratamientos. La condición necesaria y suficiente para construir un diseño de bloques incompleto equilibrado consiste en seleccionar un número de bloques que coincida con el total de combinaciones posibles de p tratamientos tomados de k en k. Sin embargo, frecuentemente esta clase de diseños pueden obtenerse con un menor número de bloques con tal de que se satisfaga: (a) pr = bk, (b) λ = r(k-1) / p-1 y (c) b ≥ p. Donde b denota el número de bloques y r el número de veces que cada nivel de tratamientos aparece a lo largo de los diferentes bloques. A su vez, el patrón de balanceo de los diseños de bloques incompletos parcialmente equilibrados consiste en que algunos pares de tratamientos aparezcan juntos en cada bloque λ1 veces, otros pares aparezcan juntos λ2 veces,..., y los pares restantes aparezcan juntos λm veces. Como consecuencia, estos diseños exigen un menor número de bloques que los diseños de bloques incompletos equilibrados, aunque la eficiencia de estos últimos es la misma para cada par de tratamientos, mientras que la de los diseños parcialmente equilibrados es distinta para cada par de asociados.
Sin restar importancia a lo expuesto, en la fase de experimentación propiamente dicha también puede ocurrir, bien sea por accidente o bien sea por cualquier otra razón, que determinadas observaciones se pierdan. Consecuentemente, quiebran los requisitos combinatorios requeridos por estos diseños para alcanzar el equilibrio. Por ejemplo, un paciente puede abandonar el tratamiento, un aparato puede fallar en el registro de determinados datos, uno o más animales mueren durante su manipulación, algunos sujetos no siguen adecuadamente las instrucciones, etc. Lo cierto es que situaciones como las descritas no les son en absoluto extrañas a los investigadores, aunque no suelan aludir a ellas. La pérdida de observaciones de un modo arbitrario conlleva que no todas las usuales funciones paramétricas pueden ser observadas. Tales situaciones, a menos que sean descubiertas conducen a una incorrecta asignación de los grados de libertad correspondientes a determinadas fuentes de variación, a la obtención de matrices singulares que, por cierto, muchos programas de ordenador invierten sin advertir de tal anomalía al usuario y, sobre todo, a que efectuemos contrastes con sumas de cuadrados que no son adecuadamente conocidas. Para intentar abordar un panorama como el descrito al investigador se le ofrecen varias salidas. Una de las más novedosas, y también de las más fáciles de implementar, es la que se muestra en el presente manuscrito siguiendo los trabajos de Dodge y Shah (1977) y de Dodge (1985).
Estimación de funciones y contrastes
Para estimar la función de respuestas de cada uno de los tratamientos implicados en el diseño de bloques incompleto, un apropiado modelo lineal estándar puede ser escrito como sigue:
(1)
donde, μ, αj y βk son parámetros desconocidos y los errores εijk son variables aleatorias con media cero e igual varianza. También se asume que nj= Σpj=1 njk ≠ 0 para todo k= 1, ... ,q, que nk = Σq k=1 njk ≠ 0 para todo j=1, ..., p y que cada fila y columna de la matriz de datos contiene al menos una observación.
El modelo de la ecuación (1) también puede ser especificado en forma matricial por
E(y)= jµ+X1α+X2ß=Xθ (2)
Aquí el vector de observaciones y es de dimensión N x 1 y la matriz de diseño X (j, X1, X2) es de dimensión N x (1+p+q). Estrechamente relacionada con la matriz de diseño X se halla la matriz de incidencia N, la cual especifica el número de observaciones efectuadas bajo los niveles j-ésimo y k-ésimo de las variables de tratamiento y bloqueo, respectivamente. En concreto, N = X’1X2.
Dicho lo anterior, nos centraremos, inicialmente, en mostrar qué funciones μ + αj + βk o valores esperados de yijk son estimables; posteriormente, haremos lo propio con los contrastes o diferencias entre pares de medias. En el caso que nos ocupa, una función paramétrica puede ser definida como una combinación lineal de parámetros μ, α1,..., αp, β1,..., βk. Tal función es estimable si se puede expresar como una combinación lineal de las expectaciones μ + αj + βk de las celdas de la matriz de incidencia para las cuales existen observaciones disponibles. Actualmente existen distintos procedimientos para saber que expectaciones son realmente estimables (ver, por ejemplo, Milliken y Johnson, 1984; Searle, 1997), no obstante, de los procedimientos examinados por nosotros, el algoritmo o proceso R introducido por Birkes, Dogdge y Seely (1976) es el más completo.
El proceso R es un bucle iterativo que se aplica sobre la matriz N para obtener una matriz final, M, que informa de las celdas que contienen funciones paramétricas estimables. Dicho proceso, además de proporcionar una base para las funciones estimables de cada uno de los efectos implicados en el diseño, también permite determinar los grados de libertad asociados con las hipótesis de interés y las porciones del diseño que están conectadas. De acuerdo con los autores citados, el algoritmo R, cuyo funcionamiento es muy similar al que rige en el popular juego de las cuatro esquinas, implica los cuatro pasos que siguen: En primer lugar, se parte de una matriz de ceros M de dimensión p x q. En segundo lugar, cada entrada de la matriz M toma el valor uno si la correspondiente entrada de la matriz de incidencia N es distinta de cero. Esto es, mjk = 1 sí njk ≠ 0. En tercer lugar, cada entrada de la matriz M toma el valor uno si existe alguna fila, columna e interacción de ambas que valgan uno; esto es, para cada par de valores (j, k) si existen r y s, tal que mjs = mrs = mrk = 1, entonces mjk = 1. Por último, se repite sucesivamente el paso 3, usando los nuevos mjk distintos de cero como ángulos del rectángulo hasta que ninguna entrada pueda ser modificada. A partir de la matriz final M, se colige rápidamente que una función paramétrica μ + αj + βk es estimable sí y sólo sí mjk = 1. Además de los citados Birke et al. (1976), Dodge (1985) también presenta una demostración de lo dicho. Para ilustrar lo dicho, a continuación, se muestra la matriz final M obtenida a partir de una hipotética matriz de incidencia N en la cual el número de niveles de la variable de tratamiento y de la variable de bloqueo son los mismos; en concreto, p = 6 y q = 6.
Desde M resulta fácil verificar las funciones que son realmente estimables. Por ejemplo, se observa que la función μ + α1 + β1 es actualmente estimable, mientras que la función μ + α4 + β2 no lo es.
A su vez, mediante sencillas operaciones con la matriz M también se puede determinar qué contrastes son estimables. En concreto, una diferencia entre cualquier par de niveles de la variable de interés resulta estimable si el elemento jk de la matriz S (S = MM’) es distinto de cero. Lo dicho es una consecuencia de lo anterior y se puede verificar teniendo en cuenta que si sjk ≠ 0, debe existir algún l tal que mjk = mlk = 1. De este modo, las funciones paramétricas μ + αj + βk y μ + α1 + βk tienen que ser estimables y, por extensión, las diferencias entre ambas expectaciones. Desde la matriz S se puede descubrir rápidamente cuales de los p x (p-1)/2 pares de tratamientos existentes son estimables. Para ello tan sólo hay que reemplazar por unos todos los elementos distintos de cero que se hallen por debajo de la diagonal principal de S y colocar en las filas de la matriz triangular inferior resultante los valores αj = α2, α3, ..., αp y en las columnas los valores αj = α1, α2,..., αp-1. A continuación, utilizamos esta última matriz con apariencia de triángulo contador para determinar, por un lado, los contrastes que son estimables y, por otro lado, cuántos pueden ser simultáneamente estimados de forma independiente. Lo primero puede ser hecho verificando la intersección de filas y columnas del triángulo que contienen unos, mientras que lo segundo implica contar las filas cuyos elementos no sean todos ceros. Dicha base coincide con los grados de libertad de la variable de interés, en nuestro caso con fa. En la Figura 1 se muestra el triángulo contador para las diferencias de α del ejemplo citado más arriba.
De acuerdo con dicha Figura 1, se observa que α1 - α2 es estimable, mientras que α1 - α4 no lo es. También se aprecia que el número de filas cuyos elementos no son todos nulos son cuatro, por tanto, fa = 4. Se excusa decir que un procedimiento similar se puede utilizar para calcular fβ, pero sustituyendo S por M’M.
Determinación de las sumas de cuadrados e hipótesis asociadas
En esta sección se genera una solución g-inversa para resolver el sistema de ecuaciones normales X’Xθ = X’y correspondiente al modelo de efectos de la ecuación (2). También se presentan las sumas de cuadrados requeridas para el análisis de la varianza y las hipótesis que cada fuente tiene asociada.
Para encontrar una solución a los parámetros del vector θ vamos a escribir en forma matricial el sistema de ecuaciones normales
donde j’j es la suma de las entradas de la matriz N, los vectores j’X1 y j’X2 contienen el número de observaciones de las filas y de las columnas, respectivamente, de la matriz de incidencia N y X’1 X1 y X’2 X2 son matrices diagonales cuyas entradas están configuradas con las sumas de las filas y de las columnas de la matriz N.
En el modelo sobreparametrizado que viene siendo considerado el orden de X es mayor que su rango, en concreto R(X) = fa + q, con lo que X’X no es invertible. De acuerdo con Searle (1997), esto se puede solucionar de una manera relativamente fácil particionando la matriz X’X y construyendo una submatriz cuyo rango sea igual a fα+q. Para ello se redefine Nq como N, X’q Xq como X’2X2 y j’Xq, ß q y X’2y como j’X2, ß ~ y X’2y con sus j-ésimas filas y/o k-ésimas columnas eliminadas. Teniendo en cuenta las modificaciones reseñadas el sistema de ecuaciones normales se puede reescribir
donde Cq son las k-ésimas columnas eliminadas de N. Las ecuaciones son resueltas utilizando la matriz
como una inversa generalizada. Sustituyendo la matriz de la parte izquierda de la ecuación (5) por la inversa de G, es inmediato que µ = 0 y ß 0 = 0 y
con
Por último, en la Tabla 1 presentamos la partición de la suma de cuadrados total e hipótesis asociadas con las fuentes del modelo. Siguiendo el trabajo de Speed y Hocking (1978), para simplificar los aspectos computacionales utilizaremos la notación R(./.). Dicha cantidad implica la reducción que se produce en la suma de cuadrados como resultado de ajustar diferentes modelos.
Observando detenidamente la Tabla 1 se aprecia rápidamente las hipótesis que tienen realmente interés. En nuestro caso las asociadas con los tratamientos y bloques ajustados, ya que ambas tienen una interpretación clara; las hipótesis restantes al no ofrecer ninguna interpretación razonable carecerían de interés.
Agradecimientos
Este trabajo ha sido financiado mediante un proyecto de investigación concedido por el MCYT (Ref.: B05-2000-0410) y FICYT (PR-01-GE-2).
Birkes, D., Dodge, Y. y Seely, J. (1976). Spanning sets for estimable contrasts in classification models. Annals of Statistics, 4, 86-107.
Bose, R. C. y Nair, K. R. (1939). Partially balanced incomplete block designs. Sankhya, 4, 337.
Das, M. N. y Giri, N. C. (1979). Design and Analysis of Experiments. New York: Halstead Press.
Dodge, Y. (1985). Analysis of Experiments with Missing Data. New York: John Wiley & Sons, Inc.
Dodge, Y. y Shah, K. R. (1977). Estimation of parameters in latin squares and greco-latin squares with missing observations. Communications in Statistics-Theory and Methods, 6, 1.465-1.472.
John, J. A. y Quenouille, M. H. Experiments: Design and Analysis. London: Mc Millan.
Lenter, M. y Bishop, T. (1986). Experimental Design and Analysis. Blacksbrg: Walley Book Co.
Milliken, G. A. y Johnson, D. E. (1984). Analysis of Messy Data: Designed Experiments. New York: Van Nostrand Reinhold.
Searle, S. R., (1997). Linear Models. Wiley Classics Library. New York: John Wiley & Sons, Inc.
Speed, F. M. y Hocking, R. R. (1976). The use of the R(./.) notation with unbalanced data. The American Statistician, 30, 30-34.
Yates, F. (1936). Balanced incomplete randomized blocks. Annals of Eugenics, 7, 121-140.
Aceptado el 16 de octubre de 2001