La revista Psicothema fue fundada en Asturias en 1989 y está editada conjuntamente por la Facultad y el Departamento de Psicología de la Universidad de Oviedo y el Colegio Oficial de Psicología del Principado de Asturias. Publica cuatro números al año.
Se admiten trabajos tanto de investigación básica como aplicada, pertenecientes a cualquier ámbito de la Psicología, que previamente a su publicación son evaluados anónimamente por revisores externos.
Psicothema, 2002. Vol. Vol. 14 (nº 2). 497-503
Paula Fernández, Guillermo Vallejo y J. Ramón Escudero
Universidad de Oviedo
El examen de la eficiencia de nueve procedimientos, dos de Máxima Verosimilitud y siete de Momentos, para el diagnóstico de la intensidad y sentido de la autocorrelación de primer orden es el tema que vertebra nuestra investigación. Para este cometido hemos diseñado un experimento de Simulación Monte Carlo en el que utilizamos dos estructuras de la matriz de correlaciones, AR y ARH, y hemos manipulado los grados de libertad de un diseño SxO (3xq) mediante diversas combinaciones del tamaño de las muestras y cantidad de puntos de serie. Los resultados indican que, cuando la estructura subyacente es AR, los procedimientos HCH, J, PP y WHS estiman correctamente el sentido e intensidad de la autocorrelación. De otro modo, sólo la heterogeneidad intragrupo creciente modifica la estimación para PP y WHS.
Diagnosis of the precision of nine methods for estimation of the first order autocorrelation in a SxO (3xq) design.The aim of this paper is to evaluate the efficiency of nine methods, two MLE and seven of moments, for estimation of the AR(1) dependence. A Monte Carlo simulation study was undertaken where two correlation structures, AR and ARH, were used. We manipulate the degrees of freedom in a SxO (3xq) design by means of various combinations of the sample size and the time points. The results indicate that when the structure is AR, the HCH, J, PP and WHS procedures estimate correcty the direction and the intensity of the autocorrelation. Otherwise, only the heterogeneity within groups increasing modify the PP and WHS estimation.
No nos pasa inadvertido que desde hace ya algún tiempo se aprecia un incremento en el estudio y aplicación de diseños de investigación intragrupo. Su común denominador es tener una estructura de carácter longitudinal donde la/las unidades de observación que componen la/las muestras se someten a observación en ocasiones sucesivas. En función de la naturaleza de las fuentes de variación, de la regla de asignación, de la naturaleza y cantidad de variables dependientes, así como del número de registros de las mismas, se despliegan en un amplio abanico de diseños particulares, todos ellos de medidas repetidas, que, simplificando, los podríamos bifurcar en diseños de sujetos x tratamientos o diseños de sujetos x ocasiones (Fernández, 1999). Amén de que se advierten ventajas de considerable valor práctico, estadístico y sustantivo adolecen de la posible presencia de efectos secuenciales que pueden amenazar tanto a la validez interna como a la validez de conclusión estadística. En este sentido, si los efectos de práctica y residuales pueden contaminar los resultados cuando las fuentes de variación son tratamientos, la dependencia serial en las puntuaciones o en los errores es el patrón habitual cuando la unidad que se asigna a la condición de observación son puntos de una serie ordenados temporal o espacialmente.
Se entiende que un conjunto q (k=1,...,q) de variables aleatorias ordenadas tienen estructura de dependencia serial de orden r si, la kth variable, dada la precedente, es interdependiente de todas las demás r variables precedentes (Gabriel, 1962). Típicamente, la correlación entre las observaciones de dos puntos en el tiempo experimenta una función negativa de la distancia temporal entre ellos susceptible de manifestarse en dos sentidos: positiva (Eik≥0, Eij+1≥0 o Eik≤ 0, Eij+1≤ 0) y negativa (Eik≥0, Eij+1≤ 0 ó Eik≤ 0, Eij+1≥0). Resta añadir que la maduración o la memoria pueden estar presentes si la investigación implica algún proceso de crecimiento o aprendizaje provocando que, desviaciones aleatorias alrededor de una tendencia subyacente sean no estacionarias (σ2k < σ2k o σ2k > σ2k, para k<k’).
Acerca de la correlación serial en las Ciencias Sociales y Comportamentales existe un consenso en tres direcciones. De una parte, que la autocorrelación positiva de primer orden es la más habitual. De otra, que existe una seria dificultad para efectuar estimaciones estables y correctas de los parámetros (σ2 y ρ) en series temporales cortas (q<30) debido a la escasa potencia de las estrategias de cálculo. Por último, son muchos los investigadores que advierten de que muy pequeñas desviaciones de la no autocorrelación pueden viciar completamente las pruebas de significación. Sin embargo, pulsar la dependencia serial puede interesar, o por razones sustantivas orientadas a comprender la naturaleza de un proceso, o por razones metodológicas con intención de disuadir el ruido estadístico que supone para aquellos procedimientos inferenciales estándar que asumen que los errores en las observaciones están independientemente muestreados (Escudero y Vallejo, 2000; Bono y Arnau, 2000). Aunque para captar la estructura de antedependencia que subyace a los datos están disponibles varios procedimientos, sólo dos de ellos nos ocupan en esta investigación; de estimación máximo verosímiles y de momentos. Con respecto a los primeros, los investigadores concluyen que además de requerir procesos iterativos que resultan sumamente laboriosos la estimación resulta sesgada cuando se poseen pocos registros. En virtud de ello, se han propuesto otros procedimientos que ofrecen soluciones más parsimoniosas basados en el cálculo de varianzas y covarianzas de los residuales mínimo cuadráticos ordinarios o de puntuaciones directas. La bondad de estos procedimientos se ha estudiado en abundancia en el contesto de la investigación conductual aplicada en los diseños de series temporales interrumpidas, sin embargo, hasta la fecha no se ha llevado a cabo ninguna investigación que compare el comportamiento de estos estimadores en un diseño tan habitualmente utilizado en la investigación básica psicológica y educacional como tan afectado por la ausencia de independencia entre las puntuaciones, el diseño de Sujetos por Ocasiones. Así pues, el asunto que vertebra nuestra investigación es el examen de la eficiencia de 9 procedimientos para el diagnóstico de la intensidad y sentido de la autocorrelación de primer orden para datos recogidos en el formato de un diseño en el que sólo hay una variable, bien de tratamiento o clasificación (j= 1,...p), que envuelve a dos o más muestras aleatorias de sujetos (i= 1,...,nj; Σnj= N), y que son observados en un reducido número de ocasiones (k= 1,...,q) que resultan de una elección sistemática de intervalos de tiempo fijos y equidistantes.
Método
Para este cometido hemos diseñado un experimento de simulación Monte Carlo. Utilizamos dos estructuras de la matriz de correlaciones (R) y manipulamos los grados de libertad del diseño mediante diversas combinaciones del tamaño de las muestras (nj) y cantidad de puntos de serie (q) en un diseño simple S x O (3xq).
De los nueve procedimientos para estimar la autocorrelación que sometemos a estudio, dos son máximo verosímiles y siete de momentos:
Procedimientos máximo verosímiles:
– ρHCH: Hearne, Clark y Hatch, (1983).
– ρJ: Jones (1985)
Procedimientos de momentos:
– ρAJS: Procedimiento desarrollado por Bartlett (1956:255) y expuesto por Andersen, Jensen y Schou (1981).
– ρABD: Azzalini y Browman (1990). Constituye una extensión del procedimiento de Daniels (1956) para cuando n>1.
– ρAB: Azzalini y Browman (1990) proponen una mejora para DABD.
– ρPP: Pantula y Pollock (1985).
– ρG: Gill (1992).
– ρWHS: Wilson, Hebel y Sherwin (1981) desarrollan una estimación para el cálculo de la autocorrelación de orden uno que denominan subóptima.
– ρAFD: Azzalini y Frigo (1991).
Los procedimientos ρHCH, ρJ y ρPP realizan el cálculo utilizando los residuales entre sujetos. ρAJS, ρABD, ρAB, y ρG utilizan los residuales intrasujetos. ρWHS se calcula utilizando el promedio de todas las posibles varianzas que se pueden computar desde dos y tres observaciones contiguas espaciadas una y dos unidades de tiempo respectivamente dentro de un individuo. ρAFD, que también en una extensión del procedimiento de Daniels (1956) para el caso de que n>1, utiliza, en lugar de los residuales, las puntuaciones directas.
Los resultados se exponen articulados en función de las [q, nj(N), GHE, GHI, R]= [4x3x4x5x8]= 1920 condiciones experimentales respectivamente que resultan de manipular las variables que se indican y que pasamos a detallar. (q): es el nº de niveles del factor intra sujeto= 4, 6, 8 y 12 niveles; (nj) indica el tamaño de los vectores de observaciones. Tres tamaños se han considerado: 5, 10 y 16 para cada uno de los grupos, conformando tamaños muestrales (N) de 15, 30 y 48 respectivamente. Los tamaños de los vectores (nj) y el número de niveles del factor intra sujeto (q) se eligieron de forma arbitraria con el objetivo de analizar la eficacia de los procedimientos anteriormente expuestos en función de la relación nj/q. (GHE) representa el grado de heterogeneidad entre los niveles del factor entre grupos. Se crearon matrices cuyos elementos guardaban entre sí diferentes razones a través de los grupos. En concreto fueron (1:1:1); (1:1.5:2); (1:2:3); y (1:3:5) que hacen un conjunto de situaciones que van desde la homogeneidad ortodoxa hasta una elevada violación de esta asunción; (GHI) es el grado de heterogeneidad intra y cubre condiciones de estacionariedad y no estacionariedad. Bajo esta última, cuatro son las condiciones sometidas a observación: moderadamente y gravemente crecientes (GHI= 1 y 2 respectivamente), moderadamente y gravemente decrecientes (GHI= 3 y 4, respectivamente); (R) se refiere a la presencia de correlación serial de primer orden entre las puntuaciones emitidas por cada una de las unidades experimentales en sentido positivo y negativo. Se someten a estudio a lo largo de una gradación que cubre 8 niveles [-0.8:0.8:(0.2)].
Los datos simulados se han generado utilizando dos estructuras de covarianza: AR y ARH. AR+ y AR- expresan la estructura de correlación serial de primer orden positiva y negativa respectivamente. Manifiestan estacionariedad en las varianzas (son matrices homogéneas) y la correlación entre la kth y la k’th observación es ρ|k-k’|. Específicamente estas matrices Σ se han construido a través de la expresión Σ= σ2 (1/1- ρ2) V donde, σ2 (1/1- ρ2), es la varianza intrasujeto común (σ2= 10, ρ= [-0.8:0.8: (0.2)] en nuestro caso) y V=D1/2 R D1/2. V es idéntica a la matriz de correlación diseñada R de tamaño qxq y D ≡ Iq. ARH+ y ARH- expresan matrices de covarianza con el mismo diseño de correlación serial positiva y negativa que las matrices AR, pero exhiben heterogeneidad intrasujeto y por tanto las varianzas varían a través de q en progresión geométrica creciente o decreciente. De cada una de ellas se contemplan cuatro condiciones de no estacionariedad: moderadamente creciente (MC), gravemente creciente (GC), moderadamente decreciente (MD) y gravemente decreciente (GD). Sirva el ejemplo para q=4. MC= (1; 1.5; 2; 2.5); GC= (1; 2; 3; 4); MD= (2.5; 2; 1.5; 1); GC= (4; 3; 2; 1). La expresión que se ha utilizado para diseñar cada una de estas 8 matrices de covarianza es la misma que para las matrices AR, pero con dos variaciones: σ2 =1 y D es una matriz escalar qxq cuyos elementos de la diagonal principal son las respectivas varianzas. Las covarianzas para AR+ y ARH+ declinan exponencialmente y para AR- y ARH- convergen uniformemente.
A continuación, vectores Zij independientes y normalmente distribuidos [N ~ (N, σ2) = N ~ (0,1)] fueron generados de acuerdo al algoritmo propuesto por Kinderman y Ramage (1976) a través del programa GAUSS (V. 3.1.4). Utilizamos el programa SPSS (V.5.0) para pulsar la precisión del procedimiento de normalización resultando satisfactorio el examen de los criterios de sesgo y kurtosis en la mayor parte de los casos que aleatoriamente verificamos. Los vectores de observaciones pseudoaleatorios y’ij1,...,y’ijq con matriz de varianzas-covarianzas Σ se obtuvieron a través de la descomposición triangular de Σj, Y’ij= T Zij, donde T es la matriz triangular inferior que satisface la igualdad Σj = T T’. Con posterioridad, mediante un programa escrito en GAUSS (1992) se efectuaron tantas simulaciones como condiciones experimentales anteriormente detalladas. Cada una de ellas consistió en muestrear 10.000 observaciones independientes para cada uno de los nueve procedimientos.
Resultados
En virtud de que muy pequeñas desviaciones de la ausencia de correlación hace vulnerables las pruebas de significación, el criterio de robustez que arbitrariamente hemos considerado para evaluar las condiciones particulares bajo las cuales los diferentes procedimientos de cálculo son insensibles, tanto a la relación nj/q, como a la violación de las asunciones de homogeneidad entre e intra grupos es que la estimación empírica debe estar contenida en el intervalo ((+/-)ρ±.07). Consideramos el procedimiento ajustado si la horquilla del intervalo es ((+/-)ρ±.02).
En las tablas que se adjuntan presentamos los resultados para un subconjunto seleccionado de combinaciones investigadas que muestran adecuadamente las diferencias que existen entre los procedimientos. De todos ellos, ABD, G y AFD manifiestan siempre un comportamiento casi idéntico, por lo que hemos decidido exponer sólo a G. Tampoco se exponen los resultados en condición de heterogeneidad entre grupos porque ningún procedimiento ha resultado afectado por la manipulación de esta variable. Con respecto a los valores expuestos, los resultados indican que:
Homoscedasticidad entre grupos e intra grupo y autocorrelación de primer orden positiva y negativa. Matrices AR. (Tabla 1):
AR+: HCH y WHS, aunque con mayor precisión el segundo, muestran siempre un comportamiento ajustado independientemente de q, nj y del valor teórico de ρ. J mantiene un comportamiento ajustado para ρ= .20 y .40 independientemente de q y nj . Conforme incrementa el valor teórico de ρtiende a subestimar el cálculo, en mayor medida conforme menores son nj y q. A partir de q= 8 es robusto y ajustado para ρ= .60. Para ρ= .80 es robusto, pero necesita nj≥10 para estar ajustado. AJS es conservador siempre para q= 4 y 6, en mayor medida conforme mayor es el valor teórico de ρ independientemente del tamaño muestral. Conforme incrementa q incrementa la bondad en la estimación, resultando robusto para ρ= .20, q= 8 y para ρ= .20, .40 y .60, q= 12. ABD, G y AFD manifiestan un comportamiento idéntico. Son siempre muy conservadores, más conforme mayor es ρ y menor es q. No dependen de nj. AB tampoco depende de nj. Es conservador para q=4, en mayor medida conforme mayor es el valor teórico de ρ. Conforme incrementa q mejora, manifestándose robusto para q= 6, ρ= .20, .40; para q= 8 lo es además para ρ= .60 y se ajusta para ρ= .20; para q= 12 es robusto pero sólo se ajusta para estimar ρ= .20 y .40. PP es robusto, pero sólo ajustado cuando q≥6. No depende de nj.
AR-: HCH experimenta un comportamiento ajustado independientemente de q, nj y del valor teórico de ρ. J es robusto y realiza mejor estimación cuanto menor es ρ en valor absoluto. Resulta más favorecido por nj que por q, ya que conforme incrementa el tamaño de muestra mejora la estimación. De este modo, siempre es ajustado para ρ= .20, nj=16; para ρ= .40 necesita q≥8 y nj=16 para estar ajustado; para ρ= .60 se ajusta con nj= 16. Cuando ρ= .80 es ajustado para nj= 16 y para nj= 10 cuando q≥8. AJS realiza mejor estimación cuanto menor es ρ en valor absoluto. No depende del tamaño de la muestra pero sí de q. Es robusto para q≥6. Se ajusta para ρ≤-.40, q≥6; ρ= -.60, q≥8, y para ρ= -.80, q= 12. ABD, G y AFD manifiestan un comportamiento muy similar y experimentan un mejor comportamiento cuanto mayores son ρ y q. Son procedimientos robustos si ρ≥-.60 y q≥8 ajustándose perfectamente para q= 12. Para q= 4 la correlación ha de ser ≥-.80 para alcanzar la robustez, y para q= 6, ρ≥-.60. No dependen en absoluto del tamaño de la muestra. AB para q= 4 es robusto si ρ=-.20. Siempre es robusto cuando q≥6 y justo para q≥8. PP siempre es robusto y se torna ajustado conforme q incrementa. WHS se ajusta siempre salvo cuando q= 4, nj= 5 y ρ≤-.60 que sólo alcanza la robustez.
Homoscedasticidad entre grupos, heteroscedasticidad intra grupo y autocorrelación de primer orden positiva y negativa. Matrices ARH. En las Tablas 2 y 3 sólo se presentan los resultados para PP, G y WHS dado que los procedimientos HCH, J, AJS y AB no se manifiestan afectados con respecto a los expuestos en la Tabla 1.
Matrices ARH+. Heteroscedasticidad intra moderada y gravemente creciente (Tabla 2): PP en GHI= 1 se vuelve liberal con respecto a GHI= 0, en mayor medida conforme mayor es ρ y menor es njpara un mismo valor de q, incluso estima con valores superiores a 1. Cuando q≥6 se comporta de forma robusta para ρ= .20, mejor conforme nj es mayor y para ρ= .40 si nj ≥10. Liberal para ρ= .60 y .80, más para este último. Para q= 8 es robusta para ρ= .20 y .40 pero sólo se ajusta para ρ= .20, nj≥10. Para q= 12 es robusto cuando ρ≤.20 y ajustado para ρ= .20 independientemente de nj, y para ρ= .40 y .60, nj= 16. Un incremento de la heteroscedasticidad incrementa levemente el error volviéndose levemente más liberal que para GHI= 1, siendo robusta en los mismos casos anteriores pero sólo se ajusta cuando q= 12 y nj =10 ó 16. G se vuelve ligeramente más conservador que lo era en GHI= 0 en mayor medida conforme incrementa la heteroscedasticidad . Un mayor número de niveles de la variable intra alivia el resultado pero no es suficiente. El tamaño de la muestra no es un factor determinante. WHS se comporta de forma robusta al igual que para GHI= 0, pero no se ajusta para ρ= .80, que estima de modo liberal aunque no de forma significativa. Conforme incrementa q se ajusta perfectamente para este valor de ρ. A medida que incrementa la heteroscedasticidad creciente (GHI= 2) es liberal de forma significativa para ρ= .80 y q= 4, robusta para q= 6 y 8 y ajustado para q= 12.
Matrices ARH+. Heteroscedasticidad intra moderada y gravemente decreciente (Tabla 3): G, ABD y AFD no experimentan ninguna variación con respecto a GHI= 0. PP apenas muestra alguna leve variación con respecto a GHI= 0. Para GHI= 3 es robusto para todos los valores que toma q, ρ y nj, tan sólo se observa cómo para q= 4 y nj= 5 es levemente más liberal para todo valor de ρ que lo era para GHI= 0, pero no en modo significativo. Conforme incrementa la heteroscedasticidad decreciente (GHI= 4) las estimaciones liberales anteriores se transforman en significativas excepto para ρ= .20. Si nj ≥10 el tamaño de muestra no es un factor determinante; es más ajustado para pequeños valores de ρ y q≥6. Si q= 4 el tamaño de muestra es un factor importante.WHS es un estimador perfecto al igual que lo era para GHI= 0.
Matrices ARH-. Heteroscedasticidad intra moderada y gravemente creciente (Tabla 3): PP con respecto a GHI= 0 es levemente más liberal aunque no siempre de modo significativo. En q= 4 es sólo robusto para ρ ≤-.40, pero ajustado sólo para ρ= -.20, nj≥10. Conforme incrementa ρ en valor absoluto más liberal es su comportamiento. Para q= 6 es robusto si ρ ≤-.60. Si q≥8 lo es siempre. Conforme incrementa q menos influye nj, pero estima ajustado para correlaciones menores o iguales a -.40. Un incremento de la heteroscedasticidad implica un incremento de estimaciones liberales, en mayor medida conforme ρ≥-.40. G con respecto a GHI= 0 es más liberal en mayor medida conforme menor es ρ, luego estima mejor para autocorrelaciones elevadas en valor absoluto. Así cuando q= 8 es robusto para ρ= -.80; y para q= 12 lo es para ρ≥-.40, pero nunca se ajusta. A medida que incrementa la heteroscedasticidad incrementa su liberalidad y sólo es robusto para q= 12 y ρ≥-.40. WHS para GHI= 3 es siempre robusto y sólo justo para nj =16, ρ≥-.40, y nj ≥10, ρ= -.20. Cuando ρ ≥-.40 la estimación es siempre levemente inferior que lo era para GHI= 0. Cuando q= 6 siempre es justo para nj ≥10 y cuando q≥8 lo es siempre. Un incremento de heterogeneidad implica una estimación inferior de la autocorrelación aunque no de forma significativa.
Matrices ARH-. Heteroscedasticidad intra moderada y gravemente decreciente (Tabla 3): PP estima de modo más conservador que para GHI= 0 aunque no significativamente. Sólo es justo cuando q≥6 y ρ= -.20. Influye el tamaño de la muestra sólo si q es pequeño. Un incremento de heteroscedasticidad no altera los resultados anteriores. G y WHS no experimentan cambio significativo con respecto a GHI= 0.
Discusión
Los resultados reportados indican que, cuando las matrices de covarianza son homogéneas los procedimientos MLE, HCH y J, y de Momentos, PP y WHS, estiman correctamente el sentido e intensidad de la autocorrelación. HCH y WHS lo hacen independientemente de q, nj y del valor teórico de ρ. Wilson et al. (1981) llegan a la misma conclusión con respecto a WHS. PP también realiza la estimación independientemente del valor teórico de ρ, mejorando la estimación a medida que q incrementa. J depende de ρ (mejor estimación cuanto menor es el valor teórico de la autocorrelación en valor absoluto (|ρ|), así como de nj y q, que, conforme éstos incrementan mejora sensiblemente en la estimación para |ρ| elevada.
Si la estructura matricial es AR+ el resto de procedimientos realizan mejor estimación cuanto menor es |ρ| y mayor es q, y no dependen del tamaño de muestra (Azzalini y Frigo, 1991). Con excepción de ABD, G y AFD que en ninguna condición investigada consiguen alcanzar la robustez (al igual que observaron Azzalini y Frigo, 1991), podemos indicar que, cuando q= 8 son procedimientos robustos en general si ρ≤.60. Si q= 12 también lo son para ρ= .80. Mejor comportamiento experimenta AB que AJS. Los resultados ofrecidos por el procedimiento AJS son los mismos que los reportados por Azzalini y Frigo (1991). Azzalini y Browman (1990) también comentan (no muestran resultados), que AB alcanza mejor comportamiento que AFD, sin embargo, señalan que éstos procedimientos mejoran conforme incrementa nj. En nuestros resultados esto no se ha observado. Cuando la estructura de la matriz es AR- la estimación para estos dos últimos procedimientos es mejor (Azzalini y Frigo, 1991), y las diferencias entre ellos son menos apreciables. Los procedimientos ABD, G y AFD son robustos en mayor grado cuanto mayores son |ρ| y q (Azzalini y Frigo, 1991).
Pantula y Pollock (1985) (que no aportan datos de simulación) definen el estimador PP como consistente y similar al procedimiento AJS (Andersen et al., 1981). Nuestros resultados indican que sí es consistente, pero no similar, ya que experimenta un comportamiento mucho mejor que el procedimiento AJS.
Si la estructura matricial además de autorregresiva es heteroscedástica (matrices ARH+ y ARH-), únicamente los procedimientos PP, WHS, G, ABD y AFD modifican el comportamiento que tenían bajo homoscedasticidad, y sólo de forma significativa cuando es creciente. En este caso, si la matriz resulta estructurada ARH+, PP se torna liberal en mayor cuantía cuanto mayor es ρ y menores son q y nj , con estimaciones por encima de la unidad, situación que se agrava cuando la heteroscedasticidad incrementa. Cuando la heteroscedasticidad es moderada, WHS, aunque se mantiene robusta, experimenta estimaciones por encima del valor teórico de ρ sólo si ρ= .80, en mayor grado conforme q es más pequeño. A medida que incrementa la desviación de la homogeneidad intragrupo el comportamiento anterior se acentúa y se torna liberal para ρ= .80, q= 4. Si q≥6 mantiene la robustez. G, ABD y AFD resultan ligeramente menos conservadores conforme mayores sean q y ρ. En matrices ARH-, PP es liberal para ρ≥.60 si q= 4. Si q≥6 es robusto, incluso ajustado conforme menor es ρ y mayor es nj. En ningún caso sobrepasa la unidad. WHS, aunque robusto, su estimación siempre es inferior al valor que se estima de ρ, en mayor medida conforme mayor es ρ y menor es q. Un incremento de la heteroscedasticidad en matrices ARH- agrava estos resultados, pero en menor medida que lo hace para matrices ARH+.
A pesar de que existe un consenso generalizado acerca de que las estimaciones MLE para parámetros autorregresivos están sesgadas salvo que t (q en nuestro caso) sea largo (Busk y Marascuilo, 1988; Suen y Ary, 1987; Sharpley y Alavosius, 1988; Matyas y Greenwood, 1996; Greenwood y Matyas, 1990; Huitema y McKean, 1991, entre otros), hemos comprobado que, de los procedimientos MLE que hemos sometido a observación, sólo esto es cierto para J, pero con condiciones. q sólo es un factor determinante si ρ es positiva y ≥.60, y en ésta situación es cuando este procedimiento modifica su estimación en función del tamaño de la muestra. Si ρ≤.40 estima correctamente sea cuales sean los niveles de q. Cuando ρ es negativa sigue realizando mejor estimación cuanto menor es ρ, pero depende más de nj que de q.
Aunque autores como Levin, Marascuilo y Hubert (1978), Gorsuch (1983), Jaccard y Wan (1993), Kendall y Ord (1990), Vallejo (1996; 1995: 359) y Betancour y Kelejian (1981), entre otros, indican que es preferible realizar la estimación de cálculo desde residuales que desde puntuaciones directas, a tenor de los resultados obtenidos no podemos corroborarlo. Los procedimientos ABD y AFD deben comportarse de la misma manera ya que ambas son modificaciones del procedimiento de Daniels (1956). ABD la exponen Azzalini y Browman (1990) y realiza el cálculo desde los residuales intra, y AFD Azzalini y Frigo (1991) desde puntuaciones directas. La estimación es prácticamente la misma con una variación no superior a +/- .02. El procedimiento WHS que se calcula desde las varianzas de las puntuaciones directas manifiesta un comportamiento excelente en la mayoría de las condiciones investigadas.
Hemos observado las siguientes regularidades:
En matrices AR y ARH: por lo general, los procedimiento cuya estimación se halla en la horquilla de la robustez o cercana a ella, y experimentan alguna variación en función de la intensidad de |ρ|, estiman mejor cuanto más pequeña sea ésta y mayor sea q. Sólo cuando son pocos los niveles de la variable intra (q= 4 o 6) y |ρ| sea elevada, es cuando el tamaño de la muestra es un factor determinante. En este sentido, dependen más de nj cuanto menor es q y mayor es ρ.
Aunque sin diferencias extremadamente grandes, el conjunto de procedimientos sometidos a estudio experimentan mejor comportamiento y más uniforme para estimar autocorrelaciones negativas que positivas (Azzalini y Frigo, 1991; Geary, 1989; Mansour, Nordheim y Rutledge, 1985).
La heteroscedasticidad decreciente no hace mella en ningún procedimiento, y si es creciente sólo afecta de modo significativo a PP, en menor medida a WHS y a G.
HCH, J, PP y WHS son excelentes.
Los procedimientos J y PP son los más dependientes del tamaño de muestra en las matrices de covarianza estudiadas.
Andersen, A.H., Jensen,E.B. y Schou, G. (1981). Two-way analysis of variance with autocorrelated errors. International Statistical Review 49, 153-157.
Azzalini, A. y Browman, A. (1990). Nonparametric regression methods for repeated measurements. En G.G. Roussas (ed.), Nonparametric Functional Estimation. Kluwer Academic Publisher.
Azzalini, A. y Frigo, A.C. (1991). An explicit nearly unbiased estimate of the AR(1) parameter for repeated measurements. Journal of Time Series Analysis 12(4), 273-281.
Bartlett, M.S. (1956). An Intriduction to Stochastic Processes with Special Reference to Methods and Applications. Cambridge University Press.
Betancourt, R. y Kelejian, H. (1981). Lagged endogenous variables and the Cochrane-Orcutt procedure. Econometrica 49, 1.073-1.078.
Bono, R. y Arnau, J. (2000). Diseños de muestras pequeñas: análisis por mínimos cuadrados generalizados. Psicothema 12(2), 87-90.
Busk, P.L. y Marascuilo, L.A. (1988). Autocorrelation in single-subject research: A counter argument to the myth of no autocorrelation. Behavioral Assessment 10, 229-242.
Daniels, H.E (1956). The aproximate distribution of serial correlation coefficients. Biometrika 43, 169-185.
Escudero, J.R. y Vallejo, G. (2000). Comparación de tres métodos alternativos para el análisis de series temporales interrumpidas. Psicothema 12(3), 480-486.
Fernández, P. (1999). Proyecto Docente no publicado. Facultad de Psicología. Universidad de Oviedo.
Gabriel, K.R. (1962). Ante-dependence analysis of an ordered set of variables. Annals of Mathematical Statistics 33, 201-112.
GAUSS. (1992). The Gauss System. (Vers. 3.1). Washington: Aptech Systems, Inc.
Geary, D.N. (1989). Modelling the covariance structure of repeated measurements. Biometrics 45, 1.183-1.195.
Gill, P.S. (1992). A note on modelling the covariance structure of repeated measurements. Biometrics 48, 965-968.
Gorsuch, R.L. (1983). Three methods for analyzing limited time-series (N= 1) data. Behavioral Assessment 5, 141-154.
Greenwood, K.M. y Matyas. T.A. (1990). Problems with the application of interrupted time-series analysis for brief single-subject data. Behavioral Assessment 12, 355-370.
Hearne, E.M., Clark, G.M. y Hatch, J.P. (1983). A test for serial correlation in univariate repeated-measures analysis. Biometrics 39, 237-243.
Huitema, B.E. y McKean, L. (1991). Autocorrelation estimation and inference with small samples. Psychological Bulletin 110, 293-304.
Jones, R.H. (1985). Repeated measures, interventions, and time series analysis. Psychoneuroendocrinology 10(1), 5-14.
Kinderman, A.J. y Ramage, J.G. (1976). Computer generation of normal random numbers. Journal of American Statistical Association 77, 893-896.
Levin, J.R., Marascuilo, L.A. y Hubert, L.J. (1978). N= nonparametric randomization tests. En T.R. Kratochwill (Eds.), Single subject research: Strategies for evaluating change.New York: Academic Press.
Mansour, H., Nordheim, E.V. y Rutledge, J.J. (1985). Maximun Likelihood estimation of variance components in repeated measures designs assuming autoregressive errors. Biometrics 41, 805-820.
Matyas, T.A. y Greenwood, K.M. (1996). Serial dependency in Single-Case Time Series. En R.D. Franklin, D.B. Allison y B.S. Gosman (Eds.), Design and Analysis of single-case Research. New Yersey: Lawrence Erlbaum.
Pantula, S.G. y Pollock, K.H. (1985). Nested analysis of variance whith autocorrelated errors. Biometrics 37, 909-920.
Sharpley, C.F. y Alavosius, M. P. (1988). Autocorrelation in behavioral data: An alternative perspective. Behavioral Assessment 10, 243-251.
Suen, H.K. y Ary, D. (1987). Autocorrelation in applied behavior analysis: Myth o reality? Behavioral Assessment 9, 125-130.
Vallejo, G. (1995). Problemas inferenciales asociados con los diseños de series temporales interrumpidas. En M.T. Anguera et al. (Eds), Métodos de Investigación en Psicología (pp. 353-379). Madrid: Síntesis.
Vallejo, G. (1996). Diseños de series temporales interrumpidas. Barcelona. Ariel Psicología.
Wilson, P.D., Hebel, J.R. y Sherwin, R. (1981). Screening and diagnosis when within-individual observations are Markov-dependent. Biometrics 37, 553-565.