La revista Psicothema fue fundada en Asturias en 1989 y está editada conjuntamente por la Facultad y el Departamento de Psicología de la Universidad de Oviedo y el Colegio Oficial de Psicología del Principado de Asturias. Publica cuatro números al año.
Se admiten trabajos tanto de investigación básica como aplicada, pertenecientes a cualquier ámbito de la Psicología, que previamente a su publicación son evaluados anónimamente por revisores externos.
Psicothema, 2000. Vol. Vol. 12 (nº 2). 308-313
Constantino Arce Fernández y Elena María Andrade Fernández
Universidad de Santiago de Compostela
La presente investigación tenía por objeto comprobar la eficiencia de tres diseños incompletos para la selección de datos de entrada, en problemas de Escalamiento MultiDimensional, con un número elevado de estímulos. Los diseños comparados fueron un diseño cíclico (Spence y Domoney, 1974), dos diseños aleatorios y un diseño con las desemejanzas más grandes. Cuando se satisfacía el umbral de información propuesto por Spence y Domoney (1974), todos los diseños empleados mostraron un grado de eficiencia similar. Sin embargo, con cantidades de información inferiores, el diseño cíclico fue el que produjo los peores resultados; mientras que los otros dos tipos de diseños mantenían su eficiencia aún por debajo del umbral, siendo los diseños aleatorios los que permitieron obtener soluciones satisfactorias incluso con las cantidades más bajas de información de entrada.
Multidimensional scaling: recovery of metric information wit incomplete designs. The objective of this investigation was to prove the efficiency of three incomplete designs which can be used to select the data entry in MultiDimensional Scaling when the number of stimuli is high. Three types of designs were compared: a ciclic design (Spence & Domoney, 1974), two aleatory designs and a design with the biggest dissimilarities. When the minimum percentage of necessary information proposed by Spence and Domoney was used, all of the designs showed a similar degree of efficiency. However, with lower levels of information the ciclic design showed the worst results, while the other two types of designs mantained their efficiency, being the aleatory designs the ones which allowed to obtain satisfactory solutions even with the lowest percentages of entry information.
El objetivo del Escalamiento MultiDimensional (EMD) consiste en convertir una matriz de desemejanzas entre estímulos en una matriz de distancias entre puntos, en alguna de las métricas de Minkowski (habitualmente la Euclidiana).
Las primeras soluciones al problema del EMD clásico fueron propuestas, por una parte, por Torgerson (1958) y, por otra, por Shepard (1962) y Kruskal (1964a, 1964b). Si bien en ambos casos el objetivo es el mismo, el procedimiento seguido es sustancialmente distinto: la aproximación de Torgerson es métrica, mientras que la aproximación de Shepard y Kruskal es no-métrica.
Si el modelo es métrico, es preciso disponer de todas y cada una de las desemejanzas entre estímulos para la obtención de las distancias correspondientes. Sin embargo, si el modelo es no-métrico es posible obtener la matriz de distancias, aún faltando alguna de las desemejanzas entre estímulos (Shepard, 1962, 1966; Sherman, 1972; Young, 1970). Una conclusión inmediata, que se podría extraer de este hecho, es que el modelo no-métrico constituye una solución satisfactoria al problema de las omisiones de respuesta por parte de los sujetos experimentales (missing values). En efecto, esto es así, pero el uso que aquí se pretende hacer de esta propiedad del modelo no-métrico tiene un alcance considerablemente mayor.
El procedimiento de recogida de datos utilizado en escalamiento multidimensional requiere, en su caso más típico, que cada estímulo sea comparado con todos los demás. Bajo el supuesto de simetría de los juicios de proximidad entre estímulos, el número de comparaciones para n estímulos es n(n-1)/2. Para n = 3, el número de comparaciones es 3, para n = 4 es 6, para n = 5 es 10, y así sucesivamente.
Cuando el valor de n es pequeño, el número de comparaciones también suele ser pequeño y, en consecuencia, el sujeto experimental puede realizar todas las comparaciones sin apenas esfuerzo. Sin embargo, cuando el valor de n es relativamente grande (p.e. n = 20), el número de comparaciones se hace muy elevado (para n = 20, el número de comparaciones es 190) y es probable que aparezca fatiga y desmotivación en el sujeto experimental en la realización de la tarea.
Precisamente, lo que se propone es que, para salvar esta inconveniencia inherente al procedimiento, se utilice la propiedad antes mencionada del modelo no-métrico. El modelo no-métrico puede derivar una matriz de distancias entre estímulos con missing values en la matriz de (de)semejanzas. Esto quiere decir que, para el ejemplo de n = 20, en realidad no es necesario que el sujeto experimental realice todas las comparaciones posibles. Aunque faltara alguna de las 190 comparaciones, se podría derivar igual la matriz de distancias entre los 20 estímulos.
El planteamiento que se acaba de señalar, también puede establecerse en términos de cantidad de información disponible como entrada para el escalamiento multidimensional. En el caso habitual se dispone de información completa. La matriz de entrada contiene todas las desemejanzas entre estímulos. El objetivo consiste en convertir las desemejanzas en distancias, una a una. Por contra, el caso en que se está interesado podría concebirse como un problema de escalamiento multidimensional a partir de información incompleta. La correspondencia entre desemejanzas (valores de entrada) y distancias (valores de salida) no es biunívoca; existen menos desemejanzas que distancias. La cuestión es que, aún así, es posible obtener una solución satisfactoria al problema.
Dado que es posible derivar una matriz de distancias a partir de información incompleta, la primera cuestión de interés consiste en investigar cuál es la cantidad mínima de información necesaria para la derivación de la matriz de distancias. El conocimiento de esta cantidad mínima de información necesaria permitiría utilizar el procedimiento de las comparaciones por pares, aún para valores de n relativamente grandes.
Spence y Domoney (1974) propusieron, basándose en estudios de Monte Carlo, una fórmula para conocer la proporción mínima de información necesaria:
Pmín = 6r/(n-1),
donde r es el número de dimensiones en que se obtiene la solución.
En el ejemplo de n = 20, y haciendo r = 2, la proporción mínima de información requerida es .6316. Dado que el número de comparaciones es 190, las comparaciones necesarias son 120. Dicho de otro modo, pueden existir 70 omisiones de respuesta y, aún así, se podría obtener la matriz de distancias entre los 20 estímulos.
Spence y Domoney (1974) hicieron la sugerencia de esta proporción mínima de información bajo el supuesto de que las comparaciones, para una investigación dada, fueran elegidas siguiendo una determinada estrategia, denominada diseño cíclico (David, 1963; John, Wolock y David, 1972; McKeon, 1960).
Objetivos
El objetivo central de la investigación que se va a presentar sobre escalamiento multidimensional consiste en comparar la eficiencia de tres tipos de estrategias (o diseños) que se pueden utilizar para la selección del subconjunto de comparaciones. Al igual que Spence y Domoney, la investigación se centra en los diseños cíclicos, pero además se quiere probar qué ocurre si la selección del subconjunto de comparaciones fuese aleatoria, y también qué ocurre si se selecciona aquel subconjunto que contenga las desemejanzas más grandes. Al respecto, Graef y Spence (1979) indicaron que las desemejanzas grandes jugaban un papel más importante en la recuperación de información métrica que las desemejanzas medias o pequeñas. Además, se ha observado que no existe ningún estudio que demuestre que las estrategias de selección mencionadas sean más eficientes que las estrategias puramente aleatorias.
En segundo lugar, se quiere probar qué ocurre cuando la cantidad de información utilizada es menor que la sugerida por Spence y Domoney (1974). Estos autores sólo trabajaron con diseños cíclicos. No sabemos nada, por tanto, de lo que sucede con los otros dos tipos de diseños (diseños con las desemejanzas más grandes, y diseños aleatorios).
Por eficiencia de un diseño incompleto se entiende la capacidad de recuperación de información métrica que tiene el diseño. Para medir la eficiencia de un diseño incompleto, lo que se hace es comparar la configuración de estímulos derivada a partir del diseño incompleto con la configuración de estímulos derivada a partir del diseño completo. La comparación de dos configuraciones no se puede hacer directamente. Es preciso realizar, primero, una rotación de ambas configuraciones a máxima congruencia. Esta rotación a máxima congruencia se ha hecho siguiendo un algoritmo ideado por Cliff (1966; cf. también Peay, 1988).
La hipótesis de que se parte es que, aunque los diseños cíclicos dejen de ser eficientes con subconjuntos de información inferiores a los sugeridos por Spence y Domoney, este no tiene por que ser el caso de los otros dos tipos de diseños (diseños con las desemejanzas más grandes, o diseños aleatorios). Si la hipótesis fuese cierta, podrían derivarse matrices de distancias entre estímulos con matrices de desemejanzas todavía más incompletas. Este hallazgo tendría una repercusión importante sobre la investigación aplicada, cuando se hace uso del escalamiento multidimensional. Permitiría mantener el procedimiento (indirecto) de las comparaciones por pares, aún para valores de n relativamente grandes. Además, el investigador podría verse liberado del proceso de selección de diseños cíclicos de alta eficiencia, una decisión siempre complicada que requiere el uso de software específico de difícil localización.
Método
Diseño
Para satisfacer los objetivos señalados lo que se ha hecho, en concreto, fue derivar, primero, una configuración de estímulos con información completa y, luego, se ha tratado de obtener la misma configuración utilizando información incompleta. Los valores de entrada, en este último caso, fueron elegidos siguiendo tres estrategias distintas:
1. Diseño cíclico de alta eficiencia.
2. Diseño con las desemejanzas más grandes.
3. Diseño aleatorio.
Diseños aleatorios, en realidad, se han utilizado 2, con lo cual el número de estrategias utilizadas fueron 4.
En segundo lugar, se ha manipulado en todos estos diseños la cantidad de información seleccionada, que osciló entre un 63%, el porcentaje que resultaba de aplicar la fórmula de Spence y Domoney (1974), y un 11%, en pasos de 10, aproximadamente. En concreto, se utilizó un 63%, un 52%, un 42%, un 32%, un 21% y un 11% de la información de entrada en cada uno de los diseños señalados.
La configuración de estímulos podría haber sido una configuración artificial cualquiera. Sin embargo, para que la investigación adquiriese interés psicológico, se ha preferido emplear datos procedentes de algún área de investigación psicológica. Una línea de investigación psicológica donde el escalamiento multidimensional ha mostrado su utilidad es en conocimiento espacial en medios urbanos; es decir, en ciudades. En las primeras investigaciones realizadas en este terreno, se les pedía a los sujetos que dibujaran mapas. Sin embargo, este tipo de tareas tenían grandes desventajas y pronto se vieron reemplazadas por tareas de estimación de distancias.
Una propiedad atractiva de las tareas de estimación de distancias es que producen directamente datos de proximidad si se consideran las distancias entre pares de lugares como juicios de desemejanza entre pares de estímulos. La estructura de los mapas cognitivos presumiblemente subyacentes puede ser recuperada, de forma natural, por medio de algún algoritmo de escalamiento multidimensional. Siendo conservadores, y asumiendo que las estimaciones de distancia subjetivas no tienen más que propiedades ordinales, todavía sería posible la recuperación de información métrica utilizando un modelo de escalamiento multidimensional no-métrico, incluso con datos que contengan error.
Para la recogida de datos con tareas de estimación de distancias en ambientes a gran escala, existen actualmente dos aproximaciones dominantes, que podríamos denominar, utilizando la terminología de Stevens (1975):
1. Tareas de estimación de magnitud, con el módulo especificado por el experimentador.
2. Tareas de estimación de magnitud, sin especificación de módulo.
Para incrementar la fiabilidad de la investigación, se han utilizado ambos tipos de tareas. Así, en un primer estudio, se pidió a una muestra de sujetos que realizara estimaciones de distancia entre 20 lugares de la ciudad de Santiago de Compostela, tomando como referente una distancia estándar entre dos lugares de la ciudad. Y, en un segundo estudio, se pidió a otra muestra de sujetos que realizara las estimaciones de distancia en metros, sin ofrecerles ningún tipo de distancia de referencia.
Resultados
En primer lugar, se analizaron los datos para investigar lo bien que permitía cada uno de los diseños incompletos la recuperación de la configuración subjetiva derivada a partir del diseño completo. El programa utilizado ha sido una versión de KYST, denominada KYST2A (Kruskal, Young y Seery, 1977). Los datos de entrada fueron, en todos los casos, una matriz de orden 20 x 20, que ha resultado de calcular la media aritmética para todos los sujetos; el modelo elegido fue siempre no-métrico (Kruskal, 1964a, 1964b; Shepard, 1962), y se obtuvieron siempre soluciones en espacios Euclidianos bi-dimensionales.
Cuando se utilizó la matriz de entrada completa, se obtuvo una solución altamente satisfactoria con un valor de stress igual a .077. En la Figura 1 se ofrece el Diagrama de Shepard, donde se puede observar que existe una relación lineal casi perfecta entre las distancias subjetivas, generadas por los sujetos experimentales, y las distancias derivadas por el programa.
En la Tabla 1 se ofrecen los valores de stress para cada uno de los diseños incompletos utilizados (cíclico, desemejanzas más grandes, aleatorio 1 y aleatorio 2) y para cada una de las cantidades de información utilizadas (63%, 52%, 42%, 32%, 21% y 11%). Se observa que los valores de stress son siempre inferiores al valor de stress correspondiente a la solución obtenida a partir del diseño completo (stress = .077). Además, se observa que este valor suele disminuir a medida que disminuye la cantidad de información utilizada en la entrada (cf. Figura 2). En la Tabla 1 también se ofrece, entre paréntesis, el número de iteraciones que ha necesitado el programa para obtener la solución. El número de iteraciones está altamente relacionado con el tiempo consumido en la realización del problema. La relación entre número de iteraciones y cantidad de información parece curvilínea. Esto es, en principio aumenta considerablemente a medida que disminuye la cantidad de información. Pero esta tendencia se produce hasta alcanzar el porcentaje del 32%. Luego, cambia la tendencia, disminuyendo el número de iteraciones de forma precipitada.
Los siguientes análisis fueron orientados a medir la semejanza existente entre la configuración derivada a partir de cada uno de los diseños y la solución obtenida a partir del diseño completo. En la Tabla 2 se ofrece información sobre la congruencia entre la mejor solución para cada uno de los diseños incompletos y la solución para el diseño completo, después de haber rotado ambas configuraciones a máxima congruencia. Un valor de 1 indicaría coincidencia perfecta alcanzada simultáneamente para todos los puntos. Se puede concluir que las configuraciones obtenidas a partir de todos los diseños incompletos y la configuración obtenida a partir de diseño completo son casi idénticas cuando se utiliza el 63% de la información; es decir, cuando se selecciona la información de acuerdo con la fórmula sugerida por Spence y Domoney (1974). Si se clasificaran los diseños por su bondad de ajuste, el primer lugar sería para el diseño cíclico (.989), el segundo para el diseño aleatorio 1 (.986), el tercero para el diseño con las desemejanzas más grandes (.974), y el cuarto para el diseño aleatorio 2 (.935), siendo las diferencias entre ajustes apenas perceptibles.
Cuando la cantidad de información está por debajo del umbral sugerido por Spence y Domoney (1974), el que más sufre es el diseño cíclico, produciendo los peores resultados. Sin embargo, los tres restantes diseños (es decir, el diseño con las desemejanzas más grandes, y los diseños aleatorios 1 y 2) mantienen su eficiencia aún por debajo del umbral (cf. Figura 3).
Los resultados ofrecidos en la Tabla 3 corroboran lo que hemos dicho anteriormente. En la primera fila se ofrece la correlación entre la primera dimensión de la solución obtenida a partir de un diseño incompleto dado y las coordenadas de la primera dimensión obtenidas a partir del diseño completo, y la segunda columna ofrece estos mismos coeficientes para la segunda dimensión.
En la Tabla 4 se obtiene una nueva confirmación para lo mismo que se ha señalado antes. Lo que se ofrece aquí es el coeficiente de correlación entre el vector de distancias derivado a partir de cada una de las soluciones de los diseños incompletos y la solución del diseño completo.
Con la información ofrecida en estas Tablas es posible concluir que el diseño con las desemejanzas más grandes es altamente eficiente incluso cuando se utiliza un 52% de la información de entrada, el diseño aleatorio 2 hasta el 42% y el diseño aleatorio 1 es altamente eficiente, incluso, cuando se utiliza tan solo un 21% de la información de entrada.
Todos los análisis que se han señalado hasta ahora se repitieron de igual manera para los datos procedentes del segundo estudio, donde se había utilizado una tarea de estimación de distancias sin especificación de módulo por parte del investigador. De nuevo, todos los diseños incompletos se mostraron eficientes en la recuperación de información cuando se satisfacía el umbral de información señalado por Spence y Domoney. Sin embargo, cuando se derivaron soluciones con información de entrada situada por debajo del umbral, se encontró, de nuevo, que fue el diseño cíclico el que ofrecía peores resultados, produciendo incluso soluciones degeneradas. Por contra, los restantes diseños incompletos (desemejanzas más grandes, aleatorio 1 y aleatorio 2) mostraron su eficiencia incluso por debajo del umbral, siendo los diseños aleatorios los que permitieron nuevamente obtener soluciones satisfactorias con cantidades más bajas de información de entrada.
Un último aspecto investigado fue el de la fiabilidad de las dos tareas psicofísicas que se han utilizado, una con especificación de módulo y otra sin especificación de módulo. Para satisfacer este objetivo, lo que se ha hecho fue presentar los pares relativos a un lugar dos veces. Luego, se halló el coeficiente de correlación por rangos de Spearman entre ambas presentaciones, para cada sujeto. La media y la desviación típica de estos coeficientes resultó ser igual a .82 y .11, respectivamente, para la tarea con especificación de módulo, y de .84 y .09 para la tarea sin especificación de módulo. Para obtener un soporte gráfico de estos resultados, se obtuvo una nueva solución mediante el programa KYST2A para todos los diseños después de incluir los datos procedentes de los juicios del lugar repetido, de forma que el número ostensible de lugares fuera 21. Luego, se consideró la distancia Euclidiana entre los puntos derivados para ambas replicaciones como la contraparte gráfica de la medida de la fiabilidad antes señalada.
Atendiendo al diseño completo, en la configuración derivada a partir de la tarea con especificación de módulo, cuando se utilizaron 21 lugares, el último lugar (llamémosle U) y el primero (A) coincidían. Se observó que la distancia derivada entre A y U era muy pequeña, demostrando gráficamente que la fiabilidad era alta. La configuración obtenida para la tarea de estimación sin especificación de módulo por parte del investigador fue muy similar.
Resultados similares se obtuvieron con todos los diseños incompletos que habían demostrado ser altamente eficientes en la recuperación de información métrica.
Por último, al considerar conjuntamente las configuraciones obtenidas a partir de las dos tareas, después de haber sido rotadas a máxima congruencia, se comprobó que ambas configuraciones derivadas eran muy semejantes, con una bondad de ajuste de .98, y una correlación entre los vectores de distancia de .925.
Conclusiones
En la presente investigación se intentó recuperar la información métrica de una solución obtenida a partir de un diseño completo mediante el programa KYST2A utilizando diferentes diseños incompletos. Cuando se satisfacía la cantidad mínima de información sugerida por Sepence y Domoney (1974), el diseño cíclico mostró los mejores resultados, aunque las diferencias con respecto a los otros diseños fueron muy pequeñas.
Cuando la cantidad de información de entrada estaba situada por debajo del umbral señalado por Spence y Domoney (1974), los diseños cíclicos produjeron generalmente soluciones degeneradas, mientras el diseño con las desemejanzas más grandes y los dos diseños aleatorios todavía fueron eficientes. El diseño con las desemejanzas más grandes perdió su eficiencia cuando se utilizaba una cantidad de información inferior al 52%. Sin embargo, los diseños aleatorios, no sólo mostraron una eficiencia comparable a la de los otros diseños cuando se satisfacía la regla conservadora, sino que incluso proporcionaron los mejores resultados cuando se trabajó bajo condiciones más severas, recuperando incluso información métrica con un 42% de información de entrada y evitando siempre las soluciones degeneradas. Lo que esto significa es que los diseños aleatorios merecen una atención mayor a la que han recibido hasta ahora. De hecho, ninguna investigación realizada hasta el momento ha podido demostrar que los diseños cíclicos produjeran mejores resultados que los diseños aleatorios.
Young (1970) y Sherman (1972), en dos estudios de Monte Carlo, mostraron que existía una relación importante entre los grados de libertad de que se dispone en un problema dado y la capacidad de recuperación de información métrica que tienen los modelos de escalamiento multidimensional no-métrico. En concreto, la relación la pudieron establecer entre el cociente que resulta de dividir los grados de libertad de las desemejanzas, n(n-1)/2, por los grados de libertad de las coordenadas, r(n-1) - r(r-1)/2. La relación es directa. Cuanto menor es este cociente, menor es la recuperación de información. Sherman incluso fijó un valor crítico en 2.5, por debajo del cual la recuperación de información es insatisfactoria. En la investigación que se ha presentado, el valor de este cociente era de 5.13.
Las soluciones que se han obtenido mediante el programa KYST2A fueron en espacios Euclidianos. Soluciones semejantes podrían haberse obtenido en otras métricas de Minkowski distintas de la Euclidiana. Por ejemplo, en la métrica de los bloques de ciudad, tal como hace Richardson (1981). En este caso no se ha hecho así por dos razones. Primero, porque Hubert y Arabie (1988) demostraron analíticamente que las técnicas basadas en el gradiente, como las utilizadas en el programa KYST2A, están destinadas a ofrecer soluciones no óptimas en la métrica de los bloques de ciudad. Y, en segundo lugar, porque las ciudades americanas son ciudades lineales que se ajustan a un patrón regular, en forma de rejilla, mientras la ciudad de Santiago de Compostela muestra un patrón de calles irregular.
Para finalizar, es deseable también señalar una conclusión, que puede ser de interés, ya no para el escalamiento multidimensional sino para la investigación sobre cognición ambiental en medios urbanos: dado que la fiabilidad de ambas tareas (con módulo y sin módulo) fue semejante, en adelante podrían utilizarse siempre las tareas libres de módulo, dado que consumen menos tiempo, tanto para el experimentador como para el sujeto experimental.
Cliff, N. (1966). Orthogonal rotation to congruence. Psychometrika, 31, 33-42.
David, H.A. (1963). The structure of cyclic paired-comparison designs. Journal of the Australian Mathematical Society, 3, 117-127.
Graef, J., y Spence, I. (1979). Using distance information in the design for large multidimensional scaling experiments. Psychological Bulletin, 86, 60-66.
Hubert, L.J., y Arabie, P. (1988). Relying on necessary conditions for optimization: Unidimensional scaling and some extensions. En H. Bock (Ed.), Classification and related methods of data analysis (pp. 463-472). Amsterdam: North-Holland.
John, J.A., Wolock, F.W., y David, H.A. (1972). Cyclic designs. Washington, C.D.: National Bureau of Standards Applied Mathematics Series no. 62.
Kruskal, J.B. (1964a). Multidimensional scaling by optimizing goodness of fit to a nonmetric hypothesis. Psychometrika, 29, 1-27.
Kruskal, J.B. (1964b). Nonmetric multidimensional scaling: A numerical method. Psychometrika, 29, 115-129.
Kruskal, J.B., Young, F.W., y Seery, J.B. (1977). How to use KYST2A, a very flexible program to do multidimensional scaling and unfolding. Murray Hill, NJ: AT & T Bell Laboratories.
McKeon, J.J. (1960). Some cyclical incomplete paired comparison designs. Chapel Hill, N.C.: University of North Carolina, L.L. Thurstone Psychometric Laboratory, Report no. 24.
Peay, E.R. (1988). Multidimensional rotation and scaling of configurations to optimal agreement. Psychometrika, 53, 199-208.
Richardson, G.D. (1981). The appropiateness of using various Minkowskian metrics for representing cognitive configurations. Environment and Planning A, 13, 475-485.
Shepard, R.N. (1962). The analysis of proximities: Multidimensional scaling with an unknown distances function (I y II). Psychometrika, 27, 125-139, 219-246.
Shepard, R.N. (1966). Metric structure in ordinal data. Journal of Mathematical Psychology, 3, 287-315.
Sherman, C.R. (1972). Nonmetric multidimensional scaling: A Monte Carlo study of the basic parameters. Psychometrika, 37, 323-355.
Spence, I., y Domoney, D.W. (1974). Single subject incomplete designs for nonmetric multidimensional scaling. Psychometrika, 39, 469-489.
Stevens, S.S. (1975). Psychophysics. Introduction to its perceptual, neural, and social prospects. Nueva York: Wiley.
Torgerson, W.S. (1958). Theory and methods of scaling. Nueva York: Wiley.
Young, F.W. (1970). Nonmetric multidimensional scaling: Recovery of metric information. Psychometrika, 35, 455-473.
Aceptado el 4 de junio de 1999