INFORMATION

Psicothema was founded in Asturias (northern Spain) in 1989, and is published jointly by the Psychology Faculty of the University of Oviedo and the Psychological Association of the Principality of Asturias (Colegio Oficial de Psicología del Principado de Asturias).
We currently publish four issues per year, which accounts for some 100 articles annually. We admit work from both the basic and applied research fields, and from all areas of Psychology, all manuscripts being anonymously reviewed prior to publication.

PSICOTHEMA
  • Director: Laura E. Gómez Sánchez
  • Frequency:
         February | May | August | November
  • ISSN: 0214-9915
  • Digital Edition:: 1886-144X
CONTACT US
  • Address: Ildelfonso Sánchez del Río, 4, 1º B
    33001 Oviedo (Spain)
  • Phone: 985 285 778
  • Fax: 985 281 374
  • Email:psicothema@cop.es

Psicothema, 1994. Vol. Vol. 6 (nº 3). 469-482




PROPIEDADES TRIDIMENSIONALES DE LA ESCENA VISUAL Y DISCRIMINACIÓN PREATENTIVA DE TEXTURAS

Diana Pérez Martínez

Universidad Complutense de Madrid

Recientes hallazgos experimentales, en tareas de búsqueda visual, sugieren que el sistema visual preatentivo es sensible a las relaciones espaciales y de intensidad que transmiten información sobre la tridimensionalidad de la escena. Esta posibilidad es negada por las teorías clásicas de visión las cuales asumen que, tanto en tareas de búsqueda como en las de discriminación de texturas, el sistema visual preatentivo se basa en características simples contenidas en la imagen retiniana. En este artículo se ha estudiado la discriminación de texturas formadas por patrones iguales que los utilizados por Enns y Rensink (1990, 1991) en experimentos de búsqueda visual, para examinar la sensibilidad a la dirección de la luz, al punto de vista y a la orientación tridimensional. Los resultados muestran que los observadores no son sensibles preatentivamente a esos factores. Esta insensibilidad a las claves monoculares de tridimensionalidad en discriminación de texturas apoya las teorías clásicas de visión, así pues, parece que las representaciones obtenidas en niveles preatentivos no son más sofisticadas de las hasta ahora supuestas.

Aspects of three-dimensional scene and preattentive texture discrimination. Recent findings have shown that preattentive vision is sensitive to aspects of three-dimensional scene corresponding to the two-dimensional image. This conclusion is not consistent with previous theories of early vision, which have assumed that visual search and texture discrimination are based on simple two-dimensional features in the image. In this paper it has been investigated the discriminability of texture composed of patterns same to those used by Enns and Rensink (1990, 1991) in visual search, for test sensitivity to direction of lighting, viewpoint, and threedimensional orientation scene. The results show that observers are not sensivite to these factors at preattentive level. This insensibility to monocular cues of tridimensionality in texture discrimination supports previous theories of vision, it appears that the parallel processes of early vision are not more sophisticated than previously assumed.

PDF

Nuestra experiencia visual del mundo se basa en imágenes bidimensionales, muestras de diferentes intensidades luminosas y colores que inciden sobre un sólo plano de células de la retina. Resulta sorprendente que podamos percibir en tres dimensiones (largo, ancho y alto) a partir de la información contenida en la imagen bidimensional retiniana. Que podamos hacerlo se debe a que en ella hay a nuestra disposición unos cuantos indicadores de la tridimensionalidad de la escena. Entre estos indicadores se encuentran las claves monoculares de profundidad que nos permiten obtener la impresión de profundidad sobre un plano bidimensional (2-D), como es el caso de un cuadro o una fotografía. A ellas pertenecen claves como la superposición (los objetos cercanos ocultan los lejanos), perspectiva aérea (los objetos distantes tienden a aparecer brumosos y teñidos de azul), tamaño y altura relativos (cuanto menores y más altos, respecto al plano del suelo, están los objetos más lejos deben encontrarse), perspectiva lineal (las líneas paralelas en la escena convergen al alejarse) y sombreado (los distintos niveles de intensidad de las partes de un objeto poseen referencias para determinar la localización del foco de iluminación). No hay ninguna duda que nuestro cerebro, sin que sepamos cómo, recurre a estos indicadores monoculares para obtener las formas tridimensionales de los objetos. Sin embargo, está menos claro en qué niveles del procesamiento visual somos capaces de obtener interpretaciones de este tipo sobre una escena 2-D.

Los modelos existentes de discriminación de texturas suponen que el sistema visual preatentivo se basa para realizar esta tarea en características simples contenidas en la imagen retiniana (por ejemplo, la orientación de segmentos de líneas). Siendo incapaz de detectar las relaciones espaciales que puedan existir entre ellas (como las localizaciones relativas de esos segmentos de líneas), requiriéndose para ello la actuación del sistema atentivo que implica escudriñamiento de la imagen. Pero recientes hallazgos experimentales, en tareas de búsqueda visual, sugieren que el sistema visual preatentivo es sensible a las relaciones espaciales y de intensidad que transmiten información sobre la tridimensionalidad de la escena (Enns y Rensink, 1990a, 1999b y 1991).

En este artículo se estudiará si, en tareas de discriminación de texturas, el sistema visual preatentivo emplea algunas de las claves monoculares de tridimensionalidad mencionadas, concretamente perspectiva lineal y sombreado. Los datos experimentales que obtengamos nos permitirán decidir si es posible generalizar los resultados obtenidos previamente en tareas de búsqueda a discriminación de texturas, así como aceptar o no las implicaciones que ello conlleva en cuanto al tipo de representaciones obtenidas en el procesamiento visual preatentivo.

Experimento 1: Efectos del punto de vista, localización del foco de luminación y luminancia del fondo.

Una escena tridimensional de objetos iluminados por una fuente de luz distante, proyecta un array bidimensional de intensidades en la retina que está determinado por varios factores: 1) la localización y orientación de las superficies, 2) la reflectancia de las superficies, 3) la dirección de la luz y 4) el punto de vista del observador. Algunos estudios sostienen la importancia de los dos últimos (localización del foco de iluminación y punto de vista) en tareas perceptivas realizadas sobre escenas bidimensionales en las que se han reproducido esos factores utilizando perspectiva lineal y sombreado. Así, parece que el agrupamiento perceptivo es más fuerte cuando la iluminación procede desde arriba (Ramachandran, 1988) y que los objetos se aprehenden más fácilmente cuando se miran también desde arriba (Rock, 1973). Sin embargo, estas conclusiones proceden de observaciones carentes de control experimental, defecto que ha sido subsanado por Enns y Rensink (1990a) en experimentos de búsqueda visual. Estos autores utilizan como estímulos polígonos sombreados que admiten la interpretación de cubos tridimensionales. Sobre ellos se simula la localización del foco de iluminación y el punto de vista del observador variando el sombreado de las caras y las posiciones de las líneas respectivamente. Sus resultados apoyan las ideas de Ramachandran y rechazan las de Rock, por lo que concluyen que el factor decisivo en tareas de búsqueda preatentiva es la localización del foco de iluminación y no el lugar desde el que observe el sujeto. Concretamente, el sistema visual parece detectar preatentivamente figuras iluminadas desde abajo entre otras iluminadas desde arriba y no al contrario, independientemente del punto de vista (arriba, abajo). La característica detectada es, según los autores, la desviación de la iluminación natural de nuestro sistema solar.

La hipótesis subyacente a esas conclusiones es que el sistema visual preatentivo es capaz de capturar las relaciones de intensidad existentes en la imágen retiniana que transmiten información sobre las características tridimensionales de la escena. Esta posibilidad es negada por las teorías clásicas que consideran necesaria la actuación del sistema atentivo para establecer relaciones de ese tipo (Beck, 1982; Julesz, 1984b; Treisman, 1987).

La ausencia de investigaciones que contrasten estas nuevas hipótesis en tareas de discriminación de texturas, nos ha llevado a diseñar el presente experimento en el que se utilizarán los mismos estímulos que los empleados por Enns y Rensink (1990a). Si el sistema visual preatentivo es capaz de capturar las propiedades que transmiten información sobre la tridimensionalidad de la escena en tareas de búsqueda, se espera que ocurra lo mismo en tareas de discriminación de texturas. Se pensó que la luminancia del fondo, máxima en los estudios de Enns y Rensink, podría haber actuado como artefacto experimental. Más concretamente, estos autores encontraron búsqueda preatentiva cuando la figura que debe ser detectada tiene en la parte superior una cara negra, mientras que las figuras que actúan como distractores la tienen blanca (figura 1, condiciones A y C). Si el factor responsable de estos resultados es la localización del foco de iluminación, se pensó que debería ocurrir lo mismo cuando el fondo fuese negro. Si no es así, las explicaciones dadas por los autores no serían las adecuadas y entonces nos encontraríamos con efectos debidos a la polaridad del contraste de los polígonos que forman el cubo. En este caso, se esperaría discriminación preatentiva para aquellas figuras que tienen en la parte superior un polígono blanco entre distractores que lo tuviesen negro (figura 1, condiciones B y D).

Método

Sujetos

10 sujetos (3 mujeres y 7 varones) participaron en este experimento. Todos tenían visión normal o corregida, eran completamente ajenos a la investigación y a sus objetivos; ninguno tenía experiencia en tareas de este tipo.

Estímulos

Un conjunto del total de las texturas utilizadas como estímulos se muestra en la figuras 1 y 2. En total hubo 10 condiciones, 8 experimentales (condiciones A, B, C, D, E, F, G y H) y 2 de control. Cada condición estaba formada por 4 texturas correspondientes a las cuatro localizaciones del área diferente (arriba-izquierda, arriba-derecha, abajo-izquierda y abajo-derecha). Como puede apreciarse el número de condiciones experimentales resultan de la combinación ortogonal de tres factores: punto de vista (arriba, abajo), localización del foco de iluminación (arriba, abajo) y luminancia del fondo (máxima: blanco, mínima: negro).

Las texturas estaban formadas por polígonos sombreados que simulaban cubos vistos desde arriba (condiciones A, B, E y F) o desde abajo (condiciones C. D, G y H). Refiriéndonos a los que constituían el área diferente, los cubos podían ser interpretados como iluminados desde arriba (condiciones B, D, F y H) o iluminados desde abajo (condiciones A, C, E y G). La luminancia del fondo podía ser máxima (condiciones A a D) o mínima (condiciones E a H). Las dos condiciones de control, una con fondo blanco y otra con fondo negro, las formaban texturas compuestas por micropatrones iguales en toda su extensión. Teniendo en cuenta ésto y las cuatro posibles posiciones del área diferente en los 8 estímulos experimentales mostrados en las figuras 1 y 2, el número total de estímulos fue de 40. La configuración completa subtendía un ángulo visual de 10'5º x 10'5º y cada micropatrón 0'6º x 0'6º de ángulo visual.

Aparatos

Los estímulos fueron generados mediante programa de ordenador por un Cyber 910-500 y presentados en la pantalla de su monitor. Se trata de un monitor color de 19" con 1.248 x 1.024 píxeles. Cada estímulo consistía en una matriz de 512 x 512 píxeles con 3 niveles de gris (blanco: 255, gris: 200, negro: 0). El sujeto daba la respuesta apretando con su mano dominante una de las cuatro teclas del teclado del ordenador preparada para ese fin, cuya disposición espacial se correspondía con la de los cuatro posibles cuadrantes del área diferente. En los primeros ensayos de práctica, el sujeto controlaba el tiempo de exposición deseado para el estímulo apretando el botón derecho del ratón conectado al teclado del ordenador, de este modo ponía fin a la presentación. El experimento se llevó a cabo con visión binocular.

Procedimiento

Los sujetos recibieron instrucciones detalladas sobre la tarea. Se utilizó el paradigma experimental de elección forzosa con cuatro alternativas, requiriendo del sujeto una respuesta sobre la localización del área diferente en la textura.

La sesión estaba constituida por 8 bloques experimentales más uno de práctica. Este bloque, previo a la sesión experimental, era igual que los experimentales excepto en el tiempo de exposición de los primeros estímulos. De los 40 ensayos de los que constaba, en los 10 primeros las texturas se mantuvieron en pantalla el tiempo deseado por el sujeto, en los 10 siguientes durante 500 mseg. y 100 mseg. en los 20 restantes. Este último fue el tiempo de exposición utilizado en la sesión experimental.

La fase experimental constaba de 320 ensayos (8 por estímulo y 32 por condición) dividida en 8 bloques. En cada bloque se presentó una sola vez cada uno de los 40 estímulos en orden aleatorio. Cada ensayo comenzaba con una señal auditiva (el bepp del Cyber) simultánea a la aparición del punto de fijación, tras 1 segundo aproximadamente se presentaba el estímulo correspondiente a ese ensayo durante 100 mseg. e inmediatamente después se presentaba una matriz de 1.024 x 1.024 píxeles en negro hasta que se emitía la respuesta. El sujeto contestaba, a través de los 4 botones de respuesta, en qué posición consideraba que se encontraba la zona de textura diferente, comenzando así el siguiente ensayo. En ningún momento se le indicó si la respuesta había sido o no correcta. Para los estímulos control se eligió aleatoriamente una de las cuatro posibles posiciones como correcta. Todo lo relacionado con el control de la sesión experimental, así como el registro de las respuestas, se llevó a cabo mediante programa de ordenador. La duración de la sesión experimental osciló entre 35 y 45 minutos, sin incluir el descanso de 10 minutos realizado por los sujetos después del cuarto bloque.

Resultados y Discusión

En la figura 3 puede verse la proporción de respuestas correctas obtenida en cada condición, incluyendo las de control. El primer paso del análisis de datos estuvo dirigido a contrastar la hipótesis que nos permitiese decidir si son o no discriminables cada uno de los estímulos utilizados en el presente experimento. Para ello se realizaron comparaciones planeadas con los grupos de control mediante la prueba de Dunnet, los resultados se muestran en la tabla 1. Como puede apreciarse todas las condiciones experimentales en las que la luminancia del fondo era máxima (A, B, C y D) difieren significativamente de la de control, lo que indica que son discriminables preatentivamente. Sin embargo, cuando el fondo fue negro hubo dos condiciones (E y H) cuyas medias de respuestas correctas no difirieron significativamente de las emitidas al azar en la condición de control.

Los resultados de este análisis previo no son consistentes con lo esperado según la hipótesis de Enns y Rensink (1990a). De acuerdo con ella, debería ocurrir discriminación preatentiva cuando las figuras que componen el área de textura diferente pueden interpretarse como iluminadas desde abajo (condiciones A, C, E y G) y no cuando admiten la interpretación de iluminadas desde arriba (condiciones B, D, F y H). Por lo tanto, las condiciones B, D, y F que resultan discriminables preatentivamente no deberían serlo, mientras que la condición E que no es discriminable debería serlo.

El siguiente paso del análisis tuvo como finalidad contrastar las predicciones de Enns y Rensink (1990a) y las de Ramachandran (1988) respecto a la importancia del factor foco de iluminación, las de Rock (1973) respecto al punto de vista y a su vez comprobar la posible existencia de interacciones con la luminancia del fondo. Para ello se llevó a cabo un análisis de varianza para diseños de medidas repetidas en el que la variable dependiente fue el número de respuestas correctas y las variables independientes los factores que definen cada uno de los estímulos: punto de vista (con dos niveles), foco de iluminación (con dos niveles) y luminancia del fondo (con dos niveles). Previamente se comprobaron los supuestos de este tipo de análisis. El de normalidad de las distribuciones se contrastó mediante el test de Shapiro y Wilk, obteniendo ajuste a la normalidad en todas las condiciones (ps > 0'065). La prueba de Cochran se empleó para comprobar el supuesto de homoscedasticidad u homogeneidad de varianzas, supuesto que en nuestro caso también se cumple (R10,8 = 0'25, p>0'05).

Los resultados del ANOVA no muestran diferencias significativas entre los niveles del factor punto de vista (F1,9 = 0'33, p> 0'582), lo que coincide con las observaciones de Enns y Rensink (1990a). El lugar desde el que observa el sujeto, arriba o abajo, no es un factor significativo en discriminación preatentiva de texturas. Por tanto aunque los objetos se aprehendan más fácilmente observándolos desde arriba, por poseer una perspectiva más familiar de acuerdo con la explicación de Rock (1973), nuestros datos no confirman que el sistema visual preatentivo en tareas de discriminación de texturas y basándose en la umbroinformación de la escena bidimensional, muestre diferente sensibilidad a los niveles del factor punto de vista.

Tampoco resultó significativo el efecto del factor localización del foco de iluminación (F1,9=1' 38, p > 0'270). Este resultado no es consistente con el obtenido por Enns y Rensink (1990a), ni con las observaciones realizadas por Ramachandran (1988), ya que de estos estudios se deducían efectos importantes de la localización de la fuente de iluminación. Sin embargo, es importante señalar que Ramachandran reconoce que el sistema visual necesita varios segundos para realizar los computos que permiten definir las formas tridimensionales a partir de la umbroinformación existente en la escena bidimensional, y sólo después es posible su agrupamiento perceptivo y segmentación.

Finalmente, se encontraron efectos significativos para la luminancia del fondo (F1,9 = 8'54, p<0'05), como puede verse en la figura 3 se obtuvo mejor discriminación para las texturas sobre fondo blanco. Este resultado puede ser explicado por el nivel de intensidad asignado a los polígonos grises que forman los cubos y que fue de 200. Lo que supone mayor contraste de estas zonas con el fondo para aquellas condiciones que poseen el fondo negro. El interés de este factor y, por tanto, su inclusión en el diseño tuvo como finalidad comprobar la posible existencia de interacciones con el factor foco de iluminación. Ello hubiese podido explicar los resultados obtenidos por Enns y Rensink (1990a) en éste ultimo, sin acudir a las interpretaciones dadas por los autores. Sin embargo, no sólo no resultó significativa esta interacción, sino ninguna de las posibles.

Como conclusión, podemos decir que los resultados del experimento presentado en esta sección no apoyan las hipótesis de que el sistema visual preatentivo muestre diferente sensibilidad a los niveles de los factores punto de vista y foco de iluminación. El lugar desde el que observa el sujeto (desde arriba o desde abajo), así como la localización de la fuente de luz (arriba o abajo) no tienen efectos en tareas de discriminación de texturas. Conviene hacer notar que, estrictamente hablando, el patrón de intensidades asignado a las caras del cubo es función no solamente de la dirección de la luz y del punto de vista, sino también de la orientación y reflectancia de las superficies. Por ello, el SV puede haberse basado en las diferencias en orientación de los polígonos que configuran los cubos y que tienen mayor contraste con el fondo para discriminar las texturas. No sería entonces necesario acudir a explicaciones que implicasen procesos de orden superior. Pero esa hipótesis, no puede contrastarse desgraciadamente en en este experimento, ya que para ello hubiese sido necesaria la inclusión de texturas formadas por micropatrones que no proporcionasen claves monoculares de tridimensionalidad.

Experimento 2: Efecto de la orientación de las superficies

Como señalamos al principio del experimento anterior, uno de los factores de la escena que determina el array bidimensional de intensidades en la imagen de la retina es la orientación de las superficies. Son numerosos los trabajos que han mostrado que la orientación bidimensional de las figuras es una clave eficazmente utilizada por el sistema preatentivo, tanto en tareas de búsqueda como de discriminación de texturas. Adicionalmente, algunos estudios recientes sobre búsqueda visual han encontrado que el sistema visual preatentivo es capaz de reconstruir la orientación tridimensional de la escena y de detectar diferencias en ella, basándose en las relaciones entre las líneas existentes en la imagen retiniana (Enns y Rensink, 1990b, 1991). Ello contradice las predicciones de las teorías clásicas que, como ya se mencionó, consideran necesario el escudriñamiento de la imagen para poder establecer relaciones de este tipo.

No hay estudios que hayan verificado esas observaciones en tareas de discriminación de texturas. Es de esperar que si el sistema visual preatentivo es capaz de reconstruir la orientación tridimensional de la escena a partir de la imagen bidimensional, las diferencias en ella serán una clave efectiva no sólo en tareas de búsqueda sino también en las de discriminación de texturas. En el siguiente experimento se trata de explorar esta posibilidad, utilizando los mismos estímulos que los empleados por Enns y Rensink (1991).

Método

Sujetos

10 sujetos participaron en el experimento, los mismos indicados en el experimento anterior.

Estímulos

Parte del conjunto de los estímulos utilizados en este experimento se muestra en la figura 4. En total hubo 5 condiciones, 4 experimentales (condiciones A, B, C y D) y una de control. Los estímulos eran texturas formadas por micropatrones constituidos por líneas negras sobre fondo blanco. Todos tenían en común tres líneas formando una «Y» y se diferenciaban por el contorno que las contenía: ninguno (condición A), hexágono (condición B), rectángulo (condición C) y círculo (condición D). El patrón global contenía una región diferente de 5 x 5 micropatrones rotados 180° respecto a los restantes y que podía estar localizada en uno de los cuatro posibles cuadrantes. Se incluyó una condición de control que estaba formada por 4 estímulos en los que todos los micropatrones que componían las texturas eran iguales. Teniendo en cuenta esto y la posición de la zona diferente sobre los 4 estímulos experimentales que aparecen en la figura 4, el total de estímulos fue de 20. La configuración completa subtendía un ángulo visual de 10' 5° x 10'5° y cada micropatrón 0'6º x 0'6º de ángulo visual.

Aparatos

Se utilizó el equipo descrito en el experimento anterior.

Procedimiento

El procedimiento experimental fue semejante al descrito en el primer experimento. La sesión estuvo también constituida por 9 bloques, 8 experimentales y uno de práctica. La diferencia aquí consistió en el número de condiciones experimentales y por tanto de ensayos en cada bloque, que fue de 20. El bloque de práctica era igual que los experimentales excepto en el tiempo de exposición permitido a los estímulos en los primeros ensayos, tiempo que fue el deseado por el sujeto para los cinco primeros, de 500 mseg. para los cinco siguientes y de 100 mseg. para los 10 restantes. Este último fue el tiempo de exposición utilizado en el resto de los bloques. La duración de la sesión experimental osciló entre 15 y 25 minutos, permitiendo a los sujetos un descanso de 5 minutos después del cuarto bloque.

Resultados y Discusión

El análisis de datos estuvo dirigido a contrastar las hipótesis de Enns y Rensink (1990b, 1991). Para ello se realizó un análisis de varianza para diseños de medidas repetidas en el que la variable dependiente fue el número de respuestas correctas y la variable independiente el factor tipo de figura que constituye las texturas (con 5 niveles, incluyendo la condición de control). Previamente se comprobaron los supuestos de este tipo de análisis. La normalidad de las distribuciones se verificó con el test de Shapiro y Wilk, obteniéndose ajuste a la distribución normal en todas las condiciones (ps > 0'2). El supuesto de homogeneidad de varianzas se comprobó mediante la prueba de Cochran (R10,5=0'2698, p>0'05) y el de esfericidad o circularidad se comprobó con el test del BMDP (p > 0'849), por lo que podemos concluir que los dos últimos supuestos también se cumplen.

Los resultados del ANOVA muestran diferencias significativas entre los niveles del factor (F4,36= 2'83, p < 0.05), lo que indica que existen diferencias en discriminación entre los distintos tipos de texturas. Para llevar a cabo las comparaciones múltiples se utilizó la prueba de Tukey para medidas repetidas, encontrándose únicamente diferencias significativas entre la condición A y la de control, véase la tabla 2. Lo que significa que las condiciones B, C y D no son discriminables a nivel preatentivo.

En la figura 5 se ofrece la proporción de respuestas correctas obtenidas en cada condición, obsérverse que los porcentajes son bajos en todas las condiciones. Los resultados experimentales obtenidos contradicen lo esperado por Enns y Rensink (1990b, 1991), según estos autores debería ocurrir discriminación por diferencias en la orientación tridimensional de 180° entre las figuras que forman el área diferente y las restantes, sólo en aquella condición que ofrece una clara interpretación tridimensional: la B. Mientras que las texturas formadas por figuras que no permiten una clara interpretación tridimensional, condiciones A, C y D, no serían discriminables preatentivamente. Pues aunque en ellas se mantiene la misma diferencia en orientación respecto a las líneas en forma de «Y» que en la condición B, la condición A no ofrece interpretación tridimensional, mientras que los contornos de las condiciones C y D (rectángulo y círculo) actuarían más como ruido que como facilitador de esa interpretación. Sin embargo sólo la condición A resultó discriminable preatentivamente.

Como conclusión, pues, rechazamos la hipótesis de que el sistema visual preatentivo sea capaz de extraer información sobre las relaciones de líneas existentes en la imagen que permiten obtener las propiedades tridimensionales de la escena. Esta conclusión se refiere no sólo a la orientación tridimensional, sino también al punto de vista. Obsérvese que giros de 180° hacen posible simular el punto de vista (desde arriba, desde abajo).

Conclusiones

En este artículo se ha intentado comprobar si en tareas de discriminación de texturas el sistema visual preatentivo es capaz de emplear las claves monoculares de tridimensionalidad presentes en la imagen retiniana. Concretamente, se ha estudiado si la perspectiva lineal y el sombreado podrían proporcionar claves preatentivas que permitiesen inferir información sobre el punto de vista, la localización del foco de iluminación y la orientación tridimensional, y discriminar texturas por diferencias en estos factores. Para ello se han utilizado los mismos estímulos que los empleados por Enns y Rensink (1990a, 1991) en tareas de búsqueda visual quienes, como ya se ha señalado, encontraron que el sistema visual preatentivo es capaz de capturar las propiedades tridimensionales de la escena a partir de las relaciones geométricas y de intensidad presentes en la imagen bidimensional retiniana.

Los resultados obtenidos en el experimento 1, nos permiten poner en duda que el sistema visual preatentivo, basándose en la umbroinformación contenida en la imagen, sea capaz de discriminar texturas por diferencias en el punto de vista y el foco de iluminación de la escena. Por su parte, los datos obtenidos en el experimento 2 nos permiten concluir que el SV preatentivo, en tareas de discriminación, no es sensible a las relaciones espaciales entre líneas que permiten capturar información sobre el punto de vista y la orientación tridimensional de la escena. Nuestros datos no permiten, pues, generalizar los resultados obtenidos en tareas de búsqueda a tareas dediscriminación de texturas. Por lo que no podemos concluir que, en este último caso, el sistema visual preatentivo tenga acceso al nivel de representación que describe las propiedades tridimensionales de una escena a partir de las claves monoculares contenidas en la imagen bidimensional.

Son varias las posibles explicaciones de la discrepancia entre los resultados de Enns y Rensink (1990a, 1990b, 1991) y los nuestros. La primera, es la posibilidad de que el proceso de encontrar límites entre áreas de texturas y el de detectar figuras en tareas de búsqueda visual estén guiados por reglas diferentes. Esta posibilidad aunque plausible no nos parece muy satisfactoria, dada la generalización de los resultados encontrados en tareas de búsqueda a discriminación de texturas aportadas por las teorías clásicas (Beck, 1974; Julesz, 1981; Bergen y Julez, 1983: Sagi y Julesz, 1985, 1987).

Otra alternativa que merece más consideración, desde nuestro punto de vista, son las diferencias existentes entre las dos investigaciones en lo referente a la fase de entrenamiento y al procedimiento experimental, diferencias que a continuación señalamos. Los resultados de Enns y Rensink están basados en las respuestas emitidas por observadores altamente entrenados (el porcentaje de errores permitidos antes de pasar a la fase experimental fue menor del 10 %) y es bien conocido en la literatura psicofísica el efecto de la práctica en la ejecución de tareas de este tipo (Gurnsey y Browse, 1987). Nuestro entrenamiento, el usado habitualmente en tareas de discriminación de texturas, permitió a los sujetos familiarizarse con el procedimiento y los estímulos pero no el desarrollar estrategias adicionales. En cuanto al procedimiento experimental, el usado por Enns y Rensink midió tiempo de reacción y por tanto la exposición de los estímulos no estuvo limitada temporalmente, obteniendo unos tiempos de reacción en torno a los 500 mseg. para los estímulos que consideran detectables preatentivamente. Sin embargo, en los experimentos que se han descrito en este capítulo el tiempo de exposición fue de 100 mseg., por lo que era imposible el escudriñamiento de la imagen. Sería muy interesante en futuras investigaciones contrastar los resultados aquí encontrados con los que se obtendrían a tiempos de exposición mayores. Así, podríamos intentar establecer los límites temporales que permiten hacer este tipo de interpretaciones, recuérdese que Ramachandran (1988) habla de varios segundos, como el tiempo que parece requerir el observador humano.

Deseamos concluir este artículo remarcando la funcionalidad de las claves monoculares de profundidad en nuestra percepción cotidiana del mundo. Es innegable que nuestro sistema visual hace uso de ellas para obtener interpretaciones tridimensionales. Conviene aclarar que los resultados de los experimentos expuestos no contradicen en modo alguno estas afirmaciones, sino el que se trate de un proceso preatentivo, es decir, que las representaciones obtenidas en ese nivel de procesamiento contengan información más sofisticada de la hasta ahora supuesta.

Referencias

Beck, J. (1974). Relation between similarity grouping and periferical discriminability. Journal of Experimental Psychology, 102, 1145-1147.

Beck, J. (1982). Textural segmentation. En J. Beck (ed.) Organization and Representation in Perception (pp. 285-317). Hillsdale, NJ: Erlbaum.

Bergen, J. R. y Julesz, B. (1983). Parallel versus serial processing in rapid pattern discrimination. Nature, 303, 696-698.

Enns, J. T. y Rensink. R. A. (1990a). Influence of scene-based properties on visual search. Science, 247, 721-723.

Enns, J. T. y Rensink, R. A. (1990b). Sensitivity to three-dimensional orientation in visual search. Psychological Science, 1, 323-326.

Enns, J. T. y Rensink, R A. (1991). Preattentive recovery of three-dimensional orientation from line drawings. Psychological Review, 98, 335-351.

Gurnsey, R. y Browse, R. A. (1987). Micropattern properties and presentation conditions influencing visual texture discrimination. Perception and Psychophysics, 41, 239-252.

Julesz, B. (1981). Textons, the elements of texture perception and their interactions. Nature, 290, 91-97.

Julesz, B. (1984). Toward an axiomatic theory of preattentive vision. En G. M. Edelman, W. M. Cowan y W. E. Gall (eds.) Dynamic Aspects of Neocortical Function (pp. 585-562). New York, NY: Wiley.

Ramachandran, V. S. (1988). Percepción de la forma a partir del sombreado. Investigación y Ciencia. 145, 68-76.

Rock, I. (1973). Orientation and Form. New York, NY: Academic.

Sagi, D. y Julesz, B. (1985). Where and what in vision. Science, 228, 1217-1219.

Sagi, D. y Julesz, B. (1987). Short-range limitation on detection of features differences. Spatial Vision, 1, 39-49.

Treisman, A. (1987). Características y objetos del procesamiento visual. Investigación y Ciencia, 124,68-78.

Aceptado el 1 de marzo de 1994

Impact Factor JCR SSCI Clarivate 2023 = 3.2 (Q1) / CiteScore SCOPUS 2023 = 6.5 (Q1)