Kitabı oku: «Visión de profundidad», sayfa 2
Claves monoculares secundarias
Claves de tamaño
Este concepto se plantea con base en un factor externo y uno interno, es decir, el tamaño real del objeto observado y la imagen virtual que produce el objeto de observación sobre la retina, respectivamente.
El tamaño de la imagen del objeto es proporcional al tamaño del objeto e inversamente proporcional a su distancia (Kersten, Pascal y Knill, 1997; Kalloniatis y Luu, 2014). Cuando un objeto observado está lejano, la imagen que subtiende en la retina es pequeña con respecto a la imagen de un objeto ubicado cerca (figura 2).
Figura 2. Tamaño de la imagen en la retina

Fuente: autor.
Dentro del grupo de claves de tamaño se encuentran las siguientes pistas:
a)Tamaño relativo. Se cumple cuando dos figuras iguales de diferente tamaño son puestas una al lado de la otra, y el observador desconoce que estas se encuentren en el mismo plano; sin embargo, este percibe diferencias en la posición de cada una de ellas, es decir, considera que la figura de mayor tamaño está más cercana, mientras que la figura pequeña está ubicada más lejos (figura 3).
Figura 3. Tamaño relativo

Fuente: autor.
b)Tamaño aparente. Cuando dos figuras iguales, pero de diferente tamaño y conocidas por un observador, son colocadas una al lado de la otra, él percibe que la figura de mayor tamaño está más cercana, mientras que la figura pequeña o de menor tamaño es apreciada como lejana. Esto sucede a pesar de que el observador conoce y es consciente de que las dos figuras se encuentren ubicadas en el mismo plano (figura 4).
Figura 4. Tamaño aparente

Fuente: autor.
Con la figura 5 se aclara más el concepto, debido a que en un solo plano están graficadas varias líneas de colores; a pesar de ello, el observador, aunque es consciente de que es un plano bidimensional, no percibe las líneas de esa manera y puede considerar que está ante un objeto geométrico con profundidad.
Figura 5. Profundidad aparente de las líneas

Fuente: Maninthemasterplan (2006).
Clave de interposición o figura fondo
Cuando una figura es parcialmente obstruida por otra (figura 6), el observador considera que la imagen vista como incompleta o interrumpida se encuentra a mayor distancia que la otra (Tovée, 2008; Kalloniatis y Luu, 2014).
Figura 6. Interposición de imágenes

Fuente: autor.
Claves de luz
Este concepto se basa en el efecto que produce la interacción de la luz; en otras palabras, la ausencia o presencia (parcial o total) de ella en un espacio, así como los objetos presentes allí y en sus alrededores (Tovée, 2008; Mather, 2006; Ponce y Born, 2008). Dentro del grupo de claves de luz se encuentran:
a)Iluminación. Cuando una imagen se encuentra iluminada, se apreciará como que está cercana; por el contrario, cuando la imagen está oscura o poco iluminada, el observador la puede percibir como lejana (Kalloniatis y Luu, 2014). La figura 7 muestra dos imágenes iguales en forma y tamaños, pero la luz presente en ellas genera una apariencia que puede ser percibida como de diferente posición en el espacio.
Figura 7. Cantidad de iluminación

Fuente: autor.
b)Sombras. Existen dos tipos de sombras: la que produce un objeto sobre otro (sombra proyectada) y la que produce un objeto sobre su propia superficie (sombra adjunta o sombreado). Ambas dan información de profundidad (Mather, 2006; Tovée, 2008) (figura 8).
Figura 8. Sombra proyectada y sombra adjunta

Fuente: autor.
Por su parte, la figura 9 muestra las claves de iluminación (luz y sombra) sobre una imagen de colores.
Figura 9. Claves de iluminación sobre imágenes en color

Fuente: Wikimedia.org (s. f.a).
Claves de claridad o nitidez
Este concepto se define en función de la claridad o ausencia de emborronamiento como es percibido un objeto o su contexto, así como desde la interacción de esta percepción entre ellos (Ponce y Born, 2008). Dentro del grupo de claves de claridad o nitidez se encuentran:
a)Nitidez y emborronamiento. Este punto va directamente relacionado con el concepto de profundidad de campo. La cantidad de emborronamiento está relacionado con la distancia de observación. Cuando una imagen se ve nítida, se considera que el objeto está cerca; por el contrario, cuando la imagen está borrosa, el observador la puede percibir como lejana (figura 10).
Figura 10. Nitidez (adelante) y emborronamiento (atrás)

Fuente: Next143 (s. f.).
b)Difusión o perspectiva atmosférica. Este concepto de profundidad aplica en la valoración de grandes distancias y se basa en que el contraste disminuye con la distancia y por las partículas atmosféricas que dispersan la luz en el ambiente (figura 11). También es llamada perspectiva aérea.
Figura 11. Perspectiva atmosférica

Fuente: SJ Travel Photo and Video (s. f.).
Clave de paralaje
Hace referencia a la disparidad de movimiento percibido entre los objetos ubicados cercanos al observador. En otras palabras, es la diferencia de velocidad percibida por el sistema visual a través de la retina, por la disimilitud de imágenes (figura 12). Al analizar la desigualdad de velocidad, puede valorarse la percepción en profundidad relativa entre los objetos. Vale la pena aclarar que el movimiento es debido al cambio de posición del observador (movimiento de cabeza), y no de los objetos percibidos (Tovée, 2008; Kalloniatis y Luu, 2014; Ponce y Born, 2008; Schwartz, 2010).
Figura 12. Paralaje

Fuente: Wikimedia.org (s. f.b).
Claves geométricas
Se definen por elementos típicamente geométricos, es decir, por la relación de los objetos y su entorno con base en ángulos o inclinaciones, así como en áreas y su relación entre líneas o bordes percibidos como líneas definidas.
Este concepto, en cuanto clave de profundidad, tiene aplicabilidad o es fiable cuando cumple estas condiciones:
a)Los elementos observados y el espacio entre ellos tienen similar tamaño y forma.
b)La inclinación de la superficie observada es superior a 50° con respecto al plano horizontal (Knill, 1998).
Dentro del grupo de las claves geométricas se encuentran:
a)Gradiente de perspectiva. Se presenta cuando el tamaño de los elementos observados y la separación entre ellos disminuyen al aumentar la distancia (figura 13). Un ejemplo típico es la perspectiva lineal, pues las líneas convergen al punto de fuga (Ponce y Born, 2008; Schwartz, 2010).
Figura 13. Gradiente de perspectiva

Fuente: Lara (s. f.).
b)Gradiente de compresión. Hace referencia a que la altura o la separación de los objetos disminuyen al aumentar la distancia (figuras 14 y 15).
Figura 14. Gradiente de compresión (1)

Fuente: PsyComa (s. f.).
Figura 15. Gradiente de compresión (2)

Fuente: Oleksity (s. f.).
c)Gradiente de densidad. Hace referencia a que el número de elementos por unidad de área (densidad) se incrementa al aumentar la distancia (figuras 16 y 17).
Figura 16. Gradiente de densidad (1)

Fuente: Lara (s. f.).
Figura 17. Gradiente de densidad (2)

Fuente: Melpacio (2012).
CLAVES BINOCULARES
Dentro de las claves binoculares se consideran la vergencia propiamente dicha (convergencia y divergencia), la correspondencia retinal y la disparidad de fijación (Kalloniatis y Luu, 2014; Foley y Richards, 1972).
Vergencia
Los ejes visuales de cada ojo realizan un movimiento (simétrico o asimétrico) de vergencia (positiva o negativa) para buscar el objeto de su interés o fijación, y para que este sea percibido con la fóvea de cada ojo (figura 18). En este momento se genera un ángulo de vergencia, que corresponde a las líneas imaginarias del eje visual de cada ojo, las cuales se cruzan en el punto de fijación percibido por el observador de manera binocular. Esto le permitirá determinar distancias absolutas.
Disparidad de fijación
Entre otros nombres, la disparidad de fijación se conoce como disparidad retiniana, disparidad retinal o disparidad binocular. En términos físicos es considerada como la separación o la diferencia angular entre el punto virtual geométrico en que debería llegar la imagen y el punto real que recibe la imagen en la retina. Este concepto es considerado como la base de la percepción de distancias en visión binocular (Poggio y Poggio, 1984; The National Academies Press, 2002).
Figura 18. Vergencias

Fuente: autor.
La figura 19 corresponde a una vista superior de los globos oculares y los puntos de observación en el espacio (espacio libre horizontal o visón lejana/cercana). La figura representa la ubicación de la imagen en la retina de un punto de fijación y la imagen de puntos ubicados simultáneamente delante de este punto (disparidad cruzada) y atrás de este (disparidad no cruzada).
Figura 19. Disparidad de fijación (positiva y negativa)

Fuente: autor.
En términos sencillos, la disparidad de fijación plantea que un objeto es visto de una forma ligeramente distinta por cada ojo; así, cada parte de este objeto forma su imagen en dos puntos retinianos a una distancia desigual de la fóvea. Este concepto está directamente relacionado con la vergencia y la correspondencia retinal, debido a que los movimientos óculo-motores de vergencia (convergencia o divergencia) colocan las imágenes correspondientes por naturaleza sobre la fóvea de cada ojo; sin embargo, las demás imágenes que están antes o después del punto de fijación se proyectan en lugares diferentes a la fóvea, pero correspondientes en las retinas de cada ojo.
La disparidad tiene un comportamiento diferente según su ubicación retinal con respecto al punto de fijación del observador. De ahí surge la siguiente clasificación:
a)Disparidad cruzada o positiva. Se produce cuando se observan objetos entre un punto de fijación ubicado en el espacio libre horizontal y el observador. También es conocida como disparidad de convergencia. La ubicación retinal de estos puntos se encuentra más hacia la derecha en la retina derecha y más a la izquierda en la retina izquierda con respecto al punto de fijación físico-geométrico correspondiente para esa distancia.
La figura 20 representa una vista posterior de los globos oculares. Muestra la ubicación físico-geométrica correspondiente para una imagen proyectada antes del punto de fijación (círculos pequeños) y la ubicación real de la imagen en la retina (círculos grandes). La diferencia entre estos puntos corresponde con la disparidad positiva o cruzada.
Figura 20. Disparidad cruzada (vista posterior)

Fuente: autor.
b)Disparidad horizontal negativa o no cruzada. Es producto de la percepción retinal de objetos entre el punto de fijación y el infinito visual. La ubicación de estos puntos se encuentra más hacia la derecha en la retina izquierda y más a la izquierda en la retina derecha con respecto al punto de fijación físicogeométrico correspondiente para esa distancia.
La figura 21 representa una vista posterior de los globos oculares. Muestra la ubicación físico-geométrica del punto correspondiente para una imagen proyectada después del punto de fijación (círculos pequeños) y la ubicación real de la imagen en la retina (círculos grandes). La diferencia entre estos puntos corresponde a la disparidad negativa o no cruzada.
Figura 21. Disparidad no cruzada (vista posterior)

Fuente: autor.
En términos generales, la disparidad binocular aumenta de manera lineal y concéntrica. El umbral de disparidad varía en todas las direcciones en la medida en que aumenta la excentricidad. Además, algunos hallazgos permiten decir que en el campo visual periférico es más sensible a la disparidad no cruzada que a la cruzada (Devismea et al., 2008).
Por otra parte, en el plano perceptual se han detallado dos fenómenos que indican el desempeño de la disparidad de fijación, a saber:
a)Cumple una función en la percepción de dos dimensiones, donde se encarga de determinar si los fragmentos percibidos deben ser agrupados como parte de una superficie única, o bien, ser desagrupados como parte de superficies separadas.
b)La visión estereoscópica no se limita al registro o la interpretación de la disparidad binocular, pero sí se basa en los puntos ocluidos parcialmente que son visibles a un ojo y no visibles al otro, con el fin de establecer la posición de las superficies. Estos puntos de oclusión parcial están codificados y envían información al ojo. La percepción de estas propiedades de la superficie dependen de la actividad neural en el área cortical V1 (The National Academies Press, 2002).
Correspondencia retinal
La correspondencia retinal o retiniana describe que un punto en el espacio estimula un punto en la retina nasal de un ojo y en la retina temporal del otro (figura 22). Las fóveas de cada ojo son los puntos retinales correspondientes de referencia.
Como conclusión, al utilizar los ojos simultáneamente se hace uso de las referencias binoculares: la vergencia, la disparidad retiniana y la correspondencia retinal. Esta es considerada como la clave más importante que utilizamos para la visión en profundidad, puesto que constituye la mejor referencia para la visión estereoscópica (Howard y Rogers, 2012).
Figura 22. Correspondencia retinal

Fuente: Zenz (2005).
Estereopsis
La estereopsis es la cualidad del sistema visual que permite identificar la estructura tridimensional del entorno y proporciona la sensación de profundidad. Otros autores plantean que la estereopsis puede ser conceptualizada como un proceso de estados multiseriales que incluye varias subunidades paralelas (Cormack y Riddle, 1996). Los investigadores señalan también que el estímulo que desencadena el fenómeno de la estereopsis es la disparidad (Chalupa y Werner, 2004; Tovée, 2008; Daw, 2006; Castro, 2008; Von Noorden y Campos, 2002; Howard y Rogers, 2012; Ding y Levi, 2011; Ponce y Born, 2008; Adams W. et al., 2005; Poggio y Poggio, 1984).
La estereopsis propiamente dicha resulta de la estimulación simultánea de puntos dispares de la retina dentro del área de Panum (figura 23) y la influencia de los elementos que se estimulan fuera de esta (Ponce y Born, 2008; Howard y Rogers, 2012; Wong, Woods y Peli, 2002; Ding y Levi, 2011; Devismea et al., 2008; Von Noorden y Campos, 2002; Chalupa y Werner, 2004; Daw, 2006). El término estereopsis se asocia con el concepto de visión binocular; esto se debe a que la estereopsis es considerada como el mayor nivel de la visión binocular.
Para su estudio, la visión binocular ha sido clasificada en tres grados, que son presentados según como se va produciendo el fenómeno de observación. El primero de ellos consiste en la percepción simultánea de imágenes en cada ojo. El segundo grado consiste en la combinación de las imágenes recibidas en una percepción única, gracias a una fusión motora y sensorial. El tercer y más alto grado de la visión binocular es la estereopsis o percepción en profundidad de manera tridimensional, que es consecuencia del procesamiento neural de las disparidades binoculares horizontales (McCoun y Reeves, 2010). Por ello, Von Noorden y Campos (2002) la consideran como una de las funciones más importantes del sentido de la vista humana.
La estereopsis también desempeña un papel fundamental en la producción de las vergencias, específicamente en los movimientos finos e involuntarios contrarios al movimiento de vergencia en dirección del objeto de fijación (Cumming, 1997).
La estereoagudeza se mide en segundos de arco (seg arc) (Kansky y Bowling, 2001). El umbral de disparidad binocular para objetos finos y estáticos está entre 2 y 10 segundos de arco, y para objetos móviles es de unos 40 segundos de arco. La mejor estereopsis se produce en la mácula central, entre 2 y 40 segundos de arco; en tanto en la periferia disminuye entre 60 y 70 segundos de arco (mayor a 30 grados de excentricidad). Esta última no tiene asociación con el componente motor y permite localizar objetos tridimensionalmente (Kansky y Bowling, 2001; Bishop, 1988; Devismea et al., 2008). Se ha encontrado que la estereopsis desaparece a los 500 metros de distancia y se compensa haciendo uso de las claves monoculares (Bishop, 1988).
Figura 23. El horóptero y la visión binocular

Fuente: Vlcekmi3 (2012).
La estereopsis es también conocida como agudeza visual estereoscópica, estereoagudeza o visión de tercera dimensión. Algunos describen la estereopsis como una forma de hiperagudeza, debido a que pacientes con buena agudeza visual pueden percibir una estereoagudeza de hasta 3 segundos de arco (Momeni-Moghadam et al., 2011), alrededor de 15 veces mejor que la agudeza visual estándar; sin embargo, algunos otros desestimaron en su momento esta afirmación (Dunlop, Neill y Dunlop, 1980).
Ücretsiz ön izlemeyi tamamladınız.