Chapter 4 Orthogonal symmetric non-negative matrix factorization under stochas-
4.2 Methods and algorithms
1.3.2.1. Entorno CAVETM
En este escenario se utiliza una grabaci´on estereosc´opica de resoluci´on full HD 1920x1080 p´ıxeles para cada ojo, realizada desde la azotea del edificio Imagina de Mediapro en la Avenida Diagonal de Barcelona durante 24 horas. El contenido consiste en cuatro vistas estereosc´opicas parcialmente solapadasque, en conjunto, abarcan un ´angulo de visi´on de 270◦ (figura 1.4) con el objetivo de generar una vista panor´amicaest´ereo (figura 1.5, arriba).
Cap´ıtulo 1 Introducci´on 11
Figura 1.4 – Captura de cuatro vistas de Barcelona(fuente: Eum´ovil)
La vista panor´amica est´ereo se obtiene mediante una t´ecnica conocida comostit- ching (o cosido de im´agenes), que es una variante de la formaci´on de im´agenes en mosaico. Se visualiza en las tres caras verticales de la CAVE (laterales y frontal) jun- to con una interfaz gr´afica interactiva para poder mostrar todas las posibilidades del demostrador.
Figura 1.5 – Vista panor´amica(arriba) ymapa de profundidad(abajo)
Cada una de las vistas se tom´o con un conjunto de dos c´amaras Panasonic AG- HPX371E colocadas en un rig est´ereo con estructura Side-by-Side. Se trata de una configuraci´on de c´amaras en paralelo con separaci´on entre los centros ´opticos (interaxial) de 680 mil´ımetros. El eje de rotaci´on se sit´ua en el centro de las dos c´amaras f´ısicas, pero los sensores se sit´uan 152 mil´ımetros por delante del mismo. Para poder capturar la calle desde lo alto del edificio, las c´amaras tienen un ´angulo de inclinaci´on con respecto al suelo de −10,55◦. Para no producir deformaciones, se establece una configuraci´on sin zoom. Debido a la gran distancia que separa la c´amara de la escena, la lente de cada c´amara tiene configuraci´on de foco en el infinito, que es el punto a partir del cual el enfoque permanece constante, es decir, todos los objetos mas all´a de la distancia m´ınima de enfoque deber´ıan aparecer perfectamente claros y sin distorsi´on.
12 Cap´ıtulo 1 Introducci´on
Sobre el contenido descrito, el demostrador incluye una serie decontenidos adi- cionales (figura 1.6) destinados a complementar la experiencia de usuario. Como fun- cionalidad, se introduce la visualizaci´on selectiva (a demanda) de dichos contenidos, que son realizados de forma previa a la transmisi´on y almacenadas en un repositorio local. Pueden ser de tres tipos:
• Modelos 3D: un men´u de interacci´on permite seleccionar entre varios modelos sint´eticos asociados con la ciudad de Barcelona durante la reproducci´on del v´ıdeo. Se trata de edificios representativos de la ciudad que el usuario puede observar desde cualquier posici´on y ´angulo mediante las interacciones con el FlystickR de
la CAVETM. Adem´as, se pueden integrar dentro del panorama de v´ıdeo mediante la acci´on correspondiente en el men´u de interacci´on.
• Audio: adem´as de la pista de audio general que se reproduce junto al panorama de v´ıdeo, cada uno de los modelos 3D seleccionables tienen a su vez una pista de audio descriptiva. Estas se reproducen a partir del momento en que se selecciona alguno de los edificios 3D disponibles, pudiendo en cualquier momento pausar o reanudad la reproducci´on mediante las interacciones con el men´u de selecci´on.
• Fotograf´ıas 3D:al seleccionar un edificio 3D, sobre el panorama aparece un visor que muestra fotograf´ıas relacionadas con el modelo. La secuencia de fotograf´ıas y el tiempo que permanecen en escena vienen determinados autom´aticamente por el audio asociado que se encuentre reproduciendo en ese momento. Adem´as, se habilita la interacci´on del usuario con este visor permitiendo avanzar o retroceder la secuencia, o bien mostrar y ocultar el visor.
Figura 1.6 –Ejemplo del demostrador CAVE. Vista del demostrador en funcionamiento con el men´u interactivo donde se muestra un modelo del estadio Camp Nou insertado en el v´ıdeo (parte izquierda) y una presentaci´on de fotograf´ıas relacionadas con el modelo 3D (parte derecha). Para interactuar se utiliza elFlystickR.
Cap´ıtulo 1 Introducci´on 13
1.3.2.2. Sal´on inmersivo
El contenido multimedia que se mostrar´a en este demostrador corresponde a una escaleta de unpartido completo de f´utbol profesional, grabado mediante tecnolog´ıa estereosc´opica. El encuentro se realiz´o en el estadio Camp Nou de Barcelona entre el F´utbol Club Barcelona y el Real Madrid durante la jornada 35 de la liga BBVA, el 21 de abril de 2012. La captura ha sido realizada utilizando una configuraci´on de c´amaras habitual en cualquier retransmisi´on futbol´ıstica, siguiendo un esquema como el de la figura 1.7.
Figura 1.7 –Esquema de c´amaras del partido: (1) principal SbS, (2-3) cortos
SbS, (4-5) detr´as de las porter´ıas SbS, (6) lateral TaB, (7) vista de las gradas, (8)steady hacia banquillos, (9-10) fueras de juego.
La c´amara principal, etiquetada como 1 es apoyada por las c´amaras 2 y 3, utilizadas para tomar planos cortos de los jugadores en el terreno de juego. Las c´amaras 4 y 5 est´an situadas detr´as de cada porter´ıa para tomar planos cortos durante las jugadas que se producen cerca de las porter´ıas y la c´amara 6 recorre la banda lateral. Tambi´en se dispone de dos c´amaras (9 y 10) para detectar y comprobar las situaciones de fuera de juego. La c´amara 8 est´a colocada sobre un soporte de tiposteadycam y apunta hacia los banquillos, mientras que la c´amara 7 graba hacia las gradas durante el tiempo en el que se llena y se vac´ıa el estadio.
14 Cap´ıtulo 1 Introducci´on
Las c´amaras HD utilizadas son del modelo GV LDK 8000, excepto la situada tras la porter´ıa derecha, que se trata de una c´amara 3D Panasonic AG-3DA1 que captura cada vista enFull HD y SbS. Todos los rigs est´an configurados enSide-by-Side, excepto el de la banda lateral, que esTop-and-Bottom. La vista de cada ojo se captura en formato
720p (1280x720 p´ıxeles formato progresivo), por lo que el resultado del montaje final es un v´ıdeo en formatoHD Ready Side-by-Side , es decir un cuadro de dimensiones 2560x720 p´ıxeles que contiene las vistas de resoluci´on completa una al lado de la otra.
Como hemos explicado en el apartado 1.3.1.2, se utiliza un conjunto demodelos tridimensionalesquese insertan en el v´ıdeo como contenido adicional en momentos determinados del partido. En la figura 1.9(a) se muestran todos los objetos que se han modelado y que est´an directamente relacionados con el contenido del v´ıdeo. En la figura 1.9(b) vemos la captura de un cuadro en el que se ha insertado uno de los objetos.
(a)Modelos 3D (b)Superposici´on de un modelo
Figura 1.9 – Superposici´on de contenidos de realidad aumentada(CeDInt)
Por otra parte, sabemos que es posible interactuar con los modelos 3D dentro del v´ıdeo, como en la figura 1.10, donde se ilustra el desplazamiento de posici´on de un modelo en el v´ıdeo, pudi´endose observar el efecto de las oclusiones entre elementos situados a diferente profundidad como ocurre con el techo del estadio que se sit´ua por delante de la copa (imagen superior).
Cap´ıtulo 1 Introducci´on 15 Otra posible forma de interacci´on hace uso de lasvistas de las diferentes c´ama- ras con el objetivo de incrementar el nivel de implicaci´on del usuario, de forma que tenga cierto control al poder seleccionar la que m´as le interese. As´ı, los espectadores se convierten en verdaderos realizadores de su propio contenido. Esta posibilidad supone numerosos retos a nivel de producci´on. Por un lado, se debe planificar cada una de las distintas posiciones de c´amara estereosc´opica y por otro, almacenar de forma coherente las diferentes fuentes de v´ıdeo. En este sentido, se presenta un reto importante en cuanto al tama˜no que ocupa el contenido en t´erminos de compresi´on sin alterar excesivamente la calidad final y en cuanto a la adecuada sincronizaci´on entre las vistas. Por otra parte, se debe prever el m´etodo m´as efectivo para dotar al usuario final de la capacidad de ir altern´andolas.
16 Cap´ıtulo 1 Introducci´on