Flow Chart representing the Methodology
TOTAL NUMBER OF STUDY PARTICIPANTS
La salida del codificador es una secuencia de bits compatible con la sintaxis de los estándares. Cada una de las capas, aparte de la muestra individual, tiene un encabezado y un patrón de bits de alineación, de tal forma que se pueda distinguir dentro de una secuencia de bits. La organización sintáctica de una secuencia de bits está dada por:
o Secuencia de video. o Grupo de imágenes o Imagen. o Rebanada. o Macrobloque. o Bloque. o Muestra.
4.1.2.1 Estructura de la secuencia de Video
Existe una estructura anidada en MPEG que incluye descripciones con creciente grado de detalle del video contenido en cada capa. En el nivel exterior se sitúa la secuencia que contiene toda o un segmento de la película. En la Figura 13 se muestra una película dividida en secuencias. (Wooton 2006)
34 Figura 13. Película dividida en secuencias.
4.1.2.2 Grupo de Imágenes
La secuencia de imágenes contiene gran cantidad de información por lo que debe de subdividirse en componentes más pequeños. El estándar MPEG-1 describe una serie de fotogramas como un grupo de imágenes la cual consta de entre 10 y 30 imágenes. Esta estructura también se aplica a los CODEC MPEG-2, MPEG-4 y H.264. La estructura del grupo de imágenes se repite tantas veces como sea necesario para producir la secuencia. En la Figura 14 se ilustra este concepto. (Wooton, 2006)
Figura 14. Estructura de grupos de imágenes dentro de una secuencia. (Wooton 2006)
La estructura de imágenes al ser compleja ya no resulta de una colección de fotogramas, ya que estos fotogramas presentan una relación muy especial entre ellos dentro de un grupo de imágenes. Dicho grupo de imágenes siempre empieza por un fotograma I, ya que si se almacena información sobre diferencias en el fotograma P carecerá de base para construir los fotogramas delta. (Wooton, 2006)
35
4.1.2.2.1 Estructura de Grupo de imágenes cerrada
Un grupo de imágenes cerradas contiene un fotograma I de inicio, algunos fotogramas P basados en el fotograma I y algunos fotogramas B codificados. En la Figura 15, las flechas indican el origen de los datos diferenciales sobre varios grupos de imágenes adyacentes.
Figura 15. Una secuencia de grupo de imágenes cerrada. (Wooton, 2006)
4.1.2.2.2 Estructura de grupo de imágenes abierta
Figura 16. Una secuencia de grupo de imágenes abierta. (Wooton, 2006)
Como se muestra en la Figura 16, la estructura de grupo de imágenes es bastante corta y no incluyen fotogramas P. Las estructuras de grupos de imágenes se unen a través de las diferencias y en ellas no existen límites entre fotogramas, ya que no cuentan con algún tipo de dependencia para la unión de dicho fotograma con otro fotograma de la secuencia. Los fotogramas I los comparten dos conjuntos de grupos de imágenes y resulta imposible hallar un punto adecuado en el que se pueda interrumpir la secuencia. Para evitar que se produzca esta situación, se puede incluir un fotograma P al final de cada grupo de imágenes para convertirla en un grupo de imágenes cerrado, o bien se puede eliminar los fotogramas B en su conjunto. (Wooton, 2006)
36
Al mantener un grupo de imágenes pequeñas implica que la compresión no será tan eficaz. Al aumentar el número de fotogramas de diferencias, el grupo de imágenes aumenta y la relación de compresión mejora, pero también aumenta la acumulación de errores. Estos dos sistemas se conocen como “grupo de imágenes pequeña” y “grupo de imágenes grande” respectivamente (Wooton, 2006), en el que cada uno da ventajas y desventajas al uso del proceso. Ver la Figura 17.
Imagen 17. Un grupo de imágenes sencillo. (Wooton, 2006)
Para transmitir un grupo de imágenes, el fotograma I ya se encuentra comprimido, sin referencia a algún otro fotograma, éste se procesa y se coloca en la primera ranura física del grupo de imágenes. La estructura de imágenes se define de ante mano, por lo que el decodificador sabe que debe saltar una serie de fotogramas hacia adelante para computar las diferencias posteriores requeridas para crear el siguiente fotograma P. El fotograma P comprimido se coloca junto a la estructura del grupo de imágenes física. Luego los fotogramas B, situados entre los fotogramas I y P, son computados mediante la técnica bidireccional. Los fotogramas se transmiten en un orden muy diferente al de la secuencia de reproducción, como se aprecia en la Figura 18.
37 Figura 18. Secuencia de Transmisión de un grupo de imágenes. (Wooton, 2006)
4.1.2.3 Macrobloques
El Macrobloque se realiza con el fin de reducir la dificultad de creación de fotogramas B e incrementar la probabilidad de encontrar áreas de las imágenes que sean idénticas, la imagen se fragmenta en cuadros de 16x16 denominados Macrobloques. En la Figura 19 se muestra la distribución simplificada de Macrobloques de un fotograma.
Figura 19. Macrobloques. (Wooton, 2006)
La matriz de la imagen que contiene los pixeles del fotograma que se comprime se convierte en una colección de rectángulos de menor tamaño con los que se trabajan de forma individual. (Wooton, 2006)
La técnica de creación de Macrobloques depende del fotograma usado. Los fotogramas I no deben de hacer referencia al exterior del fotograma en el que se
38
trabaja. Los fotogramas P hacen referencia a otro tipo de fotograma, pero solo al fotograma I o P más reciente. El orden de estos deberá preservar la secuencia temporal de los fotogramas. Los fotogramas B de un Macrobloque, harán referencia al fotograma P anterior o posterior o bien, a un fotograma I anterior. (Wooton, 2006)
4.1.2.4 Rebanadas
Los Macrobloques se distribuyen en lo que se conoce como rebanadas, tiras o slices. Se trata de componentes estandarizados, donde el decodificador sabe que si pierde la sincronización a nivel Macrobloque, puede reconstruir la imagen a partir del limite de la rebanada siguiente (ver figura 20). (Wooton, 2006), por lo que la pérdida de información puede ser minimizada y reconstruida en base a su imagen antecesora.
Figura 20. Macrobloque y rebanadas. (Wooton, 2006)
Antes de la compresión del Macrobloque, éste se normaliza mediante la sustracción de la mitad de todo el intervalo de valores correspondientes a la profundidad de bits. Esta normalización se realiza para que el decodificador genere números dentro de un intervalo controlado. La base de la compresión usa la transformada DCT para convertir los pixeles organizados en una matriz de
39
valores de frecuencia que se organiza en la misma forma rectangular como se aprecia en la Figura 21.
Figura 22. Conversión DCT. (Wooton 2006)