|
MPEG-2
- Sucesor del MPEG-1, MPEG-1, es un
grupo de estándares de codificación y compresión en audio y
vídeo nacido en 1994, pensado especialmente para la
radiodifusión dado que soporta imágenes entrelazadas y mayores
resoluciones para la HDTV. Está poco optimizado para tasas
menores a 1 Mb/s pero tiene un gran rendimiento en 3 Mb/s y
superiores. El MPEG-2 define
dos tipos de flujos de datos:
- Flujo de programa. Es similar
a MPEG-1, emplea palabras de longitud fija, y se emplea en
discos SVCD y, más importante, en los
DVD comerciales.
- Fluo de transporte. Diseñados
para transportar audio y vídeo digital a través de medios
inestables e impredecibles, concretamente en radiodifusión
digital o DVB.
Como mejora al audio del MPEG-1,
es capaz de codificar más de dos canales de audio, hasta 6, en
una configuración 5.1.
El estándar MPEG-2 engloba todo lo
que concierne a MPEG-1, por lo que un reproductor de MPEG-2 es
capaz de descodificar señales MPEG-1
Niveles y perfiles en MPEG-2
Se introduce el concepto de
niveles y perfiles para definir el tipo de codificación de vídeo
a distintas resoluciones.
Los niveles tienen que ver con la
resolución del vídeo fuente que van desde:
- LL o nivel low o bajo: Propio
de la resolución SIF (ya usada en MPEG-1). 352x2800 pixeles
@30 fp y 4 Mb/ps
- ML o nivel main o principal:
4:2:0 con 720x576 a 30fps y 14 MBps
- H-14 o high-1440, con
1440x1152 @ 30 fps y 60 Mbps
- HL o high, 1920x1152 @ 30 fps
y 80 Mbps.
Los perfiles se corresponden con
requisitos complejos del descodificador, según estos criterios:
- SP o Simple. Sólo cuadros de
tipo I y P. YUV 4:2:0. No soporta entrelazado.
- MP o Principal (Main). Es el
más usado con la funcionalidad completa vista en MPEG-1 más
modos especiales para trabajar con señal de vídeo
entrelazada. De aquí en adelante todos soportan cuadros P, I
y B. YUV 4:2:0.
- 422P o Perfil 4:2:2. Similar
al anterior pero soporta YUV 4:2:2.
- SND: Escalable en SNR donde
se transmiten imágenes de cada vez mayor calidad. Entre 1 y
2 flujos de datos.
- SP o Espacial. Se
transmite inicialmente una versión del vídeo de baja
resolución que posteriormente se refina. De 1 a 3 flujos de
datos.
- HP o Alto (High).
Pensado para la televisión de alta definición (YUV 4:2:2. De
1 a 3 flujos de datos.
El perfil y nivel más usado en DVB
es el denominado MP@ML (Main Profile at main level) que a una
resolución de 720x480 a 30 fps o 720x576 a 25 fps dan en función
de la calidad exigida y de la propia naturaleza del vídeo unas
tasas binarias que van de 8 a 9 Mbps.
Tipos de imágenes en MPEG
En el MPEG hay presentes distintos
tipos de imágenes:
- I (Intra) pictures.
Codificadas sin referenciar a otras imágenes obtienen una
tasa de compresión pequeña similar a la de JPEG. Necesarios
como punto de entrada del vídeo, se requiere uno por cada 10
o 12 cuadros como máximo.
- P (predicted) pictures.
Codificadas a partir de cuadros I o P anteriores obtienen
una mayor tasa de compresión.
- B (bidirectional) pictures.
Codificadas usando interpolación bidireccional entre los
cuadros I o P anteriores / posteriores, obtienen la máxima
tasa de compresión.
Como organizar estos cuadros en
los denominados GOP (Group Of Pictures), depende de las
posibilidades del codificador, tal y como se muestra en la
figura adjunta para parámetros M y N.
- M es la distancia entre dos
cuadros P. Su valor habitual es 3.
- N es la distancia entre dos
cuadros I siendo 12 su valor habitual.
Jerarquía de capas en MPEG
MPEG define una jerarquía de capas
para una secuencia de vídeo con funciones específicas en el
proceso MPEG que de la capa más alta a la más baja son:
Secuencia. Define los parámetros
básicos para todo el vídeo.
- GOP (Group Of Pictures).
Visto anteriormente
- Imagen / Picture. Puede ser
de tipo I, P o B.
- Slice. Permite la
resincronización tras error en los cuadros I y consiste en
una serie de macrobloques contiguos que suele ser del tamaño
de una fila completa.
- Macrobloque. Formado por
bloques de 16x16 píxeles (4 bloques para la luminancia, 1 de
crominancia Cb y otro de crominancia Cr) que por tanto
ocupan el mismo área de la imagen y que es la unidad usada
para realizar la estimación y compensación de movimiento.
- Bloque. Formado por 8x8
píxeles a los que se aplica la DCT.
Modos entrelazados del MPEG-2
Incluye:
Codificación intra-frame
- Estructura Progresiva.
Apropiada para movimientos lentos entre campos. Los bloques
y macrobloques sobre los que se aplica la DCT se forman
tomando píxeles de campos separados.
- Estructura Entrelazada. Se
aplica cuando el movimiento es más rápido. Para evitar
componentes de frecuencias altas, en este caso se forman los
bloques partiendo de un único campo. De este modo, el campo
toma el papel de la imagen completa.
Codificación inter-frame. Se
dispone de distintos modos de estimación de movimiento.
- Modo frame. Búsquedas de un
campo par a otro campo par y análogamente para el impar.
- Modo campo. Búsquedas de
vectores de movimiento entre un campo y el siguiente menos
separados que en el caso anterior.
- Modo mixto. Se usan
predicciones tanto sobre el siguiente campo como sobre el
siguiente cuadro.
Resoluciones MPEG-2 en SVCD
- Resolución de vídeo:
- 380 x 480 píxeles NTSC
(USA, Japón)
- 480 x 576 píxeles PAL
(Europa)
- Tasa de cuadros:
- 59.94 campos/s, 29.97
cuadros/s (NTSC)
- 50 campos/s, 25 cuadros/s
(PAL)
- Tasa de bits de Audio +
video:
- Máximo 2.52 Mb/s
- Mínimo 300 kB/s
- YUV 4:2:0
- Audio: MPEG-1 capa 2 (MP2),
44.1kHz, 224 Kbit/s
Resoluciones MPEG-2 en DVD
Resolución de Video:
- 720 x 576, 704 x 576, 352 x
576 y 352 x 288 píxeles en PAL (Europa)
- 720 x 480, 704 x 480, 352 x
480 y 352 x 240 píxeles en NTSC (USA, Japón)
Relación de aspecto:
Tasa de cuadros:
- 59.94 campos/s, 29.97
cuadros/s (NTSC)
- 50 campos/s, 25 cuadros/s
(PAL)
Audio:
- LPCM (Código de Pulsos
Modulado Lineal = LPCM): 48kHz o 96kHz, 16 bit, 2 canales
(Estéreo)
- MPEG-1 Capa 2 (MP2): 48kHz,
hasta 7.1 canales (requerido en reproductores PAL)
- Dolby Digital (DD): 48kHz,
448 kbit/s, hasta 5.1 canales
- Digital Theater Systems
(DTS): 754 kbit/s o 1510 kbit/s.
- Debe haber al menos una pista
de audio que no sea DTS (ni MP2 para NTSC)
Tasa de bits de Audio + video:
- Buffer máximo promedio de 9.8
Mbit/s
- Pico 15 Mbit/s
- Mínimo 300 Kbit/s
YUV 4:2:0
Resoluciones MPEG-2 en DVB
Para SDTV:
- Entre 720x480 y 352x480, a
24/30 fps
- Entre 720x576 y 352x2800, a
25 fps.
Para HDTV:
- 720 x 576 x 50 fps progresivo
(576p50)
- 1280 x 720 x 25 o 50 fps
progresivo (720p50)
- 1440 o 1920 x 1080 x 25 fps
progresivo (1080p25)
- 1440 o 1920 x 1080 x 25 fps
entrelazado (1080i25)
- 1920 x 1080 x 50 fps
progresivo (1080p50) (posible para el formato H.264/AVC)
|