MAGAZIN
ARTIKEL
Publikationsdatum
18. Mai 2000
Themen
Drucken
Teilen mit Twitter
Der MPEG-2 Video Encoder von Philipps enthält auf ca 2 cm2 4.5 Millionen Transistoren. Bei einer Taktfrequenz von 27 MHz verbraucht er 2 W.
Das Bild auf der DVD wird nach MPEG-2 datenreduziert. Dieses Verfahren liefert trotz eines Kompressionsfaktors von bis zu 200 gute Bilder mit wenig Störungen.Ein Videosignal mit 8-Bit-Quantisierung erzeugt einen Datenstrom von 216 MBit/s, womit auf einer einlagigen DVD rund 3 Minuten Bild Platz hätten. Um die von Hollywood geforderten mindestens 135 Minuten auf einer DVD unterzubringen, braucht es also eine Datenreduktion. Da das Bild zudem besser sein soll als auf der Laserdisc, hat das Reduktionsverfahren hohe Anforderungen zu erfüllen.

Profiles und Levels

MPEG-2 wird bei verschiedenen Anwendungen eingesetzt, wie Filmwiedergabe, digitale Fernsehübertragung, interaktives Fernsehen oder Bildtelefonie. Eine bestimmte Anwendung nutzt jeweils nicht alle Möglichkeiten des Standards aus.

Für die verschiedenen Anforderungen ist MPEG-2 in Bereiche unterteilt, die sogenannten „Profiles“ und in verschiedene Ebenen, die „Levels“, welche den Wertebereich der Parameter festlegen. Ein Profile kann skalierbar sein, das heisst es muss nicht der ganze Datenstrom decodiert werden, um ein Bild zu erhalten. Damit verringert sich die Zeit vom Eintreffen des Bildes bis zu seiner Wiedergabe, was etwa bei der Bildtelefonie wünschbar ist. Auf der Kostenseite steht dabei die geringere Bildqualität.

Drei Bildarten

Um die Bilddaten zu komprimieren, werden nur die Differenzen zwischen aufeinanderfolgenden Bildern codiert. Das bedeutet, dass ein Bild nicht mehr isoliert für sich stehen kann, da es ja nicht die ganze Information enthält, sondern es muss auf ein anderes Bild Bezug nehmen. MPEG-2 definiert für diese Referenz drei Bildarten.

Das Intraframe-Bild (I-Bild) steht für sich und nimmt keinen Bezug auf ein anderes Bild. Damit können schnelle Wechsel (Bildschnitte) fehlerfrei codiert werden. Zudem sind diese Bilder Einstiegspunkte nach einem Skip oder schnellen Vorlauf. Das Predective-Bild (P-Bild) wird aus dem vorangegangenen durch Bewegungskompensation abgeleitet und kann seinerseits wieder Ausgangsbild einer Vorhersage sein.

Das Bi-directional-Bild (B-Bild) benützt die Bewegungskompensation mit Bezug auf das vorangegangene und das folgende Bild, die I- oder P-Bilder sein müssen. B-Bilder werden nicht für Vorhersagen verwendet. Die Reihenfolge von I-, P- und B-Bildern sowie die Anzahl Bilder bis zum nächsten I-Bild (die group of pictures GOP) ist frei und wird vom Hersteller des Encoders festgelegt.

Bewegungskompensation

Ebenfalls dem Entwickler des Encoders überlassen ist, wie die Differenz zwischen zwei Bildern bestimmt wird. Eine übliche Methode ist die Bewegungskompensation. Dabei wird jedes Bild in Blöcke von 16 x 16 Pixeln unterteilt.

Für jeden Block wird im vorangegangenen Bild nachgeschaut, ob dieser schon vorhanden war. Falls dies zutrifft, wird bestimmt, an welche neue Position sich der Block verschoben hat. Dieser Offset wird als Bewegungsvektor bezeichnet.

Bei übereinstimmenden Blöcken muss nur der Vektor übertragen werden. Nicht übereinstimmende Blöcke stellen die Differenz zwischen den zwei aufeinanderfolgenden Bildern dar und werden codiert. Der Decoder ist mit diesen Informationen in der Lage, das Bild wieder herzustellen.

Die nicht übertragenen Blöcke werden vom vorangehenden Bild genommen und an die vom Bewegungsvektor bezeichnete Stelle eingefügt; codierte Blöcke werden decodiert.

Ganz- und Halbbilder

Eine weitere Freiheit bei der Codierung besteht in der Wahl, ob ein ganzes Bild oder zwei Halbbilder codiert werden sollen, und zwar kann diese Wahl bei jedem Bild neu getroffen werden. Sequenzen mit wenig Bewegung werden effektiver als Vollbilder codiert, während die halbbildweise Codierung bei schnellen Bewegungen zu weniger Bildstörungen führt.

Der Entscheid, ob das ganze oder zwei Halbbilder codiert werden, wird gefällt, nachdem die Bewegungsvektoren und die Anzahl der zu codierenden Blöcke bestimmt wurde.

Veränderliche Bitrate

Neben der Codierung nur der bewegten Bildinhalte wird mit zwei weiteren Operationen eine effektive Datenkompression erreicht. Bildanteile, die das menschliche Auge kaum wahrnimmt, werden unterdrückt.

Muster, die wiederholt auftreten, werden nicht jedes Mal neu codiert, sondern der Code für das Muster wird einmal übertragen, zusammen mit der Anzahl der Wiederholungen (run length encoding). Eine optimale Bildverarbeitung ergibt die Änderung der Bitrate im Bereich zwischen 1 und 11 Mbit/s je nach Komplexität des Bildes.

Damit steht für detailreiche Bilder eine hohe Datenrate zur Verfügung, und wenig komplexe Bilder werden nicht unnötig fein aufgelöst.

Gegenüberstellung DVD-Video und Video-CD

Format DVD-Video Video-CD
Daten-
reduktion:
MPEG-2
MPEG-1
Bildgrösse: 720 x 480 Pixel352 x 240 Pixel
Datendurch-
satz Video:
1 .. 11 Mbit/s (variabel) 1,15 Mbit/s (fix)
Wiedergabe-
zeit pro Disc
135 Min. .. 8 Std.74 Minuten
Tonformate AC-3 (mono, stereo,5.1)
lineares PCM/MPEG-2
lineares PCM