MAGAZIN
Seite 2 / 3

Inter-Sample-Clipping (ISP)

Dies ist die Einleitung zum Thema, das später noch wehtun wird.

Die diskreten numerischen Werte eines digitalen Audiosignals werden bei der D/A-Wandlung zur Rekonstruktion des analogen Signals herangezogen. Dabei werden auch die bei der A/D-Wandlung nicht erfassten analogen Signalanteile zwischen den Abtastwerten (Samples) wiederhergestellt. Der rekonstruierte, analoge Wert kann höher sein als der digitale Wert des Samples = Spitzenwert zwischen Samples / Inter Sample Peak. Dies alles ist absolut kein Problem, es sei denn, das digitale Sample ist sehr nah an der digitalen Nulllinie von 0 dBFS. Siehe Grafik 7 und Grafik 8.

Grafik 7: Dieses 12-kHz-Sinussignal (fs = 48 kHz/s) wird mit 4 Samples (pro Zyklus) repräsentiert. Der Spitzenwert des zurückgewandelten Signals (analog -0,55 dB) ist höher als der binäre Wert (-3,35 dBFS).Grafik 7: Dieses 12-kHz-Sinussignal (fs = 48 kHz/s) wird mit 4 Samples (pro Zyklus) repräsentiert. Der Spitzenwert des zurückgewandelten Signals (analog -0,55 dB) ist höher als der binäre Wert (-3,35 dBFS).

Der digitale Wert von Grafik 7 ist weit genug von Digital-Null entfernt (-3,35 dBFS) für eine korrekte Rückwandlung.

Grafik 8: Das 12-kHz-Sinussignal (fs = 48 kHz/s) wird mit 4 Samples (pro Zyklus) repräsentiert. Der binäre Wert des Samples ist bei -1,35 dBFS. Der Headroom von 1,35 dB reicht nicht aus, um das analoge Signal vollständig rekonstruieren zu können.Grafik 8: Das 12-kHz-Sinussignal (fs = 48 kHz/s) wird mit 4 Samples (pro Zyklus) repräsentiert. Der binäre Wert des Samples ist bei -1,35 dBFS. Der Headroom von 1,35 dB reicht nicht aus, um das analoge Signal vollständig rekonstruieren zu können.

In Grafik 8 wäre ein Headroom von 2,8 dB notwendig, um das analoge Signal vollständig zu rekonstruieren, wie dies in der Grafik 7 gegeben ist. Die Kuppe wird abgeschnitten, was zu heftigen Verzerrungen führt. In der Wellenform-Statistik werden 1306 geclippte Samples gelistet (Signaldauer 5 Sek.).

Das Thema ISP wird uns später noch beschäftigen.

Till Brönner – Jazz-Trompeter

«Bumpin’» ist ein ruhiges, balladenartiges Stück mit einem Ostinato-Grundrhythmus von Klavier und Bass. Die Natur des Stückes mit den melodischen Figuren von Trompete und Hammond-Orgel sorgen für eine gleichförmige Vorwärtsbewegung. Grössere dynamische Akzente sind nicht vorhanden. Der Lautstärkeumfang beträgt rund 27 dB.

Grafik 9: Till Brönner, «Bumpin’». Das Stück hat einen Dynamikbereich von rund 27 dB, wird aber mit 4.3 LU als gleichmässig laut empfunden.Grafik 9: Till Brönner, «Bumpin’». Das Stück hat einen Dynamikbereich von rund 27 dB, wird aber mit 4.3 LU als gleichmässig laut empfunden.

Pop, Mainstream und die Uniformität der Musikproduktion

Unter dem Genre Pop tummeln sich eine Vielzahl von Untergattungen, die je nach Präferenz auch als eigene, primäre Genres wahrgenommen werden können: Rock, Metal, Blues, R&B. Uns interessiert in diesem Artikel, wie viel Dynamikumfang Musikstücke haben, ob diese Dynamik im Wohnraum abgebildet werden kann und auch welchen Transportcontainer (wie viel Bits) wir benötigen, um diese Dynamik vermitteln zu können.

In dieser Kategorie eine gerechte Auswahl zu treffen, respektive ein aussagekräftiges Resultat zu erhalten, kann fast nur zu kurz geraten. Halten wir uns an Titel, die auf ein breites Interesse stossen und so auch für das ganze Musikbusiness ein Massstab sein könnten.

Ist dem so, dann kommt man nicht um Taylor Swift herum. Betrachten wir das Stück «Lavender Haze» (3:22 Min.) aus ihrem neusten Album «Midnight». Das Musikstück wird den Genres Ambient House, Dream-Pop, Synth-Pop, R&B, Disco zugeordnet. Typisch für die (Mainstream-)Liedgattung ist eine Spieldauer von unter 5 Minuten, mit überschaubarer musikalischer Entwicklung und in der Folge auch geringem Dynamikumfang, aber mit Gewichtung der Textaussage.

Grafik 10: Der Unterschied zwischen den leisesten und lautesten Signalanteilen bei «Lavender Haze» liegt bei rund 20 dB. Die wahrgenommene Dynamik ist allerdings gering mit 2.9 LU.Grafik 10: Der Unterschied zwischen den leisesten und lautesten Signalanteilen bei «Lavender Haze» liegt bei rund 20 dB. Die wahrgenommene Dynamik ist allerdings gering mit 2.9 LU.

Die Perzeption des Songs ist uniform laut. Vernachlässigbare geclippte Samples, die Stimme klingt sauber und klar.

The Beatles Resurrection

Zugegeben, ein übertriebener Titel. Moderne KI-Audiotechnik hat mit alten Demotapes den 1980 in New York von einem Idioten ermordeten John Lennon und den 2001 verstorbenen George Harrison nochmals auf einer Neuveröffentlichung mit Ringo und Paul aufleben lassen. Den Titel «Now and Then» hat John im Home recording als Tonfragment eingespielt – Text und Melodie. Dank KI ist es heute möglich, Johns Stimme von der Klavierbegleitung zu separieren. Das gelingt hervorragend. Es gab schon vor 1995 Versuche der drei Beatles, Johns Lied einzuspielen, was aber an der damaligen Technik scheiterte.

So, nun wurden John Stimme und Georges Spiel rekonstruiert, restauriert und in die Produktion mit Paul und Ringo eingefügt. So weit, so gut. Johns unvergleichliche Harmonik prägt den Song. Doch was das Mastering dann aus den Stems und Takes macht, ist … Urteilen Sie selbst.

Grafik 11: Im Schnitt 9 dB Dynamikumfang (1.5 Bit), eine Loudness-Range von 4.6 LU. Die Dynamik wurde massiv komprimiert.Grafik 11: Im Schnitt 9 dB Dynamikumfang (1.5 Bit), eine Loudness-Range von 4.6 LU. Die Dynamik wurde massiv komprimiert.

Verlust an Klangfeinheiten und das Erzeugen eines dichten, breiigen Sounds sind die Folge. Ein Limiter begrenzt dann alles auf -3 dB. Zumindest hat der Mastering-Ingenieur ein Inter Sample Clipping verhindert.

Die Beatles-Single ist ein Beispiel für eine irregeleitete Musikproduktion. Das Lied hat Gattungsbedingt schon weniger Dynamik als andere Werkgattungen. Dieses Stilmittel dann noch künstlich zu reduzieren, ist fragwürdig, ist aber im Mainstream eine allgegenwärtige Praxis. Wenn dann die Akteure in diesem Business auf YouTube noch episch Videos über die Hörbarkeit von ISP diskutieren – ohne technische Notwendigkeit, denn selbst das 16-Bit-Format bietet genügend Spielraum –, dann muss man sich fragen, ob diese Leute überhaupt etwas von Klangkultur und Klangfeinheiten verstehen.

Wir sind beim Thema «Loudness War»: lauter, lauter, immer lauter scheint die Devise. Das Beispiel Remaster zeigt dies.