cMP² - Resampling & Upsampling



Upsampling ist nicht gleich Upsampling 

-oder warum digitale Wiedergabe sich gefallen lassen muss, 
                                            -mit der analogen verglichen zu werden



__________________________________________________



Hinter dem Schlagwort Upsampling verbergen sich allerlei Mythen, Mode, Verfahren und sogar unterschiedliche Begrifflichkeiten.
Man spricht von Upsampling, Oversampling, NOS (non-over-sampling) oder Resampling.



Im Kontext von cMP² verwenden wir den Begriff "Resampling", denn der cicsMemoryPlayer ist grundlegend ein Computer, der die vorliegenden CD- Daten mit Hilfe von Datenverarbeitung neu berechnet.

Die Frage ist nähmlich ob die Samplingrate von 44.1kHz für HighEnd Audio wirklich ausreichend ist, oder ob sie nicht doch aus theoretischen (Nyquist-Shannon) Gründen bei der Entwicklung vom CD Format einfach beschlossen wurde.

Es mag ein veritabler Wiederspruch zum Begriff "High Fidelity" sein, Daten seiner Musiksamlung zu verändern, aber die Idee hinter dem Upsampling des cicsMemoryPlayer ist es, mit einem avancierten Berechnungsmodell die entscheidenden Daten, die bei der Herstellung der CD verloren gegangen sind, zu rekonstruieren.



          5038cd43db30225082012.jpg


Die zugrundeliegende Theorie ist genau so spektakulär wie einleuchtend
und wird in der digitalen Bildbearbeitung schon lange angewandt.
In Zusammenhang mit Audio erfordert diese Technik ein hohes Maß an Kalkulation und Datenverarbeitung
... einen Computer eben!

Bei der Aufnahme im Studio oder im Konzertsaal wird das akustische Geschehen von einem Mikrofon aufgenommen und in ein analoges, elektrisches Signal umgewandelt.
In einer analogen Wiedergabe bleibt diese elektrische und kontinuierliche Modulation erhalten, aber bei einer
digitalen Speicherung wird diese von einem A/D-Wandler in Samples mit entsprechender Auflösung (meist 24 Bit) gewandelt.


5038d087d112925082012.jpg

Die digitalen Samplingpunkte folgen nicht immer der analogen Kurve der Amplitude des Mikrofons.



Daher liegen Töne nicht in einer uendlich feinen Modulation vor, aber werden aus zeitdiskreten Punkten (Samples) zusammengesetzt.
Die Frequenz, mit der dieses geschieht, ist als Samplingrate beschrieben. Die Höhe der Samplingfrequenz muss nach Nyquist/Shannon min. Faktor 2 zur höchsten Nutzfrequenz eines Spektrums sein.

Das bedeutet am Beispiel CD-Sampling:

Eine 100Hz-Sinuswelle wird bei 44.1k Samplerate mit 441 Samples pro Sekunde abgetastet und gewandelt.
Bei 1kHz sind es 45 Samples und bei 10kHz nur noch 4 Samples pro Sekunde/Zyklus.


Hier wird das Sampling in Nähe der Grenzfrequenz verdeutlicht:

5038ce8121a2825082012.jpg

Oben : Die ungenügende Resoulution einer 44.1 Samplerate im obersten Frequenzbereich (>10kHz)


Um die Signale jedoch wieder analog rekonstruieren zu können, bzw. die Samplerate genauestens zu erhöhen, bedarf es daher eines äußerst aufwändigen Glättungsfilters, dessen Wiedergabe-Qualität von Phase und Betrag des Vierpols abhängen.

-und für diesen Filter ist ein Computer ein hervorragendes Instrument.

Das zweite Problem einer zu niedrigen Samplerate sind die
zeitlichen Schwankungen (Jitter) die beim Abspielen zu Ungenauigkeiten führen und zu der harten, gläsernen, scharfen Hochtonwiedergabe, für die digitale Systeme oftmals kritisiert werden.


 
5038ceb915bbc25082012.jpg

Oben : Beim SRC Upsampling erreichen wir ein bedeutend analogeren Verlauf der Modulation von CD Daten


Um eine hochwertige Qualität zu gewährleisten, wird im Profibereich meist mit 96 oder 192 kHz digital gesampelt; d.h. jede Sekunde werden 96.000 (oder 192.000) Mal ein vom Mikrofon stammender Wert der Amplitude in eine entsprechende digitale Zahl umgewandelt.
Jeder dieser Sample gibt den Pegel (Amplitude) des vorliegenden Signals des Mikrofons an, und wird in Bit ausgewiesen. Dies ist der Dynamikumfang und beschreibt in Daten den jeweiligen Auflösung des analogen Signals.
Die 16 Bit einer CD erhält somit 65.536 Steps über den gesamten Aussteuerungsbereich; bei 24 Bit sind es sogar über 16 Millionen Quantisierungsschritte!
Die Gesamtqualität ist also abhängig von:
- Anzahl der Sample
- Auflösung (Quantisierung) des Samples.


Bei der Wiedergabe von CD Daten können wir zwar nicht den eigentlichen Dynamikumfang verändern, aber wir können durchaus die Samplerate erhöhen.
Viele DACs können eine eingehende 44.1kHz Samplingrate auf 96 kHz oder 192 kHz erhöhen. Die dabei angewandte Technik erhöht jedoch nur die Verarbeitungsgeschwindigkeit der Daten indem man das Signal mit Nullen auffüllt. Das hat nur einen sehr begrenzten audiophilen Nutzen.
In der Grafik unten, ist der Unterschied von Samplerate Erhöhung dargestellt.


                           503634e6a5e8823082012.jpg

Oben die original Daten; mittig die einfache Erhöhung der Samplerate; unten das Upsampling mit Interpolation.


Die effektivere Art ist das Upsampeln von Daten.
Manche hochwertige Netzwerkplayer tun dies intern mit spärlicher Hilfe eines programmierbaren FPGA Chips, und die meisten Playersoftware's für Computer können mühelos Daten über einen mathematischen Algorithmus Upsamplen.
Rein rechnerisch werden die ursprünglichen 44.100 Samplingpunkte mit Hilfe von Interpolierung auf eine höhere Datendichte gebracht, und erhöht so quasi die Resolution.
Entscheidend ist jedoch, wie exakt die fehlenden Daten berechnet werden. Das ist eine Frage des mathemathischen Aufwands und der Genauigkeit der Berechnung, und genau hier ist der cicsMemoryPlayer bzw. der cPlay´er in einer besonderen Klasse.
-und zwar in einer Klasse die herkömmliche Hifi-Geräte völlig ins Abseits stellen.
Bemerkenswert ist auch daß ein Upsampling von Daten über einen Computer (mit 32 Bit fließkomma Genauigkeit) auch nicht-linear stets korrekt interpoliert wird; also wenn z.B. von 44.1kHz auf 96kHz mit einem ungleichen Faktor umrechnet wird.

Eines der wichtigsten Gewinne einer hohen Daten-/Samplerate ist jedoch, daß der Taktgeber (die sogenannte Masterclock bzw. Wordclock) öfters dazu gezwungen wird, das Signal zeitlich abzugleichen bzw. zu korrigieren.
Empirisch lässt sich belegen, daß je höher die Samplingrate, desto niedriger der Jitter.
Folglich ergibt sich die These, daß je enger die zeitlichen Toleranzen zwischen den Samplingpunkten sind, je höherwertig (Jitter-armer) die Wiedergabe.
 
Es ist aber nicht ganz gleichgültig wie diese neuen Interpolationspunkte berechnet werden, denn je nach mathematischem Alorithmus ergeben sich (hörbar) unterschiedliche Resultate.
Der ciscMemoryPlayer hat zwei verschiedene Algorithmus-Engines :

  • SRC (Secret Rabbit Code)
  • SoX (Sound eXchange)

Der bevorzugte SRC ist dabei der kalkulatorisch aufwändigste Audioresampler, denn wo Sox lediglich mit einem linearen oder mit Polynomien phasenverschobener Interpolation arbeitet (cubic splines), so berechnet SRC aus tausend von Samplingpunkte den wahrscheinlichsten Wert der einzusetzenden Interpolation.
Diese Berechnung beruht auf der Berechenbarkeitstheorie einer sinc-Filter Funktion und ist seit Jahrzehnten eine etablierte Fraktion der Informatik.


sinc-Filter
Berechenbarkeitstheorie
Gefensterte Fast Fourrier Transform Funktionen

Diese Technik ist in cPlay ein proprietäres Verfahren die mittels des L2 Cache Speichers des Prozessors ausgeführt wird und ist der Grund dafür, daß das cPlay-Programm in Versionen für unterschiedliche Prozessorqualitäten zur Verfügung steht.
Dabei verwendet cPlay für die Unendlichkeit eines sinc-Filter eine Prozessorgesteuerte "overlap-add" Methode der Fast Fourrier Transformation, und einer VLIW Prozessorarchitektur um die Praktibillität der Technik zu gewähren.

Es ist wichtig zu vertehen daß der cicsMemoryPlayer diese aufwendige Technik nicht in "real-time" bewerkstelligt, sondern stets in gebündelten Datenpakete.
Die Genauigkeit dieser Kalkulation wird in cPlay mit 128 Bit durchgeführt und ergibt eine nahezu exakte Rekonstruktion der Masterdatei bzw. Annäherung an das ursprüngliche, analoge Signal.


Das Resultat einer solchen genauen Interpolation kann man auch fotografisch darstellen.

Das Prinzip ist in den folgenden Bildern zu sehen :


-die Masterdatei repräsentiert die originale Aufnahme im Studio/Konzert.
-das downgesampelte Bild repräsentiert die Kompression des CD Formats.
-das linear interpolierte Resultat eines Re-/ Upsamplings
-und das Resultat eines mit sinc-Filter Berechnung erzeugten Resamplings.


503639d14120c23082012.jpg

     Master Datei                    Downgesampelt                   linear Interpoliert               sinc-Filter Interpoliert



 
 
Panel title
Antal besøg: 16972

Lav en gratis hjemmeside på Freewebsite-service.com

Editing

-0,63530492782593sekunder