2013-04-20 15 views

Antwort

6

Da cos(0) 1 ist, ist der erste (0.) Koeffizient von DCT-II der Mittelwert der Werte, die transformiert werden. Dies bewirkt, dass der erste Koeffizient jedes 8 × 8-Blocks den Durchschnittston seiner konstituierenden Pixel darstellt, was offensichtlich ein guter Anfang ist. Nachfolgende Koeffizienten fügen zunehmende Detailtiefen hinzu, beginnend mit Wobbelgradienten und fortschreitend in zunehmend fummeligen Mustern, und es ist einfach so, dass die ersten paar Koeffizienten den größten Teil des Signals in fotografischen Bildern erfassen.

Sin(0) ist 0, daher beginnen die DSTs mit einem Versatz von 0,5 oder 1, und der erste Koeffizient ist eher ein sanfter Hügel als eine flache Ebene. Das ist unwahrscheinlich, dass es gewöhnlichen Bildern entspricht, und das Ergebnis ist, dass DSTs mehr Koeffizienten benötigen als DCTs, um die meisten Blöcke zu kodieren.

Die DCT passt einfach. Das ist wirklich alles, was dazu gehört.

4

Die DCT eines Bildmakroblocks, bei dem die oberen und unteren und/oder die linken und rechten Kanten nicht übereinstimmen, hat in den höheren Frequenzkoeffizienten weniger Energie als eine DFT. Dies ermöglicht größere Möglichkeiten, diese hohen Koeffizienten zu entfernen, grob quantisierter oder komprimierter zu machen, ohne sichtbarere Makroblockgrenzartefakte zu erzeugen.

5

Bei der Bildkomprimierung sollten Sie die KLT- oder die Karhunen-Loève-Transformation durchführen, da dies zu dem geringstmöglichen mittleren quadratischen Fehler zwischen dem Original und dem komprimierten Bild führt. KLT ist jedoch abhängig von dem Eingangsbild, was den Komprimierungsprozess unpraktisch macht.

DCT ist die engste Annäherung an die KL-Transformation. Meistens sind wir an Niederfrequenzsignalen interessiert, so dass nur eine gerade Komponente notwendig ist, daher ist es rechnerisch machbar, nur DCT zu berechnen.

Auch die Verwendung von Kosinus statt Sinusfunktionen ist von entscheidender Bedeutung für die Komprimierung als weniger Kosinus-Funktionen benötigt werden, ein typisches Signal annähert (siehe Douglas Bagnall der Antwort für weitere Erläuterungen).

Ein weiterer Vorteil der Verwendung von Cosinus ist das Fehlen von Diskontinuitäten. Da bei der DFT das Signal periodisch dargestellt wird, neigt das Signal beim Abschneiden von Repräsentationskoeffizienten dazu, "seine Form zu verlieren". Bei der DCT kann das Signal jedoch aufgrund der kontinuierlichen periodischen Struktur relativ mehr Verkürzungen der Koeffizienten aushalten, behält jedoch immer noch die gewünschte Form.