proseminar datenkompression thema : arithmetische kodierung 18.03.2002eric bodden, malte clasen,...

Report

Post on 06-Apr-2015

107 Views

Category:

Documents

0 Downloads

Preview:

Click to see full reader

TRANSCRIPT

18.03.2002 Eric Bodden, Malte Clasen, Joachim Kneis 1

Proseminar DatenkompressionThema : Arithmetische Kodierung

Arithmetische Kodierung

18.03.2002 Eric Bodden, Malte Clasen, Joachim Kneis 2

Proseminar DatenkompressionThema : Arithmetische Kodierung

Motivation

Ziel des Verfahrens:• beliebige Daten verlustfrei komprimieren

Mittel und Weg:• Sequenzen durch Codes ersetzen

Methode:• Symbole durch Codes ersetzen (Huffman)• Sequenzen durch Codes ersetzen (Arithmetische

Kodierung)• Kodierung im Intervall [0,1)

18.03.2002 Eric Bodden, Malte Clasen, Joachim Kneis 3

Proseminar DatenkompressionThema : Arithmetische Kodierung

Geschichte

• 1960: Elias, Abramson – Erste Ansätze

• 1976: Pasco, Rissanen – Beweis, das endlich genaue Arithmetik ausreicht

• 1980: Rubin, Guazzo, Rissanen, Langdon - Erster praktikabler Algorithmus• Scaling• FIFO-Prinzip• Erste hardwarenahe Realisierungen

18.03.2002 Eric Bodden, Malte Clasen, Joachim Kneis 4

Proseminar DatenkompressionThema : Arithmetische Kodierung

Definition: Alphabet, Symbol, Sequenz

Alphabet:• endliche, nichtleere Menge

z.B. A = {a,b,c,d}

Symbol:• Element des Alphabets

z.B. a A

Sequenz:• Symbolfolge

z.B. S = abaabcda A*

18.03.2002 Eric Bodden, Malte Clasen, Joachim Kneis 5

Proseminar DatenkompressionThema : Arithmetische Kodierung

Definition: Modell

Modell:

• Abbildung A [0,1): ai PM(ai)

• PM(ai) ist angenommene Wahrscheinlichkeit

• Nicht zwingend gleich mit P(ai), der korrekten Wahrscheinlichkeit

• Im Folgenden: Annahme eines einfachen Modells

18.03.2002 Eric Bodden, Malte Clasen, Joachim Kneis 6

Proseminar DatenkompressionThema : Arithmetische Kodierung

Beispiel: Modell

a 6,51 % h 4,76 % o 2,51 % v 0,67 %

b 1,89 % i 7,55 % p 0,79 % w 1,89 %

c 3,06 % j 0,27 % q 0,02 % x 0,03 %

d 5,08 % k 1,21 % r 7,00 % y 0,04 %

e 17,40 % l 3,44 % s 7,27 % z 1,13 %

f 1,66 % m 2,53 % t 6,15 %

g 3,01 % n 9,78 % u 4,35 %

18.03.2002 Eric Bodden, Malte Clasen, Joachim Kneis 7

Proseminar DatenkompressionThema : Arithmetische Kodierung

Definition: Entropie

Entropie H ist Maß für Informationsgehalt einer Sequenz S

Definition:

Beachte: [H] = Bits / Symbol

18.03.2002 Eric Bodden, Malte Clasen, Joachim Kneis 8

Proseminar DatenkompressionThema : Arithmetische Kodierung

Definition: Modellabhängige Entropie

Problem: Korrekte Wahrscheinlichkeiten nicht bekannt

Also Differenzierung nötig

Modellabhängige Entropie

Definition:

18.03.2002 Eric Bodden, Malte Clasen, Joachim Kneis 9

Proseminar DatenkompressionThema : Arithmetische Kodierung

Beispiel: Entropie (1)

Angepaßte Entropie der Sequenz „abaabcda“ unter dem Modell

a=50%, b=25%, c=12,5%, d=12,5%. (Modell mit korrektem PM)

18.03.2002 Eric Bodden, Malte Clasen, Joachim Kneis 10

Proseminar DatenkompressionThema : Arithmetische Kodierung

Beispiel: Entropie (2)

Angepaßte Entropie der Sequenz „abaabcda“ unter dem Modell

a=12,5%, b=12,5%, c=50%, d=25% (Modell mit schlechtem PM)

18.03.2002 Eric Bodden, Malte Clasen, Joachim Kneis 11

Proseminar DatenkompressionThema : Arithmetische Kodierung

Definition: Kodierer/Dekodierer

Kodierer:

• Algorithmus, der eine gegebene Sequenz S kodiert

• Ausgabe: Code(S)

Dekodierer:

• Algorithmus, der S wieder aus Code(S) herstellt

18.03.2002 Eric Bodden, Malte Clasen, Joachim Kneis 12

Proseminar DatenkompressionThema : Arithmetische Kodierung

Einführung: Kodierung

• Relative Häufigkeiten aller Symbole über Alphabet A ergeben addiert 1

• Einzelne relative Häufigkeiten können als Teilintervalle von [0,1) aufgefasst werden

• Logische Konsequenz: Überschneidungsfreies Verteilen der Teilintervalle über das Gesamtintervall

• Resultat: Partition von [0,1)

18.03.2002 Eric Bodden, Malte Clasen, Joachim Kneis 13

Proseminar DatenkompressionThema : Arithmetische Kodierung

Kodierung in R: Grundidee Intervallbildung

Idee: Wahrscheinlichkeiten werden kumuliert

Dies liefert Teilintervall von [0,1) für jedes Symbol des Alphabets

a cb d

0 0,5 0,75 0,875 1

18.03.2002 Eric Bodden, Malte Clasen, Joachim Kneis 14

Proseminar DatenkompressionThema : Arithmetische Kodierung

Kodierung in R: Kumulierte Wahrscheinlichkeiten

Intervall aufteilen durch kumulierte Wahrscheinlichkeiten

dazu Definition von K(ak) für ak A:

18.03.2002 Eric Bodden, Malte Clasen, Joachim Kneis 15

Proseminar DatenkompressionThema : Arithmetische Kodierung

Intervallschachtelung

• Für das erste Symbol ordnen wir diesem ein Teilintervall zu

• Für das zweite betrachten wir dann dieses Teilintervall und partitionieren dies

• Iterieren bis Sequenzende...

• Ergebnis: Teilintervall von [0,1)

18.03.2002 Eric Bodden, Malte Clasen, Joachim Kneis 16

Proseminar DatenkompressionThema : Arithmetische Kodierung

Kodierung in R: Die Grenzen low und high

Bezeichnung der Intervallgrenzen:

•untere Grenze: low

•obere Grenze: high

Grenzen werden im weiteren Verlauf nach dem Lesen jeden Symbols aktualisiert:

18.03.2002 Eric Bodden, Malte Clasen, Joachim Kneis 17

Proseminar DatenkompressionThema : Arithmetische Kodierung

Kodierung in R: Baumartige Partitionierung

daraus resultiert: Baumartige Partitionierung von [0,1)

b c

ab c

d ab c

0 1

. . .. . . . . . . . .

s3...

18.03.2002 Eric Bodden, Malte Clasen, Joachim Kneis 18

Proseminar DatenkompressionThema : Arithmetische Kodierung

Kodierung in R: Beispiel (1)

0,5

0,25

0,3125

0,375d

0,25

0,28125

0,3125d

0,25

0,265625

0,28125

Eingabe a Eingabe b Eingabe a Eingabe a

18.03.2002 Eric Bodden, Malte Clasen, Joachim Kneis 19

Proseminar DatenkompressionThema : Arithmetische Kodierung

Kodierung in R: Beispiel (2)

0,25

0,265625

0,28125d

0,265625

0,26953125

0,2734375d

0,271484375

0,2719726563

0,2724609375d

0,2723388672

0,2723999024

0,2724609375

0,2723388672

0,2723693848

0,2723999024

Zie

linte

rva

Eingabe b Eingabe c Eingabe d Eingabe a

18.03.2002 Eric Bodden, Malte Clasen, Joachim Kneis 20

Proseminar DatenkompressionThema : Arithmetische Kodierung

Kodierung in R: Algorithmus in Pseudocode

low =0;

high=1;

do {

temp = lies_zeichen();

low‘ = Modell-> untere_Grenze(temp,low,high);

high‘ = Modell-> obere_Grenze (temp,low,high);

low = low‘;

high = high‘;

} while ( !ende_der_sequenz() );

return( wert_im_intervall(low,high) );

18.03.2002 Eric Bodden, Malte Clasen, Joachim Kneis 21

Proseminar DatenkompressionThema : Arithmetische Kodierung

Abschluß der Codesequenz

Sequenzende muß dem Dekodierer mitgeteilt werden

Möglichkeiten:

• Intervallgrenzen übertragen

• Länge der Sequenz übertragen

• Endsymbol mit minimaler Wahrscheinlichkeit im Modell bereitstellen

18.03.2002 Eric Bodden, Malte Clasen, Joachim Kneis 22

Proseminar DatenkompressionThema : Arithmetische Kodierung

Einführung: Dekodierung

• Idee: Schritte des Kodierers nachvollziehen

• Schritte laufen genau parallel zum Kodierungsvorgang

• Eingabe: Code in Form einer Zahl aus dem Zielintervall des Kodierers

• Verfahren: Überprüfen, in welches Teilintervall diese Zahl fällt, Teilintervall neu aufteilen und iterieren bis Sequenzende erreicht

18.03.2002 Eric Bodden, Malte Clasen, Joachim Kneis 23

Proseminar DatenkompressionThema : Arithmetische Kodierung

Dekodierung in R: Beispiel (1)

0,5

0,25

0,3125

0,375d

0,25

0,28125

0,3125d

0,25

0,265625

0,28125

Ausgabe a Ausgabe b Ausgabe a Ausgabe a

18.03.2002 Eric Bodden, Malte Clasen, Joachim Kneis 24

Proseminar DatenkompressionThema : Arithmetische Kodierung

Dekodierung in R: Beispiel (2)

0,25

0,265625

0,28125d

0,265625

0,26953125

0,2734375d

0,271484375

0,2719726563

0,2724609375d

0,2723388672

0,2723999024

0,2724609375

0,2723388672

0,2723693848

0,2723999024

Zie

linte

rva

Ausgabe b Ausgabe c Ausgabe d Ausgabe a

18.03.2002 Eric Bodden, Malte Clasen, Joachim Kneis 25

Proseminar DatenkompressionThema : Arithmetische Kodierung

Dekodierung in R: Algorithmus in Pseudocode

Eingabe: „Zahl“

seq ='';low =0;high =1;do{

low‘ = modell->untere_grenze(Zahl,low,high);high‘ = modell->obere_grenze (Zahl,low,high);low = low‘;high = high‘;seq .= modell->symbol_zu_intervall(low,high);

}while ( !ende_der_sequenz() );return(seq);

18.03.2002 Eric Bodden, Malte Clasen, Joachim Kneis 26

Proseminar DatenkompressionThema : Arithmetische Kodierung

Zusammenfassung

Bisher:

• Kodierung über reellen Zahlen

• [0,1) in Teilintervalle aufteilen

• sukzessive Intervalle aufziehen

Problem:

• unendliche Genauigkeit vorausgesetzt

18.03.2002 Eric Bodden, Malte Clasen, Joachim Kneis 27

Proseminar DatenkompressionThema : Arithmetische Kodierung

Kodierung mittels Integers (Implementierung)

Warum Integers?• keine unendlichen reellen Zahlen im Rechner• Integer in einfachen CPU schneller als Float• geringer Speicherbedarf

Konsequenz• diskretes Intervall: [0,max_int] , max_int N• max_int: größter darstellbarer Integerwert

18.03.2002 Eric Bodden, Malte Clasen, Joachim Kneis 28

Proseminar DatenkompressionThema : Arithmetische Kodierung

Die Wahrscheinlichkeitsgrenzen low_count und high_count

Wahrscheinlichkeitsgrenzen entsprechend anpassen:

low_count = low * total

high_count = high * total

total = Summe der

Häufigkeiten der Symbole

low

high

total

low_count

high_count

18.03.2002 Eric Bodden, Malte Clasen, Joachim Kneis 29

Proseminar DatenkompressionThema : Arithmetische Kodierung

Der Kodierer

3 statische Variablen• mLow = untere Grenze (0)• mHigh = obere Grenze (max_int)• mStep = Schrittweite

Interface

void Encoder( unsigned int low_count,

unsigned int high_count,

unsigned int total );

18.03.2002 Eric Bodden, Malte Clasen, Joachim Kneis 30

Proseminar DatenkompressionThema : Arithmetische Kodierung

Grenze

m Low

m H ighm ax_ in t

low _count

h igh_count

tota l

m Low

m H igh

m ax_ in t

18.03.2002 Eric Bodden, Malte Clasen, Joachim Kneis 31

Proseminar DatenkompressionThema : Arithmetische Kodierung

Beispiel: Kodierung

„a“:Encode( 0, 4, 8 ); [Pa=4,Pb=2,Pc=1,Pd=1]

mStep = ( mHigh - mLow + 1 ) / total;= ( 127 - 0 + 1) / 8= 128 / 8 = 16

mHigh = mLow + mStep * high_count - 1;= 0 + 16 * 4 - 1= 64 – 1 = 63

mLow = mLow + mStep * low_count;= 0 + 16 * 0 = 0

18.03.2002 Eric Bodden, Malte Clasen, Joachim Kneis 32

Proseminar DatenkompressionThema : Arithmetische Kodierung

Der Dekodierer

Interface:

Wahrscheinlichkeitsintervall bestimmen

uint Decode_Target( unsigned int total );

Encoder nachbilden

void Decode( unsigned int low_count,

unsigned int high_count );

18.03.2002 Eric Bodden, Malte Clasen, Joachim Kneis 33

Proseminar DatenkompressionThema : Arithmetische Kodierung

Beispiel: Dekodierung (1)

Decode_Target( 8 ); [Pa=4,Pb=2,Pc=1,Pd=1]

mStep = ( mHigh - mLow + 1 ) / total;= ( 127 - 0 + 1 ) / 8= 128 / 8 = 16

value = ( mBuffer - mLow ) / mStep;= ( 40 - 0 ) / 16= 40 / 16 = 2return value; // 2 [0,4) = „a“

18.03.2002 Eric Bodden, Malte Clasen, Joachim Kneis 34

Proseminar DatenkompressionThema : Arithmetische Kodierung

Beispiel: Dekodierung (2)

Decode( 0, 4 ); [Pa=4,Pb=2,Pc=1,Pd=1]

mHigh = mLow + mStep * high_count - 1;= 0 + 16 * 4 - 1= 64 – 1 = 63

mLow = mLow + mStep * low_count;= 0 + 16 * 0 = 0

18.03.2002 Eric Bodden, Malte Clasen, Joachim Kneis 35

Proseminar DatenkompressionThema : Arithmetische Kodierung

Problem: Begrenzt genaue Arithmetik

Problem:

• Bei bisherigem Verfahren wird betrachtetes Intervall beliebig klein.

• Folge: total > mHigh – mLow

• also: (mHigh – mLow + 1) / total = 0

18.03.2002 Eric Bodden, Malte Clasen, Joachim Kneis 36

Proseminar DatenkompressionThema : Arithmetische Kodierung

Lösung: Skalierung des Intervalls

Aber:• Führende Stellen von mHigh und mLow gleich, also

unveränderlich

Also:• Führende Stellen schon senden/speichern• Intervall entsprechend vergrößern

Mittel dazu:• Skalierungsfunktionen

18.03.2002 Eric Bodden, Malte Clasen, Joachim Kneis 37

Proseminar DatenkompressionThema : Arithmetische Kodierung

Definition: E1-Skalierung

while( mHigh < g_Half )

{

SetBit( 0 );

mLow = mLow * 2;

mHigh = mHigh * 2 + 1;

}

* 2 entspricht Shift nach links0

0,5

0,25

18.03.2002 Eric Bodden, Malte Clasen, Joachim Kneis 38

Proseminar DatenkompressionThema : Arithmetische Kodierung

Definition: E2-Skalierung

while( mLow >= g_Half )

{

SetBit( 1 );

mLow = 2*(mLow-g_Half);

mHigh = 2*(mHigh-g_Half)+1;

}

0,5

0,75

18.03.2002 Eric Bodden, Malte Clasen, Joachim Kneis 39

Proseminar DatenkompressionThema : Arithmetische Kodierung

Problem: Was tun bei Intervallmitte?

Problem bei mittig liegendem Intervall:

• führende Stellen von mLow und mHigh bleiben längere Zeit invers zueinander

• Folge: E1/E2-Skalierung nicht anwendbar

• Also: gleiches Problem wie zuvor

18.03.2002 Eric Bodden, Malte Clasen, Joachim Kneis 40

Proseminar DatenkompressionThema : Arithmetische Kodierung

Lösung

Bei mittig liegendem Intervall:• Intervall mittig aufziehen• iterieren bis obere bzw. untere Hälfte festliegt

Folge:• E3-Skalierung

18.03.2002 Eric Bodden, Malte Clasen, Joachim Kneis 41

Proseminar DatenkompressionThema : Arithmetische Kodierung

Definition: E3-Skalierung

while( ( g_1Q <= mLow ) && ( mHigh < g_3Q ) )

{

mScale++;

mLow = 2*(mLow-g_1Q);

mHigh= 2*(mHigh-g_1Q) + 1;

}

0,5

0,25

0,75

0,5

18.03.2002 Eric Bodden, Malte Clasen, Joachim Kneis 42

Proseminar DatenkompressionThema : Arithmetische Kodierung

Beispiel: E3-Skalierung

0,5

0,25

0,75

0,5

0,375

0,625

0,5

0,375

0,5

0,4375

Schritt 1 Schritt 2 Schritt 3

E3, E3, E1

18.03.2002 Eric Bodden, Malte Clasen, Joachim Kneis 43

Proseminar DatenkompressionThema : Arithmetische Kodierung

Beispiel: Gleichheit von E1 E3^n und E2^n E1

0,5

0,25

0,5

0,375

0,5

0,4375

Schritt 1 Schritt 2 Schritt 3

Anwendung von E1, E2, E2 (also 011)

18.03.2002 Eric Bodden, Malte Clasen, Joachim Kneis 44

Proseminar DatenkompressionThema : Arithmetische Kodierung

Beweis der Gleichheit (1)

Formalisierung dieser Gleichheit durch Hintereinanderausführung der Abbildungen:

18.03.2002 Eric Bodden, Malte Clasen, Joachim Kneis 45

Proseminar DatenkompressionThema : Arithmetische Kodierung

Beweis der Gleichheit (2)

18.03.2002 Eric Bodden, Malte Clasen, Joachim Kneis 46

Proseminar DatenkompressionThema : Arithmetische Kodierung

Beweis der Gleichheit (3)

18.03.2002 Eric Bodden, Malte Clasen, Joachim Kneis 47

Proseminar DatenkompressionThema : Arithmetische Kodierung

Auflösung E3-Skalierung (1)

Bisher nur E3-Skalierungen mitgezählt.

Nun, wo die Hälfte feststeht, noch entsprechende Bits ausgeben:while( ( mHigh < g_Half ) || ( mLow >= g_Half ) ) {

if( mHigh < g_Half ) // E1{

SetBit( 0 );mLow = mLow * 2;mHigh = mHigh * 2 + 1;for(; mScale > 0; mScale-- )SetBit( 1 ); // 1 == !0

}...}

18.03.2002 Eric Bodden, Malte Clasen, Joachim Kneis 48

Proseminar DatenkompressionThema : Arithmetische Kodierung

Auflösung E3-Skalierung (2)

while( ( mHigh < g_Half ) || ( mLow >= g_Half ) ) {

...

else if(mLow >= g_Half ) // E2

{

SetBit( 1 );

mLow = 2 * ( mLow - g_Half );

mHigh = 2 * ( mHigh - g_Half ) + 1;

for(; mScale > 0; mScale-- )

SetBit( 0 ); // 0 == !1

}

18.03.2002 Eric Bodden, Malte Clasen, Joachim Kneis 49

Proseminar DatenkompressionThema : Arithmetische Kodierung

Dekodierer: Buffer auch skalieren

Im Dekoder muß der Buffer noch nachskaliert werden:

// E1

mBuffer = 2 * mBuffer + GetBit();

// E2

mBuffer = 2 * (mBuffer-g_Half) + GetBit();

// E3

mBuffer = 2 * (mBuffer-g_1Q) + GetBit();

18.03.2002 Eric Bodden, Malte Clasen, Joachim Kneis 50

Proseminar DatenkompressionThema : Arithmetische Kodierung

Zusammenfassung Kodierer

Kodierer:

void Encode( unsigned int low_count, unsigned int high_count, unsigned int total );

void EncodeFinish();

EncodeFinish() schließt die Sequenz korrekt ab.

18.03.2002 Eric Bodden, Malte Clasen, Joachim Kneis 51

Proseminar DatenkompressionThema : Arithmetische Kodierung

Abschluß der Codesequenz

if( mLow < g_1Q ) // mLow < 1Q < Half <= mHigh{

SetBit( 0 ); // 1 + e3-Skalierung abbauen

for( int i=0; i<mScale+1; i++ ) SetBit( 1 );}else // mLow < Half < 3Q <= mHigh{ SetBit( 1 ); // der Decoder fügt die Nullen automatisch an}

18.03.2002 Eric Bodden, Malte Clasen, Joachim Kneis 52

Proseminar DatenkompressionThema : Arithmetische Kodierung

Zusammenfassung Dekodierer

Dekodierer:

void DecodeStart()=

for( int i=0; i<31; i++ )

mBuffer = ( mBuffer << 1 ) | GetBit();

uint DecodeTarget(unsigned int total );

void Decode(unsigned int low_count, unsigned int high_count );

18.03.2002 Eric Bodden, Malte Clasen, Joachim Kneis 53

Proseminar DatenkompressionThema : Arithmetische Kodierung

Effizienzbetrachtung (1)

Länge des Codes für jedes Symbol ai A kann wie folgt beschränkt werden:

Im folgenden: Wahrscheinlichkeiten über Sequenzen anstatt

Symbolen betrachten. l(x)

18.03.2002 Eric Bodden, Malte Clasen, Joachim Kneis 54

Proseminar DatenkompressionThema : Arithmetische Kodierung

Effizienzbetrachtung (2)

18.03.2002 Eric Bodden, Malte Clasen, Joachim Kneis 55

Proseminar DatenkompressionThema : Arithmetische Kodierung

Effizienzbetrachtung (3)

Durchschnittliche Länge >= Entropie

Also durchschnittliche Länge pro Symbol:

18.03.2002 Eric Bodden, Malte Clasen, Joachim Kneis 56

Proseminar DatenkompressionThema : Arithmetische Kodierung

Effizienzbetrachtung (4)

Entropie der Sequenz S(m) mit |S(m)|=m ist m-fache Entropie der Symbole x:

Es folgt:

18.03.2002 Eric Bodden, Malte Clasen, Joachim Kneis 57

Proseminar DatenkompressionThema : Arithmetische Kodierung

Effizienzbetrachtung – Vergleich Huffman

Für Huffman bekannt:

Für Extended Huffman:

18.03.2002 Eric Bodden, Malte Clasen, Joachim Kneis 58

Proseminar DatenkompressionThema : Arithmetische Kodierung

Nachteile gegenüber der Huffman-Kodierung

Nachteil bei sequentieller Kodierung:Wird ein Bit falsch empfangen, so ist der gesamte nachfolgende Code nicht korrekt dekodierbar.

Huffman unter Umständen speicher-effizienter bei:

• großen Alphabeten und kurzen Sequenzen[(0,086+Pmax)* HM(S) ] oder

• Wahrscheinlichkeiten von P(a)=2n

Arithmetische Kodierung i.a. etwas langsamer als Huffman

18.03.2002 Eric Bodden, Malte Clasen, Joachim Kneis 59

Proseminar DatenkompressionThema : Arithmetische Kodierung

Vorteile gegenüber der Huffman-Kodierung

• Meist höhere Speichereffizienz,auch in Bezug auf Arbeitsspeicher

• Grund: Vergabe unganzzahliger Bitlängen sowie Nutzung konstant großen Arbeitsspeichers

• Noch effizienter für kleine Alphabete

• Leichtes Aufsetzen verschiedener Modelle möglich

• Adaptive Modelle leichter zu implementieren

18.03.2002 Eric Bodden, Malte Clasen, Joachim Kneis 60

Proseminar DatenkompressionThema : Arithmetische Kodierung

Alternative Modelle

• Statische Modelle• Feste angenommene Wahrscheinlichkeitsverteilung

• Adaptive Modelle• Wahrscheinlichkeiten werden beim Lesen jedes

Symbols neu berechnet• Vorteile:

Modell muss nicht übertragen werden Modell passt sich den Daten an

18.03.2002 Eric Bodden, Malte Clasen, Joachim Kneis 61

Proseminar DatenkompressionThema : Arithmetische Kodierung

Order-n-Modelle

Betrachtung der Wahrscheinlichkeiten im Kontext der letzten n Symbole

Beispiel:

„u“ an sich: Wahrscheinlichkeit 4,35 %

„u“ nach „q“: Wahrscheinlichkeit 99 %

genauere Vorhersage durch Kontext

18.03.2002 Eric Bodden, Malte Clasen, Joachim Kneis 62

Proseminar DatenkompressionThema : Arithmetische Kodierung

PPM

Order „0..n“

• Symbol in Order-n-Kontext: Kodiere Symbol

• Sonst: Wechsel zu n-1-Kontext

• Order -1: Speichere Symbole in Gleichverteilung

Für jeden Kontext eigene Verteilung

18.03.2002 Eric Bodden, Malte Clasen, Joachim Kneis 63

Proseminar DatenkompressionThema : Arithmetische Kodierung

PPM (2)

Probleme

• Order-Wechsel für Decoder kennzeichnen

• hoher Speicherbedarf

Vorteile

• praktisch bestmögliche Kompression (neben BWT)

• gut auch bei kleinen Dateien ( < 1 Mb )

18.03.2002 Eric Bodden, Malte Clasen, Joachim Kneis 64

Proseminar DatenkompressionThema : Arithmetische Kodierung

Zusammenfassung

Arithmetische Kodierung ist zur Kompression geeignet

Implementierung mit Integers oder Floats möglich

Sequentielles Arbeiten ist möglich und sinnvoll

Dazu Methode des Scaling erforderlich

Verfahren sehr effizient für realistische Quellen

Möglichkeit des modularen Austauschs von Modellen

Sehr gut für adaptive Modelle, Erweiterungen wie PPM

18.03.2002 Eric Bodden, Malte Clasen, Joachim Kneis 65

Proseminar DatenkompressionThema : Arithmetische Kodierung

Ausblicke

Range Coder:

• Benutzt ganze Bytes statt Bits für Skaling-Methoden

• Resultat: Bis zu 50% schneller bei nur 0,01% längerem Code

In Zukunft:

• aufgrund schnellerer Float-Operationen (z.B. Itanium)eher Entwicklung in diese Richtung, weg von Integer-Arithmetik

18.03.2002 Eric Bodden, Malte Clasen, Joachim Kneis 66

Proseminar DatenkompressionThema : Arithmetische Kodierung

Implementierung

Implementierung in C++

• Einfacher Kodierer / Dekodierer

• Auswahl verschiedener Modelle möglich

• Visualisierung mit Kodierer als DLL

• Download möglich unter:http://ac.bodden.de

top related

proseminar datenkompression thema : arithmetische kodierung 18.03.2002eric bodden, malte clasen,...

Documents

multimedia- technik prof. dr. peter kneisel ! inhalt...

unser kodierung und vergÜtung in der ......kodierung und...

1. summercamp „kodierung in der inneren medizin“ ·...

medizinische informatik 5. kodierung und klassifikation

video kodierung und anwendungen in der sicherheitstechnik

binder m12 a-kodierung · binder m12 a-kodierung 50 m12...

datenkompression: arithmetische codierung h. fernau · h....

kodierung und vergÜtung in der ... - medtronic.com€¦ ·...

verstehen. Übersicht 1.enkodierung und elaboration...

1 sprachprobleme ?. 2 grundlagen der...

visuelle kodierung christian b. mendl unabhängige...

u555 messumformer für arithmetische wechselspannungs …

sekretariate - uni-muenster.de€¦ · web...

einheitlichen kodierung von verfügbarkeitsinformationen mit...

kapitel 2 kodierung 2.1 kodierung von zeichen 2.2 kodierung...

kodierung und vergÜtung in der stationÄren … · 6 1.2...

leitfaden zur kodierung nach swissdrg 2016 ·...

multifaktorielle kodierung und kontexteffekte in der...

fallstricke und nutzen bei der kodierung von

praktikum bkspp: [2ex] blatt 2 - goethe university...