hauptkomponentenanalyse und ihre anwendung zur ... · ein verfahren der multivariaten statistik, um...

Hauptkomponentenanalyse und ihre Anwendung zur Klassifizierung

von Spermien aus Raman Mikrospektroskopie-Daten

Bachelorarbeit zur Erlangung des akademischen Grades

2-Fach-Bachelor

Westfälische Wilhelms-Universität Münster Fachbereich Mathematik und Informatik

Institut für Numerische und Angewandte Mathematik

Betreuung: Prof. Dr. Martin Burger Eingereicht von: Julia Sietmann Münster, 28.06.2012

Eidesstattliche Erklärung Hiermit versichere ich, Julia Sietmann, dass ich die vorliegende Arbeit mit dem Titel

Hauptkomponentenanalyse und ihre Anwendung zur Klassifizierung von Spermien aus Raman

Mikrospektroskopie-Daten

selbständig verfasst habe, und dass ich keine anderen Quellen und Hilfsmittel als die

angegebenen benutzt habe. Gedanklich, inhaltlich oder wörtlich Übernommenes habe ich

durch Angabe von Herkunft und Text oder Anmerkung belegt bzw. kenntlich gemacht. Dies

gilt in gleicher Weise für Bilder, Tabellen, Zeichnungen und Skizzen, die nicht von mir selbst

erstellt wurden.

Alle auf der CD beigefügten Programme sind in Anlehnung an die von Prof. Dr. Burger zu

Verfügung gestellten Programme und sind von mir erweitert und verändert worden.

Münster, 28.06.2012 _________________________________ Unterschrift

Inhaltsverzeichnis

1. Einleitung ........................................................................................................................... 1 2. Hauptkomponentenanalyse ................................................................................................ 2

2.1. Allgemeines ............................................................................................................... 2 2.2. Statistische Grundbegriffe.......................................................................................... 2 2.3. Herleitung................................................................................................................... 4 2.4. Eigenschaften der Hauptkomponenten ...................................................................... 7 2.5. Probleme der PCA ..................................................................................................... 8 2.6. Kernel-PCA ................................................................................................................ 9

3. Spermienmorphologie ...................................................................................................... 11 3.1. Allgemein ................................................................................................................. 11 3.2. Der Kopf des Spermiums ......................................................................................... 11

3.2.1. Nukleus ............................................................................................................ 11 3.2.2. Akrosomregion ................................................................................................ 12 3.2.3. Mittlere Äquatorialebene ................................................................................. 13 3.2.4. Postacrosomaler Bereich .................................................................................. 13

3.3. Flagellum ................................................................................................................. 13 3.3.1. Verbindungsstück zwischen Kopfregion und Mittelstück ............................... 14 3.3.2. Mittelstück ....................................................................................................... 14 3.3.3. Hauptteil ........................................................................................................... 14

3.4. Spermien-Chromatin ................................................................................................ 14 3.4.1. Aufbau und Vergleich mit somatischen Chromatin ......................................... 15 3.4.2. Anfälligkeit und Spermien-Chromatin-Tests ................................................... 16

4. Verfahren der Reproduktion ............................................................................................ 17 5. Raman-Spektroskopie zur Analyse der Spermienqualität ............................................... 18

5.1. Raman-Spekroskopie ............................................................................................... 18 5.2. Bisherige Erkenntnisse in der Klassifizierung von Spermien mittels Raman Mikrospektroskopie- Daten...................................................................................... 19 5.3. Hauptkomponentenanalyse mit Raman Mikrospektroskopie-Daten von Mäusespermien ........................................................................................................ 22 5.4. Visualisierungen....................................................................................................... 23 5.4.2. UPEC2 ................................................................................................................. 25 5.4.3. UPEC3 ................................................................................................................. 27 5.4.4. UPEC4 ................................................................................................................. 30 5.4.5. UPEC5 ................................................................................................................. 32 5.5. Klassifizierung ......................................................................................................... 34

6. Zusammenfassung und Ausblick ..................................................................................... 36 7. Literaturverzeichnis ......................................................................................................... 38 8. Abbildungsverzeichnis ..................................................................................................... 41

1

1 Einleitung

In der heutigen, industriellen Gesellschaft sinkt bei den Männern die Spermienqualität und es

steigt somit die Nachfrage nach der unterstützenden Reproduktion, wie beispielsweise die

intracytoplasmatischen Spermatozoeninjektion (ICSI). Dabei kommt es zur Injektion des

Spermiums in die Eizelle. Dies hat den Vorteil, dass die Akrosomreaktion eines Spermiums

nicht durchlaufen werden muss. Diese Reaktion beinhaltet die Ausschüttung von

hydrolytischen Enzymen aus dem Akrosom, um in die Eizelle zu gelangen. Dabei sind die

Zellen der Corona radiata zu passieren und eine Proteinhülle, die Zona pellucida, der Eizelle

zu durchdringen. Ebenso werden die Bindung an die Eizelle und die Fusion mit der Eizelle

umgangen. (vgl. [6], [17])

Die bisherigen Kenntnisse zur Klassifizierung von Spermien sind häufig rein morphologisch

und sind in Hinblick auf die Reaktionen zwischen Eizelle und Spermium aufgestellt worden.

Bei der ICSI wird die primäre Reaktion zwischen Eizelle und Spermium umgangen, so dass

verstärkt ein Blick auf das Innere von Spermien geworfen wird. Die Morphologie von

Spermien sagt selten etwas über die innere Zusammensetzung und Schäden in der DNA aus

und initiierte daher zahlreiche chemische Analysen. Diese wiederum schädigen häufig die

untersuchten Spermien und nützen der ICSI wenig. (vgl. [8])

Die Entwicklung eines Verfahrens zur Klassifizierung von Spermien ohne Zellschädigungen

ist daher essentiell. Die Raman Mikrospektroskopie in Verbindung mit der

Hauptkomponentenanalyse ist ein erfolgsversprechendes Verfahren zur Analyse der

chemischen Zusammensetzung und anschließenden Klassifizierung der Spermien.

Im dieser Arbeit wird zunächst die mathematische Methode der Hauptkomponentenanalyse

mit ihren Vor- und Nachteilen erklärt. Als weiterführende Methode wird die Kernel-

Hauptkomponentenanalyse erläutert.

Anschließend wird der Aufbau von Spermien im Detail und die strukturellen Bedeutungen für

die Befruchtung erläutert.

Der vierte Abschnitt beschreibt kurz die verschiedenen Verfahren der Reproduktion.

Im fünften Abschnitt werden die Studien zur Klassifizierung von Spermien anhand von

Raman Mikrospektroskopie-Daten vorgestellt und anschließend die eigene Bearbeitung von

Daten erläutert und interpretiert. Klassifizierung bedeutet hier befruchtungsfähige Spermien

von infertilen Spermien zu unterscheiden und anhand von Kriterien zu bewerten.

Abschließend werden die Informationen der Arbeit zusammengeführt und ihre Bedeutung in

der Reproduktionsmedizin gezeigt.

2

2 Hauptkomponentenanalyse

2.1 Allgemeines

Die Hauptkomponentenanalyse (Englisch: Principal component analysis; kurz: PCA) ist

ein Verfahren der multivariaten Statistik, um Datensätze zu veranschaulichen und zu

reduzieren. Dabei handelt es sich um Transformationen des Koordinatensystems, die es

ermöglichen, die meist mehrdimensionalen Daten nach ihren Varianzen und Bedeutungen

zu sortieren. Im Bereich der experimentellen Naturwissenschaften werden Versuchsreihen

in einem Koordinatensystem aufgetragen. Bei linearen Zusammenhängen wurden zur

Verdeutlichung Regressionsgeraden eingetragen. Nun werden anstatt eindimensionaler

Regressionen der y-Achse auch mehrdimensionale vorgenommen (vgl. [19]). Dies erfolgt

über Achsentransformationen, so dass die Kovarianzen der mehrdimensionalen Merkmale

in den jeweiligen Richtungen maximiert (vgl. [3]) und gleichzeitig die Abstände der

Punkte zu den Projektionen minimiert werden. Die Transformationsmatrix besteht aus den

Eigenvektoren der Kovarianzmatrix, so dass man schließlich auf das Eigenwertproblem

stößt.

Wie erwähnt dient die PCA auch der Sortierung der Daten nach ihrer Bedeutung, daher

findet die Analyse nicht nur in den Wissenschaften ihren Nutzen, sondern auch in anderen

Gebieten. Beispielsweise basiert der Google-Algorithmus auf der Hauptkomponenten-

analyse, da es die Ähnlichkeit aller Texte zu den eingegebenen Wörtern misst und

anschließend mittels der PCA nach ihrer Bedeutung sortiert (vgl. [19]).

2.2 Statistische Grundbegriffe

Da die Hauptkomponentenanalyse ein Verfahren der multivariaten Statistik ist, sollten im

Vorfeld für das Verständnis einige Begriffe aus dem Bereich erklärt werden.

Vektoren x und y seien stets aus dem n und es wird das Standardskalarprodukt

verwendet, folglich heißt es: yxyx T , wobei Tx der transponierte Vektor von x

ist.

Seien x1,…,xp n zufällige Beobachtungspunkte der Dimension n, die p Merkmale und

n verschiedene Messreihen umfassen.

Alle Messreihen zusammengestellt in eine Datenmatrix ergeben X pn mit

)x,,x(X p1 .

3

Um eine Zentrierung der Daten mithilfe des arithmetischen Mittels μ vorzunehmen,

berechnet man die arithmetischen Mittelwerte aller Spalten. Die zentrierte Datenmatrix

hat dann die Gestalt:

pnp2n21n1

p2p222121

p1p212111

μxμxμx

μxμxμx

μxμxμx

Z pn mit

n

1iijj x

n

1μ , j= 1,…,p .

Zur Analyse der Streuung der Messpunkte um den Mittelwert wird im Allgemeinen die

Varianz genutzt, die quadratisch die Abstände misst. Die Kovarianz berechnet die

Streuung im Zusammenhang von zwei Merkmalen, wohingegen die Varianz nur ein

Merkmal betrachtet. Die Kovarianzmatrix ppK umfasst alle Kovarianzen und

Varianzen und berechnet sich wie folgt:

n

1ikikjijkjjk )μ)(xμ(x

1n

1) x,Kov(xK , pkj ,...,1, und ppT ZZ

1n

1K

.

Es ist ersichtlich, dass die Matrix symmetrisch ist, da Kij =Kji pji ,...,1, und es gilt

für diese reelle Matrix KTK=KKT. Daraus schließt sich nach Sätzen der linearen Algebra,

dass K nur reelle Eigenwerte besitzt und die Eigenvektoren senkrecht zueinander sind.

Ebenso bilden die Eigenvektoren eine Basis des p .

)()(

),(,

ji

jixx

xVarxVar

xxKovr

ji

bezeichnet man als Korrelationskoeffizient und gibt

Aufschluss über die linearen Zusammenhänge der

Merkmale. Geometrisch betrachtet, bezeichnet der

Korrelationskoeffizient den Winkel zwischen den

beiden Merkmalsvektoren, denn

1,1)cos(

)μ)(xμ(x1n

1)μ)(xμ(x

1n

1

)μ)(xμ(x1n

1

)()(

),(

n

1ikikkik

n

1ijijjij

n

1ikikjij

,

ji

jT

i

ji

jixx

zz

zz

xVarxVar

xxKovr

ji

α

zi

zj

Abbildung 1: Beziehung von Vektoren

4

Wenn der Koeffizient -1 oder 1 ergibt, heißt das also, dass die Vektoren auf einer Geraden

liegen, bei einem Korrelationskoeffizienten von 0 liegt ein rechter Winkel vor und die

beiden Vektoren werden als unkorreliert bezeichnet. Da der Nenner ungleich null ist,

muss bei unkorrelierten Vektoren die Kovarianz null sein. Dies wird in der Herleitung der

Hauptkomponentenanalyse gebraucht. (vgl. [12])

2.3 Herleitung

Seien wie in Abschnitt 2.2 beschrieben x1,…,xp n zufällige Beobachtungspunkte, die

in einer Datenmatrix X zusammengestellt werden. Dabei beschreibt eine Spalte ein

Merkmal. Nach einer Zentrierung der Datenmatrix ergibt sich Z.

Im zweidimensionalen Raum ist es leicht vorstellbar,

dass eine optimale Approximation eines Datensatzes

eine Projektion p auf einen Vektor v ist, wobei die

Abstände zu den Punkten z minimal sind.

Nach der Abbildung gilt:

y

vc

y

p(α

)cos

v

y)cos(c .

Durch diese Umformung nach dem Streckungsfaktor c erhält man durch Einsetzen in die

Projektionsgleichung folgendes:

2)cos(

v

vy

v

y

yv

vy

v

yvcp

TT

Wenn man für v die Länge eins wählt, so ist p mit der Länge c gleichzusetzen und die

Projektion p lässt sich berechnen:

vvyvv

vyp T

T

)(2

.

Nun soll der Abstand zu allen Punkten n1,...,i,z p1i , zur Projektion p1p ,

minimal sein unter der Bedingung, dass der Vektor v die Länge eins besitzt. Da zi ein

Zeilenvektor ist, gilt für die Projektionsgleichung mit einem Spaltenvektor v:

Ti vvzp )( .

Damit lässt sich nun die Extremalbedingung aufstellen und es lässt sich zeigen, dass die

Minimierung der Abstände mit der Maximierung der Varianz gleichzusetzen ist.

y

α

v p =c·v

y-p

Abbildung 2: Projektion

5

1 )()1(min

1 min

1 )()(min

1 )(min

1 )(min

1 )()()()()(min

1 ))(()()())((min

1 ))(())((min

1 )()(min

1 1

1 1

1 1

1

11

1

1

1

vKvvKSpurn

vvzzvzz

vvzvzzz

vvzvzzz

vvzvzzz

vvzvvvzvzvzvzvzzz

vvvzvvzzvvzvvzzzz

vvvzzvvzz

vpzpz

T

v

n

i

n

ii

Ti

TTii

v

n

i

n

ii

Ti

Tii

v

n

i

n

i

Tii

Tii

v

Ti

n

ii

Tii

v

Ti

Ti

Tii

Ti

n

ii

Tii

v

TTi

Ti

Ti

Ti

TTi

n

ii

Tii

v

TTii

n

i

Tii

v

n

ii

Ti

v

p

p

p

p

p

p

p

p

p

Wobei K die Kovarianzmatrix von X ist. Die Spur einer Matrix beschreibt die Summe der

Diagonalelemente und ist unabhängig von v. Daher ist der Ausdruck minimal, wenn

KvvT für ein pv , 1v , maximal wird. (vgl. [12])

Wenn man den Ausdruck KvvT maximiert, heißt dies nicht nur die Abstände der

Datenpunkte zur Projektion zu minimieren, sondern auch die Varianz entlang der

Projektion zu maximieren, denn es gilt:

1)(max

1)(1

1max1

1

1max1max

vZvVar

vZvZvn

vZvZn

vvKvv

p

ppp

v

T

v

TT

v

T

v

und für die nicht zentrierte Datenmatrix

1)(max1)(1

1max1)(

1

1max

vXvVarvXvXv

nvZvZv

n ppp v

T

v

T

v

Zur Maximierung lässt sich mithilfe des Lagrange-Multiplikators das Lagrange-

Funktional ohne Nebenbedingung aufstellen:

),( vL )1( vvKvv TT mit ,pv .

Die Maximierung des Lagrange-Funktionals erfolgt mit der notwendigen Bedingung für

Extremstellen. Daher wird das Differential nach pv gebildet und gleich null gesetzt.

6

0),(

v

vL

vKv

vKv

0

.

Damit ist der ideale, p-dimensionale Vektor v, auf dem die Projektion vorgenommen

wird, ein Eigenvektor (EV) von K und der Lagrange-Multiplikator ein Eigenwert (EW)

von K. Die Maximierung des Problems erfolgt alleine mithilfe des größten

Eigenwertes [16]) (vgl. :

Kvon EWgrößter ist λ λmax

K von EV vK,EW von ist λ , v1,vvλvmax

K von EV vK,EW von ist λ , v1,vλvvmax

v,1vKvvmax

pT

pT

pT

Nun steht die erste, p-dimensionale Projektionsebene v fest. Setze v= v1. Um die zweite,

p-dimensionale Projektionsebene zu ermitteln, sucht man wieder einen Vektor v2p ,

der den Ausdruck v2TKv2 maximiert. Der p-dimensionale Vektor v2 sollte die Länge eins

haben und unkorreliert zu v1 sein. Unkorreliert heißt, dass die Vektoren orthogonal

zueinander stehen, also v1T· v2=0. Durch Aufstellen des Lagrange-Funktionals und dem

anschließenden Differenzieren folgt:

,,mit )1(),,( 122222pTTT vvvvvKvvvL

und es gilt nach Differenzierung:

122

),,(vvKv

v

vL

.

Durch null setzen des Differentials und linksseitige Multiplikation mit v1T kommt heraus,

dass null ist:

0

0

0

0

0

nach 0

21

1

11

0

2121

112121

122

Kvv

vvvvKvv

vvλvvKv v

vvKv

T

TTT

TTT

Da man voraussetzt, dass die Kovarianz der Vektoren null ist, erschließt sich *:

0),()(1

1212121

ZvZvKovZvZv

nKvv TT

7

Daher ergibt sich wieder

2222 0 vKvvKv

und damit ist v2 ein Eigenvektor von der Kovarianzmatrix K. (vgl. [5])

Fortsetzung bis vp liefert p Projektionsebenen, wobei vi, i=1,…,n, stets die Eigenvektoren

der Kovarianzmatrix K sind. Die Eigenvektoren der Kovarianzmatrix K bilden eine Basis

des p aufgrund der Symmetrie von K. Die Hauptkomponenten und damit die neuen

Achsen des Koordinatensystems erhält man nach der Definition der Projektion p,

vvyp T )( , y ein Spaltenvektor, durch Multiplikation des i-ten Vektors vi mit dem i-ten

Basisvektoren ei des ursprünglichen Koordinatensystems: (eiT·vi)·vi, i=1,…,p. Zur

Drehung der Datenmatrix X oder der zentrierten Datenmatrix Z mittels der Matrix V aus

den Eigenvektoren von K ergibt sich die Gleichung: pnVXX ~ bzw.

pnVZZ ~. (vgl. [12])

2.4 Eigenschaften der Hauptkomponenten

Nach dem Berechnen der Hauptkomponenten liegt ein neues Koordinatensystem vor, das

zentriert in der Punktwolke gelegen ist.

Für die Kovarianzmatrix des transformierten Systems ergibt sich gemäß der Formel, dass

sich die Varianz aus den Eigenvektorenmatrix V und der Kovarianzmatrix von X

zusammensetzt:

VKV

VZZVn

VZVZn

ZZn

K

T

TT

T

T

1

1

)()(1

1

~~

1

1~

.

Sei die Matrix p eine Diagonalmatrix mit den Eigenwerten der Kovarianzmatrix K,

so gilt unter der Verwendung, dass die Eigenvektoren eine Orthonormalbasis (ONB)

bilden:

I

T

V

T

EW

T VVVVVKVK ONB

~.

Daraus erschließt sich, dass die Varianzen der Hauptkomponenten die Eigenwerte sind

und die Hauptkomponenten unkorreliert zueinander sind:

[12]) (vgl. .

0 ji

jiK i

ij

8

Dieses Wissen ermöglicht eine Reduktion eines Koordinatensystems, denn die erste

Hauptkomponente besitzt die größte Varianz bzw. den größten Eigenwert λ1 und

absteigend dann die letzte Hauptkomponente die geringste Varianz bzw. den kleinsten

Eigenwert λp. Dementsprechend haben die ersten k-Hauptkomponenten den größten

Anteil an der Gesamtvarianz und demonstrieren ein großes Maß an Streuung. Der Anteil

an der Gesamtvarianz aj für die j-te Hauptkomponente ermittelt sich folgenderweise:

)(...21

Spura j

p

jj

.

Ist nun das Ziel, die Daten beispielsweise auf ein Anteil von 80% der Gesamtvarianz zu

reduzieren, so ermittelt man ein pq , das folgende Gleichung erfüllt:

)(

...8,0 21

Spurq

.

Nun wird der Reduktionsschritt durchgeführt, in dem man die Matrix der Eigenvektoren

verkürzt auf qpqq vv ,...,V 1 . Die q Hauptkomponenten ergeben sich schließlich

durch Multiplikation der Datenmatrix X und der Eigenvektorenmatrix Vq:

qnqq VXX ~

,

oder wahlweise im zentrierten System durch

qnq VZZ ~

.

Auf dieser Weise vermindert man einen Datensatz mit p Merkmalen auf q Merkmale.

(vgl. [12])

Durch eine Reduktion der Daten lassen sich wichtige Varianzen und damit Unterschiede

zwischen Datensätzen verschiedener Orte, beispielsweise bei Spermien, extrahieren und

Klassifikationen vornehmen.

2.5 Probleme der PCA

Die Hauptkomponentenanalyse ist ein lineares Verfahren, dass die transformierten Achsen

entlang der größten Varianzen ausrichtet. Dabei wird vorausgesetzt, dass die Daten

normalverteilt sind und durch Linearkombinationen approximierbar sind. Im

zweidimensionalen Raum ist dies so vorzustellen, dass die Daten ungefähr in einer

ellipsenförmigen Anordnung vorliegen, wo der Mittelwert in dem Mittelpunkt der Ellipse

liegt. Die Hauptkomponenten beschreiben dann die größten und kleinsten Durchmesser

der Ellipse. Sind die Daten allerdings kreisförmig angeordnet, so kann die erste Achse

nicht entlang der größten Streuung ausgerichtet werden, da alle Varianzen gleichwertig

9

sind. Zur Analyse von Daten, die nicht linear im Koordinatensystem verteilt sind, wurde

die Kernel-PCA entwickelt. Dabei ist es möglich, jegliche Art der Verteilung in nicht-

linearen Hauptkomponenten auszudrücken. (vgl. [3])

Ebenso sind die Ergebnisse der PCA abhängig von der Skalierung der Achsen und die

Interpretationen der Ergebnisse sind subjektiv. Schließlich ist die Anzahl der

Hauptkomponenten bei einer Reduktion nicht eindeutig und hängt von der Wahl und

Absicht des Durchführenden ab. (vgl. [2])

Daher lässt sich zusammenfassend sagen, dass die Hauptkomponentenanalyse ein gutes

Verfahren zur Strukturanalyse ist, aber die Ergebnisse Modellfehler aufweisen können

und somit mit Bedacht zu interpretieren sind. (vgl. [2])

2.6 Kernel-PCA

Die Kernel-PCA ist eine Abwandlung der Hauptkomponentenanalyse, die in der Lage ist,

nicht-lineare Strukturen aus einem Datensatz zu klassifizieren und somit die PCA zu

verallgemeinern.

Als Ansatz wird eine nicht-lineare Abbildung definiert. Diese Funktion hat die Struktur

)( ,: iip zzF , wobei die p

iz 1 , i=1,…,n, Datenpunkte beschreiben, die

vom Mittelwert bereinigt sind. In der zentrierten Datenmatrix würden diese in einer Zeile

abgelesen werden. Die Funktion hat die Eigenschaft, dass die Skalarprodukte der

Funktion sich aus allen Produkten von d Einträgen der Vektoren x und y

zusammensetzen:

d ),,()()()( jid

jiji zzkzzzz ℕ, nji ,...,1, . (vgl. [13])

Damit stellt man die Kovarianzmatrix der Φ -transformierten Daten auf:

n

j

ppTjj zz

nK

1

)()(1

1.

Nun werden, wie in der normalen Hauptkomponentenanalyse, die Eigenwerte der

Kovarianzmatrix gesucht. Es wird sich zeigen, dass man wieder auf ein lineares

Eigenwertproblem stößt, was bis hierher nicht ersichtlich ist. Diese Herleitung richtet sich

nach Schölkopf (vgl. [13], [14]).

Man stelle die Eigenwertgleichung auf und zeige, dass der Eigenvektor sich als

Linearkombination der )(),...,( 1 nzz darstellen lässt:

n

jj

Tj

n

j

Tjj zvz

nvzz

nvKv

1inationLinearkomb

1

)())((1

1))()(

1

1(

10

n

iii

n

zv

zzspanv

1

1

)(

)(),...,(

Durch linksseitige Multiplikation von Φ(zk) an der Eigenwertgleichung erhält man:

)1(

),...,( und ),()()( wobei,)1(

)()()(1

1)()()(

)()(

12

111

n

zzkzzn

zzzn

zzz

vKzvz

njijT

iij

v

n

iii

K

n

i

Tjj

Tk

v

n

iii

Tk

Tk

Tk

Somit wurde eine neue Eigenwertgleichung erschlossen, wobei α der Eigenvektor ist und

)1(n der Eigenwert. Diese Eigenwertgleichung ist linear zu lösen. Wie in der

ursprünglichen Hauptkomponentenanalyse wird der eigentliche Eigenvektor v mit der

Länge eins normiert, daraus folgt für α die Bedingung 1)( T , denn:

).(

)()())(())((

1

1 1,1

T

TT

jT

i

n

i

n

jiji

n

iii

Tii

T

ij

zzzz

vv

Durch Ermittlung der Eigenvektoren v der Kovarianzmatrix KΦ über die

Eigenwertgleichung )1(n kann man schließlich auch die transformierten

Daten Φ(zi) auf die Ebene vi projizieren. Dies erfolgt wie in der linearen

Hauptkomponentenanalyse durch Multiplikation des Eigenvektors mit dem Vektor Φ(zi)

und man erhält:

ji

n

jii

n

jjii

Ti zzzv

11

)()()( .

Das bedeutet, dass die eigentliche Rechnung, das Lösen der Eigenwertgleichung, linear

erfolgt, aber die Transformierung der Daten nicht-linear durch die Funktion Φ. Die Matrix

hat eine Größe, die von der Anzahl der Datenpunkte abhängt, also nn .

11

Abbildung 3a: Schema eines Spermiums (siehe [A1])

3 Spermienmorphologie

3.1 Allgemein

Menschen folgen dem Fortpflanzungszyklus der Oogamie. Daher entwickeln die

weiblichen Individuen Eizellen, die groß und nährstoffreich sind, wohingegen die

männlichen Individuen Spermatozoen bzw. Spermien produzieren, die allein dem

Transport und der Übertragung des haploiden, männlichen Kerns dienen. Aus diesem

Grund lassen sich einige Strukturmerkmale ableiten: Spermien sind stromlinienförmig

aufgebaut, um eine maximale Geschwindigkeit aufzubauen und sie enthalten ein

Minimum an Bestandteilen. Zu diesen zählen der Kern (Nucleus, Abb. 3) und die

Centriolen, die an die Eizelle abgegeben werden, Mitochondrien (Mitochondria, Abb. 3)

als Energiequelle, das Akrosom (Acrosome, Abb. 3) zur Hydrolyse der Zona pellucida der

Eizelle und eine lange Geißel (Axial filament, Abb. 3) zur Fortbewegung. (vgl. [1])

Im Folgenden wird der Kopf beschrieben, der aus dem Kern und den verschiedenen

akrosomalen Regionen besteht. Die Bereiche kennzeichnen eine enge Verbindung

zwischen dem Nukleus und dem Akrosom. In den Membranen des Nukleus und

Akrosoms eingelagerte Rezeptoren zur Bindung an die Eizelle verdeutlichen, wie

folgenschwer eine Missbildung in diesem Abschnitt des Spermiums für die Fertilisation

ist.

Anschließend wird das Flagellum, bzw. der Schwanz (tail, Abb. 3) in seiner Struktur

beschrieben. Dabei wird deutlich, dass diese Struktur essentiell für die Motilität des

Spermiums ist und damit das Erreichen der Eizelle im Eileiter erst ermöglicht.

3.2 Der Kopf des Spermiums

3.2.1 Nukleus

Der Kern enthält die haploide Erbinformation und wird von einer doppelten Membran

umschlossen, die den perinukleären Raum einschließt. Im Gegensatz zu somatischen

12

Zellen wird die Hülle nicht von Kernporen durchbrochen (vgl. [18]). Dies erklärt sich

dadurch, dass kein Protein-Synthese Apparat (d.h. kein endoplasmatisches Reticulum

mit Ribosomen und Golgi-Apparat) vorhanden ist(vgl. [1]), der Kernporen notwendig

macht. Die äußere Membran nimmt zusätzlich eine statische Schutzfunktion ein, da sie

durch viele Strukturproteine fest ist. Während der Fertilisation sind eben diese

Proteine an Zellsignalen beteiligt (vgl. [18]).

Das Chromatin ist stark kondensiert. Während der Spermiogenese werden ungefähr

85% der Histone durch Protamine ersetzt (vgl. [21]). Durch die besondere Struktur der

basischen, positiv geladenen Proteine wird eine Hyperkondensation der

Deoxyribonucleic acid (DNA) ermöglicht, die nicht nur für die Hydrodynamik

mitbestimmend ist, sondern auch einen erhöhten Schutz vor äußeren Einflüssen

sichert. (vgl. [18])

Der Nukleus wird im Inneren neben dem Chromatin mit einer Matrix gefüllt, die die

äußere Struktur herstellt. Die Kernmatrix beschreibt daher ein nukleäres Skelett aus

Proteinen, an dem sich die Chromosomen anheften können. (vgl. [1])

3.2.2 Akrosomregion

Dieser Bereich des Kopfes enthält den Hauptanteil des Akrosoms. Das Akrosom ist

ein großes Überbleibsel des Golgi-Apparats und enthält zahlreiche Proteasen zur

Hydrolyse der Zona pellucida. Das Akrosom-Vesikel hat eine doppelte Membran. Die

terminale Membran ist stellenweise mit der äußeren Membran des Kernes verbunden,

so dass der perinukleäre Raum und das Akrosomvesikel ein Kontinuum bilden, wobei

die Räume zwischen den Membranen verbunden sind. Dort eingelagert sind

Abbildung 3b: Spermienkopf im Längsschnitt. (Schema nach [18])

13

Rezeptoren, die nach der Exocytose des Vesikels an der Bindung mit der Eizelle

beteiligt sind. (vgl. [18])

3.2.3 Mittlere Äquatorialebene

Die mittlere Äquatorialebene beschreibt den Bereich, in dem die innere und äußere

Akrosommembran ineinander übergehen und an den perinukleären Raum anschließen

(siehe Abb. 3b). Dort sind ebenfalls einige Rezeptoren eingelagert, die an der Bindung

mit der Plasmamembran der Eizelle beteiligt sind, nachdem die Zona pellicuda

durchdrungen wurde. (vgl. [18])

3.2.4 Postacrosomaler Bereich

In diesem Bereich liegen wichtige Moleküle im perinukleären Raum zur Aktivierung

der Eizelle und der Entwicklung vom Spermienkern zum Pronukleus vor. In diesem

Abschnitt ist kein Cytoplasma zugegen, da es vollständig vom perinukleären Raum

verdrängt wurde (siehe Abb. 3b). (vgl. [18])

3.3 Flagellum

Das Flagellum der Spermien ist vollständig von Mikrotubulis durchzogen. Die Anordnung

der Mikrotubuli-Dupletts im (9·2+2)-Muster ist typisch für Spermien der Mammalia.

Dabei sind neun Mikrotubuli-Dupletts konzentrisch um ein Mikrotubuli-Paar angeordnet.

Von den Dupletts ausgehend erstreckt sich in das Innere ein Motorprotein, das Dynein,

wie eine Speiche im Rad. Ebenso reicht ein innerer- und äußerer Dynein-Arm zwischen

den Dupletts, verbindet diese aber nicht. Die Verbindung entsteht durch

ein Nexinmolekül. Die Mikrotubuli-Dupletts werden außerhalb des

Rades, parallel zur Cytoplasmamembran, von Molekül-Fasern

(Ringfasern, Abb.4) begleitet, die die Flexibilität entlang der gesamten

Geißel fördern. (vgl. [18])

Da die Dyneinarme unter Adenosintriphosphat (ATP)-Verbrauch ihre

Konformation ändern, gleiten die

Mikrotubuli-Dupletts aneinander

vorbei. Geschieht dies nur auf einer

Seite des Rades, entsteht die typische

Flagellenbewegung und das Spermium

erhält einen Schub nach vorne. (vgl.

[11])

Abbildung 4: Elektronenmikroskopische Aufnahme von menschlichen Spermien. Im Längsschnitt mit Nukleus (N), Akrosom (A), Axonem (AX), Mitochondrien (M), Cytoplasma (C), Ringfasern (RF) Im Querschnitt des Flagellums lässt sich das (9+2) Muster erkennen. (siehe [A2])

14

3.3.1 Verbindungsstück zwischen Kopfregion und Mittelstück

Das Verbindungsstück lässt sich in neun Bereiche unterteilen, die einhergehen mit den

Mikrotubuli-Dupletts des Flagellums und den Fasermolekülen. Terminal befindet sich

der Basalkörper der Geißel. Dieser ist als Aufhängung für den Mikrotubuli-Apparat zu

verstehen, der dort hinein reicht. In der inneren Struktur unterscheidet sich der

Basalkörper von dem Rest des Flagellums, in dem es ein Mikrotubuli-Triplett

ausbildet und die inneren Mikrotubuli fehlen. (vgl. [18])

Proximal befindet sich neben zahlreichen Gelenkköpfchen eine Centriole. Centriolen

werden an die Nachkommen allein durch die Spermien weitergegeben und sind

essentiell für die Mitose. Die neun Mikrotubuli-Tripletts organisieren dabei die

Mikrotubuli-Fasern für den Spindelapparat und ziehen an den Chromosomen, um eine

einheitliche Verteilung zu organisieren. (vgl. [18])

3.3.2 Mittelstück

Die dominierende Struktur im Mittelteil (midpiece, Abb. 3) des Flagellums sind ca.

75-100 Mitochondrien, die in einer Helix um die Mikrotubuli angeordnet sind. So

werden die Motorproteine direkt mit ATP versorgt. Die Mitochondrien werden bei der

Fusion mit der Eizelle einschließlich ihrer mtDNA proteolytisch zerstört, so dass diese

allein maternal vererbt werden. (vgl. [18])

3.3.3 Hauptteil

Dieser Abschnitt wird vom mitochondrialen Teil durch den seitwärts drehenden

Jensen’s Ring abgetrennt. Neben den Proteinfasern entlang der Mikrotubuli wird der

Duplett-Ring durch weitere Proteine an der Cytoplasma-Membran befestigt.

Zusätzlich enthält dieser Abschnitt noch zahlreiche Kinasen, die die

Phospohorylierung des Dyneins mittels ATP katalysieren. (vgl. [18])

3.4 Spermien-Chromatin

Chromatin ist im Nukleus lokalisiert und beschreibt einen Komplex aus DNA und

Proteinen. In einer fädrigen Form kommt es in der Zelle zur Zeit des Ruhestadiums bzw.

der Synthesephase des Zellzyklus vor, wohingegen es in der Mitosephase zu

Chromosomen kondensiert. Chromosomen enthalten, in einer spezifischen Basenabfolge

von Thymin, Cytosin, Guanin und Adenin gespeichert, die Erbinformation des

Spermiums. Finden in den DNA-Strukturen Schäden statt, kann die gesamte Entwicklung

des Embryos gestört sein. (vgl. [11])

15

3.4.1 Aufbau und Vergleich mit somatischen Chromatin

Somatisches Chromatin (vgl. [1]) Spermien-Chromatin (vgl. [15])

Art

der

Proteine

Es ist ein Histon-Oktamer aus

jeweils 2 Untereinheiten von H2A,

H2B, H3, H4.

Es sind vorwiegend Protamine.

Struktur

der

Proteine

Die acht Untereinheiten lagern sich

zu einer Scheibe zusammen.

Es werden Protaminfasern gebildet.

Bindung

mit der

DNA

Es werden Wasserstoffbrücken-

bindungen und vereinzelte

Salzbrücken zwischen Lysin oder

Arginin der Histone und dem

Phosphatrückgrat der DNA

ausgebildet.

Protamin ist ein stark basisches,

positiv geladenes Polypeptid, das

kovalente Bindungen mit dem

Phosphatrückgrat der DNA eingeht

und so die negative Ladung der

DNA neutralisiert.

Ver-

packung

Die DNA windet sich um die

Histone. Dabei kommt es zu 1,7

Windungen pro Histon. Die Histon-

DNA-Komplexe werden durch

sogenannte Linker-DNA

verbunden, so dass eine

Perlenschnur-Struktur entsteht.

Protamine binden in der großen

Furche der DNA und bilden einen

Protamin-DNA-Faden. Die Fäden

ordnen sich zu donutähnlichen

Ringen zusammen. Zwischen den

Donuts liegt DNA in Histon-

Chromatin vor und ist mit der

Kernmatrix, die Strukturproteine

des Kerns, verbunden.

Ver-

drillung

Es liegt eine Windung pro 100

Basenpaare vor. Folglich ist die

DNA schwach kondensiert.

Alle 600 Basenpaare findet eine

Windung statt, so dass es zur

Hyperkondensation kommt.

Die Faser-Struktur der Protamine ermöglicht es, die DNA innerhalb der Protaminringe

enger zu verpacken, als es die lockere Perlenschnur des somatischen Chromatins

realisieren könnte. Die einzelnen Fäden sind wie in einem dicken Kabel

zusammengelagert, so dass die äußeren Fäden eine Isolierung für die Inneren bilden.

(vgl. [15])

16

Die Konsequenz ist, dass die DNA innerhalb der Protaminringe sehr gut gegenüber

äußeren Einflüssen, wie pH, UV oder spermieneigene Nukleasen, geschützt ist. Daher

ist die Verbindungs-DNA in ihrer Histon-Verpackung zwischen den Ringen, die 15%

der Gesamt-DNA umfasst, und die äußere Schicht der Protaminringe angreifbar.

Insgesamt bleibt der Anteil an anfälliger DNA klein. Denn schließlich ist der Schutz

des haploiden Chromosomensatzes essentiell für gesunde, mutationsfreie Embryonen.

(vgl. [15])

Weiterführend ist zu erwähnen, dass die Hyperkondensation notwendig für die Form

von Spermien ist. Der Verbund der DNA an die Kernmatrix und somit auch an die

Doppelmembran erzeugt die typische torpedoartige Form des Kopfes und wäre mit

einer Histon-Verpackung nicht realisierbar. Denn nach Huser et al. weisen Spermien

mit runden Kopfformen einen hohen Anteil an Histonen auf. (vgl. [4])

3.4.2 Anfälligkeit und Spermien-Chromatin-Tests

Eine große Herausforderung in der Reproduktionsmedizin stellt das Erkennen von

Defekten in der Chromatinstruktur dar. Anhand der typischen Verfahren zur

Beurteilung der Spermien durch die Beurteilung der Morphologie, Bewegung und

Befruchtungsfähigkeit, kann eine DNA-Struktur nicht immer erfasst werden. Dieses

Wissen ist aber essentiell für Prognosen innerhalb der Reproduktionsverfahren. Da

die Chromatin-Zusammensetzung mit dem Schutz der DNA vor äußeren Einflüssen

korreliert und DNA-Schäden wiederum die Entwicklungsfähigkeit von befruchteten

Eizellen beeinflussen.

Bei DNA-Schäden kommt es zu Brüchen in der DNA und somit zu ds (double-

stranded) DNA Bruchstücken oder zu teilweise einzelsträndiger, ss (single-stranded),

DNA. Diese Schädigungen häufen sich möglicherweise an zwei spezifischen Stellen

im Spermium:

a. An der Linker-DNA

b. An der DNA, die an der Oberfläche der Protaminringe liegt. (vgl. [15])

Das TUNEL (TdT-mediated dUTP-biotin nick end labeling)- und SCSA-Assay (sperm

chromatin structure assay) sind Verfahren zur Feststellung von DNA-Brüchen und

ergaben, dass häufig Defekte oder ein hohes Maß an Anfälligkeit in der Gruppe a

vorliegen. Fehlende Defekte in der Gruppe b sind begründet in der hohen Affinität der

Protamine zur DNA, so dass auch die äußere DNA nicht von anderen Molekülen

17

verdrängt werden kann und somit die DNA vor Nukleasen oder anderen Einflüssen

geschützt ist. (vgl. [15])

Dabei wird beim (TUNEL)-Assay wie folgt vorgegangen: Die Spermien-DNA wurde

isoliert, mit dem Enzym TdT, Terminale-Desoxynukleotidyl-Transferase, und dem

Nukleotid Deoxyuridine Triphosphate (dUTP) versetzt. Das Enzym baut an DNA-

Brüchen am 3’OH-Ende die Nukleotide ein, die daraufhin durch fluoreszenzmarkierte

Antikörper sichtbar gemacht werden.

Beim SCSA-Assay wird das Chromatin in einer leichten Säure inkubiert, so dass DNA

an Bruchstellen denaturiert wird, aber keine Denaturierung an den intakten Stellen

stattfindet. Dann erfolgt eine Anfärbung mit Acridine-Orange zur Unterscheidung von

ssDNA und dsDNA. Der Farbstoff bildet mit der DNA einen Komplex, der sich bei

einer bestimmten Wellenlänge farblich unterscheidet, so dass dsDNA grün und

ssDNA rot erscheint. Der Quotient DFI (DNA fragmentation index) grünrot

rotDFI

gibt schließlich den Anteil an, wie hoch die Defekte sind. (vgl. [15])

Die beiden genannten Verfahren werden bis heute zur Diagnostik in der

Reproduktionsmedizin angewendet und zeigen die Qualität des Chromatins an. Die

Methoden haben allerdings den Nachteil, dass die Spermien danach zur Befruchtung

nicht mehr verwendbar sind.

Neben diesen beiden Verfahren gibt es noch eine Reihe anderer Färbemethoden. Das

TUNEL- und SCSA-Assay spiegeln allerdings in ihrer Anwendung und ihren

Nachteilen alle Methoden wieder.

4 Verfahren der Reproduktion

Seitdem es möglich ist, Embryonen im Reagenzglas zu schaffen, ist die Nachfrage in den

Industrieländern stetig gestiegen. Daher ist es wichtig, einen kurzen Überblick über die

Verfahren zur künstlichen Befruchtung zu schaffen. Die am häufigsten angewendeten

Verfahren nach F.B. Kolodziej et al. (siehe [6]) sind die folgenden:

Die intrauterine Insemination (kurz IUI) ist ein unterstützendes Verfahren bei einer minimalen

Infertilität der männlichen Spermien. Die Frau erhält eine ovarielle Stimulationstherapie

mittels Gonadotropine, um die Anzahl der reifen Eizellen zu steigern. In regelmäßigen

Abständen wird während der Therapie die Estradiol- und Luteinisierungshormon-

konzentration bestimmt, um einen Eisprung festzustellen. Die Spermien des Mannes werden

18

aufbereitet und klassifiziert, so dass nur die wahrscheinlich fertilsten Spermien in den

Genitaltrakt der Frau übertragen werden.

Die In-vitro-Fertilisation (kurz IV) beginnt mit einer ovariellen Stimulationstherapie der Frau,

so dass später mehrere, reife Eizellen vor dem Eisprung mittels einer Punktion entnommen

werden können. Diese Eizellen werden über Nacht mit zahlreichen, aufbereiteten Spermien

inkubiert. Wenn unter dem Mikroskop zwei Vorkerne sichtbar sind, werden die Eizellen, nach

der Befreiung vom nicht befruchteten Zellmaterial, in die Gebärmutter transferiert.

Zuletzt gibt es noch das Verfahren der intracytoplasmatischen Spermatozoeninjektion (kurz

ICSI). Bei diesem Verfahren kommt es nicht zur eigenständigen Befruchtung der Eizelle

durch das Spermium. Die Befruchtung wird induziert. Es erfolgt mechanisch die Injektion

eines einzelnen Spermiums in das Cytoplasma der Eizelle und eine anschließende

Übertragung des Embryos, meist im 2-8 Zellstadium, in die Gebärmutter.

Die häufigste Methode ist die ICSI, weil es zu keiner Spermium-Eizelle-Interaktion mehr

kommen muss. Diese wurde im Vorfeld schon induziert, so dass eine Nicht-Befruchtung der

Eizelle durch das Spermium nicht mehr möglich ist. Nur die Entwicklung der Vorkerne und

Zygote werden noch durch Spermien gesteuert. Daher wird die ICSI zur sichersten

Befruchtungsmethode. Die ausbleibende Fusion der Nuklei ist allein in der Dysfunktion von

Zellbestandteilen der Eizelle und dem Spermiun begründet. Dies macht Untersuchungen des

Inneren eines Spermiums erforderlich.

5 Raman-Spektroskopie zur Analyse der Spermienqualität

5.1 Raman-Spekroskopie

Bei der Raman-Mikrospektroskopie handelt es sich um eine Apparatur, die einen Laser

auf die Probe schickt und diese abtastet. Dadurch werden die Spektrallinien und die Orte

der Emission festgehalten. Die so entstehenden Bilder sind chemische Karten der Proben.

Zur Erstellung dieser Bilder wird der Raman-Effekt von Molekülen genutzt. Beim

Aufprall eines Lichtphotons gibt es für ein Atom oder Molekül vier Möglichkeiten:

a. Die Energie des Moleküls bleibt stabil und das Photon wird auf der gleichen

Wellenlänge reflektiert. Dies bezeichnet man als elastische oder Raleigh-Streuung.

b. Das Energieniveau des Moleküls steigt durch Absorption des Photons um eine

spezifische Energiedifferenz. Die innere Energie des Moleküls nimmt zu und kann

anschließend durch Fluoreszenz oder Wärme wieder abgegeben werden.

19

c. Bei der Raman-Streuung reicht die Energie nicht zur vollständigen Anregung des

Moleküls aus. Das Photon bewirkt im Molekül allerdings ein Übergangsdipol. Der

Dipol überlagert sich mit den molekularen, permanenten Dipolen und somit

überlagern sich auch ihre elektrischen Wellen. Diese werden teilweise als

energieärmer emittiert und werden als Stoke-Linien oder Raman-Shifts bezeichnet.

d. Der Raman-Effekt kann ebenso eine Anregung des Photons bewirken. Die

sogenannten Anti-Stokes-Linien sind durch Summation von der inneren Energie

des Moleküls und der Energie des Photons entstanden. Somit sind diese

energiereicher und haben eine kleinere Wellenlänge.

Die Raman-Linien sind molekülspezifisch und können als chemische Fingerabdrücke

bezeichnet werden. Die Wellenlänge des Photons ist mit Bedacht zu wählen. Die Raman-

Shifts (Stoke- und Anti-Stoke-Linien) können in ihrer Intensität von der Fluoreszenz

überlagert werden und somit in der Messung des emittierten Lichtes nicht erkannt werden.

(vgl. [7])

5.2 Bisherige Erkenntnisse in der Klassifizierung von Spermien mittels Raman

Mikrospektroskopie-Daten

Die Raman-Mikrospektroskopie hat sich in der Biologie und Medizin seit einigen Jahren

zur Klassifizierung und chemischen Analyse von Zellen etabliert. Die chemische Analyse

der Raman-Mikrospektroskopie funktioniert ohne vorherige Fixierungen, Schnitte oder

aber auch Markierungen mittels Antikörper oder Fluoreszenzmarkern. Dadurch nehmen

die Zellen keinen Schaden während der Analyse. Dies ist essentiell für die Untersuchung

von Spermien und anderen Zellen.

2009 ist unter anderem durch Thomas Huser (siehe [4]) eine Raman Spektroskopie von

Spermien durchgeführt worden. In dieser Untersuchung haben morphologisch

unterscheidbare Spermien vorgelegen, die durch ihre Form in zwei Klassen unterteilt

worden sind: normale und abnormale Spermien. Die Analyse der Raman-Spektren ist im

Hinblick auf die Struktur der DNA durchgeführt worden. Bei einer eingestrahlten

Wellenlänge von 488nm ist es zu spezifischen Raman-Shifts gekommen, wobei ein

besonderes Augenmerk auf die Intensitäten bei 785cm-1 und 1092cm-1gelegt worden ist.

785cm-1 ist dabei spezifisch für die DNA-Basen Cytosin und Thymin. Ist nun die

Intensität dieser Stoke-Linie gering, so sind die Basen fest innerhalb eines Moleküls

gebunden. 1092cm-1 beschreibt die gebundenen Phosphatgruppen und kann so mit dem

Phosphatrückgrat der DNA gleichgesetzt werden. Ist nun das Verhältnis von 785cm-1:

20

1092cm-1 niedrig, heißt dies, dass ein großer Teil der DNA fest gebunden ist und keine

Basen frei liegen. Weiter schlussfolgernd bedeutet ein niedriger Anteil des 785cm-1-Shifts,

dass die Spermien einen hohen Anteil von Chromatin besitzen, das mittels Protaminen

verpackt wurde. Denn wie oben beschrieben, ist die Bindung von Protaminen an die DNA

verantwortlich für die Hyperkondensation der DNA. In dieser Untersuchung ist das

Verhältnis 785cm-1: 1092cm-1 von normalen und abnormalen Spermien inspiziert worden.

Im Mittel hat dies bei den morphologisch normalen Spermien niedrigere Werte als bei den

morphologisch abnormalen Spermien ergeben. Aber selbst innerhalb der morphologisch

normalen Spermien hat es große Spannweiten in diesem Verhältnis gegeben, so dass es

nahe liegend ist, dass Spermien trotz normaler Morphologie einer intensiveren

Untersuchung bedürfen.

Konrad Meister und seine Kollegen (siehe [10]) haben 2010 ihre Studien über die Raman-

Mikrospektroskopie von Spermien veröffentlicht. In dieser Studie sind, im Gegensatz zur

vorherig beschriebenen Methode, nur morphologisch normale Spermien untersucht

worden und es ist kein spezielles Augenmerk auf den Nukleus gelegt worden. Durch die

Ausarbeitung der Raman-Shifts mittels einer Cluster-Analyse, die wie die

Hauptkomponentenanalyse für unterscheidbare Klassen sorgt, sind die Spermien, mittels

der chemischen Marker, in spezifische Bereiche unterteilt worden:

a. Kern

Der Kern sticht durch hohe Intensitäten im Bereich der Nukleinsäuren heraus, speziell

bei 788cm-1. Dieser Raman-Shift ist im Kern deutlich höher als in den Mitochondrien,

da der DNA-Gehalt des Nukleus bei weitem höher und kondensierter ist, als im

Mitochondrium.

b. Hals

Dieser Teilabschnitt ist im Gegensatz zum Kern und Mittelstück kennzeichnend durch

ein Fehlen des Raman-Shifts 1575 cm-1, der für die Nukleinsäuren Adenin und Guanin

steht. Ebenso liegen zahlreiche, hohe Intensitäten von Raman-Shifts vor, die für die

Anwesenheit von Proteinen stehen.

c. Mittelstück

751 cm-1 ist ein typischer Raman-Shift für Mitochondrien. Daher weist das Mittelstück

eine herausragende Bande in diesem Bereich auf.

d. Oberfläche

Die Oberfläche ist anhand von Schwingungen zwischen Kohlenstoff- und

Wasserstoffatomen festgelegt worden, die einen Marker für Kohlenwasserstoffe sind.

21

Kohlenwasserstoffe sind Bestandteile jeder Plasmamembran und eignen sich daher zur

Bestimmung der Oberfläche.

Darüber hinaus sind einige Spermienproben mit UV-Licht in unterschiedlichen

Zeiteinheiten behandelt worden. Es ist bekannt, dass UV-Licht zu Schäden in der DNA

führt. Daher verwundert es nicht, dass bei 751cm-1 und 788cm-1 niedrigere Intensitäten

gemessen worden sind, je länger die UV-Behandlung durchgeführt worden ist. Es ist

jedoch dadurch festgestellt worden, dass diese Raman-Shifts zur Ermittlung von DNA-

Schäden und zur Begründung von sinkender Motilität nützlich sind. Schließlich ist der

Ausschlag im Raman-Spektrum bei 751cm-1 ein spezifischer Ausschlag für

Mitochondrien. Da Mitochondrien die Kraftwerke der Zelle sind und ATP produzieren,

sind diese essentiell für die Flagellum-Bewegung. Weiterführend ist zu erwähnen, dass

der Raman-Shift des Nukleus bei 788cm-1 nach 30 Minuten UV-Behandlung um 20%

gesunken ist und die Intensität der Mitochondrien bei 751cm-1 um 70%. Daraus ist

ersichtlich, dass die Mitochondrien weitaus anfälliger für UV-Strahlung sind, als der Kern

und dort eher Schädigungen auftreten.

2011 ist eine ähnliche Raman-Mikrospektroskopie durch C. Mallidis et al. (siehe [8])

durchgeführt worden. Der Laser ist auf eine Wellenlänge von 632,8nm eingestellt worden.

Die Spermienprobe ist teilweise mit UVA behandelt worden. Die wichtigsten

Erkenntnisse der Studie sind folgende:

a. Die UVA-Behandlung ist in einer Verschiebung von Ausschlägen des

Phosphatrückgrates bei 1092cm-1, zu einem Wert von 1042cm-1 zu erkennen und

ist ein Indikator für Dimerisierungen der Nukleotide. Ebenso ist der Bereich von

1400-1600cm-1 durch die UVA-Strahlen verändert worden und signalisiert

Schäden in der DNA-Protein-Bindung. Mittels einer Hauptkomponentenanalyse

lassen sich die Schwerpunkte der Schädigungen sichtbar machen. Vermehrt treten

diese im Kopfbereich unterhalb des Akrosoms auf. Dort ist der Nukleus mit dem

Chromatin lokalisiert.

b. Es ist ebenso eine Hauptkomponentenanalyse aller Raman-Shifts durchgeführt

worden und die Achsen sind auf zwei Hauptkomponenten reduziert worden. Die

Daten haben anschließend noch 25% der Inhalte umfasst und haben die größten

Varianzen enthalten. Dadurch ist es möglich gewesen, eindeutig UV-unbehandelte

Spermien von UV-behandelten Spermien zu unterscheiden.

c. Anhand eines Spermiums sind spezifische Raman-Spektren vom Flagellum,

Akrosom und der DNA extrahiert worden. Sind diese farblich den Messdaten der

22

einzelnen Orte im Spermium zugeordnet worden, so sind Anomalien festgestellt

worden. Unterhalb des Kernes sind vereinzelte Vakuolen sichtbar gewesen und

haben auf Schäden hingewiesen.

Nach all den Studien lässt sich die Raman Mikrospekroskopie für die Klassifizierung von

Spermien anwenden. Mittels der mathematischen Methode der Hauptkomponentenanalyse

ist es möglich, eindeutig defekte Spermien durch eine UVA-Behandlung zu ermitteln. Die

Unterschiede der Ergebnisse in den chemischen Analysen durch die Raman

Mikrospektroskopie-Daten zeigen, dass genaue Standards noch festzulegen sind.

5.3 Hauptkomponentenanalyse mit Raman Mikrospektroskopie-Daten von

Mäusespermien

Für die hier durchgeführte Hauptkomponentenanalyse haben insgesamt fünf Mappings

von Mäusespermien vom Centrum für Reproduktionsmedizin und Andrologie (CeRA) des

Universitätsklinikum Münster zur Verfügung gestanden. Die Mäuse sind mit einem

Pathogen, dem Upropathogenic Escherichia coli (kurz: UPEC), infiziert worden. UPEC

kommt im Urogenitalsystem vor, das die Harnwege und Geschlechtsorgane umfasst. Nun

ist anhand der Daten zu zeigen, welche Spermien durch die Infektion in ihrer Qualität

vermindert worden sind. Bei der Raman-Mikrospektroskopie ist ein Laser mit der

Wellenlänge von 632,8nm verwendet worden, so dass man die Bedeutungen der Raman-

Shifts aus Mallidis et al. (vgl. [8], sie Abschnitt 5.2) übernehmen kann.

Bevor die PCA durchgeführt worden ist, sind die Mappings mittels savemapping.m

(Matlab-Codes auf CD) in die Raumkoordinaten x,y und die Frequenzen und Intensitäten

abgespeichert worden. Dadurch ist je Mapping eine )( pn Datenmatrix entstanden, die

n Orte der Spermien markiert und p Raman-Shifts beschreiben.

Anschließend sind die Daten gefiltert worden. In dem Filter ist eine diskrete

Kosinustransformation (Matlab: dct) durchgeführt worden. Die Kosinustransformationen

der Datenmatrix sind orthogonal und gewichtet (vgl. [22]). Anschließend sind niedrige

Intensitäten bis 30 und hohe Intensitäten ab 70 gleich null gesetzt worden. Geringe

Intensitäten eines gesamten Raman-Shifts sind zur Klassifizierung nicht geeignet, da diese

wenig Interpretationsspielraum lassen und somit die Ergebnisse nur verwischen. Darüber

hinaus werden die Kontraste zu hohen Intensitäten eines Raman-Shifts dadurch erhöht.

Hohe Intensitäten einer Absorption müssen nicht unbedingt Raman-Shifts beschreiben,

sondern können auch Fluoreszenz darstellen. Diese überlagert dann in ihrer Bedeutung die

Ergebnisse der Raman-Daten zur Klassifizierung und bewirkt ebenfalls nur verfälschte

23

Daten. Das Nullsetzen dieser Intensitäten vermindert ebenso das Datenvolumen. Alles in

allem entfernt der Filter das Hintergrundrauschen, wie man in den Abbildungen von der

ersten Untersuchung (UPEC1) sehen kann. Die gefilterte Version bietet ein

kontrastreicheres Bild.

Im Anschluss ist in analysemapping.m die Hauptkomponentenanalyse durchgeführt

worden. Die ist auf die Raman-Shifts von 800cm-1 bis 1600cm-1 beschränkt worden. Nach

den bisherigen Studien zu Raman-Mikrospektroskopie von Spermien ist dieser Bereich

der bedeutendste (siehe Abschnitt 5.2). In Matlab ist der Befehl

(coeff,score,latent)= princomp(X) verwendet worden. Dabei beschreibt die

Matrix coeff spaltenweise die Eigenvektoren der Kovarianzmatrix und somit die

Gewichtungen der Raman-Shifts. score umfasst die transformierten Daten und

latent die Eigenwerte der Kovarianzmatrix. Die Ergebnisse sind auf unterschiedliche

Weise zur Analyse visualisiert worden. Unter anderem mit den Befehlen surf,

pcolor, plot.

5.4 Visualisierungen

In diesem Abschnitt sollen die Plots der untersuchten Spermien UPEC1 bis UPEC5

erklärt, beschrieben und verglichen werden, bis es in dem anschließenden Abschnitt zur

Klassifizierung kommt.

5.4.1 UPEC1

Die Abbildungen der PCA-Koeffizienten in den Abbildungen 7 bis 10 zeigen, dass

schon ab dem zweiten PCA-Koeffizienten die Bilder in ihrem Kontrast abnehmen und

in ihrer Aussagekraft sinken. Der dritte PCA-Koeffizient in Abbildung 9

Abbildung 5: Erste Hauptkomponente von UPEC1 ungefiltert

Abbildung 6: Erste Hauptkomponente von UPEC1 gefiltert

24

beispielsweise erzeugt keinerlei erkennbare Muster, um auf Strukturfehler in den

Spermien zu schließen. Diese Beobachtung korreliert mit dem Anteil der PCA-

Koeffizienten an der Gesamtvarianz. Der erste PCA-Koeffizient beinhaltet 24,75% der

Gesamtvarianz (nach analysemapping1.m), wohingegen die zweite

Hauptkomponente nur noch 3,92% der Varianz widerspiegelt. Die folgenden Anteile

der Hauptkomponenten drei und vier sind absteigend mit 2,66% und 2,42%. Zur

weiteren Analyse wird aufgrund der Anteile der Hauptkomponenten an der

Gesamtvarianz auf Abbildung 11 und damit auf die ersten beiden PCA- Koeffizienten

zurückgegriffen. Abbildung 12 zeigt im Original das Spermium. Der mittels der

Raman Mikrospektroskopie untersuchte Bereich ist in dem blauen Kästchen

eingefasst. Allerdings kam es vermutlich während der Untersuchung zu einer

Verschiebung des Objektes, so dass in Wirklichkeit der Ausschnitt woanders gelegen

ist. Daher erklärt sich auch der Strukturaufbau in Abbildung 7 oder Abbildung 11, der

einen Bereich etwa dem roten Kästen entsprechend beschreibt.

Abbildung 7: 1. PCA-Koeffizient von UPEC 1 Abbildung 8: 2. PCA-Koeffizient vonUPEC1

Abbildung 9: 3. PCA-Koeffizient von UPEC1 Abbildung 10: 4. PCA-Koeffizient von UPEC1

25

Die farblichen Skalen in den Abbildungen 7 bis 11 richten sich nach den Intensitäten

der Raman-Shifts und deren Gewichtungen und errechnen sich wie folgt:

600

1iii xFarbe

Wobei die αi die Gewichtungen der ersten Hauptkomponente sind und xi die

Intensitäten des i-ten Raman-Shifts in cm-1. Die Gewichtungen sind in Abbildung 13

dargestellt. Dabei ist auffällig, dass in der zweiten Hauptkomponente starke

Gewichtungen auf die Raman-Shifts 1092cm-1 und 785cm-1 liegen. Diese stehen nach

Studien (siehe Abschnitt 5.2) für das

Phosphatrückgrat der DNA bzw. die

Basen der DNA. Daraus erschließt sich,

dass die roten Felder in Abbildung 8

Orte der DNA sein können. Da der

Ausschnitt dieses Spermiums nur klein

ist, eignet sich dieser nur wenig zur

Klassifizierung des Spermiums, weil die

wichtigste Struktur, der Nukleus, ist nur

im geringen Umfang untersucht worden.

5.4.2 UPEC2

Bei den Aufnahmen von UPEC2 lässt sich in Abbildung 14 und Abbildung 15

ebenfalls feststellen, dass die Visualisierung der ersten Hauptkomponenten ein Bild

mit klar definierten Strukturen erzeugt. Die zweite Hauptkomponente hingegen

-30 -25 -20 -15 -10 -5 0X (µm)

Abbildung 11: 1.PCA-Koeffizient (Höhe) gegen den zweiten PCA-Koeffizient (Farbe) von UPEC1 aufgetragen.

Abbildung 12: Originalbild des Spermiums UPEC1

Abbildung 13: Gewichtung der Raman-Shifts durch die erste und zweite Hauptkomponente in UPEC1

26


Abbildung 16: 3. PCA-Koeffizient von UPEC2 Abbildung 17: 4. PCA-Koeffizient von UPEC 2

erzeugt keine Bereiche, die klar voneinander zu unterscheiden sind. Ebenso verhält es

sich in den folgenden Abbildungen der dritten und vierten Hauptkomponente.

Die Hauptkomponenten umfassen bei diesem Spermium die folgenden Anteile an der

Gesamtvarianz (nach analysemapping2.m):

1. Hauptkomponente 59,62% 2. Hauptkomponente 13,88%

3. Hauptkomponente 1,8% 4. Hauptkomponente 0,79%.

Für weitere Analysen wird dementsprechend auf die erste und zweite

Hauptkomponente verwiesen, die zusammen 73,5% der Gesamtvarianz umfassen.

Im Vergleich mit dem Originalbild des Spermiums, in Abbildung 19, lassen sich die

farblichen Bereiche, aus Abbildung 14 der ersten Hauptkomponente, den Strukturen

der Spermien zuordnen. In dunkelblau ist der Bereich des Nukleus markiert und

anschließend in türkis der Bereich des Akrosoms, der sehr eng durch Proteine mit den

Kern assoziiert ist. In gelb ist die äußere Hülle, die Cytoplasmamembran, dargestellt.

27

Die klare Darstellung des Nukleus mittels der ersten Hauptkomponente verläuft wie

oben beschrieben über die Koeffizienten, die die Raman-Shifts unterschiedlich

gewichten. In diesem Fall gibt es negative Gewichtungen in 1092cm-1

(Phosphatrückgrat). Dieser wichtige Einfluss in der ersten Hauptkomponente zeigen

die Raman-Shifts im Vergleich zu den Farbfeldern: Blaue Felder (negativ) haben die

höchste Intensität und mit steigender Farbwertigkeit, sinken auch die Intensitäten.

Weiterhin ist zu erwähnen, dass das Akrosoms sich in den Studien von Mallidis et al.

(vgl. [8]) durch eine hohe Intensität in 785 cm-1 und eine niedrige Intensität in

1092cm-1 auszeichnete, weshalb sich dieser Bereich von dem des Nukleus abhebt.

5.4.3 UPEC3

Die Untersuchung des dritten mit UPEC infizierten Spermiums hat in den

Visualisierungen ähnliche Ergebnisse ergeben. Je kleiner der Anteil an der

Gesamtvarianz, desto geringer sind die Strukturunterschiede, desto unklarer werden

Abbildung 19: Originalbild des Spermiums UPEC2Abbildung 18: 1.PCA-Koeffizient (Höhe) gegen den 2. PCA-Koeffizient (Farbe) von UPEC2


Abbildung 21: Intensität des Raman Shifts 1092cm-1 im Vergleich. Blaues Feld (0.0697,0.0263), türkises Feld (0.0697,1.0299), gelbes Feld (0.0697,1,2306)

28

die Bilder. Die Anteile an den Varianzen sind nach analysemapping3.m

folgenderweise gestaffelt:



Die erste und zweite Hauptkomponente beschreiben 80,63% der Gesamtvarianz und

wurden in Abbildung 26 gegeneinander aufgetragen. Auch in dieser Untersuchung

werden zur weiteren Analyse nur noch die ersten beiden Hauptkomponenten

berücksichtigt.

Das Bild der ersten Hauptkomponente lässt zu, auf die Orte der Organellen des

Spermiumkopfes (Abb. 27) zu schließen. Die dunkelblauen Schattierungen

beschreiben den Ort des Nukleus. Diese blaue Markierung wird allerdings durch

türkise Felder durchbrochen. Umschlossen wird dieser Bereich von einem türkisen

Streifen, der das Akrosom beschreibt und anschließend ein gelber Rand, der die

Cytoplasmamembran darstellt.

Abbildung 22: 1. PCA –Koeffizient von UPEC3 Abbildung 23: 2. PCA-Koeffizient von UPEC3


29


Abbildung 29: Raman Shifts der Felder (-0.56,-0.025) in blau und (-1,3745,-0,429) in türkis

Die Koeffizienten sind in Abbildung 28 dargestellt und zeigen negative

Multiplikatoren für die Raman-Shifts der DNA. Aber ebenso gibt es positive

Multiplikatoren für den Raman-Shift bei 1042cm-1. Dieser ist in der Studie von

Mallidis et. al (vgl. [8]) bedeutsam, indem geschädigte DNA eine Verschiebung von

1092 cm-1 nach 1042cm-1 zeigte. Wenn nun DNA-Schäden vorliegen, so kann eine

positive Gewichtung der erhöhten Intensität bei 1042cm-1 zu türkisen Feldern führen

und ein Indiz auf DNA-Schäden sein. In Abbildung 29 wurden zwei Felder

ausgewählt und deren gefilterten Raman-Shifts geplottet. Dort erkennt man die

vermutete Verschiebung des Raman-Shifts von 1092cm-1 nach 1042cm-1, so dass ein

türkises Feld entstand. Ebenso ist der Raman-Shift bei 785cm-1 nicht so stark im

türkisenen Feld ausgeprägt, wie im blauen Feld. Dies deutet zusammen daraufhin,

dass die DNA in dem türkisenen Feld Defekte aufweist oder es den Ort des Akrosoms

beschreibt.

Abbildung 27: Originalbild des Spermiums UPEC3 Abbildung 26: 1.PCA-Koeffizient (Höhe) gegen den 2. PCA-Koeffizient (Farbe) von UPEC3 aufgetragen.

30

5.4.4 UPEC4

Die Raman Mikrospektroskopie Daten des vierten Spermiums UPEC4 ergaben in der

Hauptkomponentenanalyse die Abbildungen 30-33. Da ist festzustellen, dass die erste

Hauptkomponente ein Bild erzeugt, das Strukturen des Spermiums erkennen lässt, die

nicht mit dem Bild des Spermiums (Abb. 34) korrelieren. Es scheint, dass mit dem

gelben Rand in Abbildung 29 die Cytoplasmamembran, wie in UPEC2 und UPEC3,

beschrieben wird. Die Membran verläuft dort nicht, allerdings erkennt man in der

Vergrößerung, dass in diesem Bereich das Spermium an Volumen verloren hat und

sich so der gelbe Bereich erklären lässt. Im Gegensatz zur ersten Hauptkomponente ist

das Bild der zweiten Hauptkomponente (Abb. 31) in den Teilen farblich schattiert, wo

sich die Volumenabnahme befindet. Die folgenden Hauptkomponenten erzeugten

verrauschte Bilder ohne erkennbare Bereiche.

Der abfallende Anteil an der Gesamtvarianz in der dritten und vierten

Hauptkomponente erklärt diesen Zustand, diese Anteile liegen bei:


Abbildung 30: 1. PCA-Koeffizient von UPEC 4 Abbildung 31: 2. PCA-Koeffizient von UPEC 4


31


Unterteilt man das Spermium in zwei Bereiche, zum einen in den voluminösen Teil

mit Zellinhalten und zum anderen in den abgeflachten Teil, so beschreibt die erste

Hauptkomponente die Strukturunterschiede des voluminösen Teils und die zweite

Hauptkomponente die Strukturunterschieden des flachen Abschnitts.

Die konträren Bilder gehen auch mit den Gewichtungen einher, die in Abbildung 35

gezeigt sind. Diese sind bei vielen Raman-Shifts entgegengesetzt, siehe beispielsweise

bei 1200cm-1. Die erste Hauptkomponente hat tiefe Ausschläge in den Raman-Shifts

785cm-1 und 1092cm-1. Daher signalisiert die dunkelblaue Färbung in Abbildung 30

den Ort der DNA und damit den Nukleus. Ebenso existiert eine positive Gewichtung

des Raman-Shifts 1042cm-1. Ein Absinken der Raman-Shifts in 785cm-1 und 1092cm-1

und ein Anstieg im Raman-Shift bei 1042cm-1 können zu positiven Werten in der

Summe führen:

600

1iii xFarbe .

Durch dieses Ereignis, ersichtlich in Abbildung 36, kommt es entweder zur blauen

Färbung, mit einem niedrigeren Wert bei 1042cm-1 oder einer türkisen Färbung mit

einer erhöhten Intensität bei 1042cm-1. Zur türkisen Färbung kann es außerdem

kommen, wenn es ein Feld des Akrosoms ist. Denn dort ist der Unterschied zwischen

den Intensitäten von 1042cm-1 und 1092cm-1 nicht sehr groß (vgl. [8]).


Abbildung 34: Bild des Spermiums UPEC4, im schwarzen Kasten der Nukleus.

32

Abbildung 37: Bild des Spermiums UPEC5

5.4.5 UPEC5

Die fünfte Untersuchung eines Spermiums lieferte in der Hauptkomponentenanalyse

ähnliche Resultate wie in UPEC1-4. Die ersten beiden Hauptkomponenten liefern

interpretierbare Abbildungen, wohingegen die weiteren unklare Bilder ergeben. Dies

geht mit den stark verminderten Anteilen an der Gesamtvarianz einher:



Zusammen umfassen die ersten beiden Hauptkomponenten 63,69% der Varianzen und

werden zur weiteren Analyse verwendet. In Abbildung 42 wurden diese

gegeneinander aufgetragen und zeigen gemeinsame Anstiege oder Senkungen der

PCA-Koeffizienten. Diese entstehen hier besonders durch den Raman-Shift bei

930cm-1. Im Gegensatz zur ersten Hauptkomponente ist in der zweiten eine negative

Ladung der Raman-Shifts 785cm-1 und 1092cm-1, so dass der dunkelblaue Bereich in

Abbildung 42 der Nukleus sein könnte.

Im Ganzen ist das

Bild der ersten

Hauptkomponente

sehr heterogen

und schwer mit

dem Originalbild

vergleichbar. Der

äußere Rand hebt

sich durch eine

Abbildung 36: Raman Shifts der Felder (0.0379, 0.0952) in blau und (-1.0699, 0.8044) in türkis

33

hellere Blaufärbung von dem Hintergrund ab, allerdings sind die türkisenen und gelb-

roten Felder prägnant, die sich in etwa durch die Mitte des Spermiums ziehen und

durch den positiven Multiplikator des Raman-Shifts 930cm-1 entstehen.




Abbildung 42: 1.PCA-Koeffizient (Höhe) gegen den 2. PCA-Koeffizient (Farbe) von UPEC5

34

5.5 Klassifizierung

Nun sollen die Ergebnisse der Hauptkomponentenanalyse mit den Vorkenntnissen des

Strukturaufbaus eines Spermiums in Einklang gebracht werden.

Die Struktur der DNA in einem Spermium der Mammalia kennzeichnet sich durch eine

Hyperkondensation aus. Diese entsteht durch die Protaminfäden, die sich in die große

Furche der DNA einlagern und eine kovalente Bindung mit dem Phosphatrückgrat

eingehen. Die anschließende Zusammenlagerung aller DNA-Protamin-Fibrillen erzeugt

eine dichte Struktur, die von außen kaum angreifbar ist. Ausschließlich vereinzelte

Linker-DNA ist in einer Histon-Verpackung mit der Nukleusmatrix verbunden. Ist dieser

DNA-Aufbau in der Spermatogenese gelungen, so sollte man annehmen, dass man diese

an einheitliche Ramanspektren erkennen kann. Die Hyperkondensation der DNA lässt

keine Heterogenität in den Ramanspektren zu, da die Laserstrahlen stets auf einen dichten

DNA-Protamin-Komplex treffen sollten. Da die Komplexbildung durch eine kovalente

Bindung an den negativen Phosphaten der DNA entsteht, ist der Ausschlag in 1092cm-1

(O-P-O-Streckung) entscheidend. Vergleicht man hinsichtlich dieses Kriteriums die

Bilder von UPEC2 bis UPEC5, so gelangt man zu der Erkenntnis, dass UPEC2 ein

gesundes Spermium darstellt, wohingegen die weiteren Spermien Schäden aufweisen

könnten. In UPEC3 ist eine klare dreischichtige Struktur erkennbar, allerdings ist der

blaue Bereich durch türkise Felder durchzogen. Es wurde gezeigt, dass eben diese Felder

eine Verschiebung der Werte von 1092cm-1 nach 1042cm-1 beinhalteten. Dadurch lässt

sich annehmen, dass die DNA in diesem Bereich zum einen geringeren Anteil an

Protaminen aufweist (1092cm-1 gesunken), aber auch Schäden in der DNA entstanden

sind (1042cm-1 angestiegen). In UPEC4 ließ sich keine direkte Verbindung zum

Originalbild herstellen. Es ist keine Nukleusstruktur oder Akrosomstruktur durch die

Hauptkomponenten erkennbar. Das Originalbild von UPEC4 zeigt, dass das Spermium in

ihrer Morphologie schon gravierende Defekte aufweist. Daher ist eine Klassifizierung

mittels der Raman Daten nicht nötig. Es ist aber festzustellen, dass unklare Bilder ohne

direkte Struktur mit der Morphologie korrelieren. Das Spermium UPEC5 ist schwer

einzuordnen. In der zweiten Hauptkomponente ist ein klar definierter, dunkelblauer

Bereich, der den Nukleus beschreiben könnte. Demnach wäre von der DNA-Struktur das

Spermium als gut zu klassifizieren. Allerdings füllt dieser Kern nur einen kleinen Teil des

Spermiumkopfes, das mit normalen Spermien nicht übereinstimmt. Die roten Bereiche

heben sich von dem Rest des Kopfes ab und können auf Anomalien hinweisen.

35

Insgesamt lässt sich feststellen, dass bei hohen Anteilen an der Gesamtvarianz in der

ersten Hauptkomponente, die Bilder klare Strukturen hervorbringen, wie bei UPEC2

(59,62%) und UPEC3 (64,21%). Dadurch lassen sich Klassifizierungen vornehmen. Die

Abbildungen 44 und 45 zeigen Streudiagramme der transformierten Daten. Bei einer

guten Approximation durch die Hauptkomponenten, sollten die Punkte nahe der

Koordinatenachsen (durch den Ursprung) liegen. Schließlich minimieren die

Hauptkomponenten die Abstände zu den Punkten. Dies wurde in UPEC3 stärker realisiert,

als in UPEC2. Wie in der Herleitung gezeigt wurde, erzielt die Minimierung der Abstände

zur Projektion ebenso eine Maximierung der Kovarianz. Daher stimmen die

Beobachtungen der Streudiagramme mit den Anteilen an der Gesamtvarianz überein.

Abbildung 44: Streuplot der ersten gegen Abbildung 45: Streuplot der ersten gegen die zweite Hauptkomponente (UPEC2) die zweite Hauptkomponente (UPEC3)

In den Analysen zu UPEC4 und UPEC5 hat man bemerkt, dass die Visualisierungen keine

klar erkennbaren Strukturen hervorbringen. In UPEC4 ist dies begründet in der

Morphologie des Spermiums. Andererseits sind auch die Anteile an den Gesamtvarianzen

der ersten Hauptkomponente hier niedriger, was durch den Streuplot (Abb. 46) in

größeren Abständen zu den Koordinatenachsen erkennbar ist. In UPEC5 ist ein

Schwerpunkt der Punktwolke erkennbar. Der Anteil der Gesamtvarianz beträgt hier in der

ersten Hauptkomponente 47,3% und in der zweiten Hauptkomponente 16,39%. Die Werte

sind durch viele Ausreißer nicht besonders hoch. Dennoch erklärt der Schwerpunkt, dass

in der ersten und zweiten Hauptkomponente gleiche, farbliche Markierungen entstehen. In

der zweiten Hauptkomponente hebt sich der dunkelblaue Teil zudem vom Rest ab.

36

Abbildung 46: Streuplot der ersten gegen Abbildung 47: Streuplot der ersten gegen die zweite Hauptkomponente (UPEC4) die zweite Hauptkomponente (UPEC5)

6 Zusammenfassung und Ausblick

Ein geeignetes Verfahren zur Klassifizierung der Spermien ist heute essentiell. Wenn schon in

den ersten TV-Serien (Private Practice, Staffel 5, Episode 6 und 7) das Thema der ICSI

aufgegriffen wird, zeigt es nur, wie bedeutsam die künstliche Befruchtung in der

Industriegesellschaft geworden ist. Da die ICSI die häufigste Methode der

Reproduktionsmedizin ist, rücken die Funktionsweisen des Akrosoms oder der Geißel in den

Hintergrund und sind für die Analysen weniger wichtig. Hydrolytische Enzyme oder eine

hohe Beweglichkeit des Spermiums haben keinen Einfluss auf den Befruchtungsmodus, wenn

dieser vom Mensch selbst durch eine Injektion durchgeführt wird. Also werden

Beweglichkeitsanalysen, Morphologiebetrachtungen in den Hintergrund gestellt und in das

Innere des Spermiums geschaut. Der Kern rückt in den Fokus der Analysen und Bewertungen

der Spermienqualität. Dabei soll festgestellt werden, ob die DNA Defekte aufweisen kann.

Mittels verschiedener chemischer Analysen erreichte man dies schnell und stellte fest, dass

die Spermium-DNA weitaus robuster ist als somatische DNA. Die Protamine sorgen für eine

starre Nukleusstruktur und ein Hyperkondensation der DNA. Darüber hinaus sichern

Protamine den Schutz vor körpereigenen Nukleasen oder äußeren Einflüssen, weshalb die

DNA in der Protaminverpackung weniger anfällig für Gendefekte ist. Allerdings erzielen die

chemischen Analysen nur eine Einschätzung des Spermas im Gesamten. Diese sind aber für

die weitere Verwendung unbrauchbar. Schließlich wird das Spermium durch die Analysen

zerstört. Daher bietet sich die Raman Mikrospektroskopie geradezu an. Das Spermium wird

nur kurzfristig mit einem Laser bestrahlt, so dass dieser keine Zellschäden verursacht und

daraufhin für die ICSI verwendet werden kann. Nun hat man die Ergebnisse der Raman-

Shifts, aber jedes einzelnes Spektrum zu untersuchen, ist in der Medizin kaum angebracht.

37

Daher ist ein Klassifizierungsverfahren unabdingbar. Es wurde gezeigt, dass die

Hauptkomponentenanalyse dies bedingt erzielt. Es wurden in UPEC2 und UPEC3 die

farblichen Klassen den morphologischen Strukturen Akrosom, Nukleus und

Cytoplasmamembran zugeordnet. Weiterhin ließen farbliche Abweichungen Rückschlüsse auf

den DNA-Aufbau zu und damit waren Klassifizierungen möglich.

Allerdings zeigen die Bilder von UPEC4 und UPEC5 auch die Grenzen der PCA auf. Es

werden in der Hauptkomponentenanalyse ein linearer Zusammenhang und eine

Normalverteilung angenommen. Die Streuplots zeigen, dass die Hauptkomponenten keine

genaue Approximation erzielten. Daher ist anzunehmen, dass die Daten nicht unbedingt linear

verteilt sind. Schließlich handelt es sich um eine Zelle, die in ihrer Zusammenstellung nicht

unbedingt linearen Zusammenhängen folgt. Bei einem Ortswechsel vom Nukleus zur

Plasmamembran nimmt der Proteinanteil zum Beispiel rapide ab und ist nicht linear

beschreibbar. Ebenso sind die Intensitäten in den Raman-Shifts nicht proportional, sondern

hängen neben der Konzentration auch von der Art des Moleküls ab.

Zusammenfassend lässt sich feststellen, dass die Hauptkomponentenanalyse ein bedingt

fähiges Verfahren zur Klassifizierung von Spermien ist. Als weitere Möglichkeit zur

Klassifizierung besteht die Kernel-PCA, die keinen linearen Zusammenhang voraussetzt,

sondern die Daten in einen linearen Raum transformiert. Dies eröffnet die Chance, auch

Datensätze wie in UPEC4 oder UPEC5 zu klassifizieren.

38

7 Literaturverzeichnis

Texte

[1] Bruce Alberts, Alexander Johnson, Julian Lewis, Martin Raff, Keith Roberts, Peter

Walter: Molekularbiologie der Zelle. 5. Auflage, Wiley-WCH Verlag & Co. KGaA,

Weinheim, 2011, S. 235-243, 269, 1436-1477.

[2] Fred Böker: Kapitel 4: Hauptkomponentenanalyse. Vorlesung Multivariate Verfahren

im SS2005, http://www.statoek.wiso.uni-goettingen.de/veranstaltungen/Multivariate/

Daten/mvsec4.pdf, 27.05.2012.

[3] Claudia Broelemann: Proseminar Machine Learning: Hauptkomponentenanalyse

(PCA) und Kernel-PCA, http://www.cogsys.cs.uni-tuebingen.de/lehre/ss06/

pro_learning/ClaudiaBroelemann.pdf, 27.05.2012.

[4] Thomas Huser, Christine A. Orme, Christopher W. Hollars, Michele H. Corzett, Rod

Balhorn: Raman spectroscopy of DNA packaging in individual human sperm cells

distinguishes normal from abnormal cells. Journal of Biophotonics, 2009, S. 322- 332.

[5] I.T. Jolliffe: Principal Component Analysis. 2. Auflage, Springer Verlag, New York,

2002.

[6] F.B. Kolodziej, P. Hüppe, T. Katzorke: Techniken der assistierten Reproduktion.

Wichtigsten Verfahren und Ergebnisse in Deutschland und Europa, in: Der Urologe.

Bd. 50, Nr. 1, 2011, S. 47-52.

[7] Friedrich Lottspeich, Joachim W. Engels (Hrsg.): Bioanalytik. 3. Auflage, Springer-

Verlag, Berlin/ Heidelberg, 2012, S. 151-200.

[8] C. Mallidis, J. Wistuba, B. Bleisteiner, O.S. Damm, P. Groß, F. Wübbeling, C.

Fallnich, M. Burger, S. Schlatt: In Situ visualization of damaged DNA in human

sperm by Raman microspectroscopy. In: Human Reproduction. 26, 2011, S. 1641-

1649.

39

[9] Gerhard Marinell: Multivariate Verfahren. Eine Einführung für Studierende und

Praktiker, R. Oldenbourg Verlag München, Wien, 1977, S.97-113.

[10] Konrad Meister, Diedrich A. Schmidt, Erik Bründermann, Martina Havenith:

Confocal Raman Microspectroscopy as an analytical tool to asses the mitochondrial

status in human spermatozoa. In: The Analyst, 135, 2010, S. 1370-1374.

[11] W.K. Purves, D. Sadava, G.H. Orians, H.C. Heller: Biologie, 7. Auflage, Spektrum

Akademischer Verlag, München, 2006, S. 98,1446.

[12] Rainer Schlittgen: Multivariate Statistik, 1. Auflage, Oldenbourg Wissenschaftsverlag

GmbH, München, 2009, S. 259-278, 533.

[13] Bernhard Schölkopf, Klaus-Robert Müller, Alexander J. Smola: Lernen mit Kernen.

Support-Vektor-Methoden zur Analyse hochdimensionaler Daten,

http://www.kyb.mpg.de/fileadmin/user_upload/files/publications/pdf733.pdf,

27.05.2012.

[14] Bernhard Schölkopf, Alexander Smola, Klaus-Robert Müller: Kernel Principal

Component Analysis, http://www.tribesandclimatechange.org/docs/tribes_450.pdf,

27.05.2012.

[15] Jeffrey A. Shaman, W. Steven Ward: Sperm chromatin stability and susceptibility to

damage in relation to its structure, In: The Sperm Cell. Production, Maturation,

Fertilization, Regeneration, hg. v. Christopher De Jonge, Christopher Barratt, 1.

Auflage, Cambridge University Press, 2006.

[16] Jan Siegemund: Hauptkomponentenanalyse (Principal Component Analysis (PCA))

Proseminar „Robuste Signalidentifikation”. WS 2003/04, http://www-mmdb.iai.uni-

bonn.de/lehre/proprak0304/siegemund.pdf, 27.05.2012.

[17] Dee U. Silverthorn: Physiologie. 1. Auflage, Pearson Studium, München, 2009.

40

[18] Peter Sutovsky, Gaurishankar Manandhar: Mammalian spermatogenesis and sperm

structure. Anatomical and compartmental analysis, In: The Sperm Cell. Production,

Maturation, Fertilization, Regeneration von Christopher De Jonge, Christopher

Barratt, 1. Auflage, Cambridge University Press, 2006.

[19] Volker Tresp: Hauptkomponentenanalyse, http://www.dbs.ifi.lmu.de/Lehre/

MaschLernen/SS2011/folien/Hauptkomponentenanalyse2011.pdf, 27.05.2012.

[20] Ching-Hei Yeung, Trevor G. Cooper: Physiologie der Spermienreifung und

Fertilisierung, in Andrologie. Grundlagen und Klinik der reproduktiven Gesundheit

des Mannes, E. Nieschlag, H.M. Behre, S. Nieschlag, Auflage 3, Springer

Medizin Verlag Heidelberg, 2009, S. 64-82.

[21] Ching-Hei Yeung, Trevor G. Cooper: Spermienqualität und Spermienfunktionstest. In

Andrologie: Grundlagen und Klinik der reproduktiven Gesundheit des Mannes, E.

Nieschlag, H.M. Behre, S. Nieschlag, Auflage 3, Springer Medizin Verlag Heidelberg,

2009, S. 147- 160.

[22] Dr. Stephan Dreiseitl, Einschub Diskrete Cosinus-Transformation, WS 2003/ 2004

http://staff.fh-hagenberg.at/sdreisei/Teaching/WS2003-

2004/AGM3/agm3_skriptumDCTpart.pdf, 19.06.12.

Abbildungen:

[A1] Mariana Ruiz: Simplified spermatozoon diagram,

http://commons.wikimedia.org/wiki/File:Simplified_spermatozoon_diagram.svg,

28.05.2012

[A2] Neugebauer DC, Neuwinger J, Jockenhovel F, Nieschlag E in Andrologie:

Grundlagen und Klinik der reproduktiven Gesundheit des Mannes, S.75 von E.

Nieschlag, H.M. Behre, S. Nieschlag, Auflage 3, Springer Medizin Verlag

Heidelberg, 2009

41

8 Abbildungsverzeichnis

1 Beziehung von Vektoren 032 Projektion 043a Schema eines Spermiums 113b Spermienkopf im Querschnitt 124 Elektronenmikroskopische Aufnahme von menschlichen Spermien 135 Erste Hauptkomponente von UPEC1 ungefiltert 236 Erste Hauptkomponente von UPEC1 gefiltert 237 1. PCA-Koeffizient von UPEC 1 248 2. PCA-Koeffizient von UPEC 1 249 3. PCA-Koeffizient von UPEC 1 2410 4. PCA-Koeffizient von UPEC 1 2411 1. PCA-Koeffizient (Höhe) gegen den 2. PCA-Koeffizient (Farbe) von UPEC1

aufgetragen 25

12 Originalbild des Spermiums UPEC1 2513 Gewichtung der Raman-Shifts durch die erste und zweite Hauptkomponente in

UPEC1 25

14 1. PCA-Koeffizient von UPEC 2 2615 2. PCA-Koeffizient von UPEC 2 2616 3. PCA-Koeffizient von UPEC 2 2617 4. PCA-Koeffizient von UPEC 2 2618 1. PCA-Koeffizient (Höhe) gegen den 2. PCA-Koeffizient (Farbe) von UPEC2 2719 Originalbild des Spermiums UPEC2 2720 Gewichtung der Raman-Shifts durch die erste und zweite Hauptkomponente in

UPEC2 27

21 Intensität des Raman Shifts 1092cm-1 im Vergleich. Blaues Feld (0.0697,0.0263), türkises Feld (0.0697,1.0299), gelbes Feld (0.0697,1,2306)

27

22 1. PCA-Koeffizient von UPEC 3 2823 2. PCA-Koeffizient von UPEC 3 2824 3. PCA-Koeffizient von UPEC 3 2825 4. PCA-Koeffizient von UPEC 3 2826 1. PCA-Koeffizient (Höhe) gegen den 2. PCA-Koeffizient (Farbe) von UPEC3

aufgetragen 29

27 Originalbild des Spermiums UPEC3 2928 Gewichtung der Raman-Shifts durch die erste und zweite Hauptkomponente in

UPEC3 29

29 Raman Shifts der Felder (-0.56,-0.0257) in blau und (-1,3745,-0,4293) in türkis 2930 1. PCA-Koeffizient von UPEC 4 3031 2. PCA-Koeffizient von UPEC 4 3032 3. PCA-Koeffizient von UPEC 4 3033 4. PCA-Koeffizient von UPEC 4 3034 Bild des Spermiums UPEC4, im schwarzen Kasten der Nukleus 3135 Gewichtung der Raman-Shifts durch die erste und zweite Hauptkomponente in

UPEC4 31

36 Raman Shifts der Felder (0.0379, 0.0952) in blau und (-1.0699, 0.8044) in türkis 3237 Bild des Spermiums UPEC5 3238 1. PCA-Koeffizient von UPEC 5 3339 2. PCA-Koeffizient von UPEC 5 3340 3. PCA-Koeffizient von UPEC 5 3341 4. PCA-Koeffizient von UPEC 5 33

42

42 Gewichtung der Raman-Shifts durch die erste und zweite Hauptkomponente in UPEC3

33

43 Gewichtung der Raman-Shifts durch die erste und zweite Hauptkomponente in UPEC5

33

44 Streuplot der ersten gegen die zweite Hauptkomponente (UPEC2) 3545 Streuplot der ersten gegen die zweite Hauptkomponente (UPEC3) 3546 Streuplot der ersten gegen die zweite Hauptkomponente (UPEC4) 3647 Streuplot der ersten gegen die zweite Hauptkomponente (UPEC5) 36

hauptkomponentenanalyse und ihre anwendung zur ... · ein verfahren der multivariaten statistik, um...

Documents