hauptkomponentenanalyse und ihre anwendung zur ... · ein verfahren der multivariaten statistik, um...
TRANSCRIPT
Hauptkomponentenanalyse und ihre Anwendung zur Klassifizierung
von Spermien aus Raman Mikrospektroskopie-Daten
Bachelorarbeit zur Erlangung des akademischen Grades
2-Fach-Bachelor
Westfälische Wilhelms-Universität Münster Fachbereich Mathematik und Informatik
Institut für Numerische und Angewandte Mathematik
Betreuung: Prof. Dr. Martin Burger Eingereicht von: Julia Sietmann Münster, 28.06.2012
Eidesstattliche Erklärung Hiermit versichere ich, Julia Sietmann, dass ich die vorliegende Arbeit mit dem Titel
Hauptkomponentenanalyse und ihre Anwendung zur Klassifizierung von Spermien aus Raman
Mikrospektroskopie-Daten
selbständig verfasst habe, und dass ich keine anderen Quellen und Hilfsmittel als die
angegebenen benutzt habe. Gedanklich, inhaltlich oder wörtlich Übernommenes habe ich
durch Angabe von Herkunft und Text oder Anmerkung belegt bzw. kenntlich gemacht. Dies
gilt in gleicher Weise für Bilder, Tabellen, Zeichnungen und Skizzen, die nicht von mir selbst
erstellt wurden.
Alle auf der CD beigefügten Programme sind in Anlehnung an die von Prof. Dr. Burger zu
Verfügung gestellten Programme und sind von mir erweitert und verändert worden.
Münster, 28.06.2012 _________________________________ Unterschrift
Inhaltsverzeichnis
1. Einleitung ........................................................................................................................... 1 2. Hauptkomponentenanalyse ................................................................................................ 2
2.1. Allgemeines ............................................................................................................... 2 2.2. Statistische Grundbegriffe.......................................................................................... 2 2.3. Herleitung................................................................................................................... 4 2.4. Eigenschaften der Hauptkomponenten ...................................................................... 7 2.5. Probleme der PCA ..................................................................................................... 8 2.6. Kernel-PCA ................................................................................................................ 9
3. Spermienmorphologie ...................................................................................................... 11 3.1. Allgemein ................................................................................................................. 11 3.2. Der Kopf des Spermiums ......................................................................................... 11
3.2.1. Nukleus ............................................................................................................ 11 3.2.2. Akrosomregion ................................................................................................ 12 3.2.3. Mittlere Äquatorialebene ................................................................................. 13 3.2.4. Postacrosomaler Bereich .................................................................................. 13
3.3. Flagellum ................................................................................................................. 13 3.3.1. Verbindungsstück zwischen Kopfregion und Mittelstück ............................... 14 3.3.2. Mittelstück ....................................................................................................... 14 3.3.3. Hauptteil ........................................................................................................... 14
3.4. Spermien-Chromatin ................................................................................................ 14 3.4.1. Aufbau und Vergleich mit somatischen Chromatin ......................................... 15 3.4.2. Anfälligkeit und Spermien-Chromatin-Tests ................................................... 16
4. Verfahren der Reproduktion ............................................................................................ 17 5. Raman-Spektroskopie zur Analyse der Spermienqualität ............................................... 18
5.1. Raman-Spekroskopie ............................................................................................... 18 5.2. Bisherige Erkenntnisse in der Klassifizierung von Spermien mittels Raman Mikrospektroskopie- Daten...................................................................................... 19 5.3. Hauptkomponentenanalyse mit Raman Mikrospektroskopie-Daten von Mäusespermien ........................................................................................................ 22 5.4. Visualisierungen....................................................................................................... 23 5.4.2. UPEC2 ................................................................................................................. 25 5.4.3. UPEC3 ................................................................................................................. 27 5.4.4. UPEC4 ................................................................................................................. 30 5.4.5. UPEC5 ................................................................................................................. 32 5.5. Klassifizierung ......................................................................................................... 34
6. Zusammenfassung und Ausblick ..................................................................................... 36 7. Literaturverzeichnis ......................................................................................................... 38 8. Abbildungsverzeichnis ..................................................................................................... 41
1
1 Einleitung
In der heutigen, industriellen Gesellschaft sinkt bei den Männern die Spermienqualität und es
steigt somit die Nachfrage nach der unterstützenden Reproduktion, wie beispielsweise die
intracytoplasmatischen Spermatozoeninjektion (ICSI). Dabei kommt es zur Injektion des
Spermiums in die Eizelle. Dies hat den Vorteil, dass die Akrosomreaktion eines Spermiums
nicht durchlaufen werden muss. Diese Reaktion beinhaltet die Ausschüttung von
hydrolytischen Enzymen aus dem Akrosom, um in die Eizelle zu gelangen. Dabei sind die
Zellen der Corona radiata zu passieren und eine Proteinhülle, die Zona pellucida, der Eizelle
zu durchdringen. Ebenso werden die Bindung an die Eizelle und die Fusion mit der Eizelle
umgangen. (vgl. [6], [17])
Die bisherigen Kenntnisse zur Klassifizierung von Spermien sind häufig rein morphologisch
und sind in Hinblick auf die Reaktionen zwischen Eizelle und Spermium aufgestellt worden.
Bei der ICSI wird die primäre Reaktion zwischen Eizelle und Spermium umgangen, so dass
verstärkt ein Blick auf das Innere von Spermien geworfen wird. Die Morphologie von
Spermien sagt selten etwas über die innere Zusammensetzung und Schäden in der DNA aus
und initiierte daher zahlreiche chemische Analysen. Diese wiederum schädigen häufig die
untersuchten Spermien und nützen der ICSI wenig. (vgl. [8])
Die Entwicklung eines Verfahrens zur Klassifizierung von Spermien ohne Zellschädigungen
ist daher essentiell. Die Raman Mikrospektroskopie in Verbindung mit der
Hauptkomponentenanalyse ist ein erfolgsversprechendes Verfahren zur Analyse der
chemischen Zusammensetzung und anschließenden Klassifizierung der Spermien.
Im dieser Arbeit wird zunächst die mathematische Methode der Hauptkomponentenanalyse
mit ihren Vor- und Nachteilen erklärt. Als weiterführende Methode wird die Kernel-
Hauptkomponentenanalyse erläutert.
Anschließend wird der Aufbau von Spermien im Detail und die strukturellen Bedeutungen für
die Befruchtung erläutert.
Der vierte Abschnitt beschreibt kurz die verschiedenen Verfahren der Reproduktion.
Im fünften Abschnitt werden die Studien zur Klassifizierung von Spermien anhand von
Raman Mikrospektroskopie-Daten vorgestellt und anschließend die eigene Bearbeitung von
Daten erläutert und interpretiert. Klassifizierung bedeutet hier befruchtungsfähige Spermien
von infertilen Spermien zu unterscheiden und anhand von Kriterien zu bewerten.
Abschließend werden die Informationen der Arbeit zusammengeführt und ihre Bedeutung in
der Reproduktionsmedizin gezeigt.
2
2 Hauptkomponentenanalyse
2.1 Allgemeines
Die Hauptkomponentenanalyse (Englisch: Principal component analysis; kurz: PCA) ist
ein Verfahren der multivariaten Statistik, um Datensätze zu veranschaulichen und zu
reduzieren. Dabei handelt es sich um Transformationen des Koordinatensystems, die es
ermöglichen, die meist mehrdimensionalen Daten nach ihren Varianzen und Bedeutungen
zu sortieren. Im Bereich der experimentellen Naturwissenschaften werden Versuchsreihen
in einem Koordinatensystem aufgetragen. Bei linearen Zusammenhängen wurden zur
Verdeutlichung Regressionsgeraden eingetragen. Nun werden anstatt eindimensionaler
Regressionen der y-Achse auch mehrdimensionale vorgenommen (vgl. [19]). Dies erfolgt
über Achsentransformationen, so dass die Kovarianzen der mehrdimensionalen Merkmale
in den jeweiligen Richtungen maximiert (vgl. [3]) und gleichzeitig die Abstände der
Punkte zu den Projektionen minimiert werden. Die Transformationsmatrix besteht aus den
Eigenvektoren der Kovarianzmatrix, so dass man schließlich auf das Eigenwertproblem
stößt.
Wie erwähnt dient die PCA auch der Sortierung der Daten nach ihrer Bedeutung, daher
findet die Analyse nicht nur in den Wissenschaften ihren Nutzen, sondern auch in anderen
Gebieten. Beispielsweise basiert der Google-Algorithmus auf der Hauptkomponenten-
analyse, da es die Ähnlichkeit aller Texte zu den eingegebenen Wörtern misst und
anschließend mittels der PCA nach ihrer Bedeutung sortiert (vgl. [19]).
2.2 Statistische Grundbegriffe
Da die Hauptkomponentenanalyse ein Verfahren der multivariaten Statistik ist, sollten im
Vorfeld für das Verständnis einige Begriffe aus dem Bereich erklärt werden.
Vektoren x und y seien stets aus dem n und es wird das Standardskalarprodukt
verwendet, folglich heißt es: yxyx T , wobei Tx der transponierte Vektor von x
ist.
Seien x1,…,xp n zufällige Beobachtungspunkte der Dimension n, die p Merkmale und
n verschiedene Messreihen umfassen.
Alle Messreihen zusammengestellt in eine Datenmatrix ergeben X pn mit
)x,,x(X p1 .
3
Um eine Zentrierung der Daten mithilfe des arithmetischen Mittels μ vorzunehmen,
berechnet man die arithmetischen Mittelwerte aller Spalten. Die zentrierte Datenmatrix
hat dann die Gestalt:
pnp2n21n1
p2p222121
p1p212111
μxμxμx
μxμxμx
μxμxμx
Z pn mit
n
1iijj x
n
1μ , j= 1,…,p .
Zur Analyse der Streuung der Messpunkte um den Mittelwert wird im Allgemeinen die
Varianz genutzt, die quadratisch die Abstände misst. Die Kovarianz berechnet die
Streuung im Zusammenhang von zwei Merkmalen, wohingegen die Varianz nur ein
Merkmal betrachtet. Die Kovarianzmatrix ppK umfasst alle Kovarianzen und
Varianzen und berechnet sich wie folgt:
n
1ikikjijkjjk )μ)(xμ(x
1n
1) x,Kov(xK , pkj ,...,1, und ppT ZZ
1n
1K
.
Es ist ersichtlich, dass die Matrix symmetrisch ist, da Kij =Kji pji ,...,1, und es gilt
für diese reelle Matrix KTK=KKT. Daraus schließt sich nach Sätzen der linearen Algebra,
dass K nur reelle Eigenwerte besitzt und die Eigenvektoren senkrecht zueinander sind.
Ebenso bilden die Eigenvektoren eine Basis des p .
)()(
),(,
ji
jixx
xVarxVar
xxKovr
ji
bezeichnet man als Korrelationskoeffizient und gibt
Aufschluss über die linearen Zusammenhänge der
Merkmale. Geometrisch betrachtet, bezeichnet der
Korrelationskoeffizient den Winkel zwischen den
beiden Merkmalsvektoren, denn
1,1)cos(
)μ)(xμ(x1n
1)μ)(xμ(x
1n
1
)μ)(xμ(x1n
1
)()(
),(
n
1ikikkik
n
1ijijjij
n
1ikikjij
,
ji
jT
i
ji
jixx
zz
zz
xVarxVar
xxKovr
ji
α
zi
zj
Abbildung 1: Beziehung von Vektoren
4
Wenn der Koeffizient -1 oder 1 ergibt, heißt das also, dass die Vektoren auf einer Geraden
liegen, bei einem Korrelationskoeffizienten von 0 liegt ein rechter Winkel vor und die
beiden Vektoren werden als unkorreliert bezeichnet. Da der Nenner ungleich null ist,
muss bei unkorrelierten Vektoren die Kovarianz null sein. Dies wird in der Herleitung der
Hauptkomponentenanalyse gebraucht. (vgl. [12])
2.3 Herleitung
Seien wie in Abschnitt 2.2 beschrieben x1,…,xp n zufällige Beobachtungspunkte, die
in einer Datenmatrix X zusammengestellt werden. Dabei beschreibt eine Spalte ein
Merkmal. Nach einer Zentrierung der Datenmatrix ergibt sich Z.
Im zweidimensionalen Raum ist es leicht vorstellbar,
dass eine optimale Approximation eines Datensatzes
eine Projektion p auf einen Vektor v ist, wobei die
Abstände zu den Punkten z minimal sind.
Nach der Abbildung gilt:
y
vc
y
p(α
)cos
v
y)cos(c .
Durch diese Umformung nach dem Streckungsfaktor c erhält man durch Einsetzen in die
Projektionsgleichung folgendes:
2)cos(
v
vy
v
y
yv
vy
v
yvcp
TT
Wenn man für v die Länge eins wählt, so ist p mit der Länge c gleichzusetzen und die
Projektion p lässt sich berechnen:
vvyvv
vyp T
T
)(2
.
Nun soll der Abstand zu allen Punkten n1,...,i,z p1i , zur Projektion p1p ,
minimal sein unter der Bedingung, dass der Vektor v die Länge eins besitzt. Da zi ein
Zeilenvektor ist, gilt für die Projektionsgleichung mit einem Spaltenvektor v:
Ti vvzp )( .
Damit lässt sich nun die Extremalbedingung aufstellen und es lässt sich zeigen, dass die
Minimierung der Abstände mit der Maximierung der Varianz gleichzusetzen ist.
y
α
v p =c·v
y-p
Abbildung 2: Projektion
5
1 )()1(min
1 min
1 )()(min
1 )(min
1 )(min
1 )()()()()(min
1 ))(()()())((min
1 ))(())((min
1 )()(min
1 1
1 1
1 1
1
11
1
1
1
vKvvKSpurn
vvzzvzz
vvzvzzz
vvzvzzz
vvzvzzz
vvzvvvzvzvzvzvzzz
vvvzvvzzvvzvvzzzz
vvvzzvvzz
vpzpz
T
v
n
i
n
ii
Ti
TTii
v
n
i
n
ii
Ti
Tii
v
n
i
n
i
Tii
Tii
v
Ti
n
ii
Tii
v
Ti
Ti
Tii
Ti
n
ii
Tii
v
TTi
Ti
Ti
Ti
TTi
n
ii
Tii
v
TTii
n
i
Tii
v
n
ii
Ti
v
p
p
p
p
p
p
p
p
p
Wobei K die Kovarianzmatrix von X ist. Die Spur einer Matrix beschreibt die Summe der
Diagonalelemente und ist unabhängig von v. Daher ist der Ausdruck minimal, wenn
KvvT für ein pv , 1v , maximal wird. (vgl. [12])
Wenn man den Ausdruck KvvT maximiert, heißt dies nicht nur die Abstände der
Datenpunkte zur Projektion zu minimieren, sondern auch die Varianz entlang der
Projektion zu maximieren, denn es gilt:
1)(max
1)(1
1max1
1
1max1max
vZvVar
vZvZvn
vZvZn
vvKvv
p
ppp
v
T
v
TT
v
T
v
und für die nicht zentrierte Datenmatrix
1)(max1)(1
1max1)(
1
1max
vXvVarvXvXv
nvZvZv
n ppp v
T
v
T
v
Zur Maximierung lässt sich mithilfe des Lagrange-Multiplikators das Lagrange-
Funktional ohne Nebenbedingung aufstellen:
),( vL )1( vvKvv TT mit ,pv .
Die Maximierung des Lagrange-Funktionals erfolgt mit der notwendigen Bedingung für
Extremstellen. Daher wird das Differential nach pv gebildet und gleich null gesetzt.
6
0),(
v
vL
vKv
vKv
0
.
Damit ist der ideale, p-dimensionale Vektor v, auf dem die Projektion vorgenommen
wird, ein Eigenvektor (EV) von K und der Lagrange-Multiplikator ein Eigenwert (EW)
von K. Die Maximierung des Problems erfolgt alleine mithilfe des größten
Eigenwertes [16]) (vgl. :
Kvon EWgrößter ist λ λmax
K von EV vK,EW von ist λ , v1,vvλvmax
K von EV vK,EW von ist λ , v1,vλvvmax
v,1vKvvmax
pT
pT
pT
Nun steht die erste, p-dimensionale Projektionsebene v fest. Setze v= v1. Um die zweite,
p-dimensionale Projektionsebene zu ermitteln, sucht man wieder einen Vektor v2p ,
der den Ausdruck v2TKv2 maximiert. Der p-dimensionale Vektor v2 sollte die Länge eins
haben und unkorreliert zu v1 sein. Unkorreliert heißt, dass die Vektoren orthogonal
zueinander stehen, also v1T· v2=0. Durch Aufstellen des Lagrange-Funktionals und dem
anschließenden Differenzieren folgt:
,,mit )1(),,( 122222pTTT vvvvvKvvvL
und es gilt nach Differenzierung:
122
),,(vvKv
v
vL
.
Durch null setzen des Differentials und linksseitige Multiplikation mit v1T kommt heraus,
dass null ist:
0
0
0
0
0
nach 0
21
1
11
0
2121
112121
122
Kvv
vvvvKvv
vvλvvKv v
vvKv
T
TTT
TTT
Da man voraussetzt, dass die Kovarianz der Vektoren null ist, erschließt sich *:
0),()(1
1212121
ZvZvKovZvZv
nKvv TT
7
Daher ergibt sich wieder
2222 0 vKvvKv
und damit ist v2 ein Eigenvektor von der Kovarianzmatrix K. (vgl. [5])
Fortsetzung bis vp liefert p Projektionsebenen, wobei vi, i=1,…,n, stets die Eigenvektoren
der Kovarianzmatrix K sind. Die Eigenvektoren der Kovarianzmatrix K bilden eine Basis
des p aufgrund der Symmetrie von K. Die Hauptkomponenten und damit die neuen
Achsen des Koordinatensystems erhält man nach der Definition der Projektion p,
vvyp T )( , y ein Spaltenvektor, durch Multiplikation des i-ten Vektors vi mit dem i-ten
Basisvektoren ei des ursprünglichen Koordinatensystems: (eiT·vi)·vi, i=1,…,p. Zur
Drehung der Datenmatrix X oder der zentrierten Datenmatrix Z mittels der Matrix V aus
den Eigenvektoren von K ergibt sich die Gleichung: pnVXX ~ bzw.
pnVZZ ~. (vgl. [12])
2.4 Eigenschaften der Hauptkomponenten
Nach dem Berechnen der Hauptkomponenten liegt ein neues Koordinatensystem vor, das
zentriert in der Punktwolke gelegen ist.
Für die Kovarianzmatrix des transformierten Systems ergibt sich gemäß der Formel, dass
sich die Varianz aus den Eigenvektorenmatrix V und der Kovarianzmatrix von X
zusammensetzt:
VKV
VZZVn
VZVZn
ZZn
K
T
TT
T
T
1
1
)()(1
1
~~
1
1~
.
Sei die Matrix p eine Diagonalmatrix mit den Eigenwerten der Kovarianzmatrix K,
so gilt unter der Verwendung, dass die Eigenvektoren eine Orthonormalbasis (ONB)
bilden:
I
T
V
T
EW
T VVVVVKVK ONB
~.
Daraus erschließt sich, dass die Varianzen der Hauptkomponenten die Eigenwerte sind
und die Hauptkomponenten unkorreliert zueinander sind:
[12]) (vgl. .
0 ji
jiK i
ij
8
Dieses Wissen ermöglicht eine Reduktion eines Koordinatensystems, denn die erste
Hauptkomponente besitzt die größte Varianz bzw. den größten Eigenwert λ1 und
absteigend dann die letzte Hauptkomponente die geringste Varianz bzw. den kleinsten
Eigenwert λp. Dementsprechend haben die ersten k-Hauptkomponenten den größten
Anteil an der Gesamtvarianz und demonstrieren ein großes Maß an Streuung. Der Anteil
an der Gesamtvarianz aj für die j-te Hauptkomponente ermittelt sich folgenderweise:
)(...21
Spura j
p
jj
.
Ist nun das Ziel, die Daten beispielsweise auf ein Anteil von 80% der Gesamtvarianz zu
reduzieren, so ermittelt man ein pq , das folgende Gleichung erfüllt:
)(
...8,0 21
Spurq
.
Nun wird der Reduktionsschritt durchgeführt, in dem man die Matrix der Eigenvektoren
verkürzt auf qpqq vv ,...,V 1 . Die q Hauptkomponenten ergeben sich schließlich
durch Multiplikation der Datenmatrix X und der Eigenvektorenmatrix Vq:
qnqq VXX ~
,
oder wahlweise im zentrierten System durch
qnq VZZ ~
.
Auf dieser Weise vermindert man einen Datensatz mit p Merkmalen auf q Merkmale.
(vgl. [12])
Durch eine Reduktion der Daten lassen sich wichtige Varianzen und damit Unterschiede
zwischen Datensätzen verschiedener Orte, beispielsweise bei Spermien, extrahieren und
Klassifikationen vornehmen.
2.5 Probleme der PCA
Die Hauptkomponentenanalyse ist ein lineares Verfahren, dass die transformierten Achsen
entlang der größten Varianzen ausrichtet. Dabei wird vorausgesetzt, dass die Daten
normalverteilt sind und durch Linearkombinationen approximierbar sind. Im
zweidimensionalen Raum ist dies so vorzustellen, dass die Daten ungefähr in einer
ellipsenförmigen Anordnung vorliegen, wo der Mittelwert in dem Mittelpunkt der Ellipse
liegt. Die Hauptkomponenten beschreiben dann die größten und kleinsten Durchmesser
der Ellipse. Sind die Daten allerdings kreisförmig angeordnet, so kann die erste Achse
nicht entlang der größten Streuung ausgerichtet werden, da alle Varianzen gleichwertig
9
sind. Zur Analyse von Daten, die nicht linear im Koordinatensystem verteilt sind, wurde
die Kernel-PCA entwickelt. Dabei ist es möglich, jegliche Art der Verteilung in nicht-
linearen Hauptkomponenten auszudrücken. (vgl. [3])
Ebenso sind die Ergebnisse der PCA abhängig von der Skalierung der Achsen und die
Interpretationen der Ergebnisse sind subjektiv. Schließlich ist die Anzahl der
Hauptkomponenten bei einer Reduktion nicht eindeutig und hängt von der Wahl und
Absicht des Durchführenden ab. (vgl. [2])
Daher lässt sich zusammenfassend sagen, dass die Hauptkomponentenanalyse ein gutes
Verfahren zur Strukturanalyse ist, aber die Ergebnisse Modellfehler aufweisen können
und somit mit Bedacht zu interpretieren sind. (vgl. [2])
2.6 Kernel-PCA
Die Kernel-PCA ist eine Abwandlung der Hauptkomponentenanalyse, die in der Lage ist,
nicht-lineare Strukturen aus einem Datensatz zu klassifizieren und somit die PCA zu
verallgemeinern.
Als Ansatz wird eine nicht-lineare Abbildung definiert. Diese Funktion hat die Struktur
)( ,: iip zzF , wobei die p
iz 1 , i=1,…,n, Datenpunkte beschreiben, die
vom Mittelwert bereinigt sind. In der zentrierten Datenmatrix würden diese in einer Zeile
abgelesen werden. Die Funktion hat die Eigenschaft, dass die Skalarprodukte der
Funktion sich aus allen Produkten von d Einträgen der Vektoren x und y
zusammensetzen:
d ),,()()()( jid
jiji zzkzzzz ℕ, nji ,...,1, . (vgl. [13])
Damit stellt man die Kovarianzmatrix der Φ -transformierten Daten auf:
n
j
ppTjj zz
nK
1
)()(1
1.
Nun werden, wie in der normalen Hauptkomponentenanalyse, die Eigenwerte der
Kovarianzmatrix gesucht. Es wird sich zeigen, dass man wieder auf ein lineares
Eigenwertproblem stößt, was bis hierher nicht ersichtlich ist. Diese Herleitung richtet sich
nach Schölkopf (vgl. [13], [14]).
Man stelle die Eigenwertgleichung auf und zeige, dass der Eigenvektor sich als
Linearkombination der )(),...,( 1 nzz darstellen lässt:
n
jj
Tj
n
j
Tjj zvz
nvzz
nvKv
1inationLinearkomb
1
)())((1
1))()(
1
1(
10
n
iii
n
zv
zzspanv
1
1
)(
)(),...,(
Durch linksseitige Multiplikation von Φ(zk) an der Eigenwertgleichung erhält man:
)1(
),...,( und ),()()( wobei,)1(
)()()(1
1)()()(
)()(
12
111
n
zzkzzn
zzzn
zzz
vKzvz
njijT
iij
v
n
iii
K
n
i
Tjj
Tk
v
n
iii
Tk
Tk
Tk
Somit wurde eine neue Eigenwertgleichung erschlossen, wobei α der Eigenvektor ist und
)1(n der Eigenwert. Diese Eigenwertgleichung ist linear zu lösen. Wie in der
ursprünglichen Hauptkomponentenanalyse wird der eigentliche Eigenvektor v mit der
Länge eins normiert, daraus folgt für α die Bedingung 1)( T , denn:
).(
)()())(())((
1
1 1,1
T
TT
jT
i
n
i
n
jiji
n
iii
Tii
T
ij
zzzz
vv
Durch Ermittlung der Eigenvektoren v der Kovarianzmatrix KΦ über die
Eigenwertgleichung )1(n kann man schließlich auch die transformierten
Daten Φ(zi) auf die Ebene vi projizieren. Dies erfolgt wie in der linearen
Hauptkomponentenanalyse durch Multiplikation des Eigenvektors mit dem Vektor Φ(zi)
und man erhält:
ji
n
jii
n
jjii
Ti zzzv
11
)()()( .
Das bedeutet, dass die eigentliche Rechnung, das Lösen der Eigenwertgleichung, linear
erfolgt, aber die Transformierung der Daten nicht-linear durch die Funktion Φ. Die Matrix
hat eine Größe, die von der Anzahl der Datenpunkte abhängt, also nn .
11
Abbildung 3a: Schema eines Spermiums (siehe [A1])
3 Spermienmorphologie
3.1 Allgemein
Menschen folgen dem Fortpflanzungszyklus der Oogamie. Daher entwickeln die
weiblichen Individuen Eizellen, die groß und nährstoffreich sind, wohingegen die
männlichen Individuen Spermatozoen bzw. Spermien produzieren, die allein dem
Transport und der Übertragung des haploiden, männlichen Kerns dienen. Aus diesem
Grund lassen sich einige Strukturmerkmale ableiten: Spermien sind stromlinienförmig
aufgebaut, um eine maximale Geschwindigkeit aufzubauen und sie enthalten ein
Minimum an Bestandteilen. Zu diesen zählen der Kern (Nucleus, Abb. 3) und die
Centriolen, die an die Eizelle abgegeben werden, Mitochondrien (Mitochondria, Abb. 3)
als Energiequelle, das Akrosom (Acrosome, Abb. 3) zur Hydrolyse der Zona pellucida der
Eizelle und eine lange Geißel (Axial filament, Abb. 3) zur Fortbewegung. (vgl. [1])
Im Folgenden wird der Kopf beschrieben, der aus dem Kern und den verschiedenen
akrosomalen Regionen besteht. Die Bereiche kennzeichnen eine enge Verbindung
zwischen dem Nukleus und dem Akrosom. In den Membranen des Nukleus und
Akrosoms eingelagerte Rezeptoren zur Bindung an die Eizelle verdeutlichen, wie
folgenschwer eine Missbildung in diesem Abschnitt des Spermiums für die Fertilisation
ist.
Anschließend wird das Flagellum, bzw. der Schwanz (tail, Abb. 3) in seiner Struktur
beschrieben. Dabei wird deutlich, dass diese Struktur essentiell für die Motilität des
Spermiums ist und damit das Erreichen der Eizelle im Eileiter erst ermöglicht.
3.2 Der Kopf des Spermiums
3.2.1 Nukleus
Der Kern enthält die haploide Erbinformation und wird von einer doppelten Membran
umschlossen, die den perinukleären Raum einschließt. Im Gegensatz zu somatischen
12
Zellen wird die Hülle nicht von Kernporen durchbrochen (vgl. [18]). Dies erklärt sich
dadurch, dass kein Protein-Synthese Apparat (d.h. kein endoplasmatisches Reticulum
mit Ribosomen und Golgi-Apparat) vorhanden ist(vgl. [1]), der Kernporen notwendig
macht. Die äußere Membran nimmt zusätzlich eine statische Schutzfunktion ein, da sie
durch viele Strukturproteine fest ist. Während der Fertilisation sind eben diese
Proteine an Zellsignalen beteiligt (vgl. [18]).
Das Chromatin ist stark kondensiert. Während der Spermiogenese werden ungefähr
85% der Histone durch Protamine ersetzt (vgl. [21]). Durch die besondere Struktur der
basischen, positiv geladenen Proteine wird eine Hyperkondensation der
Deoxyribonucleic acid (DNA) ermöglicht, die nicht nur für die Hydrodynamik
mitbestimmend ist, sondern auch einen erhöhten Schutz vor äußeren Einflüssen
sichert. (vgl. [18])
Der Nukleus wird im Inneren neben dem Chromatin mit einer Matrix gefüllt, die die
äußere Struktur herstellt. Die Kernmatrix beschreibt daher ein nukleäres Skelett aus
Proteinen, an dem sich die Chromosomen anheften können. (vgl. [1])
3.2.2 Akrosomregion
Dieser Bereich des Kopfes enthält den Hauptanteil des Akrosoms. Das Akrosom ist
ein großes Überbleibsel des Golgi-Apparats und enthält zahlreiche Proteasen zur
Hydrolyse der Zona pellucida. Das Akrosom-Vesikel hat eine doppelte Membran. Die
terminale Membran ist stellenweise mit der äußeren Membran des Kernes verbunden,
so dass der perinukleäre Raum und das Akrosomvesikel ein Kontinuum bilden, wobei
die Räume zwischen den Membranen verbunden sind. Dort eingelagert sind
Abbildung 3b: Spermienkopf im Längsschnitt. (Schema nach [18])
13
Rezeptoren, die nach der Exocytose des Vesikels an der Bindung mit der Eizelle
beteiligt sind. (vgl. [18])
3.2.3 Mittlere Äquatorialebene
Die mittlere Äquatorialebene beschreibt den Bereich, in dem die innere und äußere
Akrosommembran ineinander übergehen und an den perinukleären Raum anschließen
(siehe Abb. 3b). Dort sind ebenfalls einige Rezeptoren eingelagert, die an der Bindung
mit der Plasmamembran der Eizelle beteiligt sind, nachdem die Zona pellicuda
durchdrungen wurde. (vgl. [18])
3.2.4 Postacrosomaler Bereich
In diesem Bereich liegen wichtige Moleküle im perinukleären Raum zur Aktivierung
der Eizelle und der Entwicklung vom Spermienkern zum Pronukleus vor. In diesem
Abschnitt ist kein Cytoplasma zugegen, da es vollständig vom perinukleären Raum
verdrängt wurde (siehe Abb. 3b). (vgl. [18])
3.3 Flagellum
Das Flagellum der Spermien ist vollständig von Mikrotubulis durchzogen. Die Anordnung
der Mikrotubuli-Dupletts im (9·2+2)-Muster ist typisch für Spermien der Mammalia.
Dabei sind neun Mikrotubuli-Dupletts konzentrisch um ein Mikrotubuli-Paar angeordnet.
Von den Dupletts ausgehend erstreckt sich in das Innere ein Motorprotein, das Dynein,
wie eine Speiche im Rad. Ebenso reicht ein innerer- und äußerer Dynein-Arm zwischen
den Dupletts, verbindet diese aber nicht. Die Verbindung entsteht durch
ein Nexinmolekül. Die Mikrotubuli-Dupletts werden außerhalb des
Rades, parallel zur Cytoplasmamembran, von Molekül-Fasern
(Ringfasern, Abb.4) begleitet, die die Flexibilität entlang der gesamten
Geißel fördern. (vgl. [18])
Da die Dyneinarme unter Adenosintriphosphat (ATP)-Verbrauch ihre
Konformation ändern, gleiten die
Mikrotubuli-Dupletts aneinander
vorbei. Geschieht dies nur auf einer
Seite des Rades, entsteht die typische
Flagellenbewegung und das Spermium
erhält einen Schub nach vorne. (vgl.
[11])
Abbildung 4: Elektronenmikroskopische Aufnahme von menschlichen Spermien. Im Längsschnitt mit Nukleus (N), Akrosom (A), Axonem (AX), Mitochondrien (M), Cytoplasma (C), Ringfasern (RF) Im Querschnitt des Flagellums lässt sich das (9+2) Muster erkennen. (siehe [A2])
14
3.3.1 Verbindungsstück zwischen Kopfregion und Mittelstück
Das Verbindungsstück lässt sich in neun Bereiche unterteilen, die einhergehen mit den
Mikrotubuli-Dupletts des Flagellums und den Fasermolekülen. Terminal befindet sich
der Basalkörper der Geißel. Dieser ist als Aufhängung für den Mikrotubuli-Apparat zu
verstehen, der dort hinein reicht. In der inneren Struktur unterscheidet sich der
Basalkörper von dem Rest des Flagellums, in dem es ein Mikrotubuli-Triplett
ausbildet und die inneren Mikrotubuli fehlen. (vgl. [18])
Proximal befindet sich neben zahlreichen Gelenkköpfchen eine Centriole. Centriolen
werden an die Nachkommen allein durch die Spermien weitergegeben und sind
essentiell für die Mitose. Die neun Mikrotubuli-Tripletts organisieren dabei die
Mikrotubuli-Fasern für den Spindelapparat und ziehen an den Chromosomen, um eine
einheitliche Verteilung zu organisieren. (vgl. [18])
3.3.2 Mittelstück
Die dominierende Struktur im Mittelteil (midpiece, Abb. 3) des Flagellums sind ca.
75-100 Mitochondrien, die in einer Helix um die Mikrotubuli angeordnet sind. So
werden die Motorproteine direkt mit ATP versorgt. Die Mitochondrien werden bei der
Fusion mit der Eizelle einschließlich ihrer mtDNA proteolytisch zerstört, so dass diese
allein maternal vererbt werden. (vgl. [18])
3.3.3 Hauptteil
Dieser Abschnitt wird vom mitochondrialen Teil durch den seitwärts drehenden
Jensen’s Ring abgetrennt. Neben den Proteinfasern entlang der Mikrotubuli wird der
Duplett-Ring durch weitere Proteine an der Cytoplasma-Membran befestigt.
Zusätzlich enthält dieser Abschnitt noch zahlreiche Kinasen, die die
Phospohorylierung des Dyneins mittels ATP katalysieren. (vgl. [18])
3.4 Spermien-Chromatin
Chromatin ist im Nukleus lokalisiert und beschreibt einen Komplex aus DNA und
Proteinen. In einer fädrigen Form kommt es in der Zelle zur Zeit des Ruhestadiums bzw.
der Synthesephase des Zellzyklus vor, wohingegen es in der Mitosephase zu
Chromosomen kondensiert. Chromosomen enthalten, in einer spezifischen Basenabfolge
von Thymin, Cytosin, Guanin und Adenin gespeichert, die Erbinformation des
Spermiums. Finden in den DNA-Strukturen Schäden statt, kann die gesamte Entwicklung
des Embryos gestört sein. (vgl. [11])
15
3.4.1 Aufbau und Vergleich mit somatischen Chromatin
Somatisches Chromatin (vgl. [1]) Spermien-Chromatin (vgl. [15])
Art
der
Proteine
Es ist ein Histon-Oktamer aus
jeweils 2 Untereinheiten von H2A,
H2B, H3, H4.
Es sind vorwiegend Protamine.
Struktur
der
Proteine
Die acht Untereinheiten lagern sich
zu einer Scheibe zusammen.
Es werden Protaminfasern gebildet.
Bindung
mit der
DNA
Es werden Wasserstoffbrücken-
bindungen und vereinzelte
Salzbrücken zwischen Lysin oder
Arginin der Histone und dem
Phosphatrückgrat der DNA
ausgebildet.
Protamin ist ein stark basisches,
positiv geladenes Polypeptid, das
kovalente Bindungen mit dem
Phosphatrückgrat der DNA eingeht
und so die negative Ladung der
DNA neutralisiert.
Ver-
packung
Die DNA windet sich um die
Histone. Dabei kommt es zu 1,7
Windungen pro Histon. Die Histon-
DNA-Komplexe werden durch
sogenannte Linker-DNA
verbunden, so dass eine
Perlenschnur-Struktur entsteht.
Protamine binden in der großen
Furche der DNA und bilden einen
Protamin-DNA-Faden. Die Fäden
ordnen sich zu donutähnlichen
Ringen zusammen. Zwischen den
Donuts liegt DNA in Histon-
Chromatin vor und ist mit der
Kernmatrix, die Strukturproteine
des Kerns, verbunden.
Ver-
drillung
Es liegt eine Windung pro 100
Basenpaare vor. Folglich ist die
DNA schwach kondensiert.
Alle 600 Basenpaare findet eine
Windung statt, so dass es zur
Hyperkondensation kommt.
Die Faser-Struktur der Protamine ermöglicht es, die DNA innerhalb der Protaminringe
enger zu verpacken, als es die lockere Perlenschnur des somatischen Chromatins
realisieren könnte. Die einzelnen Fäden sind wie in einem dicken Kabel
zusammengelagert, so dass die äußeren Fäden eine Isolierung für die Inneren bilden.
(vgl. [15])
16
Die Konsequenz ist, dass die DNA innerhalb der Protaminringe sehr gut gegenüber
äußeren Einflüssen, wie pH, UV oder spermieneigene Nukleasen, geschützt ist. Daher
ist die Verbindungs-DNA in ihrer Histon-Verpackung zwischen den Ringen, die 15%
der Gesamt-DNA umfasst, und die äußere Schicht der Protaminringe angreifbar.
Insgesamt bleibt der Anteil an anfälliger DNA klein. Denn schließlich ist der Schutz
des haploiden Chromosomensatzes essentiell für gesunde, mutationsfreie Embryonen.
(vgl. [15])
Weiterführend ist zu erwähnen, dass die Hyperkondensation notwendig für die Form
von Spermien ist. Der Verbund der DNA an die Kernmatrix und somit auch an die
Doppelmembran erzeugt die typische torpedoartige Form des Kopfes und wäre mit
einer Histon-Verpackung nicht realisierbar. Denn nach Huser et al. weisen Spermien
mit runden Kopfformen einen hohen Anteil an Histonen auf. (vgl. [4])
3.4.2 Anfälligkeit und Spermien-Chromatin-Tests
Eine große Herausforderung in der Reproduktionsmedizin stellt das Erkennen von
Defekten in der Chromatinstruktur dar. Anhand der typischen Verfahren zur
Beurteilung der Spermien durch die Beurteilung der Morphologie, Bewegung und
Befruchtungsfähigkeit, kann eine DNA-Struktur nicht immer erfasst werden. Dieses
Wissen ist aber essentiell für Prognosen innerhalb der Reproduktionsverfahren. Da
die Chromatin-Zusammensetzung mit dem Schutz der DNA vor äußeren Einflüssen
korreliert und DNA-Schäden wiederum die Entwicklungsfähigkeit von befruchteten
Eizellen beeinflussen.
Bei DNA-Schäden kommt es zu Brüchen in der DNA und somit zu ds (double-
stranded) DNA Bruchstücken oder zu teilweise einzelsträndiger, ss (single-stranded),
DNA. Diese Schädigungen häufen sich möglicherweise an zwei spezifischen Stellen
im Spermium:
a. An der Linker-DNA
b. An der DNA, die an der Oberfläche der Protaminringe liegt. (vgl. [15])
Das TUNEL (TdT-mediated dUTP-biotin nick end labeling)- und SCSA-Assay (sperm
chromatin structure assay) sind Verfahren zur Feststellung von DNA-Brüchen und
ergaben, dass häufig Defekte oder ein hohes Maß an Anfälligkeit in der Gruppe a
vorliegen. Fehlende Defekte in der Gruppe b sind begründet in der hohen Affinität der
Protamine zur DNA, so dass auch die äußere DNA nicht von anderen Molekülen
17
verdrängt werden kann und somit die DNA vor Nukleasen oder anderen Einflüssen
geschützt ist. (vgl. [15])
Dabei wird beim (TUNEL)-Assay wie folgt vorgegangen: Die Spermien-DNA wurde
isoliert, mit dem Enzym TdT, Terminale-Desoxynukleotidyl-Transferase, und dem
Nukleotid Deoxyuridine Triphosphate (dUTP) versetzt. Das Enzym baut an DNA-
Brüchen am 3’OH-Ende die Nukleotide ein, die daraufhin durch fluoreszenzmarkierte
Antikörper sichtbar gemacht werden.
Beim SCSA-Assay wird das Chromatin in einer leichten Säure inkubiert, so dass DNA
an Bruchstellen denaturiert wird, aber keine Denaturierung an den intakten Stellen
stattfindet. Dann erfolgt eine Anfärbung mit Acridine-Orange zur Unterscheidung von
ssDNA und dsDNA. Der Farbstoff bildet mit der DNA einen Komplex, der sich bei
einer bestimmten Wellenlänge farblich unterscheidet, so dass dsDNA grün und
ssDNA rot erscheint. Der Quotient DFI (DNA fragmentation index) grünrot
rotDFI
gibt schließlich den Anteil an, wie hoch die Defekte sind. (vgl. [15])
Die beiden genannten Verfahren werden bis heute zur Diagnostik in der
Reproduktionsmedizin angewendet und zeigen die Qualität des Chromatins an. Die
Methoden haben allerdings den Nachteil, dass die Spermien danach zur Befruchtung
nicht mehr verwendbar sind.
Neben diesen beiden Verfahren gibt es noch eine Reihe anderer Färbemethoden. Das
TUNEL- und SCSA-Assay spiegeln allerdings in ihrer Anwendung und ihren
Nachteilen alle Methoden wieder.
4 Verfahren der Reproduktion
Seitdem es möglich ist, Embryonen im Reagenzglas zu schaffen, ist die Nachfrage in den
Industrieländern stetig gestiegen. Daher ist es wichtig, einen kurzen Überblick über die
Verfahren zur künstlichen Befruchtung zu schaffen. Die am häufigsten angewendeten
Verfahren nach F.B. Kolodziej et al. (siehe [6]) sind die folgenden:
Die intrauterine Insemination (kurz IUI) ist ein unterstützendes Verfahren bei einer minimalen
Infertilität der männlichen Spermien. Die Frau erhält eine ovarielle Stimulationstherapie
mittels Gonadotropine, um die Anzahl der reifen Eizellen zu steigern. In regelmäßigen
Abständen wird während der Therapie die Estradiol- und Luteinisierungshormon-
konzentration bestimmt, um einen Eisprung festzustellen. Die Spermien des Mannes werden
18
aufbereitet und klassifiziert, so dass nur die wahrscheinlich fertilsten Spermien in den
Genitaltrakt der Frau übertragen werden.
Die In-vitro-Fertilisation (kurz IV) beginnt mit einer ovariellen Stimulationstherapie der Frau,
so dass später mehrere, reife Eizellen vor dem Eisprung mittels einer Punktion entnommen
werden können. Diese Eizellen werden über Nacht mit zahlreichen, aufbereiteten Spermien
inkubiert. Wenn unter dem Mikroskop zwei Vorkerne sichtbar sind, werden die Eizellen, nach
der Befreiung vom nicht befruchteten Zellmaterial, in die Gebärmutter transferiert.
Zuletzt gibt es noch das Verfahren der intracytoplasmatischen Spermatozoeninjektion (kurz
ICSI). Bei diesem Verfahren kommt es nicht zur eigenständigen Befruchtung der Eizelle
durch das Spermium. Die Befruchtung wird induziert. Es erfolgt mechanisch die Injektion
eines einzelnen Spermiums in das Cytoplasma der Eizelle und eine anschließende
Übertragung des Embryos, meist im 2-8 Zellstadium, in die Gebärmutter.
Die häufigste Methode ist die ICSI, weil es zu keiner Spermium-Eizelle-Interaktion mehr
kommen muss. Diese wurde im Vorfeld schon induziert, so dass eine Nicht-Befruchtung der
Eizelle durch das Spermium nicht mehr möglich ist. Nur die Entwicklung der Vorkerne und
Zygote werden noch durch Spermien gesteuert. Daher wird die ICSI zur sichersten
Befruchtungsmethode. Die ausbleibende Fusion der Nuklei ist allein in der Dysfunktion von
Zellbestandteilen der Eizelle und dem Spermiun begründet. Dies macht Untersuchungen des
Inneren eines Spermiums erforderlich.
5 Raman-Spektroskopie zur Analyse der Spermienqualität
5.1 Raman-Spekroskopie
Bei der Raman-Mikrospektroskopie handelt es sich um eine Apparatur, die einen Laser
auf die Probe schickt und diese abtastet. Dadurch werden die Spektrallinien und die Orte
der Emission festgehalten. Die so entstehenden Bilder sind chemische Karten der Proben.
Zur Erstellung dieser Bilder wird der Raman-Effekt von Molekülen genutzt. Beim
Aufprall eines Lichtphotons gibt es für ein Atom oder Molekül vier Möglichkeiten:
a. Die Energie des Moleküls bleibt stabil und das Photon wird auf der gleichen
Wellenlänge reflektiert. Dies bezeichnet man als elastische oder Raleigh-Streuung.
b. Das Energieniveau des Moleküls steigt durch Absorption des Photons um eine
spezifische Energiedifferenz. Die innere Energie des Moleküls nimmt zu und kann
anschließend durch Fluoreszenz oder Wärme wieder abgegeben werden.
19
c. Bei der Raman-Streuung reicht die Energie nicht zur vollständigen Anregung des
Moleküls aus. Das Photon bewirkt im Molekül allerdings ein Übergangsdipol. Der
Dipol überlagert sich mit den molekularen, permanenten Dipolen und somit
überlagern sich auch ihre elektrischen Wellen. Diese werden teilweise als
energieärmer emittiert und werden als Stoke-Linien oder Raman-Shifts bezeichnet.
d. Der Raman-Effekt kann ebenso eine Anregung des Photons bewirken. Die
sogenannten Anti-Stokes-Linien sind durch Summation von der inneren Energie
des Moleküls und der Energie des Photons entstanden. Somit sind diese
energiereicher und haben eine kleinere Wellenlänge.
Die Raman-Linien sind molekülspezifisch und können als chemische Fingerabdrücke
bezeichnet werden. Die Wellenlänge des Photons ist mit Bedacht zu wählen. Die Raman-
Shifts (Stoke- und Anti-Stoke-Linien) können in ihrer Intensität von der Fluoreszenz
überlagert werden und somit in der Messung des emittierten Lichtes nicht erkannt werden.
(vgl. [7])
5.2 Bisherige Erkenntnisse in der Klassifizierung von Spermien mittels Raman
Mikrospektroskopie-Daten
Die Raman-Mikrospektroskopie hat sich in der Biologie und Medizin seit einigen Jahren
zur Klassifizierung und chemischen Analyse von Zellen etabliert. Die chemische Analyse
der Raman-Mikrospektroskopie funktioniert ohne vorherige Fixierungen, Schnitte oder
aber auch Markierungen mittels Antikörper oder Fluoreszenzmarkern. Dadurch nehmen
die Zellen keinen Schaden während der Analyse. Dies ist essentiell für die Untersuchung
von Spermien und anderen Zellen.
2009 ist unter anderem durch Thomas Huser (siehe [4]) eine Raman Spektroskopie von
Spermien durchgeführt worden. In dieser Untersuchung haben morphologisch
unterscheidbare Spermien vorgelegen, die durch ihre Form in zwei Klassen unterteilt
worden sind: normale und abnormale Spermien. Die Analyse der Raman-Spektren ist im
Hinblick auf die Struktur der DNA durchgeführt worden. Bei einer eingestrahlten
Wellenlänge von 488nm ist es zu spezifischen Raman-Shifts gekommen, wobei ein
besonderes Augenmerk auf die Intensitäten bei 785cm-1 und 1092cm-1gelegt worden ist.
785cm-1 ist dabei spezifisch für die DNA-Basen Cytosin und Thymin. Ist nun die
Intensität dieser Stoke-Linie gering, so sind die Basen fest innerhalb eines Moleküls
gebunden. 1092cm-1 beschreibt die gebundenen Phosphatgruppen und kann so mit dem
Phosphatrückgrat der DNA gleichgesetzt werden. Ist nun das Verhältnis von 785cm-1:
20
1092cm-1 niedrig, heißt dies, dass ein großer Teil der DNA fest gebunden ist und keine
Basen frei liegen. Weiter schlussfolgernd bedeutet ein niedriger Anteil des 785cm-1-Shifts,
dass die Spermien einen hohen Anteil von Chromatin besitzen, das mittels Protaminen
verpackt wurde. Denn wie oben beschrieben, ist die Bindung von Protaminen an die DNA
verantwortlich für die Hyperkondensation der DNA. In dieser Untersuchung ist das
Verhältnis 785cm-1: 1092cm-1 von normalen und abnormalen Spermien inspiziert worden.
Im Mittel hat dies bei den morphologisch normalen Spermien niedrigere Werte als bei den
morphologisch abnormalen Spermien ergeben. Aber selbst innerhalb der morphologisch
normalen Spermien hat es große Spannweiten in diesem Verhältnis gegeben, so dass es
nahe liegend ist, dass Spermien trotz normaler Morphologie einer intensiveren
Untersuchung bedürfen.
Konrad Meister und seine Kollegen (siehe [10]) haben 2010 ihre Studien über die Raman-
Mikrospektroskopie von Spermien veröffentlicht. In dieser Studie sind, im Gegensatz zur
vorherig beschriebenen Methode, nur morphologisch normale Spermien untersucht
worden und es ist kein spezielles Augenmerk auf den Nukleus gelegt worden. Durch die
Ausarbeitung der Raman-Shifts mittels einer Cluster-Analyse, die wie die
Hauptkomponentenanalyse für unterscheidbare Klassen sorgt, sind die Spermien, mittels
der chemischen Marker, in spezifische Bereiche unterteilt worden:
a. Kern
Der Kern sticht durch hohe Intensitäten im Bereich der Nukleinsäuren heraus, speziell
bei 788cm-1. Dieser Raman-Shift ist im Kern deutlich höher als in den Mitochondrien,
da der DNA-Gehalt des Nukleus bei weitem höher und kondensierter ist, als im
Mitochondrium.
b. Hals
Dieser Teilabschnitt ist im Gegensatz zum Kern und Mittelstück kennzeichnend durch
ein Fehlen des Raman-Shifts 1575 cm-1, der für die Nukleinsäuren Adenin und Guanin
steht. Ebenso liegen zahlreiche, hohe Intensitäten von Raman-Shifts vor, die für die
Anwesenheit von Proteinen stehen.
c. Mittelstück
751 cm-1 ist ein typischer Raman-Shift für Mitochondrien. Daher weist das Mittelstück
eine herausragende Bande in diesem Bereich auf.
d. Oberfläche
Die Oberfläche ist anhand von Schwingungen zwischen Kohlenstoff- und
Wasserstoffatomen festgelegt worden, die einen Marker für Kohlenwasserstoffe sind.
21
Kohlenwasserstoffe sind Bestandteile jeder Plasmamembran und eignen sich daher zur
Bestimmung der Oberfläche.
Darüber hinaus sind einige Spermienproben mit UV-Licht in unterschiedlichen
Zeiteinheiten behandelt worden. Es ist bekannt, dass UV-Licht zu Schäden in der DNA
führt. Daher verwundert es nicht, dass bei 751cm-1 und 788cm-1 niedrigere Intensitäten
gemessen worden sind, je länger die UV-Behandlung durchgeführt worden ist. Es ist
jedoch dadurch festgestellt worden, dass diese Raman-Shifts zur Ermittlung von DNA-
Schäden und zur Begründung von sinkender Motilität nützlich sind. Schließlich ist der
Ausschlag im Raman-Spektrum bei 751cm-1 ein spezifischer Ausschlag für
Mitochondrien. Da Mitochondrien die Kraftwerke der Zelle sind und ATP produzieren,
sind diese essentiell für die Flagellum-Bewegung. Weiterführend ist zu erwähnen, dass
der Raman-Shift des Nukleus bei 788cm-1 nach 30 Minuten UV-Behandlung um 20%
gesunken ist und die Intensität der Mitochondrien bei 751cm-1 um 70%. Daraus ist
ersichtlich, dass die Mitochondrien weitaus anfälliger für UV-Strahlung sind, als der Kern
und dort eher Schädigungen auftreten.
2011 ist eine ähnliche Raman-Mikrospektroskopie durch C. Mallidis et al. (siehe [8])
durchgeführt worden. Der Laser ist auf eine Wellenlänge von 632,8nm eingestellt worden.
Die Spermienprobe ist teilweise mit UVA behandelt worden. Die wichtigsten
Erkenntnisse der Studie sind folgende:
a. Die UVA-Behandlung ist in einer Verschiebung von Ausschlägen des
Phosphatrückgrates bei 1092cm-1, zu einem Wert von 1042cm-1 zu erkennen und
ist ein Indikator für Dimerisierungen der Nukleotide. Ebenso ist der Bereich von
1400-1600cm-1 durch die UVA-Strahlen verändert worden und signalisiert
Schäden in der DNA-Protein-Bindung. Mittels einer Hauptkomponentenanalyse
lassen sich die Schwerpunkte der Schädigungen sichtbar machen. Vermehrt treten
diese im Kopfbereich unterhalb des Akrosoms auf. Dort ist der Nukleus mit dem
Chromatin lokalisiert.
b. Es ist ebenso eine Hauptkomponentenanalyse aller Raman-Shifts durchgeführt
worden und die Achsen sind auf zwei Hauptkomponenten reduziert worden. Die
Daten haben anschließend noch 25% der Inhalte umfasst und haben die größten
Varianzen enthalten. Dadurch ist es möglich gewesen, eindeutig UV-unbehandelte
Spermien von UV-behandelten Spermien zu unterscheiden.
c. Anhand eines Spermiums sind spezifische Raman-Spektren vom Flagellum,
Akrosom und der DNA extrahiert worden. Sind diese farblich den Messdaten der
22
einzelnen Orte im Spermium zugeordnet worden, so sind Anomalien festgestellt
worden. Unterhalb des Kernes sind vereinzelte Vakuolen sichtbar gewesen und
haben auf Schäden hingewiesen.
Nach all den Studien lässt sich die Raman Mikrospekroskopie für die Klassifizierung von
Spermien anwenden. Mittels der mathematischen Methode der Hauptkomponentenanalyse
ist es möglich, eindeutig defekte Spermien durch eine UVA-Behandlung zu ermitteln. Die
Unterschiede der Ergebnisse in den chemischen Analysen durch die Raman
Mikrospektroskopie-Daten zeigen, dass genaue Standards noch festzulegen sind.
5.3 Hauptkomponentenanalyse mit Raman Mikrospektroskopie-Daten von
Mäusespermien
Für die hier durchgeführte Hauptkomponentenanalyse haben insgesamt fünf Mappings
von Mäusespermien vom Centrum für Reproduktionsmedizin und Andrologie (CeRA) des
Universitätsklinikum Münster zur Verfügung gestanden. Die Mäuse sind mit einem
Pathogen, dem Upropathogenic Escherichia coli (kurz: UPEC), infiziert worden. UPEC
kommt im Urogenitalsystem vor, das die Harnwege und Geschlechtsorgane umfasst. Nun
ist anhand der Daten zu zeigen, welche Spermien durch die Infektion in ihrer Qualität
vermindert worden sind. Bei der Raman-Mikrospektroskopie ist ein Laser mit der
Wellenlänge von 632,8nm verwendet worden, so dass man die Bedeutungen der Raman-
Shifts aus Mallidis et al. (vgl. [8], sie Abschnitt 5.2) übernehmen kann.
Bevor die PCA durchgeführt worden ist, sind die Mappings mittels savemapping.m
(Matlab-Codes auf CD) in die Raumkoordinaten x,y und die Frequenzen und Intensitäten
abgespeichert worden. Dadurch ist je Mapping eine )( pn Datenmatrix entstanden, die
n Orte der Spermien markiert und p Raman-Shifts beschreiben.
Anschließend sind die Daten gefiltert worden. In dem Filter ist eine diskrete
Kosinustransformation (Matlab: dct) durchgeführt worden. Die Kosinustransformationen
der Datenmatrix sind orthogonal und gewichtet (vgl. [22]). Anschließend sind niedrige
Intensitäten bis 30 und hohe Intensitäten ab 70 gleich null gesetzt worden. Geringe
Intensitäten eines gesamten Raman-Shifts sind zur Klassifizierung nicht geeignet, da diese
wenig Interpretationsspielraum lassen und somit die Ergebnisse nur verwischen. Darüber
hinaus werden die Kontraste zu hohen Intensitäten eines Raman-Shifts dadurch erhöht.
Hohe Intensitäten einer Absorption müssen nicht unbedingt Raman-Shifts beschreiben,
sondern können auch Fluoreszenz darstellen. Diese überlagert dann in ihrer Bedeutung die
Ergebnisse der Raman-Daten zur Klassifizierung und bewirkt ebenfalls nur verfälschte
23
Daten. Das Nullsetzen dieser Intensitäten vermindert ebenso das Datenvolumen. Alles in
allem entfernt der Filter das Hintergrundrauschen, wie man in den Abbildungen von der
ersten Untersuchung (UPEC1) sehen kann. Die gefilterte Version bietet ein
kontrastreicheres Bild.
Im Anschluss ist in analysemapping.m die Hauptkomponentenanalyse durchgeführt
worden. Die ist auf die Raman-Shifts von 800cm-1 bis 1600cm-1 beschränkt worden. Nach
den bisherigen Studien zu Raman-Mikrospektroskopie von Spermien ist dieser Bereich
der bedeutendste (siehe Abschnitt 5.2). In Matlab ist der Befehl
(coeff,score,latent)= princomp(X) verwendet worden. Dabei beschreibt die
Matrix coeff spaltenweise die Eigenvektoren der Kovarianzmatrix und somit die
Gewichtungen der Raman-Shifts. score umfasst die transformierten Daten und
latent die Eigenwerte der Kovarianzmatrix. Die Ergebnisse sind auf unterschiedliche
Weise zur Analyse visualisiert worden. Unter anderem mit den Befehlen surf,
pcolor, plot.
5.4 Visualisierungen
In diesem Abschnitt sollen die Plots der untersuchten Spermien UPEC1 bis UPEC5
erklärt, beschrieben und verglichen werden, bis es in dem anschließenden Abschnitt zur
Klassifizierung kommt.
5.4.1 UPEC1
Die Abbildungen der PCA-Koeffizienten in den Abbildungen 7 bis 10 zeigen, dass
schon ab dem zweiten PCA-Koeffizienten die Bilder in ihrem Kontrast abnehmen und
in ihrer Aussagekraft sinken. Der dritte PCA-Koeffizient in Abbildung 9
Abbildung 5: Erste Hauptkomponente von UPEC1 ungefiltert
Abbildung 6: Erste Hauptkomponente von UPEC1 gefiltert
24
beispielsweise erzeugt keinerlei erkennbare Muster, um auf Strukturfehler in den
Spermien zu schließen. Diese Beobachtung korreliert mit dem Anteil der PCA-
Koeffizienten an der Gesamtvarianz. Der erste PCA-Koeffizient beinhaltet 24,75% der
Gesamtvarianz (nach analysemapping1.m), wohingegen die zweite
Hauptkomponente nur noch 3,92% der Varianz widerspiegelt. Die folgenden Anteile
der Hauptkomponenten drei und vier sind absteigend mit 2,66% und 2,42%. Zur
weiteren Analyse wird aufgrund der Anteile der Hauptkomponenten an der
Gesamtvarianz auf Abbildung 11 und damit auf die ersten beiden PCA- Koeffizienten
zurückgegriffen. Abbildung 12 zeigt im Original das Spermium. Der mittels der
Raman Mikrospektroskopie untersuchte Bereich ist in dem blauen Kästchen
eingefasst. Allerdings kam es vermutlich während der Untersuchung zu einer
Verschiebung des Objektes, so dass in Wirklichkeit der Ausschnitt woanders gelegen
ist. Daher erklärt sich auch der Strukturaufbau in Abbildung 7 oder Abbildung 11, der
einen Bereich etwa dem roten Kästen entsprechend beschreibt.
Abbildung 7: 1. PCA-Koeffizient von UPEC 1 Abbildung 8: 2. PCA-Koeffizient vonUPEC1
Abbildung 9: 3. PCA-Koeffizient von UPEC1 Abbildung 10: 4. PCA-Koeffizient von UPEC1
25
Die farblichen Skalen in den Abbildungen 7 bis 11 richten sich nach den Intensitäten
der Raman-Shifts und deren Gewichtungen und errechnen sich wie folgt:
600
1iii xFarbe
Wobei die αi die Gewichtungen der ersten Hauptkomponente sind und xi die
Intensitäten des i-ten Raman-Shifts in cm-1. Die Gewichtungen sind in Abbildung 13
dargestellt. Dabei ist auffällig, dass in der zweiten Hauptkomponente starke
Gewichtungen auf die Raman-Shifts 1092cm-1 und 785cm-1 liegen. Diese stehen nach
Studien (siehe Abschnitt 5.2) für das
Phosphatrückgrat der DNA bzw. die
Basen der DNA. Daraus erschließt sich,
dass die roten Felder in Abbildung 8
Orte der DNA sein können. Da der
Ausschnitt dieses Spermiums nur klein
ist, eignet sich dieser nur wenig zur
Klassifizierung des Spermiums, weil die
wichtigste Struktur, der Nukleus, ist nur
im geringen Umfang untersucht worden.
5.4.2 UPEC2
Bei den Aufnahmen von UPEC2 lässt sich in Abbildung 14 und Abbildung 15
ebenfalls feststellen, dass die Visualisierung der ersten Hauptkomponenten ein Bild
mit klar definierten Strukturen erzeugt. Die zweite Hauptkomponente hingegen
-30 -25 -20 -15 -10 -5 0X (µm)
Abbildung 11: 1.PCA-Koeffizient (Höhe) gegen den zweiten PCA-Koeffizient (Farbe) von UPEC1 aufgetragen.
Abbildung 12: Originalbild des Spermiums UPEC1
Abbildung 13: Gewichtung der Raman-Shifts durch die erste und zweite Hauptkomponente in UPEC1
26
Abbildung 14: 1. PCA-Koeffizient von UPEC2 Abbildung 15: 2. PCA-Koeffizient von UPEC2
Abbildung 16: 3. PCA-Koeffizient von UPEC2 Abbildung 17: 4. PCA-Koeffizient von UPEC 2
erzeugt keine Bereiche, die klar voneinander zu unterscheiden sind. Ebenso verhält es
sich in den folgenden Abbildungen der dritten und vierten Hauptkomponente.
Die Hauptkomponenten umfassen bei diesem Spermium die folgenden Anteile an der
Gesamtvarianz (nach analysemapping2.m):
1. Hauptkomponente 59,62% 2. Hauptkomponente 13,88%
3. Hauptkomponente 1,8% 4. Hauptkomponente 0,79%.
Für weitere Analysen wird dementsprechend auf die erste und zweite
Hauptkomponente verwiesen, die zusammen 73,5% der Gesamtvarianz umfassen.
Im Vergleich mit dem Originalbild des Spermiums, in Abbildung 19, lassen sich die
farblichen Bereiche, aus Abbildung 14 der ersten Hauptkomponente, den Strukturen
der Spermien zuordnen. In dunkelblau ist der Bereich des Nukleus markiert und
anschließend in türkis der Bereich des Akrosoms, der sehr eng durch Proteine mit den
Kern assoziiert ist. In gelb ist die äußere Hülle, die Cytoplasmamembran, dargestellt.
27
Die klare Darstellung des Nukleus mittels der ersten Hauptkomponente verläuft wie
oben beschrieben über die Koeffizienten, die die Raman-Shifts unterschiedlich
gewichten. In diesem Fall gibt es negative Gewichtungen in 1092cm-1
(Phosphatrückgrat). Dieser wichtige Einfluss in der ersten Hauptkomponente zeigen
die Raman-Shifts im Vergleich zu den Farbfeldern: Blaue Felder (negativ) haben die
höchste Intensität und mit steigender Farbwertigkeit, sinken auch die Intensitäten.
Weiterhin ist zu erwähnen, dass das Akrosoms sich in den Studien von Mallidis et al.
(vgl. [8]) durch eine hohe Intensität in 785 cm-1 und eine niedrige Intensität in
1092cm-1 auszeichnete, weshalb sich dieser Bereich von dem des Nukleus abhebt.
5.4.3 UPEC3
Die Untersuchung des dritten mit UPEC infizierten Spermiums hat in den
Visualisierungen ähnliche Ergebnisse ergeben. Je kleiner der Anteil an der
Gesamtvarianz, desto geringer sind die Strukturunterschiede, desto unklarer werden
Abbildung 19: Originalbild des Spermiums UPEC2Abbildung 18: 1.PCA-Koeffizient (Höhe) gegen den 2. PCA-Koeffizient (Farbe) von UPEC2
Abbildung 20: Gewichtung der Raman-Shifts durch die erste und zweite Hauptkomponente in UPEC2
Abbildung 21: Intensität des Raman Shifts 1092cm-1 im Vergleich. Blaues Feld (0.0697,0.0263), türkises Feld (0.0697,1.0299), gelbes Feld (0.0697,1,2306)
28
die Bilder. Die Anteile an den Varianzen sind nach analysemapping3.m
folgenderweise gestaffelt:
1. Hauptkomponente 64,21% 2. Hauptkomponente 16,42%
3. Hauptkomponente 1,58% 4. Hauptkomponente 0,77%.
Die erste und zweite Hauptkomponente beschreiben 80,63% der Gesamtvarianz und
wurden in Abbildung 26 gegeneinander aufgetragen. Auch in dieser Untersuchung
werden zur weiteren Analyse nur noch die ersten beiden Hauptkomponenten
berücksichtigt.
Das Bild der ersten Hauptkomponente lässt zu, auf die Orte der Organellen des
Spermiumkopfes (Abb. 27) zu schließen. Die dunkelblauen Schattierungen
beschreiben den Ort des Nukleus. Diese blaue Markierung wird allerdings durch
türkise Felder durchbrochen. Umschlossen wird dieser Bereich von einem türkisen
Streifen, der das Akrosom beschreibt und anschließend ein gelber Rand, der die
Cytoplasmamembran darstellt.
Abbildung 22: 1. PCA –Koeffizient von UPEC3 Abbildung 23: 2. PCA-Koeffizient von UPEC3
Abbildung 24: 3. PCA-Koeffizient von UPEC3 Abbildung 25: 4. PCA-Koeffizient von UPEC3
29
Abbildung 28: Gewichtung der Raman-Shifts durch die erste und zweite Hauptkomponente in UPEC3
Abbildung 29: Raman Shifts der Felder (-0.56,-0.025) in blau und (-1,3745,-0,429) in türkis
Die Koeffizienten sind in Abbildung 28 dargestellt und zeigen negative
Multiplikatoren für die Raman-Shifts der DNA. Aber ebenso gibt es positive
Multiplikatoren für den Raman-Shift bei 1042cm-1. Dieser ist in der Studie von
Mallidis et. al (vgl. [8]) bedeutsam, indem geschädigte DNA eine Verschiebung von
1092 cm-1 nach 1042cm-1 zeigte. Wenn nun DNA-Schäden vorliegen, so kann eine
positive Gewichtung der erhöhten Intensität bei 1042cm-1 zu türkisen Feldern führen
und ein Indiz auf DNA-Schäden sein. In Abbildung 29 wurden zwei Felder
ausgewählt und deren gefilterten Raman-Shifts geplottet. Dort erkennt man die
vermutete Verschiebung des Raman-Shifts von 1092cm-1 nach 1042cm-1, so dass ein
türkises Feld entstand. Ebenso ist der Raman-Shift bei 785cm-1 nicht so stark im
türkisenen Feld ausgeprägt, wie im blauen Feld. Dies deutet zusammen daraufhin,
dass die DNA in dem türkisenen Feld Defekte aufweist oder es den Ort des Akrosoms
beschreibt.
Abbildung 27: Originalbild des Spermiums UPEC3 Abbildung 26: 1.PCA-Koeffizient (Höhe) gegen den 2. PCA-Koeffizient (Farbe) von UPEC3 aufgetragen.
30
5.4.4 UPEC4
Die Raman Mikrospektroskopie Daten des vierten Spermiums UPEC4 ergaben in der
Hauptkomponentenanalyse die Abbildungen 30-33. Da ist festzustellen, dass die erste
Hauptkomponente ein Bild erzeugt, das Strukturen des Spermiums erkennen lässt, die
nicht mit dem Bild des Spermiums (Abb. 34) korrelieren. Es scheint, dass mit dem
gelben Rand in Abbildung 29 die Cytoplasmamembran, wie in UPEC2 und UPEC3,
beschrieben wird. Die Membran verläuft dort nicht, allerdings erkennt man in der
Vergrößerung, dass in diesem Bereich das Spermium an Volumen verloren hat und
sich so der gelbe Bereich erklären lässt. Im Gegensatz zur ersten Hauptkomponente ist
das Bild der zweiten Hauptkomponente (Abb. 31) in den Teilen farblich schattiert, wo
sich die Volumenabnahme befindet. Die folgenden Hauptkomponenten erzeugten
verrauschte Bilder ohne erkennbare Bereiche.
Der abfallende Anteil an der Gesamtvarianz in der dritten und vierten
Hauptkomponente erklärt diesen Zustand, diese Anteile liegen bei:
1. Hauptkomponente 39,12% 2. Hauptkomponente 18,52%
Abbildung 30: 1. PCA-Koeffizient von UPEC 4 Abbildung 31: 2. PCA-Koeffizient von UPEC 4
Abbildung 32: 3. PCA-Koeffizient von UPEC4 Abbildung 33: 4. PCA-Koeffizient von UPEC4
31
3. Hauptkomponente 2,1% 4. Hauptkomponente 1,4%.
Unterteilt man das Spermium in zwei Bereiche, zum einen in den voluminösen Teil
mit Zellinhalten und zum anderen in den abgeflachten Teil, so beschreibt die erste
Hauptkomponente die Strukturunterschiede des voluminösen Teils und die zweite
Hauptkomponente die Strukturunterschieden des flachen Abschnitts.
Die konträren Bilder gehen auch mit den Gewichtungen einher, die in Abbildung 35
gezeigt sind. Diese sind bei vielen Raman-Shifts entgegengesetzt, siehe beispielsweise
bei 1200cm-1. Die erste Hauptkomponente hat tiefe Ausschläge in den Raman-Shifts
785cm-1 und 1092cm-1. Daher signalisiert die dunkelblaue Färbung in Abbildung 30
den Ort der DNA und damit den Nukleus. Ebenso existiert eine positive Gewichtung
des Raman-Shifts 1042cm-1. Ein Absinken der Raman-Shifts in 785cm-1 und 1092cm-1
und ein Anstieg im Raman-Shift bei 1042cm-1 können zu positiven Werten in der
Summe führen:
600
1iii xFarbe .
Durch dieses Ereignis, ersichtlich in Abbildung 36, kommt es entweder zur blauen
Färbung, mit einem niedrigeren Wert bei 1042cm-1 oder einer türkisen Färbung mit
einer erhöhten Intensität bei 1042cm-1. Zur türkisen Färbung kann es außerdem
kommen, wenn es ein Feld des Akrosoms ist. Denn dort ist der Unterschied zwischen
den Intensitäten von 1042cm-1 und 1092cm-1 nicht sehr groß (vgl. [8]).
Abbildung 35: Gewichtung der Raman-Shifts durch die erste und zweite Hauptkomponente in UPEC4
Abbildung 34: Bild des Spermiums UPEC4, im schwarzen Kasten der Nukleus.
32
Abbildung 37: Bild des Spermiums UPEC5
5.4.5 UPEC5
Die fünfte Untersuchung eines Spermiums lieferte in der Hauptkomponentenanalyse
ähnliche Resultate wie in UPEC1-4. Die ersten beiden Hauptkomponenten liefern
interpretierbare Abbildungen, wohingegen die weiteren unklare Bilder ergeben. Dies
geht mit den stark verminderten Anteilen an der Gesamtvarianz einher:
1. Hauptkomponente 47,3% 2. Hauptkomponente 16,39%
3. Hauptkomponente 3,09% 4. Hauptkomponente 1,23%.
Zusammen umfassen die ersten beiden Hauptkomponenten 63,69% der Varianzen und
werden zur weiteren Analyse verwendet. In Abbildung 42 wurden diese
gegeneinander aufgetragen und zeigen gemeinsame Anstiege oder Senkungen der
PCA-Koeffizienten. Diese entstehen hier besonders durch den Raman-Shift bei
930cm-1. Im Gegensatz zur ersten Hauptkomponente ist in der zweiten eine negative
Ladung der Raman-Shifts 785cm-1 und 1092cm-1, so dass der dunkelblaue Bereich in
Abbildung 42 der Nukleus sein könnte.
Im Ganzen ist das
Bild der ersten
Hauptkomponente
sehr heterogen
und schwer mit
dem Originalbild
vergleichbar. Der
äußere Rand hebt
sich durch eine
Abbildung 36: Raman Shifts der Felder (0.0379, 0.0952) in blau und (-1.0699, 0.8044) in türkis
33
hellere Blaufärbung von dem Hintergrund ab, allerdings sind die türkisenen und gelb-
roten Felder prägnant, die sich in etwa durch die Mitte des Spermiums ziehen und
durch den positiven Multiplikator des Raman-Shifts 930cm-1 entstehen.
Abbildung 38: 1. PCA-Koeffizient von UPEC5 Abbildung 39: 2. PCA-Koeffizient von UPEC5
Abbildung 40: 3. PCA-Koeffizient von UPEC5 Abbildung 41: 4. PCA-Koeffizient von UPEC5
Abbildung 43: Gewichtung der Raman-Shifts durch die erste und zweite Hauptkomponente in UPEC5
Abbildung 42: 1.PCA-Koeffizient (Höhe) gegen den 2. PCA-Koeffizient (Farbe) von UPEC5
34
5.5 Klassifizierung
Nun sollen die Ergebnisse der Hauptkomponentenanalyse mit den Vorkenntnissen des
Strukturaufbaus eines Spermiums in Einklang gebracht werden.
Die Struktur der DNA in einem Spermium der Mammalia kennzeichnet sich durch eine
Hyperkondensation aus. Diese entsteht durch die Protaminfäden, die sich in die große
Furche der DNA einlagern und eine kovalente Bindung mit dem Phosphatrückgrat
eingehen. Die anschließende Zusammenlagerung aller DNA-Protamin-Fibrillen erzeugt
eine dichte Struktur, die von außen kaum angreifbar ist. Ausschließlich vereinzelte
Linker-DNA ist in einer Histon-Verpackung mit der Nukleusmatrix verbunden. Ist dieser
DNA-Aufbau in der Spermatogenese gelungen, so sollte man annehmen, dass man diese
an einheitliche Ramanspektren erkennen kann. Die Hyperkondensation der DNA lässt
keine Heterogenität in den Ramanspektren zu, da die Laserstrahlen stets auf einen dichten
DNA-Protamin-Komplex treffen sollten. Da die Komplexbildung durch eine kovalente
Bindung an den negativen Phosphaten der DNA entsteht, ist der Ausschlag in 1092cm-1
(O-P-O-Streckung) entscheidend. Vergleicht man hinsichtlich dieses Kriteriums die
Bilder von UPEC2 bis UPEC5, so gelangt man zu der Erkenntnis, dass UPEC2 ein
gesundes Spermium darstellt, wohingegen die weiteren Spermien Schäden aufweisen
könnten. In UPEC3 ist eine klare dreischichtige Struktur erkennbar, allerdings ist der
blaue Bereich durch türkise Felder durchzogen. Es wurde gezeigt, dass eben diese Felder
eine Verschiebung der Werte von 1092cm-1 nach 1042cm-1 beinhalteten. Dadurch lässt
sich annehmen, dass die DNA in diesem Bereich zum einen geringeren Anteil an
Protaminen aufweist (1092cm-1 gesunken), aber auch Schäden in der DNA entstanden
sind (1042cm-1 angestiegen). In UPEC4 ließ sich keine direkte Verbindung zum
Originalbild herstellen. Es ist keine Nukleusstruktur oder Akrosomstruktur durch die
Hauptkomponenten erkennbar. Das Originalbild von UPEC4 zeigt, dass das Spermium in
ihrer Morphologie schon gravierende Defekte aufweist. Daher ist eine Klassifizierung
mittels der Raman Daten nicht nötig. Es ist aber festzustellen, dass unklare Bilder ohne
direkte Struktur mit der Morphologie korrelieren. Das Spermium UPEC5 ist schwer
einzuordnen. In der zweiten Hauptkomponente ist ein klar definierter, dunkelblauer
Bereich, der den Nukleus beschreiben könnte. Demnach wäre von der DNA-Struktur das
Spermium als gut zu klassifizieren. Allerdings füllt dieser Kern nur einen kleinen Teil des
Spermiumkopfes, das mit normalen Spermien nicht übereinstimmt. Die roten Bereiche
heben sich von dem Rest des Kopfes ab und können auf Anomalien hinweisen.
35
Insgesamt lässt sich feststellen, dass bei hohen Anteilen an der Gesamtvarianz in der
ersten Hauptkomponente, die Bilder klare Strukturen hervorbringen, wie bei UPEC2
(59,62%) und UPEC3 (64,21%). Dadurch lassen sich Klassifizierungen vornehmen. Die
Abbildungen 44 und 45 zeigen Streudiagramme der transformierten Daten. Bei einer
guten Approximation durch die Hauptkomponenten, sollten die Punkte nahe der
Koordinatenachsen (durch den Ursprung) liegen. Schließlich minimieren die
Hauptkomponenten die Abstände zu den Punkten. Dies wurde in UPEC3 stärker realisiert,
als in UPEC2. Wie in der Herleitung gezeigt wurde, erzielt die Minimierung der Abstände
zur Projektion ebenso eine Maximierung der Kovarianz. Daher stimmen die
Beobachtungen der Streudiagramme mit den Anteilen an der Gesamtvarianz überein.
Abbildung 44: Streuplot der ersten gegen Abbildung 45: Streuplot der ersten gegen die zweite Hauptkomponente (UPEC2) die zweite Hauptkomponente (UPEC3)
In den Analysen zu UPEC4 und UPEC5 hat man bemerkt, dass die Visualisierungen keine
klar erkennbaren Strukturen hervorbringen. In UPEC4 ist dies begründet in der
Morphologie des Spermiums. Andererseits sind auch die Anteile an den Gesamtvarianzen
der ersten Hauptkomponente hier niedriger, was durch den Streuplot (Abb. 46) in
größeren Abständen zu den Koordinatenachsen erkennbar ist. In UPEC5 ist ein
Schwerpunkt der Punktwolke erkennbar. Der Anteil der Gesamtvarianz beträgt hier in der
ersten Hauptkomponente 47,3% und in der zweiten Hauptkomponente 16,39%. Die Werte
sind durch viele Ausreißer nicht besonders hoch. Dennoch erklärt der Schwerpunkt, dass
in der ersten und zweiten Hauptkomponente gleiche, farbliche Markierungen entstehen. In
der zweiten Hauptkomponente hebt sich der dunkelblaue Teil zudem vom Rest ab.
36
Abbildung 46: Streuplot der ersten gegen Abbildung 47: Streuplot der ersten gegen die zweite Hauptkomponente (UPEC4) die zweite Hauptkomponente (UPEC5)
6 Zusammenfassung und Ausblick
Ein geeignetes Verfahren zur Klassifizierung der Spermien ist heute essentiell. Wenn schon in
den ersten TV-Serien (Private Practice, Staffel 5, Episode 6 und 7) das Thema der ICSI
aufgegriffen wird, zeigt es nur, wie bedeutsam die künstliche Befruchtung in der
Industriegesellschaft geworden ist. Da die ICSI die häufigste Methode der
Reproduktionsmedizin ist, rücken die Funktionsweisen des Akrosoms oder der Geißel in den
Hintergrund und sind für die Analysen weniger wichtig. Hydrolytische Enzyme oder eine
hohe Beweglichkeit des Spermiums haben keinen Einfluss auf den Befruchtungsmodus, wenn
dieser vom Mensch selbst durch eine Injektion durchgeführt wird. Also werden
Beweglichkeitsanalysen, Morphologiebetrachtungen in den Hintergrund gestellt und in das
Innere des Spermiums geschaut. Der Kern rückt in den Fokus der Analysen und Bewertungen
der Spermienqualität. Dabei soll festgestellt werden, ob die DNA Defekte aufweisen kann.
Mittels verschiedener chemischer Analysen erreichte man dies schnell und stellte fest, dass
die Spermium-DNA weitaus robuster ist als somatische DNA. Die Protamine sorgen für eine
starre Nukleusstruktur und ein Hyperkondensation der DNA. Darüber hinaus sichern
Protamine den Schutz vor körpereigenen Nukleasen oder äußeren Einflüssen, weshalb die
DNA in der Protaminverpackung weniger anfällig für Gendefekte ist. Allerdings erzielen die
chemischen Analysen nur eine Einschätzung des Spermas im Gesamten. Diese sind aber für
die weitere Verwendung unbrauchbar. Schließlich wird das Spermium durch die Analysen
zerstört. Daher bietet sich die Raman Mikrospektroskopie geradezu an. Das Spermium wird
nur kurzfristig mit einem Laser bestrahlt, so dass dieser keine Zellschäden verursacht und
daraufhin für die ICSI verwendet werden kann. Nun hat man die Ergebnisse der Raman-
Shifts, aber jedes einzelnes Spektrum zu untersuchen, ist in der Medizin kaum angebracht.
37
Daher ist ein Klassifizierungsverfahren unabdingbar. Es wurde gezeigt, dass die
Hauptkomponentenanalyse dies bedingt erzielt. Es wurden in UPEC2 und UPEC3 die
farblichen Klassen den morphologischen Strukturen Akrosom, Nukleus und
Cytoplasmamembran zugeordnet. Weiterhin ließen farbliche Abweichungen Rückschlüsse auf
den DNA-Aufbau zu und damit waren Klassifizierungen möglich.
Allerdings zeigen die Bilder von UPEC4 und UPEC5 auch die Grenzen der PCA auf. Es
werden in der Hauptkomponentenanalyse ein linearer Zusammenhang und eine
Normalverteilung angenommen. Die Streuplots zeigen, dass die Hauptkomponenten keine
genaue Approximation erzielten. Daher ist anzunehmen, dass die Daten nicht unbedingt linear
verteilt sind. Schließlich handelt es sich um eine Zelle, die in ihrer Zusammenstellung nicht
unbedingt linearen Zusammenhängen folgt. Bei einem Ortswechsel vom Nukleus zur
Plasmamembran nimmt der Proteinanteil zum Beispiel rapide ab und ist nicht linear
beschreibbar. Ebenso sind die Intensitäten in den Raman-Shifts nicht proportional, sondern
hängen neben der Konzentration auch von der Art des Moleküls ab.
Zusammenfassend lässt sich feststellen, dass die Hauptkomponentenanalyse ein bedingt
fähiges Verfahren zur Klassifizierung von Spermien ist. Als weitere Möglichkeit zur
Klassifizierung besteht die Kernel-PCA, die keinen linearen Zusammenhang voraussetzt,
sondern die Daten in einen linearen Raum transformiert. Dies eröffnet die Chance, auch
Datensätze wie in UPEC4 oder UPEC5 zu klassifizieren.
38
7 Literaturverzeichnis
Texte
[1] Bruce Alberts, Alexander Johnson, Julian Lewis, Martin Raff, Keith Roberts, Peter
Walter: Molekularbiologie der Zelle. 5. Auflage, Wiley-WCH Verlag & Co. KGaA,
Weinheim, 2011, S. 235-243, 269, 1436-1477.
[2] Fred Böker: Kapitel 4: Hauptkomponentenanalyse. Vorlesung Multivariate Verfahren
im SS2005, http://www.statoek.wiso.uni-goettingen.de/veranstaltungen/Multivariate/
Daten/mvsec4.pdf, 27.05.2012.
[3] Claudia Broelemann: Proseminar Machine Learning: Hauptkomponentenanalyse
(PCA) und Kernel-PCA, http://www.cogsys.cs.uni-tuebingen.de/lehre/ss06/
pro_learning/ClaudiaBroelemann.pdf, 27.05.2012.
[4] Thomas Huser, Christine A. Orme, Christopher W. Hollars, Michele H. Corzett, Rod
Balhorn: Raman spectroscopy of DNA packaging in individual human sperm cells
distinguishes normal from abnormal cells. Journal of Biophotonics, 2009, S. 322- 332.
[5] I.T. Jolliffe: Principal Component Analysis. 2. Auflage, Springer Verlag, New York,
2002.
[6] F.B. Kolodziej, P. Hüppe, T. Katzorke: Techniken der assistierten Reproduktion.
Wichtigsten Verfahren und Ergebnisse in Deutschland und Europa, in: Der Urologe.
Bd. 50, Nr. 1, 2011, S. 47-52.
[7] Friedrich Lottspeich, Joachim W. Engels (Hrsg.): Bioanalytik. 3. Auflage, Springer-
Verlag, Berlin/ Heidelberg, 2012, S. 151-200.
[8] C. Mallidis, J. Wistuba, B. Bleisteiner, O.S. Damm, P. Groß, F. Wübbeling, C.
Fallnich, M. Burger, S. Schlatt: In Situ visualization of damaged DNA in human
sperm by Raman microspectroscopy. In: Human Reproduction. 26, 2011, S. 1641-
1649.
39
[9] Gerhard Marinell: Multivariate Verfahren. Eine Einführung für Studierende und
Praktiker, R. Oldenbourg Verlag München, Wien, 1977, S.97-113.
[10] Konrad Meister, Diedrich A. Schmidt, Erik Bründermann, Martina Havenith:
Confocal Raman Microspectroscopy as an analytical tool to asses the mitochondrial
status in human spermatozoa. In: The Analyst, 135, 2010, S. 1370-1374.
[11] W.K. Purves, D. Sadava, G.H. Orians, H.C. Heller: Biologie, 7. Auflage, Spektrum
Akademischer Verlag, München, 2006, S. 98,1446.
[12] Rainer Schlittgen: Multivariate Statistik, 1. Auflage, Oldenbourg Wissenschaftsverlag
GmbH, München, 2009, S. 259-278, 533.
[13] Bernhard Schölkopf, Klaus-Robert Müller, Alexander J. Smola: Lernen mit Kernen.
Support-Vektor-Methoden zur Analyse hochdimensionaler Daten,
http://www.kyb.mpg.de/fileadmin/user_upload/files/publications/pdf733.pdf,
27.05.2012.
[14] Bernhard Schölkopf, Alexander Smola, Klaus-Robert Müller: Kernel Principal
Component Analysis, http://www.tribesandclimatechange.org/docs/tribes_450.pdf,
27.05.2012.
[15] Jeffrey A. Shaman, W. Steven Ward: Sperm chromatin stability and susceptibility to
damage in relation to its structure, In: The Sperm Cell. Production, Maturation,
Fertilization, Regeneration, hg. v. Christopher De Jonge, Christopher Barratt, 1.
Auflage, Cambridge University Press, 2006.
[16] Jan Siegemund: Hauptkomponentenanalyse (Principal Component Analysis (PCA))
Proseminar „Robuste Signalidentifikation”. WS 2003/04, http://www-mmdb.iai.uni-
bonn.de/lehre/proprak0304/siegemund.pdf, 27.05.2012.
[17] Dee U. Silverthorn: Physiologie. 1. Auflage, Pearson Studium, München, 2009.
40
[18] Peter Sutovsky, Gaurishankar Manandhar: Mammalian spermatogenesis and sperm
structure. Anatomical and compartmental analysis, In: The Sperm Cell. Production,
Maturation, Fertilization, Regeneration von Christopher De Jonge, Christopher
Barratt, 1. Auflage, Cambridge University Press, 2006.
[19] Volker Tresp: Hauptkomponentenanalyse, http://www.dbs.ifi.lmu.de/Lehre/
MaschLernen/SS2011/folien/Hauptkomponentenanalyse2011.pdf, 27.05.2012.
[20] Ching-Hei Yeung, Trevor G. Cooper: Physiologie der Spermienreifung und
Fertilisierung, in Andrologie. Grundlagen und Klinik der reproduktiven Gesundheit
des Mannes, E. Nieschlag, H.M. Behre, S. Nieschlag, Auflage 3, Springer
Medizin Verlag Heidelberg, 2009, S. 64-82.
[21] Ching-Hei Yeung, Trevor G. Cooper: Spermienqualität und Spermienfunktionstest. In
Andrologie: Grundlagen und Klinik der reproduktiven Gesundheit des Mannes, E.
Nieschlag, H.M. Behre, S. Nieschlag, Auflage 3, Springer Medizin Verlag Heidelberg,
2009, S. 147- 160.
[22] Dr. Stephan Dreiseitl, Einschub Diskrete Cosinus-Transformation, WS 2003/ 2004
http://staff.fh-hagenberg.at/sdreisei/Teaching/WS2003-
2004/AGM3/agm3_skriptumDCTpart.pdf, 19.06.12.
Abbildungen:
[A1] Mariana Ruiz: Simplified spermatozoon diagram,
http://commons.wikimedia.org/wiki/File:Simplified_spermatozoon_diagram.svg,
28.05.2012
[A2] Neugebauer DC, Neuwinger J, Jockenhovel F, Nieschlag E in Andrologie:
Grundlagen und Klinik der reproduktiven Gesundheit des Mannes, S.75 von E.
Nieschlag, H.M. Behre, S. Nieschlag, Auflage 3, Springer Medizin Verlag
Heidelberg, 2009
41
8 Abbildungsverzeichnis
1 Beziehung von Vektoren 032 Projektion 043a Schema eines Spermiums 113b Spermienkopf im Querschnitt 124 Elektronenmikroskopische Aufnahme von menschlichen Spermien 135 Erste Hauptkomponente von UPEC1 ungefiltert 236 Erste Hauptkomponente von UPEC1 gefiltert 237 1. PCA-Koeffizient von UPEC 1 248 2. PCA-Koeffizient von UPEC 1 249 3. PCA-Koeffizient von UPEC 1 2410 4. PCA-Koeffizient von UPEC 1 2411 1. PCA-Koeffizient (Höhe) gegen den 2. PCA-Koeffizient (Farbe) von UPEC1
aufgetragen 25
12 Originalbild des Spermiums UPEC1 2513 Gewichtung der Raman-Shifts durch die erste und zweite Hauptkomponente in
UPEC1 25
14 1. PCA-Koeffizient von UPEC 2 2615 2. PCA-Koeffizient von UPEC 2 2616 3. PCA-Koeffizient von UPEC 2 2617 4. PCA-Koeffizient von UPEC 2 2618 1. PCA-Koeffizient (Höhe) gegen den 2. PCA-Koeffizient (Farbe) von UPEC2 2719 Originalbild des Spermiums UPEC2 2720 Gewichtung der Raman-Shifts durch die erste und zweite Hauptkomponente in
UPEC2 27
21 Intensität des Raman Shifts 1092cm-1 im Vergleich. Blaues Feld (0.0697,0.0263), türkises Feld (0.0697,1.0299), gelbes Feld (0.0697,1,2306)
27
22 1. PCA-Koeffizient von UPEC 3 2823 2. PCA-Koeffizient von UPEC 3 2824 3. PCA-Koeffizient von UPEC 3 2825 4. PCA-Koeffizient von UPEC 3 2826 1. PCA-Koeffizient (Höhe) gegen den 2. PCA-Koeffizient (Farbe) von UPEC3
aufgetragen 29
27 Originalbild des Spermiums UPEC3 2928 Gewichtung der Raman-Shifts durch die erste und zweite Hauptkomponente in
UPEC3 29
29 Raman Shifts der Felder (-0.56,-0.0257) in blau und (-1,3745,-0,4293) in türkis 2930 1. PCA-Koeffizient von UPEC 4 3031 2. PCA-Koeffizient von UPEC 4 3032 3. PCA-Koeffizient von UPEC 4 3033 4. PCA-Koeffizient von UPEC 4 3034 Bild des Spermiums UPEC4, im schwarzen Kasten der Nukleus 3135 Gewichtung der Raman-Shifts durch die erste und zweite Hauptkomponente in
UPEC4 31
36 Raman Shifts der Felder (0.0379, 0.0952) in blau und (-1.0699, 0.8044) in türkis 3237 Bild des Spermiums UPEC5 3238 1. PCA-Koeffizient von UPEC 5 3339 2. PCA-Koeffizient von UPEC 5 3340 3. PCA-Koeffizient von UPEC 5 3341 4. PCA-Koeffizient von UPEC 5 33
42
42 Gewichtung der Raman-Shifts durch die erste und zweite Hauptkomponente in UPEC3
33
43 Gewichtung der Raman-Shifts durch die erste und zweite Hauptkomponente in UPEC5
33
44 Streuplot der ersten gegen die zweite Hauptkomponente (UPEC2) 3545 Streuplot der ersten gegen die zweite Hauptkomponente (UPEC3) 3546 Streuplot der ersten gegen die zweite Hauptkomponente (UPEC4) 3647 Streuplot der ersten gegen die zweite Hauptkomponente (UPEC5) 36