ubungsblatt zu protein interaction networks · pdf fileubungsblatt zu protein interaction...

Post on 06-Feb-2018

214 Views

Category:

Documents

1 Downloads

Preview:

Click to see full reader

TRANSCRIPT

Ubungsblatt zu Protein InteractionNetworks

Samira Jaeger

January 10, 2011

1 Netzwerkzentralitat (6P)

In der Vorlesung haben Degree Centrality besprochen. Finde drei weitere etablierteZentralitatsmaße und diskutiere diese. In welchem Zusammenhang werden diese ver-wendet und welche biologischen Aussagen konnen fur biologische Netzwerke durchZentralitatsanalyse getroffen werden ?

Die Abgabe beinhaltet: (a) Definition der Zentralitatsmaße, (b) Erlauterung der zuGrunde liegenden Idee des jeweiligen Maßes, und (c) Anwendungsbeispiele fur biolo-gischen Netzwerke.

2 Datenbanksuche (2P)

Neben Protein-protein Interaktionen innerhalb einer Spezies gibt es auch spezies-ubergreifende Interaktionen, z.B. Virus-Host-Interaktionen. HIV-1 oder das Epstein-Barr Virus infizieren Menschen uber Virus-Host-Interaktionen. Spezifische Daten-banken erfassen und speichern diese Host-Virus-Interakionen, z.B. HIV-1, Human Pro-tein Interaction Database (http://www.ncbi.nlm.nih.gov/RefSeq/HIVInteractions/index.html).

Das HIV-1 Genom besteht aus 9 Genen die wiederum 19 Proteine kodieren, welchein unterschiedlichster Art und Weise mit einer Vielzahl von menschlichen Proteineninteragieren, um verschiedene Pathways im menschlichen Organismus auszunutzen.

• Welche Formen von Interaktionen zwischen HIV-1 und Mensch konnen unter-schieden werden?

• Gibt es HIV-1 Proteine, die mit den selben menschlichen Proteinen interagieren?Wenn ja, welche sind dies und welchen Pathways kommen diese vor?

Die Abgabe beinhaltet: (a) eine Listen der unterschiedlichen Interaktionstypen zwis-chen HIV-1 und menschlichen Proteine und (b) eine Liste der HIV-1 und menschlichenProteinen die miteinander interagieren und die mit ihnen assozierten Pathways.

1

3 Analyse eines Proteininteraktionsnetzwerkes (12P)

Auf der Vorlesungsseite ist das Proteininteraktionsnetzwerk der Fruchtfliege (Drosophilamelanogaster) bereit gestellt, welches im Rahmen der Ubung analysiert werden soll.Das Netzwerk ist im sif-format Formaten verfugbar.

P1 P2

P3

P4

Figure 1: Beispielgraph.

Das sif-format ist ein einfaches Textformat in dem Proteininteraktionen einesNetzwerkes/Graphens folgendermassen dargestellt werden. Jede Zeile steht fur eineungerichtete Kante und hat die Form:P1 pp P2

P2 pp P3

P2 pp P4

Dabei sind Px und Py Proteinidentifier (UniProt Ids) und pp zeigt eine Protein-Protein-Interaktion an.

3.1 Netzwerkeigenschaften (5P)

Im ersten Teil der Aufgabe soll das Interaktionsnetzwerk in Java eingelesen werdenund anschließend seine Eigenschaften bestimmt werden:

• Charakterisiere das Interaktionsnetzwerk: Wie viele Proteine und Interaktionenumfasst es ? Bestimme die durchschnittliche Anzahl Interaktionen pro Protein.

• Berechne die (a) Kantendichte und (b) den durchschnittlichen Clusterkoeffizien-ten in obigem Fliege-Netzwerk.

• Berechne fur jedes Protein die Degree Centrality und ordne die Proteine nachihrer Zentralitat. Welches sind die 5 zentralsten Proteine im Netzwerk (undwelche funktionalen Aufgaben erfullen sie) ?

Die Abgabe beinhaltet: (a) den Java Code, (b) die Berechnung und Ausgabe dergesuchten Netzwerkeigenschaften und eine Liste der 5 zentralsten Proteine im Netzwerkinklusive der jeweiligen Degree centrality.

2

3.2 Funktionale Module (7P)

Im zweiten Teil der Aufgabe sollen funktionale Module identifiziert werden. Funk-tionale Module oder Cluster sind in Netzwerken als stark vernetzte Subgraphen zufinden. Die Identifizierung von k-cores in Interaktionsnetzwerken ist eine Moglichkeitum solche stark vernetzten Subgraphen zu detektieren. k-cores sind definiert als eineGruppe von Proteinen, in der jedes Protein mindestens k Interaktionen besitzt.

Figure 2: Beispiel k-cores fur k = 0, 1, 2, 3. k gibt an, wie viele Verbindungenein Knoten zu anderen Knoten im selben k-core hat bzw. haben muss, umTeil eines k-cores zu sein. (Nachtrag zur Vorstellung der Ubung: Die beidenweißen Knoten sind nicht Teil des k = 3-cores, da sie nur nur mit zwei im k= 3-core liegenden Knoten verbunden sind, der dritte Link geht jeweils zueinem Knoten im k = 2-core.)

Algorithmus zur Detektion von k-cores:for all v ∈ V do

consider its node degree and the degree of its neighborsif deg(v) <k then

prune velse

if v has n neighbors with degree <k thendeg(v) = deg(v) - nif deg(v) <k then

prune vend if

end ifend if

end for

• Implementiere das vorgestellte Verfahren zur Identifizierung von k-cores. Findeden großten k-core in dem Interaktionsnetzwerk und visualisiere diesen. Wie vieleProteine enthalt dieser k-core und wie viele Interaktionen besitzt jedes Protein

3

im k-core.

• Analysiere die funktionalen Eigenschaften des Modules reprasentiert durch denidentifizierten k-core. Tipp: Die funktionale Analyse kann mit Hilfe von DAVID(http://david.abcc.ncifcrf.gov/) durchgefuhrt werden. DAVID ist ein Analyse-Tool mit dem Gruppen von Genen und Proteinen anhand ihrer Funktion, Path-ways oder Domanen untersucht werden konnen, um uberreprasentierte funk-tionale Eigenschaften in diesen Gruppen zu finden.

Die Abgabe beinhaltet: (a) den Java Code, (b) die Visualisierung des großten k-cores und Erlauterung seiner Eigenschaften (Anzahl der Proteine, Mindestanzahl vonInteraktionen pro Protein (k)) und (c) die funktionale Charakterisierung des k-coresanhand von uberreprasentierten Funktionen, Pathways und Domanen mit Hilfe vonDAVID.

4

top related