einführung in die räumliche statistik (2015)
TRANSCRIPT
Wo ist der Wald vor lauter Bäumen?
Visualisierung und Beschreibung räumlicher Daten
Jakob Nikolas Kather, 2015
I. Dichtemessung und Aggregation
II. Quantifizierung von Verteilungen
III. Clustering
IV. Anwendungen
I. Dichtemessung und Aggregation
2D-Histogramm Beispieldatensatz 1
Kernel density estimation (KDE) Beispieldatensatz 1
Kernel density estimation (KDE) Beispieldatensatz 2
Kernel density estimation (KDE) echter Datensatz
II. Quantifizierung von Verteilungen
Dichtezählung
Nachbarn und Kanteneffekte
Kanteneffekt
Was ist Zufall?
Baddeley, A. J., & Turner, R. (2004). Spatstat: An R Package for Analyzing Spatial Point Pattens, available from: http://www.spatstat.org/spatstat/doc/spatstatJSSpaper.pdf
F(r): empty space function = point-to-event distribution
G(r): nearest neighbour distance distribution function = event-to-event distribution
K(r): Anzahl der Nachbarn N abhängig vom Radius r
normalisiert auf Gesamtzahl der Punkte n und Gesamtdichte der Punkte λ = n/A
Ripley’s K function
Zufälliges Muster Muster mit Clustern
III. Clustering
k means clustering
1. Lege zufällig k Zentren fest 2. Jeder Datenpunkt wird dem nächsten Zentrum zugeordnet 3. Verschiebe jedes Zentrum in die Mitte der zugehörigen Punktwolke
Jeder Datenpunkt wird dem nächsten Zentrum zugeordnet Verschiebe jedes Zentrum in die Mitte der zugehörigen Punktwolke
Jeder Datenpunkt wird dem nächsten Zentrum zugeordnet
Verschiebe jedes Zentrum in die Mitte der zugehörigen Punktwolke
Jeder Datenpunkt wird dem nächsten Zentrum zugeordnet
Verschiebe jedes Zentrum in die Mitte der zugehörigen Punktwolke
k means clustering
1. Lege zufällig k Zentren fest 2. Jeder Datenpunkt wird dem nächsten Zentrum zugeordnet 3. Verschiebe jedes Zentrum in die Mitte der zugehörigen Punktwolke
Jeder Datenpunkt wird dem nächsten Zentrum zugeordnet Verschiebe jedes Zentrum in die Mitte der zugehörigen Punktwolke
Jeder Datenpunkt wird dem nächsten Zentrum zugeordnet
Verschiebe jedes Zentrum in die Mitte der zugehörigen Punktwolke
Jeder Datenpunkt wird dem nächsten Zentrum zugeordnet
Verschiebe jedes Zentrum in die Mitte der zugehörigen Punktwolke
https://de.wikipedia.org/wiki/K-Means-Algorithmus
k = 2
k = 3
k = 4
k = 5
k = 6
https://en.wikipedia.org/wiki/Category:Data_clustering_algorithms
… noch viel mehr
IV. Anwendungen
http://en.wikipedia.org/wiki/1854_Broad_Street_cholera_outbreak#/media/File:Snow-cholera-map-1.jpg
Ideen für Anwendungen in den Lebenswissenschaften?
Visualisierung ∎ Dichtemessung ∎ Clustering
… von räumlichen Daten auf Landkarten
Diese Präsentation ist verfügbar auf Slideshare
slideshare.net/jnkather
Lebenswissenschaftliches Wochenendseminar
http://www.lwws.de