statistik für biologenstrucbio.biologie.uni-konstanz.de/~dikay/statistik/24.10.pdf ·...
Post on 12-Feb-2020
4 Views
Preview:
TRANSCRIPT
Statistik für Biologen
K. DiederichsWintersemester 2019/20
Fünf von vier Menschen haben ein Problem mit Mathematik
3
Vorlesung Donnerstag, 10:00-11:30 Uhr M629
Übungen Mo 18:45-20:15 M630 Bianca Buratti 47Di 18:45-20:15 L602 Kim-Isabelle Mayer 80Mi 17:00-18:30 P603 Kathy Su 69Mi 18:45-20:15 M627 Nikolas Buchenau 68
Klausur Montag, 17.2.20, 8:00 – 9:30 Uhr, R512/R513 Nachklausur Dienstag, 31.3.20, 11:00 – 12:30 Uhr, A701
Literaturempfehlung ("KSV"): Köhler, Schachtel, Voleske: Biostatistik (ab 3. Auflage)Springer, € 24,95 (Kindle 16€) ; <80 Exemplare in der Lehrbuchsammlung; elektronische Version (zuhause über VPN)Folien: http://strucbio.biologie.uni-konstanz.de/~dikay/statistik
4
• 3 ECTS-Punkte bei Bestehen der Klausur (ggf. Nachklausur).
• Für 3.-Semester ist die wöchentliche Teilnahme sowie das Vorzeigen eigenhändig verfaßter Lösungen (bzw Lösungsversuche) der Übungsaufgaben am Anfang des Tutoriums Pflicht. Wer in mehr als 2 Wochen ohne ärztliches Attest das Tutorium verpasst bzw die Lösungen nicht vorzeigen kann, wird nicht zur Klausur zugelassen. 5.-Semester: Zulassung gemäß Vorjahresregelung.
• bei Klausur zugelassene Hilfsmittel sind 1 Statistikbuch oder Formelsammlung, Vorlesungsmitschrift/ausdruck+Übungsaufgaben+z,t,F, χ2,-Tabellen (d.h. alles sonstige Schriftliche) in einem schmalen Ordner, Taschenrechner, aber nicht Handy/Notebook. Studentenausweis/ Perso mitbringen! Kein Rücktritt nach der Klausur – Durchstreichen aller Seiten vor Abgabe ergibt 0 Punkte.
• für Studenten, die nicht im 3. Semester sind: für die Klausur /Nachklausur muss man sich bis 2 Wochen vor dem Erst-Klausurtermin bei Frau Bucifal (Fachbereichs -Sekretariat, M605) verbindlich anmelden (evtl STUDIS/ZEuS).
• bei Nichtbestehen der Klausuren kann eine mündliche Prüfung abgelegt werden. Falls diese auch nicht bestanden wird, gibt es keine weitere Möglichkeit, den Schein zu erwerben.
Schein "Statistik"
5
• Übungsaufgaben sind Beispiele für Klausuraufgaben; sie werden in der Vorlesung angesagt und in der Folgewoche in Tutorien besprochen.
• Es kann jede Woche ein beliebiges Tutorium besucht werden.
• 3.-Semester: Wer bei den Tutorien eine Aufgabe richtig vorrechnet, bekommt einen Sonderpunkt. Bis zu zwei Sonderpunkte werden bei folgender Haupt- und Nachklausur (aber später nicht mehr!) hinzugerechnet, falls die Punktezahl unter 16 (von 40) liegt.
• 5.-Semester: es gelten die Regelungen des Vorjahres
Übungsaufgaben und Tutorien
6
• Die Vorlesung besuchen! Die Stunden bauen auf ein- ander auf. Nicht Faktenwissen zählt, sondern Verständnis.
• Nicht erst zwei Wochen vor der Klausur anfangen zu lernen und nur anhand der früheren Klausuren üben, sondern von der ersten Woche an die Übungsaufgaben selbständig lösen und in den Tutorien vertiefen.
• Übungsaufgaben und frühere Klausuren: zunächst eine Aufgabe 15 Minuten lang versuchen, selbständig zu lösen. Dann erst den ersten Schritt der Lösung anschauen!
• In der Klausur zunächst die leichteren Aufgaben, und erst danach die schweren Aufgaben bearbeiten.
Wie arbeitet man erfolgreich?
7
Zitate und Interpretationen
„Traue keiner Statistik, die du nicht selber gefälscht hast.“ Von der Nazipropaganda im Zweiten Weltkrieg erfunden und Winston Churchill zugeschrieben.
“There are three kinds of lies: Lies, Damned Lies and Statistics.” (Mark Twain) Deutsche Übersetzung: „Lüge, Meineid, Statistik“
„Probability Theory - the Logic of Science“ ist der Titel eines Buches von E.T. Jaynes.
8
Sampling errors: Aristotle's suspect statistical skillsTaner Z. SenNature 513, 315 (18 September 2014)
In his review of Armand Marie Leroi's book The Lagoon (Nature 512, 250–251; 2014), Roberto Lo Presti rightly praises Aristotle's observational skills. But the philosopher may not have been as adroit in numeracy as he was in biology.Aristotle famously declared that “males have more teeth than females in the case of men, sheep, goats, and swine” (see his History of Animals, Book 2, Part 3). This was an obvious sampling mistake, which bears out the importance today of a strong statistical foundation for biological curricula.
9
Heavy use of equations impedes communication among biologistsTim W. Fawcett and Andrew D. Higginson
AbstractMost research in biology is empirical, yet empirical studies rely fundamentally on theoretical work for generating testable predictions and interpreting observations. Despite this interdependence, many empirical studies build largely on other empirical studies with little direct reference to relevant theory, suggesting a failure of communication that may hinder scientific progress. To investigate the extent of this problem, we analyzed how the use of mathematical equations affects the scientific impact of studies in ecology and evolution. The density of equations in an article has a significant negative impact on citation rates, with papers receiving 28% fewer citations overall for each additional equation per page in the main text. Long, equation-dense papers tend to be more frequently cited by other theoretical papers, but this increase is outweighed by a sharp drop in citations from nontheoretical papers (35% fewer citations for each additional equation per page in the main text). In contrast, equations presented in an accompanying appendix do not lessen a paper’s impact. Our analysis suggests possible strategies for enhancing the presentation of mathematical models to facilitate progress in disciplines that rely on the tight integration of theoretical and empirical work.
PNAS July 17, 2012 vol. 109 no. 29 11735-11739
10
Mathematical illiteracy impedes progress in biologyNakul Chitnis and Thomas A. Smith
Fawcett and Higginson (1) have shown that citation rates of biology papers with equations in the main text are lower than those of papers without equations. They claim that this implies “heavy use of equations impedes communication among biologists” and recommend that equations be moved to appendixes to improve citation rates. We suggest that a better interpretation of their results would be “mathematical illiteracy impedes progress in biology.”
PNAS November 6, 2012 vol. 109, E3055
11
Lehrbücher:
(KSV): Köhler, Schachtel, Voleske: Biostatistik (Springer, Buch und e-Book)
Selbststudium: Kuckartz Rädiker Ebert Schehl: Statistik - eine verständliche Einführung (Springer, e-Book)
Empfehlenswert: Beck-Bornholdt , Hans-Peter; Dubben , Hans-Hermann: Der Schein der Weisen. Irrtümer und Fehlurteile im täglichen Denken. 2003, Rowohlt TB. EUR 8,90 Beck-Bornholdt, Hans-Peter; Dubben, Hans-Hermann: Der Hund, der Eier legt. Erkennen von Fehlinformation durch Querdenken. (rororo sachbuch; rororo science) 2001, Rowohlt TB. EUR 9,90
Gero von Randow: Das Ziegenproblem - Denken in Wahrscheinlichkeiten. Rowohlt TB 2004. EUR 7,90
Englische Zeitschriftenartikel: z.B. “Systems Biology - How Information Theory handles cell signaling and uncertainty”. Science 338 (2012), 334-335 (Entropie, bedingte Wahrscheinlichkeit)
„Points of Significance“ (diverse Themen) Nature Methods monatlich seit 2013
12
Im Internet zu finden
https://de.wikibooks.org/wiki/Statistik
Statistics Online Computational Resources (SOCR) - Sammlung statistischer Methoden zur Online Datenanalyse u.v.m. (http://socr.stat.ucla.edu/) (engl.)
Hilfsmittel beim Rechnen der Übungsaufgaben (nicht für Klausur!):
http://statpages.org: Web Pages that Perform Statistical Calculations Über 600 Links, davon 380 Seiten mit Kalkulationsprogrammen (engl.)
http://integrals.wolfram.com : Online Integrator (z.B. x^3 Sin[x] )http://mathworld.wolfram.com : The web‘s most extensive math resourcehttp://www.wolframalpha.com : mathematisch orientierte Such- und Rechenmaschine
Excel / Oocalc / Libreoffice auf dem PC
13
http://www.j3l7h.de/videos.html - Jörn Loviscach (U Bielefeld): Informatik, Mathe, ... (Deutsch; auch als YouTube-Kanal zu finden) z.B. Mathe 1 Teil 2, Winter 2010/2011
https://www.coursera.org/ - Take the World's Best Courses, Online, For Free (33 Universitäten, 206 Kurse, 2 Mio Teilnehmer): Passion Driven Statistics; Statistics 1; Mathematical Biostatistics Boot Camp („just sign up“)
https://www.udacity.com/course/intro-to-statistics--st101 - „Intro to Statistics“
https://www.edx.org - The Future of Online Education (MIT, Harvard, Berkeley, U of Texas, ...)
Video-Vorlesungen
14
Statistik
aus Wikipedia, der freien Enzyklopädie (http://de.wikipedia.org/wiki/Statistik)
Als eine Statistik bezeichnet man:
1. namengebend (von lateinisch status - Staat, Zustand mit griechischer Endung) die (vergleichende) Staatsbeschreibung (eingeführt wurde der Begriff vom Göttinger Kameralisten Gottfried Achenwall um 1749);
2. die heute als amtliche Statistik fortlebt;
3. davon verallgemeinernd quantitative Erhebungen aller Art, wie zum Beispiel für Markt- und Meinungsforschung;
4. deren Ergebnisse, deren Darstellung u.a. die deskriptive Statistik besorgt;
5. die mathematische Statistik;
6. gewisse Zufallsvariablen, z.B. eine »Teststatistik«;
7. gewisse Modelle der statistischen Physik: Boltzmann-Statistik, Maxwell-Boltzmann-Verteilung, Fermi-Dirac-Statistik, Bose-Einstein-Statistik
15
Wikipedia: Übersicht und Einteilung (bezieht sich auf Punkt 4 u. 5)
• deskriptive Statistik (beschreibende Statistik, empirische Statistik), mit der vorliegende Daten in geeigneter Weise beschrieben und zusammengefasst werden. Mit ihren Methoden verdichtet man quantitative Daten zu Tabellen, graphischen Darstellungen und Kennzahlen.
• induktive Statistik (schließende Statistik, mathematische Statistik), mit der man aus vorliegenden Daten, die als Stichprobe erhoben worden sind, auf eine zu Grunde liegende verborgene Struktur schließt. Die Wahrscheinlichkeitstheorie liefert die Grundlagen für die erforderlichen Schätz- und Testverfahren.
Induktive Statistik und Wahrscheinlichkeitstheorie werden unter dem Oberbegriff Stochastik zusammengefasst.
Während sich die univariate Statistik mit der Beschreibung der Verteilung eines Untersuchungsmerkmals beschäftigt, wird in der multivariaten Statistik die gemeinsame Verteilung von mehreren Untersuchungsmerkmalen betrachtet.
16
Stryer: Biochemistry (3.Auflage)
17
Drei Beispiele aus
Knippers: Molekulare Genetik, 8. Aufl. (Thieme)
18
19
20Plattner, H. und Hentschel, J.: Zellbiologie (3. Aufl., Thieme)
21
Mathematik
Chemie
Sozialwissenschaften
Physik
Genetik(Alignments)
Molekular-biologie(Kolonien)
(Bio-)Statistik
Evolution(Stammbäume)
Struktur-biologie(Datenanalyse)
Ökologie(math. Modelle für Zusammenhänge)
Biologie
22
- welche Daten soll man ermitteln? (Kap. A)- wieviele Daten soll man ermitteln? (Kap. A)- auf welche Weise soll man seine Untersuchungsdaten ermitteln? (Kap. A)- auf welche Art soll man das Untersuchungsmaterial auswerten? (Kap. A)- wie sollen die Daten beschrieben und übersichtlich angeordnet werden? (Kap.B)- welche Schlüsse lassen sich ziehen? (Kap. C)- wie zuverlässig sind die Aussagen, die getroffen werden? (Kap. C)- welche weiterführenden Fragestellungen werfen die Ergebnisse auf?
Fragen, die die Statistik bearbeitet
23
A.
Einführung:
1. Versuchsplanung
2. Merkmalsauswahl
3. Skalenniveaus
4. Durchführung
B.
Beschreibende (deskriptive) Statistik
C.
Schließende Statistik
Fehler 1. und 2. Art
Testverfahren
Regressionsanalyse
Varianzanalyse
(Bayes-Statistik)
W.1. Wahrscheinlichkeitsrechnung
Grundlagen der Zufallsereignisse
W.2. Kombinatorik
Wahrscheinlichkeits-verteilungen
(Binomial, Poisson, Normal)
W.3. Prüfverteilungen
(Normal, t, F, χ2)
Verwenden von Tabellen
Gliederung der Vorlesung
24
Beispiel* (aus KSV): Wirkung von DDT auf Fliegen
25
A.1. Versuchsplanung (vor Versuch!)
•Fragestellung unter Berücksichtigung der Literatur aufarbeiten
(Beispiel: Wirkung von DDT auf Fliegen untersuchen)
•Modell mit entsprechenden Hypothesen formulieren (Beispiel: zeit-
und mengenabhängige Sterblichkeit)
•Untersuchungsmethode zur Überprüfung der Hypothesen vorschlagen
(Beispiel: Verabreichung von einmalig 300μg DDT (Quelle), 100
Drosophila, Alter: 1 Woche)
•Merkmale festlegen, die gemessen oder beobachtet werden sollen.
Methode dafür festlegen. Zeitrahmen festlegen. (Beispiel: tote
Fliegen zählen über 24h)
26
A.2. Merkmalsauswahl
Merkmal: etwas, was man zur Untersuchung einer Fragestellung zählt/misst
Objektivität: Unabhängigkeit vom Experimentator
Zuverlässigkeit/Reliabilität : Unabhängigkeit von der Auswahl des Messobjektes
(beide Kriterien bedeuten: Reproduzierbarkeit)
Aussagekraft / Validität (auch: "Gültigkeit") : Messung misst das, was die Frage beantworten kann
Merkmale haben diese Eigenschaften nur im Hinblick auf die Fragestellungen, die in der Versuchsplanung festgelegt wurden!
27
Skalenniveau zugehörige Daten
Maßzahlen und Tests
Nominal-Skala Häufigkeiten ?
Ordinal-Skala Rangplätze ?
Intervall-Skala Messwerte Mittelwert
Verhältnis-Skala Messwerte
A.3 Skalenniveaus
28
A.4. Ablauf ("Datenerhebung") eines Experimentes
• Nebeneinflüsse
• Reproduzierbarkeit
• Selbstschutz
• Dokumentation
• Eigentliche Durchführung
• Daten aufschreiben / speichern
• Datenverarbeitungtabellarisch / graphisch Hypothesen/Modell überprüfen / verifizieren / ablehnen
• Interpretation
• (Präsentation / Publikation)
29
Kumulative Sterbehäufigkeit von Drosophila nach Behandlung mit DDT
Stunden nach Behandlungsbeginn 1 2 3 4 5 6 7 8 9
Tote Fliegen 1 12 58 84 95 98 98 99 100
010
203040
5060
708090
100
1 2 3 4 5 6 7 8 9
tote Fliegen (gesamt)
tote Fliegen(neu)
30
Präzision (precision) – wie unterschiedlich sind die Messwerte?Wahrheitsnähe (accuracy) – wie weit sind die Messwerte vom wahren Wert entfernt?
A.5 „Qualität“ und „Genauigkeit“ von Messungen
top related