Statistische Grafiken für die Doktorarbeit

Die Verwendung von Grafiken ist sowohl während der Datenanalyse als auch in der Beschreibung der Ergebnisse in der Doktorarbeit sehr wichtig. Während der Analyse helfen die Grafiken, die Verteilung der Daten einzuschätzen, Ausreißer zu identifizieren  und geben Hinweise auf eventuelle Zusammenhänge und Unterschiede. Wenn die Ergebnisse in der Doktorarbeit beschrieben werden, unterstreichen die Abbildungen diese und erleichtern dem Leser das Verständnis.

Je nach Datentyp und Fragestellung sind verschiedene Abbildungen sinnvoll. In diesem Blogbeitrag wird nur auf eine kleine Auswahl von Möglichkeiten eingegangen, die aber in den meisten medizinischen Doktorarbeiten benötigt werden.

Balkendiagramme für nominale und ordinale Daten

Zur Veranschaulichung von nominalen und ordinale Daten (Variablen mit Kategorien wie Geschlecht oder Krankheitsstadium) sind Balkendiagramme passend. Sie zeigen die Häufigkeit der jeweiligen Kategorie mit der Höhe der Balken. Werden zwei nominale oder ordinale Variablen gleichzeitig betrachtet, bietet sich ein gruppiertes Balkendiagramm wie in Abbildung 1 an.

gruppBalken_Sex_Func

Abb. 1: Gruppiertes Balkendiagramm

Die häufig verwendeten Tortendiagramme sind hingegen nicht zu empfehlen, da sie einen falschen Eindruck der Häufigkeiten vermitteln können. Ebensowenig empfehle ich 3D-Balkendiagramme, die auch die Einschätzung des Betrachters täuschen können.

Boxplots für metrische Daten

Metrisch skalierte Daten (alles, was auf einer gleichabständigen Skala gemessen wird, wie Alter, Gesicht, Blutdruck…) lassen sich gut mit Boxplots visualisieren. Der Boxplot beschreibt die Lage und Streuung der Daten ohne eine Schiefe oder Ausreißer zu verstecken.

Wird die metrische Variable für mehrere Gruppen untersucht, so werden die Boxplots für jede Gruppe nebeneinander gestellt wie in Abbildung 2. Diese Abbildung zeigt Unterschiede in Lage und Streuung und eignet sich gut als Ausgangspunkt für die Interpretation von Gruppenvergleichen.

Boxplot_Digdose_Diglevel

Abb. 2: Mehrere Boxplots für den Gruppenvergleich

Der Boxplot ist folgendermaßen aufgebaut (vergleiche Abbildung 3): Er besteht aus einer Box und aus zwei Strichen, jeweils nach oben und unten. Die Box enthält die 50 % mittleren Beobachtungen der Daten (25 %- bis 75 %-Quantil). In der Box markiert der Querstrich die mittlere Beobachtung, also den Median (50 %-Quantil). Die Striche nach oben und unten sind maximal 1,5-mal so lang wie die Länge der Box und enden an einem Datenpunkt. Datenpunkte, die außerhalb der Striche liegen, sind so genannte Ausreißer und werden als Punkte gesondert markiert.

Boxplot2

Abb. 3: Aufbau des Boxplots

Das häufig verwendete Balkendiagramm zur Visualisierung von Mittelwert und Standardabweichung oder Standardfehler von metrischen Variablen kann ich nicht empfehlen. Eine mögliche Schiefe in der Verteilung der Daten wird verdeckt. Außerdem wird der Unterschied bei Gruppenvergleichen durch das Einzeichnen der Standardabweichung oder des Standardfehlers nicht richtig abgebildet.

Streudiagramm für zwei metrische Variablen

Wird der Zusammenhang von zwei metrischen Variablen untersucht, ist ein Punkt- oder Streudiagramm wie in Abbildung 4 das Mittel der Wahl. Hier wird die eine Variable an der x-Achse, die andere an der y-Achse angetragen und die Daten als Punkte visualisiert. Zusammenhänge und Trends in den Daten sind dann leicht ersichtlich und können durch das Einzeichnen von Kurven oder Geraden unterstrichen werden.

Abbildung8

Abb. 4: Streudiagramm

Geschrieben von

Bisher keine Kommentare.

Hinterlassen Sie einen Kommentar


Ihre Nachricht