Die deskriptive Statistik dient als eine Methode zur Datenauswertung. Fehler in der deskriptiven Statistik können erhebliche negative Einflüsse auf alle folgenden Entscheidungen haben. Aus diesem Grund ist ein besonders gründliches Arbeiten in diesem Bereich besonders wichtig. Wir zeigen dir, worauf es bei der deskriptiven Statistik ankommt und welche Werkzeuge in diesem Bereich besonders regelmäßig genutzt werden.
Definition: Deskriptive Statistik
Im Begriff der deskriptiven Statistik steckt das Wort deskriptiv, was beschreibend bedeutet. Es handelt sich also um eine beschreibende Statistik und bildet die Grundlage für alle weiteren statistischen Arbeiten. Im Rahmen der deskriptiven Statistik möchte man anhand von Tabellen, Grafiken und durch die Bestimmung der relevanten Kennzahlen für einen Überblick über die Datenlage sorgen. Relevante Kennzahlen, auch Parameter genannt, sind beispielsweise der Mittelwert, die Varianz oder auch die Streuungsmaße. Die deskriptive Statistik bedient sich verschiedener Werkzeuge für unterschiedliche Zwecke.1
Deskriptive Statistik: Kennzahlen
Welche Kennzahlen die deskriptive Statistik nutzt, hängt maßgeblich davon ab, welche Fragestellung, aber auch welches Skalenniveau die verwendeten Daten bieten. Grundsätzlich gibt es drei verschiedene Arten von Kennzahlen, welche wieder eigene Parameter umfassen. Die wichtigen Kennzahlen im Bereich der deskriptiven Statistik sind:
- Lageparameter
- Zusammenhangsmaße
- Streuungsmaße2
Lageparameter in der deskriptiven Statistik
Als wichtiges Mittel muss die deskriptive Statistik auf grundsätzliche Tendenzen eines Datensatzes reagieren können. Die Lageparameter geben genau diese Tendenzen an. Es wird im Rahmen der Lageparameter untersucht, ob die gemessenen Werte bestimmten Parameter zugeordnet werden können. Befragt man, wie im Beispiel die Personen nach ihrem Alter, können anhand der Antworten Lageparameter ermittelt werden. Im Zuge dessen sind das arithmetische Mittel, der Modus und der Median die wichtigsten Parameter.
Arithmetisches Mittel in der deskriptiven Statistik
Das arithmetische Mittel wird in der deskriptiven Statistik aufgrund seiner geringen Aussagekraft nur in seltenen Fällen eingesetzt. Es kann dir vermitteln, wie hoch oder auch niedrig deine Messwerte im Durchschnitt sind. Schauen wir uns dazu das Beispiel mit den Altersfragen nochmals genauer an. Beim arithmetischen Mittel werden alle Messwerte addiert und das Ergebnis dieser Addition durch die Anzahl der Messwerte dividiert.
Berechnung des Modus in der deskriptiven Statistik
Der Modus kann für alle unterschiedlichen Skalenniveaus eingesetzt werden. Der daraus abgeleitete Modalwert beschreibt den Wert, welcher im vorhandenen Datensatz am häufigsten vorkommt.
Der Median in der deskriptiven Statistik
Der Median wird immer anhand von Daten erhoben, welche den Anforderungen einer sogenannten Ordinalskala entsprechen.
Streuungsmaße in der deskriptiven Statistik
Häufig genügen die Lagemaße nicht, um die Daten verständlich aufzubereiten. Die deskriptive Statistik setzt aus diesem Grund auch andere Hilfsmittel wie die Streuungsmaße ein. Dabei wird die Streuung der Daten erfasst, um unter anderem herauszufinden, ob es statistische Ausreißer gibt oder ob die Werte eher homogen sind. Die deskriptive Statistik bietet hier insgesamt drei standardisierte Streuungsmaße:
- Varianz
- Standardabweichung
- Spannweite
Die Varianz in der deskriptiven Statistik
Die Standardabweichung ist eines der wichtigsten Werkzeuge der deskriptiven Statistik. Für die Berechnung genau dieser Abweichung ist es wichtig die Wurzel der Varianz zu ziehen. Da die Varianz allerdings nicht bei allen Daten vorgegeben ist, muss diese berechnet werden.
Die Formel für die Varianz lautet:
∑ [xi – ∅]2 / n
Dabei setzen wir xi für die Messwerte von i = 1 bis n und n = Anzahl der Messwerte.
Die Standardabweichung als Maß der deskriptiven Statistik
Die deskriptive Statistik benötigt häufig genaue Werte. Dementsprechend wichtig ist es Abweichungen von den erwarteten Standards genauer definieren zu können. Die Standardabweichung ist die Wurzel aus der Varianz.
Die Spannweite als Teil der deskriptiven Statistik
Die deskriptive Statistik greift unter anderem auf die sogenannte Spannweite zurück. Unter diesem Begriff subsummiert sich der Abstand zwischen dem Minimum und dem Maximum der erhobenen Datensätze. Dies lässt sich leicht ermitteln, indem der niedrigste Wert vom Höchsten abgezogen wird.
Statistische Zusammenhangsmaße in der deskriptiven Statistik
Die deskriptive Statistik ist nicht nur auf nackte Zahlen, sondern auch auf den Zusammenhang zwischen den verschiedenen Variablen angewiesen. Hier kommen die statistischen Zusammenhangsmaße ins Spiel. Denn diese müssen miteinander in Zusammenhang gebracht werden. Hierzu bedient sich die deskriptive Statistik verschiedener Korrelationskoeffizienten. Diese wären:
- Die Korrelationskoeffizienz nach Pearson
- Die Rangkorrelationskoeffizienz
- Die Kontingenzkoeffizienz
Schauen wir uns diese drei Korrelationskoeffizienten einmal genauer an und betrachten wir deren Einsatzbereiche und Nutzen.4
Der Korrelationskoeffizient nach Pearson
Die deskriptive Statistik kann und soll den Zusammenhang zwischen verschiedenen Variablen nachweisen können. Dazu ist es unter anderem wichtig lineare Zusammenhänge zu erkennen. Hierfür ist die Korrelationskoeffizienz nach Pearson ein gültiges Mittel. Die Formel zur Berechnung des Korrelationskoeffizienten ist relativ kompliziert, ergibt aber immer nur drei mögliche Ergebnisse.
Ist das Ergebnis ungefähr bei Null, so gibt es keine Korrelation zwischen den Variablen.
Liegt der Wert über Null, so gibt es eine positive Korrelation. Größere Werte von Faktor X bedeuten auch Größere Werte von Faktor Y. Ist der Wert kleiner als Null, gibt es einen negativen Zusammenhang. Steigen die Werte von X, sinken diese von Y gleichermaßen.
Der Rangkorrelationskoeffizient der deskriptiven Statistik
Der Rangkorrelationskoeffizient nach Spearman, welcher auch unter dem Namen Spearman Rho bekannt ist, stellt eine Methode da, Zusammenhänge zwischen einzelnen Variablen zu erkennen und nachzuweisen. Die Korrelation der Werte wird anhand vorher vergebener Ränge berechnet. Der Abstand zwischen den einzelnen Datenpunkten und Datensätzen ist dabei von untergeordneter Rolle.
Der Kontingenzkoeffizient in der deskriptiven Statistik
Im Grunde ist der Korrelationskoeffizient nach Person bereits ein Beispiel für den Kontingenzkoeffizienten. Der Kontingenzkoeffizient drückt die Stärke des Zusammenhangs zwischen verschiedenen nominalen oder ordinalen Variablen und Kennzahlen aus. Verglichen wird dabei die Häufigkeit von Merkmalen mit der Häufigkeit, welche ohne diese Merkmale aufgetreten ist. Das Maß für den Zusammenhang der beobachteten Merkmale ist die quadratische Kontingenz. Diese wird also zum Quadrat genommen.
Was ist der Unterschied zwischen der deskriptiven und der induktiven Statistik
Besonders häufig kommt es zu Verwirrungen bei der Unterscheidung von deskriptiver und induktiver Statistik, obwohl sich beide Bereiche eigentlich einfach unterscheiden lassen. Die deskriptive Statistik bildet die Grundlage für alle weiteren Untersuchungen und Arbeiten mit den Daten.
Die induktive Statistik geht weit darüber hinaus. Sie versucht mit wahrscheinlichkeitstheoretischen Methoden zu ermitteln, ob sich auf Grundlage der Datenlage eine allgemeine Gültigkeit der Erkenntnisse ableiten lässt. Die deskriptive Statistik nutzt diese Methoden nicht.
Häufig gestellte Fragen
Die deskriptive Statistik ist ein Werkzeug, um Daten und ihren Nutzen zu bewerten und objektiv und sicher zu beschreiben. Die deskriptive Statistik ist ein wichtiges Werkzeug zur Datenerfassung und Einordnung.
In allen Bereichen, in denen statistische Datensätze erhoben und ausgewertet werden, bildet die deskriptive Statistik die Grundlage der Arbeit. Daher ist die deskriptive Statistik ein Universalwerkzeug in den verschiedensten Fachbereichen.
Auch wenn es wichtig ist die Formeln und ihre Einsatzbereiche zu kennen, gibt es mittlerweile viele hilfreiche Werkzeuge und Tools, welche die deskriptive Statistik deutlich einfacher machen.
Je nach gewähltem Fachbereich kann die deskriptive Statistik durchaus zur alltäglichen Arbeit gehören. Die Methoden und Mittel zu kennen ist in jedem Fall sinnvoll und zielführend.
Bei der deskriptiven Statistik werden Stichproben beschreiben. Die Inferenzstatistik folgt nun, um eine Aussage über die Grundgesamtheit zu treffen.
Quellen
1Novustat: Deskriptive Statistik, in: Novustat.com, o.D., [online] https://novustat.com/statistik-glossar/deskriptive-statistik.html#:~:text=Eine%20deskriptive%20Statistik%20beschreibt%20einen,von%20empirischen%20Daten%20zu%20beschreiben. (abgerufen am 23.01.2023)
2Lois D.: Deskriptive Statistik, in Unibw.de, April 2015, [online] https://www.unibw.de/hum-bildungswissenschaft/professuren/swm/methodenskripte/deskriptive-statistik.pdf (abgerufen am 23.01.2023)
3Welt der BWL: Varianz, in: Welt-der-bwl.de, o.D., [online] https://welt-der-bwl.de/Varianz#:~:text=Beispiel%3A%20Varianz%20berechnen&text=Die%20Varianz-Formel%20ist%3A%20?,%3D%2080%2F5%20%3D%2016. (abgerufen am 23.01.2023)
4Universität München: Deskriptive Statistik, in: Statistik.uni-muenchen.de, o.D., [online] https://www.statistik.uni-muenchen.de/formulare/skripte_u_aehnliches/deskriptivestatistik_groll.pdf (abgerufen am 23.01.2023)
5Bol G.: Kontingenzkoeffizient. In: Deskriptive Statistik: Lehr- und Arbeitsbuch, 2004, o.D., [online] https://doi.org/10.1524/9783486599510.125 (abgerufen am 23.01.2023)