16.11:
Microsoft Excel: Ermitteln von zentraler Tendenz, Schiefe und Kurtosis
Die zentrale Tendenz bezieht sich auf den zentralen Punkt oder den typischen Wert eines Datensatzes. Er fasst den Datensatz mit einem einzelnen Wert zusammen, der den Mittelpunkt seiner Verteilung darstellt. Die drei Hauptmaße der zentralen Tendenz sind:
Mittelwert: Das arithmetische Mittel aller Datenpunkte. Er wird berechnet, indem alle Werte addiert und durch die Anzahl der Werte dividiert werden. Der Mittelwert reagiert empfindlich auf Extremwerte (Ausreißer).
Median: Der mittlere Wert, wenn die Datenpunkte in aufsteigender oder absteigender Reihenfolge angeordnet sind. Wenn es eine gerade Anzahl von Beobachtungen gibt, ist der Median der Durchschnitt der beiden mittleren Zahlen. Der Median wird weniger von Ausreißern und verzerrten Daten beeinflusst.
Modus: Der am häufigsten vorkommende Wert in einem Datensatz. Ein Dataset kann einen Modus, mehr als einen Modus oder gar keinen Modus haben.
Die Variation misst die Streuung oder Streuung eines Satzes von Datenpunkten. Es gibt Einblicke, wie stark sich die Datenpunkte vom Mittelwert und voneinander unterscheiden. Zu den wichtigsten Maßen für die Variation gehören:
Bereich: Die Differenz zwischen den Maximal- und Minimalwerten im Dataset. Es bietet einen schnellen Überblick über die Streuung, ist aber sehr empfindlich gegenüber Ausreißern.
Varianz: Der Durchschnitt der quadrierten Differenzen vom Mittelwert. Es quantifiziert, wie verteilt die Datenpunkte um den Mittelwert herum sind.
Standardabweichung: Die Quadratwurzel der Varianz. Er wird in den gleichen Einheiten wie die Daten ausgedrückt und stellt ein Maß für die durchschnittliche Entfernung jedes Datenpunkts vom Mittelwert dar.
schief
Die Schiefe misst die Asymmetrie der Datenverteilung um den Mittelwert. Sie gibt an, ob sich die Datenpunkte stärker auf eine Seite der Verteilung konzentrieren oder auf die Seite, zu der der Schwanz länger oder dicker ist. Zu den Arten von Schiefe gehören:
Positiver Skew (Right Skew): Der rechte Schwanz ist länger oder dicker als der linke. Der Mittelwert ist größer als der Median.
Negative Schiefe (Linksschräge): Der linke Schwanz ist länger oder dicker als der rechte. Der Mittelwert ist kleiner als der Median.
Ein Schiefewert nahe Null gibt an, dass die Datenverteilung symmetrisch ist.
kurtosis
Kurtosis misst die “Tailedness” oder die Schärfe des Peaks einer Datenverteilung. Es gibt Einblick in die Enden (Schwänze) der Verteilung. Zu den Arten von Kurtosis gehören:
Positive Kurtosis (leptokurtisch): Zeigt eine Verteilung mit einem schärferen Peak und schwereren Schwänzen als eine Normalverteilung an. Die Datenpunkte konzentrieren sich stärker auf die Tails und den Peak.
Negative Kurtosis (Platykurtisch): Zeigt eine Verteilung mit einem flacheren Peak und leichteren Schwänzen als eine Normalverteilung an. Die Datenpunkte sind weniger auf die Tails und den Peak konzentriert.
Mesokurtisch: Gibt eine Verteilung mit Kurtosis an, die der einer Normalverteilung ähnelt.
Kurtosis hilft dabei, die Ausreißer und die Wahrscheinlichkeit von Extremwerten im Datensatz zu verstehen.
Betrachten Sie die folgenden drei hypothetischen Datensätze, die in Microsoft Excel gezeichnet sind.
Nun können drei Maße der zentralen Tendenz – Mittelwert, Median und Modus – mit den Excel-Funktionen AVERAGE, MEDIAN und MODE berechnet werden. SNGL für den ausgewählten Datenbereich.
Nach der Visualisierung der Datasets A und C werden ihre Schwänze nach links und rechts verlängert.
Quantitativ kann diese Schiefe mit der Excel-Funktion SKEW für den ausgewählten Datenbereich ermittelt werden. Sie werden für die Datasets A, B und C wie folgt berechnet.
Die Kurtosis kann mit der Excel-Funktion KURT für den ausgewählten Datenbereich für die Datensätze A, B und C gemessen werden.
Schiefe und Kurtosis als Maß für die Asymmetrie bestimmen die Abweichung von der Symmetrie. Schiefe Werte, die näher an Null liegen, deuten auf eine größere Symmetrie in den Daten hin.
Positive Kurtosis-Werte deuten auf einen höheren Peak der Verteilung im Vergleich zu einer Normalverteilung hin, mit weniger Werten in der Mitte als in den Schwänzen.
Umgekehrt zeigen negative Werte die Flachheit der Verteilung an, wobei mehr Werte in der Mitte als in den Schwänzen liegen.
Related Videos
Statistical Softwares
610 Aufrufe
Statistical Softwares
539 Aufrufe
Statistical Softwares
308 Aufrufe
Statistical Softwares
362 Aufrufe
Statistical Softwares
387 Aufrufe
Statistical Softwares
204 Aufrufe
Statistical Softwares
144 Aufrufe
Statistical Softwares
160 Aufrufe
Statistical Softwares
162 Aufrufe
Statistical Softwares
149 Aufrufe
Statistical Softwares
193 Aufrufe
Statistical Softwares
265 Aufrufe
Statistical Softwares
990 Aufrufe
Statistical Softwares
562 Aufrufe
Statistical Softwares
651 Aufrufe
Statistical Softwares
363 Aufrufe