13.10
Bootstrapping ist eine Resampling-Methode, bei der Stichproben verwendet werden, die nach dem Zufallsprinzip aus der bereits gesammelten Stichprobe gezogen und ersetzt werden.
Stellen Sie sich einen Paläontologen vor, der versucht, mit nur fünf fossilen Exemplaren die mittlere Flügellänge einer prähistorischen Insektenart zu bestimmen.
Eine höhere Stichprobengröße ist wünschenswert, um bessere Schlussfolgerungen zu ziehen, aber es gibt keine Möglichkeit, mehr Fossilien zu erhalten. In solchen Fällen ist die Bootstrap-Resampling-Methode von Vorteil.
Diese Daten von fünf Exemplaren ergeben eine mittlere Länge von 10,7 cm.
Um mit dem Bootstrapping zu beginnen, ziehen Sie nach dem Zufallsprinzip Stichproben aus dem ursprünglichen Stichprobensatz.
Beachten Sie, dass diese Stichprobengröße mit der ursprünglichen Stichprobengröße identisch ist, einige Werte jedoch wiederholt werden. Dies liegt daran, dass das Bootstrap-Resampling völlig zufällig ist.
Mehrere solcher Bootstrap-Stichproben werden gezogen, um die mittlere Flügellängenverteilung zu schätzen. Auf diese Weise können auch Konfidenzintervalle erhalten werden, um den Mittelwert der Grundgesamtheit genauer zu schätzen.
Bootstrapping ist einfach und kostengünstig, erfordert jedoch eine begrenzte Stichprobe. Wenn eine solche Stichprobe verzerrt oder fälschlicherweise erfasst wird, bleibt das Bootstrap-Resampling genauso verzerrt oder fehlerhaft wie die ursprüngliche Stichprobe.
Der Begriff „Bootstrap“ entstand im 19. Jahrhundert als Metapher für Selbstverbesserung oder das eigenständige Erreichen von etwas ohne externe Hilfe. Dieses Konzept erstreckt sich auch auf statistisches Bootstrapping, eine in sich geschlossene Methode zur Schätzung von Populationsparametern durch Resampling, auch wenn es rechenintensiv sein kann. Bootstrapping wurde 1979 vom amerikanischen Statistiker Dr. Bradley Efron entwickelt und bietet eine robuste Möglichkeit, Schlussfolgerungen zu ziehen, wenn die ursprüngliche Stichprobengröße klein oder die Daten komplex sind.
Bootstrapping, auch als Bootstrap-Resampling bekannt, simuliert den Sampling-Prozess, indem mehrere Zufallsstichproben mit Ersetzung aus einem vorhandenen Datensatz gezogen werden. Dabei fungiert die ursprüngliche Stichprobe als Ersatz-„Population“ und jede Resampling-Probe wird als unabhängige Stichprobe behandelt, die aus dieser „Population“ gezogen wurde. Die zugrunde liegende Annahme ist, dass die ursprüngliche Stichprobe eine gute Darstellung der breiteren Population ist. Dieser Ansatz ist besonders wertvoll, wenn die Stichprobengröße begrenzt ist, wie bei Studien mit seltenen Fossilien, alten Genomproben, Geweben von seltenen Krankheiten, Studien zu bedrohten Arten und einzigartigen Experimenten, die nicht einfach wiederholt werden können.
Der grundlegende Prozess des Bootstrappings umfasst die folgenden Schritte:
Da das Resampling mit Ersetzung erfolgt, kann jede neue Stichprobe wiederholte Werte aus den Originaldaten enthalten, was die Zufälligkeit des Resampling-Prozesses widerspiegelt. Bootstrapping erfordert normalerweise eine hohe Anzahl von Resamples (oft über 1.000), um stabile Schätzungen zu erzielen, die dann zur Berechnung von Statistiken wie Mittelwert, Varianz, Standardfehler oder Konfidenzintervallen für Populationsparameter verwendet werden können.
Bootstrapping ist sowohl kostengünstig als auch zugänglich und bietet eine unkomplizierte Möglichkeit, Schlussfolgerungen zu ziehen, ohne dass zusätzliche Daten erforderlich sind. Allerdings ist es stark von der ursprünglichen Stichprobe abhängig, was bedeutet, dass alle Verzerrungen oder Fehler in den ursprünglichen Daten auch in den Bootstrapping-Ergebnissen vorhanden sind.
Bootstrapping ist eine Resampling-Methode, bei der Stichproben verwendet werden, die nach dem Zufallsprinzip aus der bereits gesammelten Stichprobe gezogen und ersetzt werden.
Stellen Sie sich einen Paläontologen vor, der versucht, mit nur fünf fossilen Exemplaren die mittlere Flügellänge einer prähistorischen Insektenart zu bestimmen.
Eine höhere Stichprobengröße ist wünschenswert, um bessere Schlussfolgerungen zu ziehen, aber es gibt keine Möglichkeit, mehr Fossilien zu erhalten. In solchen Fällen ist die Bootstrap-Resampling-Methode von Vorteil.
Diese Daten von fünf Exemplaren ergeben eine mittlere Länge von 10,7 cm.
Um mit dem Bootstrapping zu beginnen, ziehen Sie nach dem Zufallsprinzip Stichproben aus dem ursprünglichen Stichprobensatz.
Beachten Sie, dass diese Stichprobengröße mit der ursprünglichen Stichprobengröße identisch ist, einige Werte jedoch wiederholt werden. Dies liegt daran, dass das Bootstrap-Resampling völlig zufällig ist.
Mehrere solcher Bootstrap-Stichproben werden gezogen, um die mittlere Flügellängenverteilung zu schätzen. Auf diese Weise können auch Konfidenzintervalle erhalten werden, um den Mittelwert der Grundgesamtheit genauer zu schätzen.
Bootstrapping ist einfach und kostengünstig, erfordert jedoch eine begrenzte Stichprobe. Wenn eine solche Stichprobe verzerrt oder fälschlicherweise erfasst wird, bleibt das Bootstrap-Resampling genauso verzerrt oder fehlerhaft wie die ursprüngliche Stichprobe.
From Chapter 13:
Now Playing
Nonparametric Statistics
899 Views
Nonparametric Statistics
1.9K Views
Nonparametric Statistics
663 Views
Nonparametric Statistics
1.4K Views
Nonparametric Statistics
545 Views
Nonparametric Statistics
522 Views
Nonparametric Statistics
524 Views
Nonparametric Statistics
727 Views
Nonparametric Statistics
629 Views
Nonparametric Statistics
1.0K Views
Nonparametric Statistics
1.1K Views
Nonparametric Statistics
1.5K Views
Nonparametric Statistics
1.2K Views
Nonparametric Statistics
1.6K Views
Nonparametric Statistics
947 Views
See More