13.10
Bootstrapping is a resampling method that uses samples randomly drawn from the already collected sample with replacement.
Imagine a paleontologist trying to determine the mean wing length of a prehistoric insect species with only five fossil specimens.
A higher sample size is desirable to make better inferences, but there is no way to obtain more fossils. In such cases, the bootstrap resampling method is beneficial.
These data from five specimens give a mean length of 10.7 cm.
To begin bootstrapping, randomly draw samples from the original sample set.
Notice that this sample has an identical sample size to the original one, but some values are repeated. This occurs because the bootstrap resampling is entirely random.
Several such bootstrap samples are drawn to estimate the mean wing length distribution. This way, confidence intervals can also be obtained to estimate the population mean more accurately.
Bootstrapping is easy and cost-effective, but it relies on a limited sample. If such a sample is biased or collected erroneously, the bootstrap resampling will remain as biased or erroneous as the original sample.
De term "bootstrap" ontstond in de 19e eeuw als metafoor voor zelfverbetering of het zelfstandig bereiken van iets, zonder externe hulp. Dit concept heeft zijn weg gevonden naar de statistische bootstrapping, een op zichzelf staande methode om populatieparameters te schatten door middel van resampling. Hoewel deze methode rekenintensief kan zijn, biedt ze een krachtige oplossing. Bootstrapping, ontwikkeld door de Amerikaanse statisticus Dr. Bradley Efron in 1979, biedt een robuuste manier om inferentie uit te voeren, vooral wanneer de oorspronkelijke steekproefomvang klein is of de gegevens complex zijn.
Bootstrapping, ook bekend als bootstrap-resampling, simuleert het bemonsteringsproces door meerdere willekeurige steekproeven te trekken, met teruglegging, uit een bestaande dataset. Hierbij fungeert de oorspronkelijke steekproef als een vervangende "populatie," en wordt elke resampling behandeld als een onafhankelijke steekproef uit deze "populatie." De onderliggende aanname is dat de oorspronkelijke steekproef een goede representatie vormt van de bredere populatie. Deze methode is vooral waardevol wanneer de steekproefgroottes beperkt zijn, zoals bij studies met zeldzame fossielen, oude genomische monsters, weefsels van zeldzame ziekten, bedreigde diersoorten, en unieke experimenten die niet eenvoudig kunnen worden herhaald.
Het basisproces van bootstrapping omvat de volgende stappen:
Omdat resampling met teruglegging gebeurt, kan elke nieuwe steekproef herhaalde waarden uit de oorspronkelijke gegevens bevatten, wat de willekeur van het resamplingproces weerspiegelt. Bootstrapping vereist meestal een groot aantal resamples (vaak meer dan 1.000) om stabiele schattingen te verkrijgen. Deze schattingen kunnen vervolgens worden gebruikt om statistieken zoals het gemiddelde, de variantie, de standaardfout of betrouwbaarheidsintervallen voor populatieparameters te berekenen.
Bootstrapping is zowel kosteneffectief als toegankelijk, en biedt een eenvoudige manier om conclusies te trekken zonder dat er aanvullende gegevens nodig zijn. Het is echter sterk afhankelijk van de originele steekproef, wat betekent dat eventuele vertekeningen of fouten in de originele gegevens ook in de bootstrapped resultaten aanwezig zullen zijn.
Bootstrapping is a resampling method that uses samples randomly drawn from the already collected sample with replacement.
Imagine a paleontologist trying to determine the mean wing length of a prehistoric insect species with only five fossil specimens.
A higher sample size is desirable to make better inferences, but there is no way to obtain more fossils. In such cases, the bootstrap resampling method is beneficial.
These data from five specimens give a mean length of 10.7 cm.
To begin bootstrapping, randomly draw samples from the original sample set.
Notice that this sample has an identical sample size to the original one, but some values are repeated. This occurs because the bootstrap resampling is entirely random.
Several such bootstrap samples are drawn to estimate the mean wing length distribution. This way, confidence intervals can also be obtained to estimate the population mean more accurately.
Bootstrapping is easy and cost-effective, but it relies on a limited sample. If such a sample is biased or collected erroneously, the bootstrap resampling will remain as biased or erroneous as the original sample.
From Chapter 13:
Now Playing
Nonparametric Statistics
899 Views
Nonparametric Statistics
1.9K Views
Nonparametric Statistics
663 Views
Nonparametric Statistics
1.4K Views
Nonparametric Statistics
545 Views
Nonparametric Statistics
522 Views
Nonparametric Statistics
524 Views
Nonparametric Statistics
727 Views
Nonparametric Statistics
629 Views
Nonparametric Statistics
1.0K Views
Nonparametric Statistics
1.1K Views
Nonparametric Statistics
1.5K Views
Nonparametric Statistics
1.2K Views
Nonparametric Statistics
1.6K Views
Nonparametric Statistics
947 Views
See More