13.10
Il bootstrap è un metodo di ricampionamento che utilizza campioni estratti in modo casuale dal campione già raccolto con sostituzione.
Immaginate un paleontologo che cerca di determinare la lunghezza media delle ali di una specie di insetti preistorici con solo cinque esemplari fossili.
Una dimensione del campione più elevata è auspicabile per fare inferenze migliori, ma non c'è modo di ottenere più fossili. In questi casi, il metodo di ricampionamento bootstrap è vantaggioso.
Questi dati provenienti da cinque esemplari danno una lunghezza media di 10,7 cm.
Per iniziare il bootstrap, prelevare casualmente i campioni dal set di campioni originale.
Si noti che questo campione ha una dimensione del campione identica a quella originale, ma alcuni valori vengono ripetuti. Ciò si verifica perché il ricampionamento bootstrap è completamente casuale.
Diversi campioni bootstrap di questo tipo vengono estratti per stimare la distribuzione media della lunghezza dell'ala. In questo modo, è possibile ottenere intervalli di confidenza per stimare la media della popolazione in modo più accurato.
Il bootstrapping è facile ed economico, ma si basa su un campione limitato. Se tale campione è distorto o raccolto in modo errato, il ricampionamento bootstrap rimarrà distorto o errato come il campione originale.
Il termine "bootstrap" ha avuto origine nel XIX secolo come metafora per l'auto-miglioramento o il raggiungimento di qualcosa in modo indipendente, senza assistenza esterna. Lo stesso concetto si estende al bootstrapping in ambito statistico, cioè un metodo autonomo per stimare i parametri della popolazione tramite ricampionamento, anche se ciò, a volte, può essere richiedere grandi sforzi computazionali. Sviluppato dallo statistico americano Dr. Bradley Efron nel 1979, il metodo bootstrap fornisce un valido approccio per eseguire inferenze quando la dimensione del campione originale è piccola o i dati sono complessi.
Il bootstrap è una tecnica di ricampionamento casuale, che simula il processo di campionamento estraendo più campioni a caso da un set di dati esistente, con sostituzione. Qui, il campione originale funge da "popolazione" di partenza, e ogni ricampionamento viene derivato da questa “popolazione” e considerato come un campione indipendente. Il presupposto di base è che il campione originale sia una buona rappresentazione di una popolazione più ampia. Questo approccio è particolarmente utile quando le dimensioni del campione sono limitate, come negli studi con fossili rari, campioni genomici antichi, tessuti di malattie rare, studi su specie in via di estinzione ed esperimenti unici che non possono essere facilmente ripetuti.
Il processo di base del bootstrap include i seguenti passaggi:
Poiché il ricampionamento è con sostituzione, ogni nuovo campione può includere valori ripetuti dai dati originali, riflettendo la casualità nel processo di ricampionamento. Il metodo bootstrap, in genere, richiede un numero elevato di ricampionamenti (spesso oltre 1.000) per ottenere stime stabili, che possono quindi essere utilizzate per calcolare statistiche come la media, la varianza, l'errore standard o gli intervalli di confidenza per i parametri della popolazione.
Il bootstrap è sia conveniente che accessibile, offrendo un modo semplice per fare inferenze senza bisogno di dati aggiuntivi. Tuttavia, si basa molto sul campione originale, il che significa che qualsiasi bias o errore nei dati originali sarà presente anche nei risultati ottenuti tramite metodo bootstrap.
Il bootstrap è un metodo di ricampionamento che utilizza campioni estratti in modo casuale dal campione già raccolto con sostituzione.
Immaginate un paleontologo che cerca di determinare la lunghezza media delle ali di una specie di insetti preistorici con solo cinque esemplari fossili.
Una dimensione del campione più elevata è auspicabile per fare inferenze migliori, ma non c'è modo di ottenere più fossili. In questi casi, il metodo di ricampionamento bootstrap è vantaggioso.
Questi dati provenienti da cinque esemplari danno una lunghezza media di 10,7 cm.
Per iniziare il bootstrap, prelevare casualmente i campioni dal set di campioni originale.
Si noti che questo campione ha una dimensione del campione identica a quella originale, ma alcuni valori vengono ripetuti. Ciò si verifica perché il ricampionamento bootstrap è completamente casuale.
Diversi campioni bootstrap di questo tipo vengono estratti per stimare la distribuzione media della lunghezza dell'ala. In questo modo, è possibile ottenere intervalli di confidenza per stimare la media della popolazione in modo più accurato.
Il bootstrapping è facile ed economico, ma si basa su un campione limitato. Se tale campione è distorto o raccolto in modo errato, il ricampionamento bootstrap rimarrà distorto o errato come il campione originale.
From Chapter 13:
Now Playing
Nonparametric Statistics
899 Views
Nonparametric Statistics
1.9K Views
Nonparametric Statistics
663 Views
Nonparametric Statistics
1.4K Views
Nonparametric Statistics
545 Views
Nonparametric Statistics
522 Views
Nonparametric Statistics
524 Views
Nonparametric Statistics
727 Views
Nonparametric Statistics
629 Views
Nonparametric Statistics
1.0K Views
Nonparametric Statistics
1.1K Views
Nonparametric Statistics
1.5K Views
Nonparametric Statistics
1.2K Views
Nonparametric Statistics
1.6K Views
Nonparametric Statistics
947 Views
See More