13.10
Bootstrapping é um método de reamostragem que usa amostras retiradas aleatoriamente da amostra já coletada com substituição.
Imagine um paleontólogo tentando determinar o comprimento médio da asa de uma espécie de inseto pré-histórico com apenas cinco espécimes fósseis.
Um tamanho de amostra maior é desejável para fazer melhores inferências, mas não há como obter mais fósseis. Nesses casos, o método de reamostragem de bootstrap é benéfico.
Esses dados de cinco espécimes dão um comprimento médio de 10,7 cm.
Para iniciar o bootstrapping, extraia aleatoriamente amostras do conjunto de amostras original.
Observe que esse exemplo tem um tamanho de amostra idêntico ao original, mas alguns valores são repetidos. Isso ocorre porque a reamostragem de bootstrap é totalmente aleatória.
Várias dessas amostras de bootstrap são retiradas para estimar a distribuição média do comprimento da asa. Dessa forma, intervalos de confiança também podem ser obtidos para estimar a média da população com mais precisão.
O bootstrapping é fácil e econômico, mas depende de uma amostra limitada. Se essa amostra for tendenciosa ou coletada erroneamente, a reamostragem de bootstrap permanecerá tão tendenciosa ou errônea quanto a amostra original.
O termo "bootstrap" surgiu no século XIX como uma metáfora para o auto-aprimoramento, ou para alcançar algo de forma independente, sem assistência externa. Este conceito se estende ao bootstrapping estatístico, um método autocontido para estimar parâmetros populacionais por meio de reamostragem, embora possa ser computacionalmente intensivo. Desenvolvido pelo estatístico americano Dr. Bradley Efron em 1979, o bootstrapping fornece uma maneira robusta de realizar inferência quando o tamanho da amostra original é pequeno ou os dados são complexos.
O bootstrapping, também conhecido como reamostragem bootstrap, simula o processo de amostragem extraindo várias amostras aleatórias, com substituição, de um conjunto de dados existente. Nele, a amostra original atua como uma "população" substituta, e cada reamostragem é tratada como uma amostra independente extraída dessa "população". A suposição subjacente é que a amostra original é uma boa representação da população mais ampla. Essa abordagem é especialmente valiosa quando os tamanhos das amostras são limitados, como em estudos com fósseis raros, amostras genômicas antigas, tecidos biológicos de doenças raras, estudos de espécies ameaçadas e experimentos únicos que não podem ser facilmente repetidos.
O processo básico de bootstrapping inclui as seguintes etapas:
Como a reamostragem é com substituição, cada nova amostra pode incluir valores repetidos dos dados originais, refletindo a aleatoriedade no processo de reamostragem. O bootstrapping normalmente requer um alto número de reamostragens (geralmente mais de 1.000) para atingir estimativas estáveis, que podem então ser usadas para calcular estatísticas como média, variância, erro padrão ou intervalos de confiança para parâmetros populacionais.
O bootstrapping é econômico e acessível, oferecendo uma maneira direta de fazer inferências sem precisar de dados adicionais. No entanto, ele depende muito da amostra original, o que significa que quaisquer vieses ou erros nos dados originais também estarão presentes nos resultados de bootstrap.
Bootstrapping é um método de reamostragem que usa amostras retiradas aleatoriamente da amostra já coletada com substituição.
Imagine um paleontólogo tentando determinar o comprimento médio da asa de uma espécie de inseto pré-histórico com apenas cinco espécimes fósseis.
Um tamanho de amostra maior é desejável para fazer melhores inferências, mas não há como obter mais fósseis. Nesses casos, o método de reamostragem de bootstrap é benéfico.
Esses dados de cinco espécimes dão um comprimento médio de 10,7 cm.
Para iniciar o bootstrapping, extraia aleatoriamente amostras do conjunto de amostras original.
Observe que esse exemplo tem um tamanho de amostra idêntico ao original, mas alguns valores são repetidos. Isso ocorre porque a reamostragem de bootstrap é totalmente aleatória.
Várias dessas amostras de bootstrap são retiradas para estimar a distribuição média do comprimento da asa. Dessa forma, intervalos de confiança também podem ser obtidos para estimar a média da população com mais precisão.
O bootstrapping é fácil e econômico, mas depende de uma amostra limitada. Se essa amostra for tendenciosa ou coletada erroneamente, a reamostragem de bootstrap permanecerá tão tendenciosa ou errônea quanto a amostra original.
From Chapter 13:
Now Playing
Nonparametric Statistics
899 Views
Nonparametric Statistics
1.9K Views
Nonparametric Statistics
663 Views
Nonparametric Statistics
1.4K Views
Nonparametric Statistics
545 Views
Nonparametric Statistics
522 Views
Nonparametric Statistics
524 Views
Nonparametric Statistics
727 Views
Nonparametric Statistics
629 Views
Nonparametric Statistics
1.0K Views
Nonparametric Statistics
1.1K Views
Nonparametric Statistics
1.5K Views
Nonparametric Statistics
1.2K Views
Nonparametric Statistics
1.6K Views
Nonparametric Statistics
947 Views
See More