O termo “bootstrap” originou-se no século 19 como uma metáfora para autoaperfeiçoamento ou alcançar algo de forma independente, sem ajuda externa. Esse conceito se estende ao bootstrapping estatístico, um método autônomo para estimar parâmetros populacionais por meio de reamostragem, embora possa ser computacionalmente intensivo. Desenvolvido pelo estatístico americano Dr. Bradley Efron em 1979, o bootstrapping fornece uma maneira robusta de realizar inferências quando o tamanho da amostra original é pequeno ou os dados são complexos.
O bootstrapping, também conhecido como reamostragem de bootstrap, simula o processo de amostragem extraindo várias amostras aleatórias, com substituição, de um conjunto de dados existente. Aqui, a amostra original atua como uma “população” substituta e cada nova amostra é tratada como uma amostra independente extraída dessa “população”. A suposição subjacente é que a amostra original é uma boa representação da população mais ampla. Essa abordagem é especialmente valiosa quando os tamanhos das amostras são limitados, como em estudos com fósseis raros, amostras genômicas antigas, tecidos de doenças raras, estudos de espécies ameaçadas de extinção e experimentos únicos que não podem ser facilmente repetidos.
O processo básico de inicialização inclui as seguintes etapas:
Como a reamostragem é com substituição, cada nova amostra pode incluir valores repetidos dos dados originais, refletindo a aleatoriedade no processo de reamostragem. O bootstrapping normalmente requer um grande número de reamostras (geralmente mais de 1.000) para obter estimativas estáveis, que podem ser usadas para calcular estatísticas como média, variância, erro padrão ou intervalos de confiança para parâmetros populacionais.
O bootstrapping é econômico e acessível, oferecendo uma maneira direta de fazer inferências sem a necessidade de dados adicionais. No entanto, ele depende muito da amostra original, o que significa que quaisquer vieses ou erros nos dados originais também estarão presentes nos resultados inicializados.
Bootstrapping é um método de reamostragem que usa amostras retiradas aleatoriamente da amostra já coletada com substituição.
Imagine um paleontólogo tentando determinar o comprimento médio da asa de uma espécie de inseto pré-histórico com apenas cinco espécimes fósseis.
Um tamanho de amostra maior é desejável para fazer melhores inferências, mas não há como obter mais fósseis. Nesses casos, o método de reamostragem de bootstrap é benéfico.
Esses dados de cinco espécimes dão um comprimento médio de 10,7 cm.
Para iniciar o bootstrapping, extraia aleatoriamente amostras do conjunto de amostras original.
Observe que esse exemplo tem um tamanho de amostra idêntico ao original, mas alguns valores são repetidos. Isso ocorre porque a reamostragem de bootstrap é totalmente aleatória.
Várias dessas amostras de bootstrap são retiradas para estimar a distribuição média do comprimento da asa. Dessa forma, intervalos de confiança também podem ser obtidos para estimar a média da população com mais precisão.
O bootstrapping é fácil e econômico, mas depende de uma amostra limitada. Se essa amostra for tendenciosa ou coletada erroneamente, a reamostragem de bootstrap permanecerá tão tendenciosa ou errônea quanto a amostra original.
Related Videos
Nonparametric Statistics
683 Visualizações
Nonparametric Statistics
231 Visualizações
Nonparametric Statistics
761 Visualizações
Nonparametric Statistics
119 Visualizações
Nonparametric Statistics
80 Visualizações
Nonparametric Statistics
109 Visualizações
Nonparametric Statistics
109 Visualizações
Nonparametric Statistics
112 Visualizações
Nonparametric Statistics
167 Visualizações
Nonparametric Statistics
593 Visualizações
Nonparametric Statistics
695 Visualizações
Nonparametric Statistics
742 Visualizações
Nonparametric Statistics
641 Visualizações
Nonparametric Statistics
629 Visualizações
Nonparametric Statistics
634 Visualizações
Nonparametric Statistics
210 Visualizações
Nonparametric Statistics
72 Visualizações
Nonparametric Statistics
425 Visualizações
Nonparametric Statistics
172 Visualizações
Nonparametric Statistics
276 Visualizações
Nonparametric Statistics
194 Visualizações
Nonparametric Statistics
296 Visualizações