13.10: Inicialização

Bootstrapping
JoVE Core
Statistics
A subscription to JoVE is required to view this content.  Sign in or start your free trial.
JoVE Core Statistics
Bootstrapping
Please note that all translations are automatically generated. Click here for the English version.

593 Views

01:24 min
January 09, 2025

Overview

O termo “bootstrap” originou-se no século 19 como uma metáfora para autoaperfeiçoamento ou alcançar algo de forma independente, sem ajuda externa. Esse conceito se estende ao bootstrapping estatístico, um método autônomo para estimar parâmetros populacionais por meio de reamostragem, embora possa ser computacionalmente intensivo. Desenvolvido pelo estatístico americano Dr. Bradley Efron em 1979, o bootstrapping fornece uma maneira robusta de realizar inferências quando o tamanho da amostra original é pequeno ou os dados são complexos.

O bootstrapping, também conhecido como reamostragem de bootstrap, simula o processo de amostragem extraindo várias amostras aleatórias, com substituição, de um conjunto de dados existente. Aqui, a amostra original atua como uma “população” substituta e cada nova amostra é tratada como uma amostra independente extraída dessa “população”. A suposição subjacente é que a amostra original é uma boa representação da população mais ampla. Essa abordagem é especialmente valiosa quando os tamanhos das amostras são limitados, como em estudos com fósseis raros, amostras genômicas antigas, tecidos de doenças raras, estudos de espécies ameaçadas de extinção e experimentos únicos que não podem ser facilmente repetidos.

O processo básico de inicialização inclui as seguintes etapas:

  1. Colete uma amostra inicial de tamanho n da população para estimar um parâmetro de interesse.
  2. Trate essa amostra como uma “população”.
  3. Retirar várias novas amostras de calibre n, com substituição, a partir da amostra original por amostragem aleatória.
  4. Use essas “reamostras de bootstrap” para análise para estimar o parâmetro desejado.

Como a reamostragem é com substituição, cada nova amostra pode incluir valores repetidos dos dados originais, refletindo a aleatoriedade no processo de reamostragem. O bootstrapping normalmente requer um grande número de reamostras (geralmente mais de 1.000) para obter estimativas estáveis, que podem ser usadas para calcular estatísticas como média, variância, erro padrão ou intervalos de confiança para parâmetros populacionais.

O bootstrapping é econômico e acessível, oferecendo uma maneira direta de fazer inferências sem a necessidade de dados adicionais. No entanto, ele depende muito da amostra original, o que significa que quaisquer vieses ou erros nos dados originais também estarão presentes nos resultados inicializados.

Transcript

Bootstrapping é um método de reamostragem que usa amostras retiradas aleatoriamente da amostra já coletada com substituição.

Imagine um paleontólogo tentando determinar o comprimento médio da asa de uma espécie de inseto pré-histórico com apenas cinco espécimes fósseis.

Um tamanho de amostra maior é desejável para fazer melhores inferências, mas não há como obter mais fósseis. Nesses casos, o método de reamostragem de bootstrap é benéfico.

Esses dados de cinco espécimes dão um comprimento médio de 10,7 cm.

Para iniciar o bootstrapping, extraia aleatoriamente amostras do conjunto de amostras original.

Observe que esse exemplo tem um tamanho de amostra idêntico ao original, mas alguns valores são repetidos. Isso ocorre porque a reamostragem de bootstrap é totalmente aleatória.

Várias dessas amostras de bootstrap são retiradas para estimar a distribuição média do comprimento da asa. Dessa forma, intervalos de confiança também podem ser obtidos para estimar a média da população com mais precisão.

O bootstrapping é fácil e econômico, mas depende de uma amostra limitada. Se essa amostra for tendenciosa ou coletada erroneamente, a reamostragem de bootstrap permanecerá tão tendenciosa ou errônea quanto a amostra original.

Key Terms and definitions​

Learning Objectives

Questions that this video will help you answer

This video is also useful for