13.10: Bootstrapping

Bootstrapping
JoVE Core
Statistics
A subscription to JoVE is required to view this content.  Sign in or start your free trial.
JoVE Core Statistics
Bootstrapping
Please note that all translations are automatically generated. Click here for the English version.

612 Views

01:24 min
January 09, 2025

Overview

המונח “bootstrap” מקורו במאה ה -19 כמטאפורה לשיפור עצמי או להשיג משהו באופן עצמאי, ללא סיוע חיצוני. תפיסה זו מתרחבת לאתחול סטטיסטי, שיטה עצמאית להערכת פרמטרים של אוכלוסייה באמצעות דגימה מחדש, למרות שהיא יכולה להיות אינטנסיבית מבחינה חישובית. פותח על ידי הסטטיסטיקאי האמריקאי ד”ר בראדלי אפרון בשנת 1979, bootstrapping מספק דרך חזקה לבצע הסקה כאשר גודל המדגם המקורי קטן או הנתונים מורכבים.

Bootstrapping, הידוע גם בשם bootstrap reampling, מדמה את תהליך הדגימה על ידי ציור דגימות אקראיות מרובות, עם החלפה, מתוך ערכת נתונים קיימת. כאן, המדגם המקורי משמש כ”אוכלוסייה” עצמאית, וכל מדגם חוזר מטופל כמדגם עצמאי שנלקח מ”אוכלוסייה” זו. הנחת היסוד היא שהמדגם המקורי מייצג היטב את האוכלוסייה הרחבה. גישה זו חשובה במיוחד כאשר גודל הדגימות מוגבל, כמו במחקרים עם מאובנים נדירים, דגימות גנומיות עתיקות, רקמות ממחלות נדירות, מחקרי מינים בסכנת הכחדה וניסויים ייחודיים שלא ניתן לחזור עליהם בקלות.

התהליך הבסיסי של bootstrapping כולל את השלבים הבאים:

  1. לאסוף מדגם ראשוני של גודל n מהאוכלוסייה כדי להעריך פרמטר של עניין.
  2. התייחסו למדגם זה כאל “אוכלוסייה”.
  3. ציירו מספר דגימות חדשות בגודל n, עם החלפה, מהמדגם המקורי באמצעות דגימה אקראית.
  4. השתמש אלה “דגימות חוזרות bootstrap” לניתוח כדי להעריך את הפרמטר הרצוי.

מכיוון שהדגימה מחדש היא עם החלפה, כל דגימה חדשה עשויה לכלול ערכים חוזרים מהנתונים המקוריים, המשקפים את האקראיות בתהליך הדגימה מחדש. Bootstrapping דורש בדרך כלל מספר גבוה של דגימות חוזרות (לעתים קרובות מעל 1,000) כדי להשיג אומדנים יציבים, אשר לאחר מכן ניתן להשתמש בהם כדי לחשב נתונים סטטיסטיים כמו ממוצע, שונות, שגיאת תקן או רווחי סמך עבור פרמטרים באוכלוסייה.

Bootstrapping הוא גם חסכוני וגם נגיש, ומציע דרך פשוטה להסיק מסקנות ללא צורך בנתונים נוספים. עם זאת, הוא מסתמך במידה רבה על המדגם המקורי, כלומר כל הטיות או שגיאות בנתונים המקוריים יהיו נוכחים גם בתוצאות האתחול.

Transcript

Bootstrapping היא שיטת דגימה מחדש המשתמשת בדגימות שנלקחו באופן אקראי מהדגימה שכבר נאספה עם החלפה.

תארו לעצמכם פליאונטולוג מנסה לקבוע את אורך הכנפיים הממוצע של מין חרק פרהיסטורי עם חמש דגימות מאובנים בלבד.

גודל מדגם גבוה יותר רצוי כדי להסיק מסקנות טובות יותר, אך אין דרך להשיג מאובנים נוספים. במקרים כאלה, שיטת הדגימה מחדש של bootstrap מועילה.

נתונים אלה מחמש דגימות נותנים אורך ממוצע של 10.7 ס”מ.

כדי להתחיל באתחול, צייר באופן אקראי דוגמאות מערכת הדגימות המקורית.

שים לב שלמדגם זה יש גודל מדגם זהה לזה המקורי, אך ערכים מסוימים חוזרים על עצמם. מצב זה מתרחש מכיוון שהדגימה מחדש של bootstrap היא אקראית לחלוטין.

מספר דגימות bootstrap כאלה נמשכות כדי להעריך את התפלגות אורך הכנפיים הממוצעת. בדרך זו, ניתן לקבל רווחי סמך גם כדי להעריך את ממוצע האוכלוסייה בצורה מדויקת יותר.

Bootstrapping הוא קל וחסכוני, אבל הוא מסתמך על מדגם מוגבל. אם דגימה כזו מוטה או נאספת בטעות, הדגימה מחדש של האתחול תישאר מוטה או שגויה כמו הדגימה המקורית.

Key Terms and definitions​

Learning Objectives

Questions that this video will help you answer

This video is also useful for