המונח “bootstrap” מקורו במאה ה -19 כמטאפורה לשיפור עצמי או להשיג משהו באופן עצמאי, ללא סיוע חיצוני. תפיסה זו מתרחבת לאתחול סטטיסטי, שיטה עצמאית להערכת פרמטרים של אוכלוסייה באמצעות דגימה מחדש, למרות שהיא יכולה להיות אינטנסיבית מבחינה חישובית. פותח על ידי הסטטיסטיקאי האמריקאי ד”ר בראדלי אפרון בשנת 1979, bootstrapping מספק דרך חזקה לבצע הסקה כאשר גודל המדגם המקורי קטן או הנתונים מורכבים.
Bootstrapping, הידוע גם בשם bootstrap reampling, מדמה את תהליך הדגימה על ידי ציור דגימות אקראיות מרובות, עם החלפה, מתוך ערכת נתונים קיימת. כאן, המדגם המקורי משמש כ”אוכלוסייה” עצמאית, וכל מדגם חוזר מטופל כמדגם עצמאי שנלקח מ”אוכלוסייה” זו. הנחת היסוד היא שהמדגם המקורי מייצג היטב את האוכלוסייה הרחבה. גישה זו חשובה במיוחד כאשר גודל הדגימות מוגבל, כמו במחקרים עם מאובנים נדירים, דגימות גנומיות עתיקות, רקמות ממחלות נדירות, מחקרי מינים בסכנת הכחדה וניסויים ייחודיים שלא ניתן לחזור עליהם בקלות.
התהליך הבסיסי של bootstrapping כולל את השלבים הבאים:
מכיוון שהדגימה מחדש היא עם החלפה, כל דגימה חדשה עשויה לכלול ערכים חוזרים מהנתונים המקוריים, המשקפים את האקראיות בתהליך הדגימה מחדש. Bootstrapping דורש בדרך כלל מספר גבוה של דגימות חוזרות (לעתים קרובות מעל 1,000) כדי להשיג אומדנים יציבים, אשר לאחר מכן ניתן להשתמש בהם כדי לחשב נתונים סטטיסטיים כמו ממוצע, שונות, שגיאת תקן או רווחי סמך עבור פרמטרים באוכלוסייה.
Bootstrapping הוא גם חסכוני וגם נגיש, ומציע דרך פשוטה להסיק מסקנות ללא צורך בנתונים נוספים. עם זאת, הוא מסתמך במידה רבה על המדגם המקורי, כלומר כל הטיות או שגיאות בנתונים המקוריים יהיו נוכחים גם בתוצאות האתחול.
Bootstrapping היא שיטת דגימה מחדש המשתמשת בדגימות שנלקחו באופן אקראי מהדגימה שכבר נאספה עם החלפה.
תארו לעצמכם פליאונטולוג מנסה לקבוע את אורך הכנפיים הממוצע של מין חרק פרהיסטורי עם חמש דגימות מאובנים בלבד.
גודל מדגם גבוה יותר רצוי כדי להסיק מסקנות טובות יותר, אך אין דרך להשיג מאובנים נוספים. במקרים כאלה, שיטת הדגימה מחדש של bootstrap מועילה.
נתונים אלה מחמש דגימות נותנים אורך ממוצע של 10.7 ס”מ.
כדי להתחיל באתחול, צייר באופן אקראי דוגמאות מערכת הדגימות המקורית.
שים לב שלמדגם זה יש גודל מדגם זהה לזה המקורי, אך ערכים מסוימים חוזרים על עצמם. מצב זה מתרחש מכיוון שהדגימה מחדש של bootstrap היא אקראית לחלוטין.
מספר דגימות bootstrap כאלה נמשכות כדי להעריך את התפלגות אורך הכנפיים הממוצעת. בדרך זו, ניתן לקבל רווחי סמך גם כדי להעריך את ממוצע האוכלוסייה בצורה מדויקת יותר.
Bootstrapping הוא קל וחסכוני, אבל הוא מסתמך על מדגם מוגבל. אם דגימה כזו מוטה או נאספת בטעות, הדגימה מחדש של האתחול תישאר מוטה או שגויה כמו הדגימה המקורית.
Related Videos
Nonparametric Statistics
726 צפיות
Nonparametric Statistics
242 צפיות
Nonparametric Statistics
853 צפיות
Nonparametric Statistics
137 צפיות
Nonparametric Statistics
101 צפיות
Nonparametric Statistics
118 צפיות
Nonparametric Statistics
140 צפיות
Nonparametric Statistics
143 צפיות
Nonparametric Statistics
203 צפיות
Nonparametric Statistics
612 צפיות
Nonparametric Statistics
735 צפיות
Nonparametric Statistics
821 צפיות
Nonparametric Statistics
699 צפיות
Nonparametric Statistics
765 צפיות
Nonparametric Statistics
656 צפיות
Nonparametric Statistics
251 צפיות
Nonparametric Statistics
82 צפיות
Nonparametric Statistics
566 צפיות
Nonparametric Statistics
208 צפיות
Nonparametric Statistics
362 צפיות
Nonparametric Statistics
271 צפיות
Nonparametric Statistics
355 צפיות