7.10: הערכת ממוצע אוכלוסייה עם סטיית תקן לא ידועה

Estimating Population Mean with Unknown Standard Deviation
JoVE Core
Statistics
A subscription to JoVE is required to view this content.  Sign in or start your free trial.
JoVE Core Statistics
Estimating Population Mean with Unknown Standard Deviation
Please note that all translations are automatically generated. Click here for the English version.

7,731 Views

01:22 min
April 30, 2023

Overview

בפועל, אנחנו כמעט ולא יודעים את סטיית התקן של האוכלוסייה. בעבר, כאשר גודל המדגם היה גדול, זה לא היווה בעיה לסטטיסטיקאים. הם השתמשו בסטיות התקן של המדגם s כאומדן עבור σ והמשיכו כבעבר לחשב רווח בר-סמך עם תוצאות קרובות מספיק. עם זאת, סטטיסטיקאים נתקלו בבעיות כאשר גודל המדגם היה קטן. מדגם קטן גרם לאי דיוקים ברווח בר-סמך.

ויליאם ס. גוסט (1876-1937) ממבשלת גינס בדבלין, אירלנד נתקל בבעיה זו. הניסויים שלו עם כשות ושעורה הניבו מעט מאוד דגימות. רק החלפת σ ב-s לא הניבה תוצאות מדויקות כאשר ניסה לחשב רווח בר-סמך. הוא הבין שהוא לא יכול להשתמש בהתפלגות נורמלית לצורך החישוב; הוא מצא כי ההתפלגות בפועל תלויה בגודל המדגם. בעיה זו הובילה אותו “לגלות” את מה שנקרא התפלגות t של התלמיד. השם מגיע מהעובדה שגוסט כתב תחת שם העט “סטודנט”.

עד אמצע שנות השבעים, חלק מהסטטיסטיקאים השתמשו בקירוב ההתפלגות הנורמלית עבור גדלי מדגם גדולים והשתמשו בהתפלגות t של סטודנט רק עבור גודל מדגם של 30 לכל היותר. עם מחשבונים גרפיים ומחשבים, הנוהג כעת הוא להשתמש בהתפלגות t של התלמיד בכל פעם ש- s משמש כאומדן עבור σ.

אם לוקחים מדגם אקראי פשוט בגודל n מאוכלוסייה שיש לה התפלגות נורמלית בקירוב עם μ ממוצע וסטיית תקן לא ידועה σ ומחשבים את ציון t באמצעות המדגם SD.

מאפייני התפלגות t של התלמיד

  • הגרף עבור התפלגות t של סטודנט דומה לעקומה הנורמלית הסטנדרטית.
  • הממוצע להתפלגות t של התלמיד הוא אפס וההתפלגות סימטרית בערך אפס.
  • להתפלגות t של סטודנט יש הסתברות גבוהה יותר בזנבות שלה מאשר להתפלגות הנורמלית הסטנדרטית מכיוון שהתפשטות התפלגות t גדולה יותר מהתפשטות הנורמלי הסטנדרטי. כך שהגרף של התפלגות t של הסטודנט יהיה עבה יותר בזנבות וקצר יותר במרכז מאשר הגרף של ההתפלגות הנורמלית הסטנדרטית.
  • הצורה המדויקת של התפלגות t של התלמיד תלויה בדרגות החופש. ככל שדרגות החופש גדלות, הגרף של התפלגות t של סטודנט הופך להיות דומה יותר לגרף של ההתפלגות הנורמלית הסטנדרטית.
  • ההנחה היא שהאוכלוסייה הבסיסית של תצפיות בודדות מתפלגת בדרך כלל עם ממוצע אוכלוסייה לא ידוע μ וסטיית תקן של אוכלוסייה לא ידועה σ. גודל האוכלוסייה הבסיסית אינו רלוונטי בדרך כלל אלא אם כן הוא קטן מאוד. אם זה בצורת פעמון (נורמלי) אז ההנחה מתקיימת ולא צריך דיון. מניחים דגימה אקראית, אבל זו הנחה נפרדת לחלוטין מהנורמליות.

מחשבונים ומחשבים יכולים לחשב בקלות את ההסתברויות של כל תלמיד. ניתן להשתמש גם בטבלת הסתברות להתפלגות t של התלמיד. הטבלה נותנת ציוני t המתאימים לרמת הביטחון (עמודה) ולדרגות החופש (שורה). בעת שימוש בטבלת t, שים לב שטבלאות מסוימות מעוצבות כדי להציג את רמת הביטחון בכותרות העמודות, בעוד שכותרות העמודות בטבלאות מסוימות עשויות להציג רק אזור מתאים בזנב אחד או בשניהם.

טבלת t של תלמיד נותנת ציונים t בהתחשב בדרגות החופש ובהסתברות הזנב הימני. השולחן מוגבל מאוד. מחשבונים ומחשבים יכולים לחשב בקלות את הסתברויות t של כל תלמיד.

הסימון עבור התפלגות t של סטודנט (תוך שימוש ב– T כמשתנה אקראי) הוא:

  • T ~ tdf כאשר df = n – 1.
  • לדוגמה, אם יש לנו מדגם בגודל n = 20 פריטים, אז אנו מחשבים את דרגות החופש כ– df = n – 1 = 20 – 1 = 19 ואנו כותבים את ההתפלגות כ– T ~ t19.

אם סטיית התקן של האוכלוסייה אינה ידועה, השגיאה הקשורה לממוצע אוכלוסייה מחושבת באמצעות SD לדוגמה.

טקסט זה מעובד מתוך Openstax, מבוא, סעיף 8.2 אוכלוסייה אחת פירושה שימוש ב- <a href=”https://openstax.org/books/introductory-statistics/pages/8-2-a-single-population-mean-using-the-student-t-distribution”>t התפלגות .

Transcript

הערכת ממוצע האוכלוסייה מתוך רווח בר-סמך דורשת מרווח טעות.

הוא מחושב באמצעות ערך z כאשר סטיית התקן של האוכלוסייה ידועה, גודל המדגם הוא יותר מ -30, והאוכלוסייה מתפלגת בדרך כלל.

במצב מציאותי, ניתן להניח שהתפלגות האוכלוסייה תקינה, אך סטיית התקן של האוכלוסייה אינה ידועה.

לכן, מרווח הטעות מחושב באופן שונה באמצעות המשוואה הבאה.

כאן, הערך הקריטי מחושב באמצעות התפלגות t, וסטיית תקן מדגם מנוצלת.

ערך t הקריטי – tα/2 – אינו קבוע מכיוון שהוא משתנה עם גודל המדגם.

בדרך כלל הוא גדול מערך z, מה שעשוי ליצור טווח רחב יותר של ערכים המשמשים להערכת ממוצע האוכלוסייה.

השימוש בהתפלגות t דורש שהדגימות לפחות יתפלגו באופן נורמלי בקירוב וגודל המדגם יהיה יותר מ-30.

כאן, ממוצע המדגם נותר האומדן הנקודתי הטוב ביותר, אך רווח בר-סמך מספק הערכה אמינה של הערך האמיתי של ממוצע האוכלוסייה.

Key Terms and definitions​

Learning Objectives

Questions that this video will help you answer

This video is also useful for