13.16: וולד-וולפוביץ מבצע את מבחן II

Wald-Wolfowitz Runs Test II
JoVE Core
Statistics
A subscription to JoVE is required to view this content.  Sign in or start your free trial.
JoVE Core Statistics
Wald-Wolfowitz Runs Test II
Please note that all translations are automatically generated. Click here for the English version.

267 Views

01:17 min
January 09, 2025

Overview

מבחן ריצות וולד-וולפוביץ (באנגלית: Wald-Wolfowitz runs test) הוא מבחן לא פרמטרי המשמש להערכת אקראיות של נתונים מסודרים. הבדיקה מעריכה את מספר הריצות, שהן רצפים עוקבים של אלמנטים דומים בתוך הנתונים. אם מספר הריצות גבוה או נמוך משמעותית מהצפוי, הנתונים נחשבים לא אקראיים, דבר המצביע על דפוס או מבנה הניתנים לזיהוי.

עבור נתונים בינאריים, הפעלות מזוהות באמצעות סמלים כגון + ו- −, או שווה ערך, 1s ו- 0s. במקרה של נתונים קטגוריאליים עם שתי קטגוריות, קטגוריות אלה מומרות לבחירות בינאריות. עם זאת, במקרים כמו רצפי DNA, שבהם קטגוריות כגון A, T, G ו- C הן אינהרנטיות, אין צורך בהמרה, וניתן להחיל את הבדיקה ישירות על הרצפים. עבור נתונים מספריים, ערכים מומרים לעתים קרובות על ידי הקצאת + (או 1) לאלה שמעל סף מסוים (כמו הממוצע או החציון) ו- − (או 0) לאלה שמתחתיו, מה שמאפשר זיהוי של ריצות.

השערת האפס של הבדיקה (H0) קובעת כי הנתונים עוקבים אחר רצף אקראי, בעוד שההשערה החלופית (H1) מציעה כי לנתונים יש תבנית או סדר בסיסיים. סטטיסטיקת הבדיקה, המסומנת כ-G, מייצגת את מספר הריצות שנצפו בנתונים. ערך זה מושווה לאחר מכן לערכים קריטיים במבחן דו-זנבי. אם G נמצא מחוץ לטווח הקריטי (כלומר, הוא גבוה מדי או נמוך מדי), אנו דוחים את השערת האפס, ומסיקים שהנתונים אינם אקראיים ומציגים רצף מסוים. לעומת זאת, אם G נופל בטווח הקריטי, איננו דוחים את השערת האפס, מה שמרמז על כך שהנתונים הם ככל הנראה אקראיים ללא סדר ספציפי.

הערכים הקריטיים מתקבלים מטבלת ריצות סטנדרטית כאשר מספר הרכיבים בנתונים בעלי מאפיין מסוים (לדוגמה, ערכים קטנים מהחציון), מסומנים ב- n1, ומספר הרכיבים בנתונים בעלי מאפיין שונה (לדוגמה, ערכים גדולים מהחציון) המסומנים ב- n2 קטן או שווה ל- 20 וברמת המובהקות α= 0.05 (הערה: אל תבלבלו מספרים אלה עם גודל המדגם n).

כאשר תנאים אלה אינם מתקיימים, כלומר, כאשר n1 ו– n2 וגדולים מ- 20 או כאשר רמת המשמעות α אינה אלא 0.05, נעשה שימוש בסטטיסטיקת הבדיקה z, והיא מחושבת באמצעות המשוואה הבאה:

Equation 1

כאשר μG ו- σG מחושבות באמצעות המשוואות הבאות:

Equation 2

Equation 3

ערכי z קריטיים, כלומר ערכי z קריטיים שליליים (זנב שמאלי) וחיוביים (זנב ימני), מתקבלים מטבלת ההתפלגות z הסטנדרטית. כאשר סטטיסטיקת הבדיקה z (המחושבת מהמשוואות לעיל) היא מעבר לטווח של –z ו- +z, האקראיות נדחית, ומגיעה למסקנה שיש עדות לרצף מסוים בנתונים. אם סטטיסטיקת הבדיקה נמצאת בתוך הטווח, האקראיות בנתונים אינה נדחית.

בדיקת ההפעלה אינה מושפעת מגודל המדגם או מההתפלגות הבסיסית של האוכלוסייה והמדגם, מה שהופך אותו לרב-תכליתי עבור סוגים שונים של נתונים רציפים לזיהוי אקראיות. עם זאת, בעוד שהוא יכול לזהות אם רצף הוא אקראי, הוא אינו מודד את מידת או גודל האקראיות בתוך הנתונים.

Transcript

מדען אסף נתונים על אורכי הגוף של 30 בבונים המתקרבים למקור מים.

לכן, מבחן וולד-וולפוביץ יכול לקבוע אם הרצף שבו בבונים התקרבו למקור המים הוא אקראי או קשור לאורך גופם.

כאן, השערת האפס קובעת שהנתונים נמצאים ברצף אקראי, ואילו ההשערה החלופית קובעת שהנתונים אינם ברצף אקראי.

עבור נתונים מספריים אלה, הריצות – G – מחושבות על-ידי הקצאת סימנים בינאריים לערכים הגדולים והקטנים מהחציון 74.5.

כאן, הערך של G הוא 17.

שים לב שמספר הערכים הקטן מהחציון – n1 – וגדול מהחציון – n2 – קטן מ- 20.

לכן, ניתן לקבל את הערכים הקריטיים ב- α = 0.05 מהטבלה הסטנדרטית.

מבחן וולד-וולפוביץ הוא דו-זנבי. לכן, כדי לדחות את האקראיות, סטטיסטיקת הבדיקה צריכה להיות מעבר לטווח הערכים הקריטיים.

כאן, G נופל בטווח זה, ומספק ראיות לטובת השערת האפס.

Key Terms and definitions​

Learning Objectives

Questions that this video will help you answer

This video is also useful for