11.8: التباين

Variation
JoVE Core
Statistics
A subscription to JoVE is required to view this content.  Sign in or start your free trial.
JoVE Core Statistics
Variation
Please note that all translations are automatically generated. Click here for the English version.

6,805 Views

01:19 min
April 30, 2023

Overview

من السمات المهمة لأي مجموعة من البيانات الاختلاف في البيانات. في بعض مجموعات البيانات ، تتركز قيم البيانات بشكل وثيق بالقرب من المتوسط. في مجموعات البيانات الأخرى ، تنتشر قيم البيانات على نطاق أوسع من المتوسط. المقياس الأكثر شيوعا للتباين ، أو السبريد ، هو الانحراف المعياري ، وهو الجذر التربيعي للتباين.

عندما يتم رسم المتغيرات المستقلة والتابعة على مخطط مبعثر ، فإن ميل الخط هو قيمة تصف معدل التغيير بين المتغيرين. يخبرنا الميل كيف يتغير المتغير التابع (y) لكل وحدة زيادة في المتغير المستقل (x) ، في المتوسط. يصف تقاطع y المتغير التابع عندما يساوي المتغير المستقل صفرا. يمكن رسم خط الانحدار ، أو الخط الأنسب ، على مخطط مبعثر واستخدامه للتنبؤ بنتائج المتغيرات x و y في مجموعة بيانات معينة أو عينة بيانات.

يعرف

الفرق بين قيمة العينة المرصودة ، y ، والقيمة المتوقعة ، Equation1 من معادلة الانحدار ، باسم الانحراف غير المبرر. في حين أن الفرق بين القيمة المتوقعة ومتوسط العينة ، y̅ ، يسمى الانحراف المبرح. الفرق بين القيمة المرصودة ، y ، ومتوسط العينة ، ، هو الانحراف الكلي.

إذا أضفت مربعات الانحرافات الموضحة لجميع نقاط البيانات ، نحصل على التباين الموضح. بنفس الطريقة ، إذا أضفنا مربعات الانحرافات غير المبررة لجميع نقاط البيانات ، نحصل على التباين غير المبرر. أيضا ، إذا أضفنا مربعات إجمالي الانحرافات لجميع نقاط البيانات ، نحصل على التباين الكلي. بقسمة التغير الموضح على الانحراف الكلي يعطينا قيمة معامل التحديد، r2، وهو ما يمثل النسبة المئوية للتغير في المتغير التابع y الذي يمكن تفسيره بالتباين في المتغير المستقل x باستخدام خط الانحدار.

هذا النص مقتبس من Openstax ، الإحصاءات التمهيدية ، القسم 12 ، الانحدار الخطي والارتباط.

Transcript

في مجموعة بيانات غير مترابطة ، بالنسبة لقيمة معينة من x ، فإن أفضل قيمة متوقعة ل y هي المتوسط.

إذا كان للمتغيرات ارتباط خطي ، فيمكن التنبؤ بقيمة y عن طريق استبدال قيمة x في معادلة الانحدار.

تعرف

المسافة الرأسية بين قيمة y المتوقعة ومتوسط العينة ، y-bar ، باسم الانحراف المفصل. يمكن أن تفسر العلاقة بين المتغيرين هذا الانحراف.

تعرف المسافة الرأسية بين نقطة البيانات وقيمة y المتوقعة بالانحراف غير المبرر أو المتبقي. لا يمكن للعلاقة بين المتغيرات أن تفسر هذا الانحراف. قد يكون بسبب الصدفة وحدها أو تورط متغيرات أخرى.

مجموع الانحرافات غير المبررة والموضحة يعطي الانحراف الكلي.

ينتج عن تربيع الانحرافات وتجميعها لجميع نقاط البيانات مقدار التباين غير المفسر والموضح والكلي.

نسبة التباين الموضح إلى التباين الكلي هي قيمة r المربعة ، والمعروفة أيضا باسم معامل التحديد. يشير إلى نسبة التباين في قيمة y التي يمكن أن يشرحها خط الانحدار.

Key Terms and definitions​

  • Variation - The spread or deviation of the data values in relation to the mean of the data set.
  • Standard Deviation - The most common measure of variation, and equal to the square root of variance.
  • Regression Line - A predictive line indicating the relation between dependent and independent variables in a scatter plot.
  • Explained and Unexplained Variation - The parts of total variation attributable to and not attributable to the Regression Line, respectively.
  • Coefficient of Determination - Represents percentage of variation in dependent variable that can be explained using the Regression line.

Learning Objectives

  • Define Variation – Understand the spread in a given dataset (e.g., variation)
  • Contrast Explained and Unexplained Variation – Understand the different components of total variation (e.g., Explained and Unexplained Variation).
  • Explore Regression Line – Understanding its role in predicting values (e.g., Regression Line).
  • Explain Coefficient of Determination - Understanding what it represents.
  • Apply in Context – Understand how these concepts come together when analyzing a data set.

Questions that this video will help you answer

  • What is variation and how does it relate to standard deviation?
  • What's the role and significance of Regression Line in a scatter plot?
  • What is the coefficient of determination, and what does it represent?

This video is also useful for

  • Students – Understand how these key terms can help comprehend dataset characteristics
  • Educators – Provides a clearer framework for the teaching of the topic
  • Researchers – Crucial elements for a much broader scientific study or methodology
  • Science Enthusiasts – Offers insights and understandings that can satisfy curiosity towards these topics.