من السمات المهمة لأي مجموعة من البيانات الاختلاف في البيانات. في بعض مجموعات البيانات ، تتركز قيم البيانات بشكل وثيق بالقرب من المتوسط. في مجموعات البيانات الأخرى ، تنتشر قيم البيانات على نطاق أوسع من المتوسط. المقياس الأكثر شيوعا للتباين ، أو السبريد ، هو الانحراف المعياري ، وهو الجذر التربيعي للتباين.
عندما يتم رسم المتغيرات المستقلة والتابعة على مخطط مبعثر ، فإن ميل الخط هو قيمة تصف معدل التغيير بين المتغيرين. يخبرنا الميل كيف يتغير المتغير التابع (y) لكل وحدة زيادة في المتغير المستقل (x) ، في المتوسط. يصف تقاطع y المتغير التابع عندما يساوي المتغير المستقل صفرا. يمكن رسم خط الانحدار ، أو الخط الأنسب ، على مخطط مبعثر واستخدامه للتنبؤ بنتائج المتغيرات x و y في مجموعة بيانات معينة أو عينة بيانات.
يعرفالفرق بين قيمة العينة المرصودة ، y ، والقيمة المتوقعة ، من معادلة الانحدار ، باسم الانحراف غير المبرر. في حين أن الفرق بين القيمة المتوقعة
ومتوسط العينة ، y̅ ، يسمى الانحراف المبرح. الفرق بين القيمة المرصودة ، y ، ومتوسط العينة ، y̅ ، هو الانحراف الكلي.
إذا أضفت مربعات الانحرافات الموضحة لجميع نقاط البيانات ، نحصل على التباين الموضح. بنفس الطريقة ، إذا أضفنا مربعات الانحرافات غير المبررة لجميع نقاط البيانات ، نحصل على التباين غير المبرر. أيضا ، إذا أضفنا مربعات إجمالي الانحرافات لجميع نقاط البيانات ، نحصل على التباين الكلي. بقسمة التغير الموضح على الانحراف الكلي يعطينا قيمة معامل التحديد، r2، وهو ما يمثل النسبة المئوية للتغير في المتغير التابع y الذي يمكن تفسيره بالتباين في المتغير المستقل x باستخدام خط الانحدار.
هذا النص مقتبس من Openstax ، الإحصاءات التمهيدية ، القسم 12 ، الانحدار الخطي والارتباط.
في مجموعة بيانات غير مترابطة ، بالنسبة لقيمة معينة من x ، فإن أفضل قيمة متوقعة ل y هي المتوسط.
إذا كان للمتغيرات ارتباط خطي ، فيمكن التنبؤ بقيمة y عن طريق استبدال قيمة x في معادلة الانحدار.
تعرفالمسافة الرأسية بين قيمة y المتوقعة ومتوسط العينة ، y-bar ، باسم الانحراف المفصل. يمكن أن تفسر العلاقة بين المتغيرين هذا الانحراف.
تعرف المسافة الرأسية بين نقطة البيانات وقيمة y المتوقعة بالانحراف غير المبرر أو المتبقي. لا يمكن للعلاقة بين المتغيرات أن تفسر هذا الانحراف. قد يكون بسبب الصدفة وحدها أو تورط متغيرات أخرى.
مجموع الانحرافات غير المبررة والموضحة يعطي الانحراف الكلي.
ينتج عن تربيع الانحرافات وتجميعها لجميع نقاط البيانات مقدار التباين غير المفسر والموضح والكلي.
نسبة التباين الموضح إلى التباين الكلي هي قيمة r المربعة ، والمعروفة أيضا باسم معامل التحديد. يشير إلى نسبة التباين في قيمة y التي يمكن أن يشرحها خط الانحدار.
Related Videos
Correlation and Regression
11.8K المشاهدات
Correlation and Regression
6.2K المشاهدات
Correlation and Regression
6.0K المشاهدات
Correlation and Regression
5.8K المشاهدات
Correlation and Regression
4.1K المشاهدات
Correlation and Regression
7.4K المشاهدات
Correlation and Regression
4.6K المشاهدات
Correlation and Regression
6.8K المشاهدات
Correlation and Regression
2.3K المشاهدات
Correlation and Regression
3.0K المشاهدات