11.5: القيم المتطرفة والنقاط المؤثرة

Outliers and Influential Points
JoVE Core
Statistics
A subscription to JoVE is required to view this content.  Sign in or start your free trial.
JoVE Core Statistics
Outliers and Influential Points
Please note that all translations are automatically generated. Click here for the English version.

4,072 Views

01:08 min
April 30, 2023

Overview

القيم المتطرفة هي ملاحظة للبيانات التي لا تتناسب مع بقية البيانات. يطلق عليه أحيانا قيمة قصوى. عندما تقوم برسم بياني للقيم المتطرفة ، سيبدو أنه لا يتناسب مع نمط الرسم البياني. ترجع بعض القيم المتطرفة إلى أخطاء (على سبيل المثال ، تدوين 50 بدلا من 500) ، بينما قد يشير البعض الآخر إلى حدوث شيء غير عادي. القيم المتطرفة موجودة بعيدا عن خط المربعات الصغرى في الاتجاه الرأسي. لديهم “أخطاء” كبيرة ، حيث يكون “الخطأ” أو المتبقي هو المسافة الرأسية من الخط إلى النقطة.

يجب فحص القيم المتطرفة عن كثب. في بعض الأحيان ، لسبب أو لآخر ، لا ينبغي إدراجها في تحليل البيانات. قد يكون القيم المتطرفة نتيجة لبيانات خاطئة. في أحيان أخرى ، قد يحتوي القيم المتطرفة على معلومات قيمة عن السكان قيد الدراسة ويجب أن يظل مدرجا في البيانات. المفتاح هو فحص ما يجعل نقطة البيانات غريبة بعناية.

إلى جانب القيم المتطرفة ، قد تحتوي العينة على نقطة واحدة أو بضع نقاط تسمى النقاط المؤثرة. النقاط المؤثرة هي نقاط بيانات ملحوظة بعيدة عن نقاط البيانات الأخرى المرصودة في الاتجاه الأفقي. قد يكون لهذه النقاط تأثير كبير على منحدر خط الانحدار. لتحديد نقطة مؤثرة، يمكنك إزالتها من مجموعة البيانات ومعرفة ما إذا كان ميل خط الانحدار قد تغير بشكل كبير.

يمكن استخدام أجهزة الكمبيوتر والعديد من الآلات الحاسبة لتحديد القيم المتطرفة من البيانات. غالبا ما يحدد إخراج الكمبيوتر لتحليل الانحدار كلا من القيم المتطرفة والنقاط المؤثرة حتى تتمكن من فحصها.

هذا النص مقتبس من Openstax ، الإحصاءات التمهيدية ، القسم 12.6 القيم المتطرفة

Transcript

ضع في اعتبارك المخطط المبعثر للدخل السنوي مقابل سنوات الدراسة ، المزود بخط انحدار.

يتمتع شخص واحد لديه بضع سنوات فقط من الدراسة بدخل مرتفع بشكل استثنائي مقارنة بالآخرين.

تسمى

نقطة البيانات هذه التي لا تتبع الاتجاه وبعيدة عن خط الانحدار في الاتجاه الرأسي بالقيم المتطرفة.

من الناحية الكمية ، يمكن تحديد القيم المتطرفة باستخدام المخلفات ، وهو الفرق بين قيمة y المرصودة لنقطة البيانات وقيمة y كما هو متوقع من معادلة الانحدار.

الآن ، يتم حساب الانحراف المعياري للبقايا باستخدام صيغته.

كقاعدة عامة ، يتم وضع علامة على نقاط البيانات الموجودة على الأقل انحرافين معياريين متبقيين أعلى وأسفل خط الانحدار كقيم متطرفة محتملة.

بالإضافة إلى ذلك ، قد تحتوي مجموعات البيانات أيضا على نقاط مؤثرة. تقع هذه النقاط أفقيا بعيدا عن بقية النقاط. تؤدي إضافة أو إزالة النقاط المؤثرة إلى تغيير خط الانحدار بشكل كبير.

Key Terms and definitions​

Learning Objectives

Questions that this video will help you answer

This video is also useful for