ما هو معامل التحديد؟
معامل التحديد هو مقياس يستخدم في التحليل الإحصائي يقيم مدى نجاح النموذج في تفسير النتائج المستقبلية والتنبؤ بها. إنه يدل على مستوى التباين الموضح في مجموعة البيانات. يتم استخدام معامل التحديد ، المعروف أيضًا باسم "المربعة R" ، كدليل توجيهي لقياس دقة النموذج.
تتمثل إحدى طرق تفسير هذا الرقم في القول إن المتغيرات المضمنة في نموذج معين تفسر تقريبًا٪ x من التباين الملحوظ. لذلك ، إذا كان R 2 = 0.50 ، فيمكن تفسير نصف التباين المرصود تقريبًا بواسطة النموذج.
R-تربيع
الماخذ الرئيسية
- معامل التحديد هو فكرة معقدة تركز على التحليل الإحصائي للنموذج المستقبلي للبيانات. يتم استخدام معامل التحديد لشرح مدى تباين أحد العوامل الذي يمكن أن يحدث بسبب علاقته بعامل آخر.
فهم معامل التحديد
يتم استخدام معامل التحديد لشرح مقدار التباين لعامل ما الذي يمكن أن يحدث بسبب علاقته بعامل آخر. يعتمد بشكل كبير على تحليل الاتجاه ويتم تمثيله كقيمة بين 0 و 1.
كلما كانت القيمة أقرب إلى 1 ، كلما كان الملاءمة أو العلاقة أفضل بين العاملين. معامل التحديد هو مربع معامل الارتباط ، المعروف أيضًا باسم "R" ، والذي يسمح له بعرض درجة الارتباط الخطي بين متغيرين.
يُعرف هذا الارتباط باسم "صلاح الملاءمة". تشير القيمة 1.0 إلى ملاءمة مثالية ، وبالتالي فهي نموذج موثوق به للغاية للتنبؤات المستقبلية ، مما يشير إلى أن النموذج يفسر جميع الاختلافات الملاحظة. من ناحية أخرى ، تشير قيمة 0 إلى أن النموذج فشل في تصميم البيانات بدقة على الإطلاق. بالنسبة للنموذج الذي يحتوي على العديد من المتغيرات ، مثل نموذج الانحدار المتعدد ، فإن R 2 المعدل هو معامل أفضل لتحديد. في الاقتصاد ، تعتبر قيمة R 2 أعلى من 0.60 جديرة بالاهتمام.
مزايا تحليل معامل التحديد
معامل التحديد هو مربع العلاقة بين الدرجات المتوقعة في مجموعة بيانات مقابل مجموعة الدرجات الفعلية. يمكن التعبير عنها أيضًا كمربع للعلاقة بين درجات X و Y ، حيث يكون X هو المتغير المستقل و Y هو المتغير التابع.
بغض النظر عن التمثيل ، يعني مربع R يساوي 0 أن المتغير التابع لا يمكن التنبؤ به باستخدام المتغير المستقل. على العكس ، إذا كان يساوي 1 ، فهذا يعني أن المتغير المستقل يتم التنبؤ به دائمًا بواسطة المتغير المستقل.
يقيس معامل التحديد الذي يندرج ضمن هذا النطاق مدى توقع المتغير المستقل على المتغير المستقل. على سبيل المثال ، تشير المربعة R إلى 0.20 ، إلى أن 20٪ من المتغير التابع يتم التنبؤ بها بواسطة المتغير المستقل.
تقيس درجة الملاءمة ، أو درجة الارتباط الخطي ، المسافة بين الخط المجهز على الرسم البياني وجميع نقاط البيانات المنتشرة حول الرسم البياني. سيكون للمجموعة الضيقة من البيانات خط انحدار قريب جدًا من النقاط ولديه مستوى عالٍ من الملاءمة ، مما يعني أن المسافة بين الخط والبيانات صغيرة جدًا. نوبة جيدة لديها R- المربعة التي هي قريبة من 1.
ومع ذلك ، R-squared غير قادر على تحديد ما إذا كانت نقاط البيانات أو التنبؤات متحيزة. كما أنه لا يخبر المحلل أو المستخدم ما إذا كان معامل قيمة التحديد جيدًا أم لا. على سبيل المثال ، المربعات الصغرى المنخفضة ليست سيئة ، والأمر متروك للشخص لاتخاذ قرار بناءً على عدد المربعات الصافية.
لا ينبغي تفسير معامل التحديد بسذاجة. على سبيل المثال ، إذا تم الإبلاغ عن تربيع نموذج R بنسبة 75٪ ، يكون التباين في أخطائه أقل بنسبة 75٪ من تباين المتغير التابع ، ويكون الانحراف المعياري لأخطائه أقل بنسبة 50٪ من الانحراف المعياري للجهة التابعة متغير. يبلغ الانحراف المعياري لأخطاء النموذج حوالي ثلث حجم الانحراف المعياري للأخطاء التي قد تحصل عليها باستخدام نموذج ثابت فقط.
أخيرًا ، حتى إذا كانت القيمة التربيعية كبيرة ، فقد لا يكون هناك دلالة إحصائية للمتغيرات التوضيحية في نموذج ما ، أو قد يكون الحجم الفعلي لهذه المتغيرات صغيرًا من الناحية العملية.