ما هو مجموع المربعات؟
مجموع المربعات هو أسلوب إحصائي يستخدم في تحليل الانحدار لتحديد تشتت نقاط البيانات. في تحليل الانحدار ، يتمثل الهدف في تحديد مدى ملائمة سلسلة البيانات لوظيفة يمكن أن تساعد في شرح كيفية إنشاء سلسلة البيانات. يتم استخدام مجموع المربعات كوسيلة رياضية للعثور على الوظيفة التي تناسبها (تختلف على الأقل) من البيانات.
الصيغة لمجموع المربعات
لمجموعة X من عناصر n: مجموع المربعات = i = 0∑n (Xi −X) 2 في المكان: Xi = عنصر ith في setX = متوسط كل العناصر في المجموعة (Xi −X) = انحراف كل عنصر عن الوسط
مجموع المربعات كما هو معروف الاختلاف.
ماذا مجموع المربعات يخبرك؟
مجموع المربعات هو مقياس للانحراف عن الوسط. في الإحصائيات ، يكون المتوسط هو متوسط مجموعة الأرقام وهو المقياس الأكثر شيوعًا للاتجاه المركزي. يتم حساب الوسط الحسابي ببساطة من خلال جمع القيم في مجموعة البيانات وتقسيمها على عدد القيم.
لنفترض أن أسعار إغلاق Microsoft (MSFT) في الأيام الخمسة الماضية كانت 74.01 و 74.77 و 73.94 و 73.61 و 73.40 بالدولار الأمريكي. يبلغ مجموع الأسعار 369.73 دولارًا ، وبالتالي يكون متوسط أو متوسط سعر الكتاب المدرسي 369.73 دولارًا / 5 = 73.95 دولارًا.
لكن معرفة متوسط مجموعة القياس لا يكفي دائمًا. من المفيد في بعض الأحيان معرفة مقدار التباين الموجود في مجموعة من القياسات. قد يعطي مدى بعيدًا عن القيم الفردية بعض الشيء عن مدى ملاءمة الملاحظات أو القيم لنموذج الانحدار الذي تم إنشاؤه.
على سبيل المثال ، إذا أراد أحد المحللين معرفة ما إذا كان سعر سهم MSFT يتحرك جنبًا إلى جنب مع سعر Apple (AAPL) ، فيمكنه سرد مجموعة من الملاحظات لعملية كلا الأسهم لفترة معينة ، على سبيل المثال 1 ، 2 أو 10 سنوات ، وإنشاء نموذج خطي مع كل من الملاحظات أو القياسات المسجلة. إذا لم تكن العلاقة بين كلا المتغيرين (أي سعر AAPL وسعر MSFT) عبارة عن خط مستقيم ، فهناك اختلافات في مجموعة البيانات التي تحتاج إلى التدقيق.
في الإحصائيات ، إذا كان الخط في النموذج الخطي الذي تم إنشاؤه لا يمر بجميع قياسات القيمة ، فإن بعض التباين الذي لوحظ في أسعار الأسهم غير مفسر. يتم استخدام مجموع المربعات لحساب ما إذا كانت هناك علاقة خطية بين متغيرين ، ويشار إلى أي متغير غير موضح بالمجموع المتبقي من المربعات.
مجموع المربعات هو مجموع مربع الاختلاف ، حيث يتم تعريف الاختلاف على أنه الفارق بين كل قيمة فردية والوسط. لتحديد مجموع المربعات ، تكون المسافة بين كل نقطة بيانات وسطر الأنسب مربعة ثم يتم تلخيصها. سوف الخط الأفضل مناسبا تقليل هذه القيمة.
كيفية حساب مجموع المربعات
الآن يمكنك أن ترى لماذا يسمى القياس مجموع الانحرافات التربيعية ، أو مجموع المربعات باختصار. باستخدام مثال MSFT أعلاه ، يمكن حساب مجموع المربعات على النحو التالي:
- SS = (74.01 - 73.95) 2 + (74.77 - 73.95) 2 + (73.94 - 73.95) 2 + (73.61 - 73.95) 2 + (73.40 - 73.95) 2 SS = (0.06) 2 + (0.82) 2 + (- 0.01) 2 + (-0.34) 2 + (-0.55) 2 SS = 1.0942
ستؤدي إضافة مجموع الانحرافات وحدها دون تربيع إلى عدد يساوي أو يساوي الصفر ، حيث تؤدي الانحرافات السلبية إلى تعويض الانحرافات الإيجابية تقريبًا. للحصول على رقم أكثر واقعية ، يجب تربيع مجموع الانحرافات. سيكون مجموع المربعات دائمًا رقمًا إيجابيًا لأن مربع أي عدد ، سواء أكان إيجابيًا أم سلبيًا ، إيجابي دائمًا.
مثال عن كيفية استخدام مجموع المربعات
استنادًا إلى نتائج حساب MSFT ، يشير مجموع المربعات المرتفعة إلى أن معظم القيم بعيدة عن الوسط ، وبالتالي ، هناك تباين كبير في البيانات. يشير مجموع المربعات المنخفضة إلى التباين المنخفض في مجموعة الملاحظات.
في المثال أعلاه ، يُظهر 1.0942 أن التباين في سعر سهم MSFT في الأيام الخمسة الأخيرة منخفض جدًا وأن المستثمرين الذين يتطلعون إلى الاستثمار في الأسهم التي تتميز باستقرار الأسعار والتقلبات المنخفضة قد يختارون MSFT.
الماخذ الرئيسية
- يقيس مجموع المربعات انحراف نقاط البيانات بعيدًا عن القيمة المتوسطة. تشير نتيجة مجموع المربعات إلى درجة كبيرة من التباين داخل مجموعة البيانات ، بينما تشير النتيجة الأقل إلى أن البيانات تختلف اختلافًا كبيرًا عن القيمة المتوسطة.
قيود استخدام مجموع المربعات
يتطلب اتخاذ قرار استثماري بشأن الأسهم المطلوب شراؤها المزيد من الملاحظات أكثر من تلك المدرجة هنا. قد يضطر المحلل إلى العمل مع سنوات من البيانات لمعرفة مدى اليقين العالي أو المنخفض لمدى تباين الأصل. مع إضافة المزيد من نقاط البيانات إلى المجموعة ، يصبح مجموع المربعات أكبر حيث سيتم توزيع القيم.
قياسات الاختلاف الأكثر استخدامًا هي الانحراف المعياري والتباين. ومع ذلك ، لحساب أي من المقياسين ، يجب أولاً حساب مجموع المربعات. التباين هو متوسط مجموع المربعات (أي مجموع المربعات مقسومًا على عدد المشاهدات). الانحراف المعياري هو الجذر التربيعي للفرق.
هناك طريقتان لتحليل الانحدار يستخدمان مجموع المربعات: طريقة المربعات الصغرى الخطية وطريقة المربعات الصغرى غير الخطية. تشير طريقة المربعات الصغرى إلى حقيقة أن دالة الانحدار تقلل مجموع مربعات التباين من نقاط البيانات الفعلية. وبهذه الطريقة ، يمكن رسم دالة توفر إحصائيًا أفضل ملاءمة للبيانات. لاحظ أن وظيفة الانحدار يمكن أن تكون إما خطية (خط مستقيم) أو غير خطية (خط منحني).