ما هي إحصائيات تشي سكوير؟
خي مربع ( χ 2) إحصاء هو اختبار يقيس كيفية مقارنة التوقعات بالبيانات الملاحظة الفعلية (أو نتائج النماذج). يجب أن تكون البيانات المستخدمة في حساب إحصائيات chi-square عشوائية ، خام ، متبادلة ، مستمدة من متغيرات مستقلة ، وتستمد من عينة كبيرة بما يكفي. على سبيل المثال ، نتائج رمي عملة 100 مرة تفي بهذه المعايير.
غالبًا ما تستخدم اختبارات تشي-سكوير في اختبار الفرضيات.
صيغة تشي تشي
χc2 = ∑ (Oi − Ei) 2 من مكان: c = درجات من الحرية = القيمة المرصودة (القيم) E = القيمة (القيم) المتوقعة \ تبدأ {الانحياز} & \ chi ^ 2_c = \ sum \ frac {(O_i - E_i) ^ 2} {E_i} \ & \ textbf {where:} \ & c = \ text {degree of freedom} \ & O = \ text {الملاحظة القيمة (القيم)} \ & E = \ النص {القيمة (القيم المتوقعة) } \ \ end {محاذاة} χc2 = ∑Ei (Oi −Ei) 2 حيث: c = درجات من الحرية = القيمة المرصودة (القيم) E = القيمة (القيم) المتوقعة
ماذا إحصائية تشي سكوير يخبرك؟
هناك نوعان رئيسيان من اختبارات chi-square: اختبار الاستقلال ، الذي يطرح سؤالًا عن العلاقة ، مثل ، "هل هناك علاقة بين الجنس وعشرات SAT؟" ؛ واختبار الملاءمة ، الذي يسأل شيئًا مثل "إذا تم رمي عملة معدنية 100 مرة ، فهل ستظهر رؤوسًا 50 مرة وذيول 50 مرة؟"
بالنسبة لهذه الاختبارات ، يتم استخدام درجات الحرية لتحديد ما إذا كان يمكن رفض فرضية فارغة معينة استنادًا إلى إجمالي عدد المتغيرات والعينات داخل التجربة.
على سبيل المثال ، عند النظر في الطلاب واختيار الدورة ، من المحتمل ألا يكون حجم عينة من 30 أو 40 طالبًا كبيرًا بما يكفي لتوليد بيانات مهمة. الحصول على نفس النتائج أو نتائج مماثلة من دراسة باستخدام حجم عينة من 400 أو 500 طالب هو أكثر صحة.
في مثال آخر ، فكر في رمي عملة 100 مرة. والنتيجة المتوقعة لإسقاط عملة عادلة 100 مرة هي أن الرؤوس ستظهر 50 مرة وستكون ذيول 50 مرة. قد تكون النتيجة الفعلية هي أن الرؤوس تأتي 45 مرة وأنابيب الذيل تظهر 55 مرة. توضح إحصائيات chi-square أي تباينات بين النتائج المتوقعة والنتائج الفعلية.
مثال على اختبار شي تربيع
تخيل إجراء استطلاع عشوائي عبر 2000 ناخب مختلف ، من الذكور والإناث. تم تصنيف الأشخاص الذين استجابوا حسب جنسهم وما إذا كانوا جمهوريين أم ديمقراطيين أم مستقلين. تخيل شبكة مع الأعمدة المسمى جمهورية ، ديمقراطية ، ومستقلة ، وصفين المسمى الذكور والإناث. افترض أن البيانات المستقاة من 2000 شخص على النحو التالي:
الخطوة الأولى لحساب الإحصاء التربيعي chi هي العثور على الترددات المتوقعة. يتم حساب هذه لكل "خلية" في الشبكة. نظرًا لوجود فئتين من النوع الاجتماعي وثلاث فئات من الرأي السياسي ، فهناك ستة ترددات متوقعة. صيغة التردد المتوقع هي:
E (r، c) = n (r) × c (r) nwhere: r = row in questionc = عمود في questionn = إجمالي المطابق \ start {align} & E (r، c) = \ frac {n (r) الأوقات c (r)} {n} \ & \ textbf {where:} \ & r = \ text {row in question} \ & c = \ text {عمود في السؤال} \ & n = \ text {الموافق الكلي} \ \ end {محاذاة} E (r، c) = nn (r) × c (r) حيث: r = صف في questionc = عمود في questionn = إجمالي مطابق
في هذا المثال ، الترددات المتوقعة هي:
- E (1،1) = (900 × 800) / 2،000 = 360E (1،2) = (900 × 800) / 2،000 = 360E (1،3) = (200 × 800) / 2،000 = 80E (2،1) = (900 × 1200) / 2،000 = 540E (2،2) = (900 × 1200) / 2،000 = 540E (2،3) = (200 × 1200) / 2،000 = 120
بعد ذلك ، يتم استخدام هذه القيم لحساب إحصائيات مربع التربيع chi باستخدام الصيغة التالية:
Chi-squared = ∑2E (r، c) حيث: O (r، c) = البيانات المرصودة للصف والعمود المعطى \ تبدأ {align} & \ text {Chi-squared} = \ sum \ frac {^ 2} {E (r، c)} \ & \ textbf {where:} \ & O (r، c) = \ text {البيانات الملحوظة للصف والعمود المحدد} \ \ end {align} Chi-squared = (E (r، c) 2 حيث: O (r، c) = البيانات الملاحظة للصف والعمود المعطى
في هذا المثال ، يكون التعبير لكل قيمة ملحوظة:
- O (1،1) = (400 - 360) 2/360 = 4.44O (1،2) = (300 - 360) 2/360 = 10O (1،3) = (100 - 80) 2/80 = 5O (2،1) = (500 - 540) 2/540 = 2.96O (2،2) = (600 - 540) 2/540 = 6.67O (2،3) = (100 - 120) 2/120 = 3.33
إحصاء chi-square يساوي مجموع هذه القيمة ، أو 32.41. يمكننا بعد ذلك أن ننظر إلى جدول إحصائي خيالي لترى ، بالنظر إلى درجات الحرية في تركيبتنا ، إذا كانت النتيجة ذات دلالة إحصائية أم لا.
