ما هو معنى الطبعات؟
يعني Winsorized الوسيلة التي تستبدل في البداية القيم الأصغر والأكبر بالملاحظات الأقرب إليها. يتم ذلك للحد من تأثير القيم المتطرفة غير الطبيعية ، أو القيم المتطرفة ، على الحساب. بعد استبدال القيم ، يتم بعد ذلك استخدام صيغة الوسط الحسابي لحساب المتوسط النسبي.
الصيغة لمعنى الطبعات هو
Winsorized Mean = Nxn… xn + 1 + xn + 2… xn حيث: n = عدد نقاط البيانات الأكبر والأصغر التي يجب استبدالها بالملاحظة
يتم التعبير عن وسائل الطبعات بطريقتين. يشير مصطلح "k n " winsorized إلى استبدال أصغر وأكبر الملاحظات ، حيث "k" عدد صحيح. يتضمن الوسيط winsorized "X٪" استبدال نسبة مئوية معينة من القيم من طرفي البيانات.
كيفية حساب متوسط الطبعات
يتم احتساب الوسط المتعقل عن طريق استبدال أصغر وأكبر نقاط البيانات ، ثم جمع كل نقاط البيانات وتقسيم المجموع على إجمالي عدد نقاط البيانات.
ماذا يعني winsorized اقول لكم؟
يكون الوسط المتعقل أقل حساسية للقيم المتطرفة لأنه يمكن أن يحل محلها بقيم أقل تطرفًا. بمعنى أنه أقل عرضه للخطوط العريضة مقابل الوسط. ومع ذلك ، إذا كان التوزيع ذا ذيول سمين ، فإن تأثير إزالة القيم الأعلى والأدنى في التوزيع سيكون له تأثير ضئيل بسبب العدد الكبير من التباين في أرقام التوزيع.
الماخذ الرئيسية
- طريقة حسابية تتضمن استبدال القيم الأصغر والأكبر بالملاحظات الأقرب إليها.أقل حساسية تجاه القيم المتطرفة لأنها يمكن أن تحل محلها بقيم أقل تطرفًا. إنها على عكس الوسط المشذوب ، والذي يتضمن إزالة نقاط البيانات - على الرغم من أن نتيجة الاثنين تميل إلى أن تكون قريبة.
مثال على كيفية استخدام متوسط الطبعات
يمكن للمرء أن يحسب المتوسط النسبي لمجموعة البيانات التالية: 1 ، 5 ، 7 ، 8 ، 9 ، 10 ، 14. في هذا المثال ، نحن نفترض أن الوسيلة winsorized هي في الترتيب الأول ، نستبدل القيم الأصغر والأكبر بقيمها أقرب الملاحظات.
تظهر الآن مجموعة البيانات على النحو التالي: 5 ، 5 ، 7 ، 8 ، 9 ، 10 ، 10. أخذ المتوسط الحسابي للمجموعة الجديدة ينتج متوسط winsorized من 7.7 ، أو (5 + 5 + 7 + 8 + 9 + 10 + 10) مقسوما على 7.
أو ضع في اعتبارك أن 20٪ يعني winsorized يأخذ أعلى 10٪ وأقل 10٪ ويستبدلهم بأقرب قيمة تالية. سنقوم بتعديل مجموعة البيانات التالية: 2 ، 4 ، 7 ، 8 ، 11 ، 14 ، 18 ، 23 ، 23 ، 27 ، 35 ، 40 ، 49 ، 50 ، 55 ، 60 ، 61 ، 61 ، 62 ، 75. سيتم استبدال أصغر وأكبر نقاط البيانات ، أو 10 ٪ ، مع أقرب قيمة المقبل. وبالتالي ، فإن مجموعة البيانات الجديدة هي: 7 ، 7 ، 7 ، 8 ، 11 ، 14 ، 18 ، 23 ، 23 ، 27 ، 35 ، 40 ، 49 ، 50 ، 55 ، 60 ، 61 ، 61 ، 61 ، 61. المتوسط هو 33.9 ، أو إجمالي البيانات (678) مقسومًا على إجمالي عدد نقاط البيانات (20).
الفرق بين متوسط winsorized ومتوسط المشذبة
يتضمن الوسط المتعقل تعديل نقاط البيانات ، في حين أن الوسط المقتطع يتضمن إزالة نقاط البيانات. من الشائع أن يكون متوسط winsorized يعني قلص لتكون قريبة.
حدود استخدام متوسط الطبعات
الجانب السلبي الرئيسي للوسائل winsorized هو أنها تقدم التحيز في مجموعة البيانات. منحت ، تكون مجموعة البيانات أقل تحيزًا بعد التعديل مما لو تركت القيم المتطرفة.
تعلم المزيد عن الطبعات المتوسطة
للحصول على نظرة ثاقبة ذات صلة ، حول الاختلافات بين العمليات الحسابية الرئيسية.
