بقلم أوتافيانو هيلين *
تتمتع دراسة البيانات من وكالات البحث المختلفة بميزة زيادة كمية المعلومات ، ولكنها تزيد من التقلبات
تعطي استطلاعات الرأي حول التفضيلات الانتخابية للسكان مؤشرات لما يمكن أن يحدث إذا جرت الانتخابات في ذلك الوقت. ومع ذلك ، من أجل تقييم نتائج البحث بطريقة أكثر عمومية ، خاصة فيما يتعلق بالاتجاهات المحتملة التي قد تكشف عنها ، يجب توخي بعض الحذر. لنجسد ذلك بناءً على نتائج تفضيلات المرشحين الأربعة الرئيسيين في استطلاعات الرأي للانتخابات الرئاسية التي أجرتها منظمات مختلفة في الأشهر من فبراير إلى مارس 2022 ،[1] قبل ذلك ، يتغير الحزب ، وتعريف القوائم وتوحيد الترشيحات ، وإن لم يكن بشكل نهائي ، الأشياء التي حدثت في أوائل أبريل.
تظهر البيانات المراد تحليلها في الشكل 1. الإحداثي (المحور y) من كل نقطة في الشكل 1 يوضح التفضيلات التي عبر عنها الأشخاص الذين تمت استشارتهم في استطلاع تم إجراؤه في التاريخ المقابل للإحداثي (المحور x).[2] عندما ، في نفس الاستطلاع ، تم النظر في أكثر من مجموعة واحدة من المرشحين (تسمى عادةً سيناريو من قبل وسائل الإعلام) ، تم تمثيل النتائج المختلفة في نفس الإحداثي السيني.
الرقم 1 - نتائج الاقتراع. معظم المرشحين المفضلين.
عادة ، يتم تقديم نتائج الاستطلاع جنبًا إلى جنب مع تقدير تقريبي لـ "هامش الخطأ" ، عادةً في حدود 2٪ أو 3٪. يعني هذا "هامش الخطأ" أنه إذا تم إجراء المسح في نفس اليوم ، باستخدام نفس الإجراءات ومخاطبة الأشخاص الذين لديهم نفس الملفات الشخصية (العمر ، والجنس ، والتعليم ، والدخل ، والمنطقة الجغرافية ، والدين ، وما إلى ذلك) ، قد تكون النتائج مختلفة ضمن هذا النطاق. إن "هوامش الخطأ" هذه ذات طبيعة إحصائية فقط ، أي أنها لا تتضمن شكوكًا بسبب المنهجية المعتمدة أو الفرضيات المتعلقة بملف السكان المصوتين. علاوة على ذلك ، هذه الهوامش صالحة للمرشحين ذوي التفضيلات الجيدة ؛ في حالة المرشحين ذوي معدلات التفضيل المنخفضة ، تكون "هوامش الخطأ" أصغر ، كما تمت مناقشته لاحقًا.
لذلك ، فإن الاختلافات التي تقل عن هامش الخطأ بين استبيانين متتاليين أجرتهما نفس الشركة لا تسمح لنا بافتراض أنه كان هناك ، بشكل آمن وحقيقي ، تباين في تفضيلات الناخبين. لن يكون هذا الاستنتاج ممكنًا إلا إذا تم استيفاء أحد الشروط التالية على الأقل: كان الاختلاف أكبر من "هامش الخطأ" ؛ يحدث تغيير في نفس الاتجاه مرة أخرى في مسح جديد أجرته نفس الشركة ؛ حدث اختلاف مماثل في الاستطلاعات التي أجرتها شركة أخرى في نفس التواريخ.
نسبة 2 أو 3٪ المعتادة هي تقدير تقريبي لهامش الخطأ. يعتمد هذا الهامش ، في الواقع ، على درجة تفضيل المرشح. على سبيل المثال ، كما يتضح من الشكل 1 ، في حين تباينت التفضيلات القصوى والدنيا للمرشحين المحتملين الأعلى تصنيفًا (لولا وبولسونارو) ، على التوالي ، في نطاق 13٪ و 12٪ في الفترة ، اختلف المرشحان سيرو ومورو ضمن نطاقات أصغر بكثير ، 5٪ و 4٪ على التوالي. هامش الخطأ هذا ، من 2٪ إلى 3٪ ، صالح للمرشحين ذوي التفضيل العالي.
وكقاعدة عامة ، كلما اقترب تفضيل الترشح من 50٪ ، زاد "هامش الخطأ". وبالتالي ، فإن التباين بنسبة 3٪ في تفضيل الترشيح ، من 50٪ إلى 53٪ ، على سبيل المثال ، قد لا يعني شيئًا ، في حين أن الاختلاف نفسه في الترشيح ذي التصنيف المنخفض ، على سبيل المثال ، من 5٪ إلى 8٪ ، قد يكون مهمًا جدًا. .
عند مقارنة الاستطلاعات من قبل شركات مختلفة ، يمكن أن تكون النطاقات ("هوامش الخطأ") أكبر ، كما هو موضح أدناه.
بالإضافة إلى الاختلافات العشوائية البحتة ، قد تكون هناك أيضًا اختلافات في النتائج بسبب اعتماد منهجيات وفرضيات مختلفة فيما يتعلق بملف السكان الذين سيصوتون (كيف يتم توزيعها حسب الدخل ، والتعليم ، والعمر ، ومنطقة البلد ، إلخ. ..).
على سبيل المثال ، من بين البيانات الموضحة في الشكل 1 ، هناك نوعان من الاستطلاعات: واحد شخصي والآخر عبر الهاتف. الاختلافات بين هاتين النتيجتين كبيرة جدا. في الاستطلاعات التي أجريت عن طريق الهاتف ، كان لدى المرشح لولا ، في المتوسط ، أصوات أقل بنحو 2 إلى 3 ٪ من الاستطلاعات التي أجريت شخصيًا. أما بالنسبة للمرشح الذي يأتي في المركز الثاني ، فإن الوضع مقلوب ، حيث زاد عدد الأصوات في المشاورات الهاتفية عن المشاورات التي تتم وجهاً لوجه.
يجب مراعاة مثل هذه الحقائق عند مقارنة النتائج المنشورة من قبل شركات بحثية مختلفة.
البيانات التي تظهر في الشكل 1 ، والتي تم إصدارها خلال شهري فبراير ومارس ، لا تظهر أي اتجاه في التفضيلات للمرشحين المحتملين الأربعة بمرور الوقت.[3] إذا جرت الانتخابات في تلك الفترة وبضم المرشحين في الاقتراع ، فإن النتائج تشير إلى تصويت بين 39 و 42٪ للولا وبين 26 و 29٪ للمرشح الآخر. أما بالنسبة للأصوات الصحيحة ، فسيحصل لولا على ما بين 45 و 49٪ منهم.
من الضروري أن نقول إن حقيقة أن البيانات لا تشير إلى أي دليل على وجود تباين كبير على مدى الشهرين المدروسين ليس دليلاً على عدم وجود تغيير: عدم وجود دليل على التأثير ليس دليلاً على عدم وجوده.
بالإضافة إلى الاختلافات العشوائية النموذجية في عمليات أخذ العينات والاختلافات بين النتائج التي تم الحصول عليها من قبل شركات الاقتراع المختلفة بسبب اختلاف المنهجيات والفرضيات حول ملفات تعريف الناخبين ، هناك تأثير ارتباط بين النتائج يمكن أن يؤدي إلى استنتاجات خاطئة.
لفهم هذا ، افترض أن هناك موقفين فقط من المرشحين. تمت مقابلة ألف شخص ، ولنقل 600 شخص يقولون إنهم يفضلون أ و 400 يفضلون ب: 60٪ و 40٪ على التوالي. بعد بضعة أيام ، في نفس الشارع ، تمت مقابلة 1000 شخص آخر (من قبل نفس الشركة ، باستخدام نفس المنهجيات والافتراضات ، وما إلى ذلك). حتى لو لم يكن هناك فرق بين تفضيل الناخبين ، فإن عدد الأشخاص الذين يقولون إنهم يفضلون "أ" قد يكون أعلى قليلاً أو أقل قليلاً من 600 بالصدفة. لنفترض أنها 630 (63٪). لذلك ، سيكون بالضرورة عدد الأشخاص الذين يقولون إنهم يفضلون المرشح ب أقل ، 370 (37٪). قد يعطي هذا انطباعًا بأن تفضيل الناخبين متنوع: زاد تفضيل أحد المرشحين ، و "تأكيدًا لهذا التغيير في موقف الناخبين" ، انخفض تفضيل الآخر ؛ زاد الفرق بينهما بنسبة 6٪ ، وهو ما يتجاوز بكثير هوامش الخطأ المعتادة.
لكن البيانات لا تدعم هذا الاستنتاج ، والعبارة الواردة في الاقتباسات أعلاه خاطئة. حقيقة أن B قد انخفض ، بدلاً من "تأكيد الاتجاه" ، يعكس فقط حقيقة أن مجموع النسبة المئوية المفضلة للمرشحين اثنين ثابت ، 100٪: إذا نما أحدهما ، فإن الآخر ينخفض بالضرورة.
عندما يكون هناك أكثر من مرشحين ، يكون هذا التأثير أقل وضوحًا ؛ ومع ذلك ، عندما يحصل اثنان منهم على نسبة كبيرة من إجمالي الأصوات ، كما هو الحال مع البيانات الموضحة في الشكل 1 ، يكون التأثير كبيرًا. يعني هذا التأثير أنه على الرغم من أن التفضيلات الخاصة بالمرشحين الرئيسيين تباينت في نطاق من 12٪ إلى 13٪) ، فإن الاختلاف بين التفضيلات لكليهما اختلف ، في نفس الفترة ، من 22٪.
يجب أن تكون مجموعة من جميع التأثيرات الموصوفة قد حدثت في البحث في الفترة المذكورة. على سبيل المثال ، في المنطقة التي تم تسليط الضوء عليها على اليسار في الشكل 2 ، يبدو أن ترشيح لولا كان سينخفض كثيرًا مع انعكاس الموقف تقريبًا طوال النصف الأول من شهر فبراير.
ومع ذلك ، قد تكون هذه الحقيقة مجرد مزيج من التأثيرات المدروسة. أولاً ، الاختلافات في ترتيب 3٪ في التفضيل الظاهري لمرشح ليست مهمة. ثانيًا ، نظرًا للتأثير الذي تمت مناقشته أعلاه ، فإن الزيادة ، فقط من خلال التذبذب العشوائي ، في درجة أحد هذين المرشحين الأكثر تصويتًا تعني ، على الأرجح ، انخفاض الآخر ، مما يؤدي إلى اختلافات في الاختلاف في ترتيب الضعف. من هذه القيمة ، 6٪ ، قد لا تكون ذات دلالة إحصائية. التأثير الثالث هو حقيقة أنه في نهاية الفترة المبينة في الشكل 2 ، تم تضمين الاستطلاعات الهاتفية ؛ أعطت استطلاعات الرأي الهاتفية ، في الفترة التي تم تحليلها ، في المتوسط ، أصواتًا أقل لولا وأكثر لبولسونارو.
لذلك ، لا تسمح لنا البيانات باستنتاج وجود تباين منهجي خلال تلك الفترة.
الرقم 2 - نفس الشكل 1 ، ولكن فقط للمرشحين اللذين يتمتعان بأعلى تفضيلات. قد تشير المنطقة التي تم إبرازها بشكل خاطئ إلى اتجاه: انخفاض في تفضيل أحد المرشحين والنمو للآخر.
اختتام
يمكننا تحليل نتائج استطلاعات الرأي الانتخابية من خلال النظر فقط إلى النتائج المقدمة من قبل شركة واحدة بمرور الوقت ، مما يمنع الاختلافات الملحوظة من التأثر بفرضيات مختلفة تتعلق بالملف الاجتماعي الاقتصادي لجمهور الناخبين والمنهجيات المعتمدة (الهاتف والوجه- لوجه ، على سبيل المثال). مثال). ومع ذلك ، فإن القيام بذلك يحد من كمية المعلومات التي يمكننا تحليلها.
تتمتع دراسة البيانات من وكالات البحث المختلفة بميزة زيادة كمية المعلومات ، لكنها تزيد من التقلبات بسبب الافتراضات والمنهجيات المختلفة المعتمدة.
مهما كان خيار التحليل ، من الضروري تجنب الاستنتاجات المتسرعة. من المهم أيضًا أن نتذكر أن التفضيلات الانتخابية تتغير ببطء بمرور الوقت ، ما لم تظهر حقائق أو أخبار مذهلة للغاية ، صحيحة أو خاطئة.
* أوتافيانو هيلين أستاذ بارز في معهد الفيزياء بجامعة جنوب المحيط الهادئ.
الملاحظات
[1] المسوحات التي أجرتها الوكالات التالية: Quaest و Ipespe و Datafolha و Paraná Pesquisas و MDA و Ideia و Futura و PoderData و Gerp.
[2] تتوافق التواريخ مع تلك التي أجريت فيها الاستطلاعات ، وليس تلك التي تم فيها نشر النتائج.
[3] هذا لا يعني أنه لا يوجد بعض الاختلاف في تفضيلات الناخبين. لا يوجد دليل على ذلك.