Του Γιώργου Δημητρίου
Ας με συγχωρέσουν οι Έλληνες δημοσκόποι αλλά το μαθηματικό τους υπόβαθρο είναι ανάλογο με το βαθμό με τον οποίο εισάγονται μέσω των πανελληνίων εξετάσεων στις σχολές κοινωνικών και πολιτικών επιστημών. Ο μέσος όρος βαθμολογίας στα μαθηματικά είναι πολύ κάτω από τη βάση του 10.
Χρησιμοποιώντας κανείς τα στοιχεία των δικών τους ερευνών θα διαπιστώσει ότι έχουν χαοτικές τυπικές αποκλίσεις μεταξύ των πραγματικών εκλογικών αποτελεσμάτων και των δημοσκοπήσεων τους. Μόνιμα και σταθερά σε βάρος του ΣΥΡΙΖΑ .
Η βασική σοφία των ερευνητών είναι διαρκώς να αναφέρουν ότι ο ΣΥΡΙΖΑ υποεκπροσωπείται στη δειγματοληψία γιατί δεν απαντούν εύκολα οι ψηφοφόροι του. Μεγάλο ψέμα, αφού και αν ακόμα αυτό ίσχυε υπάρχει τεχνικός τρόπος να το αποκαταστήσουν το πρόβλημα, όπως θα δείξω παρακάτω.
Είναι άξιο απορίας ότι ο μέσος όρος αυτών των τυπικών αποκλίσεων σε βάρος του ΣΥΡΙΖΑ μετά από μελέτη που πραγματοποίησα στις δημοσκοπήσεις 2010 – 2019 ανέρχεται στο 6,9%. Το τυπικό σφάλμα των ερευνών (SE) είναι η μετρούμενη τυπική απόκλιση γύρω από μία μέση τιμή για επαναλαμβανόμενες δειγματοληψίες οι οποίες όταν υποεκπροσωπούνται τα δείγματα συμβαίνουν τέρατα..
Η δημοσκοπική αλήθεια θα έπρεπε να βρίσκεται εντός +/- 1 SE του μετρούμενου μέσου όρου. Τυχαία, ίσως όχι τόσο τυχαία, αλλά σίγουρα υποεκπροσωπούμενα δείγματα σε ό,τι αφορά στο Σύριζα, των n = 1000 ατόμων. Το τυπικό σφάλμα 1/v 1000 ή – 3,2% ,άρα η μετρούμενη τιμή έχει σφάλμα 3%.
ΕΚΛΟΓΙΚΟ ΠΑΡΑΔΕΙΓΜΑ
Εστω ότι το 52% στην έρευνα ψηφίζει τη Νέα Δημοκρατία και 48% τον ΣΥΡΙΖΑ. Για κανονική κατανομή τότε το 68% ( περίπου 2/3 rd s ) θα βρίσκεται εντός του διαστήματος =/- 1 SE του μετρούμενου μέσου όρου. Η δημοσκοπική αλήθεια είναι στο εύρος του 68%.
Το εκλογικό αυτό παράδειγμα δείχνει περιθώριο λάθους για το δείγμα n = 1000 αντιπροσωπευτικών ερωτηθέντων Σύριζα 48 +/- 3% και 52 +/- 3% Νέα Δημοκρατία, αρκετό περιθώριο λάθους για να αλλάξει τις εκλογές αντίστροφα. Ο,τι έγινε στην Τουρκία θα συμβεί και εδώ με τις δημοσκοπικές προβλέψεις και τις πραγματικές εκλογές. Νικητής θα είναι ο υποεκπροσωπούμενος ΣΥΡΙΖΑ.
Και αυτό είναι μόνο ένα τυπικό σφάλμα για εμπιστοσύνη της δημοσκόπησης να ανέρχεται στο 95% περίπου θα χρειαζόμασταν +/- 6% ,ενώ για να μειώσουμε το περιθώριο σφάλματος στο 1% θα χρειαζόταν οι δημοσκοπήσεις να δειγματίσουν n = 10.000 άτομα. Συνεπώς θα μπορούσαν να μειώσουν το περιθώριο σφάλματος αλλά ίσως να μην τους ήταν βολικό…
Είναι κατανοητό ότι η ομολογημένη υποεκπροσώπηση του ΣΥΡΙΖΑ στη δειγματοληψία δυστυχώς όλων των δημοσκοπήσεων δίνει παραμορφωτικές απαντήσεις και αποτελέσματα. Είναι επίσης πολύ προβληματική η υποτίμηση της γενιάς Millenium και η πρόχειρη ανάλυση της δεξαμενής των αναποφάσιστων.
Η ΥΠΟΕΚΠΡΟΣΩΠΗΣΗ ΤΟΥ ΣΥΡΙΖΑ ΠΑΡΑΜΟΡΦΏΝΕΙ ΚΑΙ ΤΗΝ ΚΑΤΑΝΟΜΗ
Η λέξη κλειδί στις δημοσκοπήσεις είναι η <<Κατανομή >> που υποδηλώνει μία αληθινή τιμή με συσχετισμένο περιθώριο σφάλματος. Ως παράδειγμα χρησιμοποιούμε Χ99 στο
σημείο κατανομής 1% . Τότε θα χρειαζόμασταν n = 10.000 ατόμων ως αντιπροσωπευτικό δείγμα στο σημείο Χ99 + της κατανομής.
Το 1% θα αποτελούσε το 1/100 της συνολικής μάζας ατόμων για να μας δώσει 10.000 άτομα δείγματος. Εάν ληφθεί ως πληθυσμιακή μάζα μικρότερη από την ελάχιστη, ή πολύ περισσότερο η υποεκπροσωπηση του Σύριζα κατά 6,9%, τότε το περιθώριο σφάλματος αυξάνεται με γεωμετρική πρόοδο.
ΣΥΜΠΕΡΑΣΜΑ ο ΜΗΤΣΟΤΑΚΗΣ ΜΕ ΕΠΙΔΌΣΕΙΣ ΚΙΛΙΝΣΝΤΑΡΟΓΛΟΥ
1)Ο ΣΥΡΙΖΑ υποεκπροσωπείται σε όλες τις δημοσκοπήσεις κατά 6,9% κατά μέσο όρο συνεπώς τα αποτελέσματα μπορούν κατά τη μεγαλύτερη πιθανότητα να του δώσουν σημαντική πρωτιά.
2)Οι Έλληνες δημοσκόποι θα μπορούσαν να μειώσουν το περιθώριο σφάλματος από +/- 3% δηλαδή 6% , στο 1% εάν προέκτειναν το δείγμα σε 10.000 άτομα. Μόνο 2 εταιρείες επέκτειναν το δείγμα μόνο στα 4.000 άτομα για μία ή δύο φορές.
3)Με βάση τις τυπικές αποκλίσεις μεταξύ δημοσκοπήσεων και πραγματικών εκλογικών αποτελεσμάτων και σε συνάρτηση με την υποεκτίμηση του ΣΥΡΙΖΑ στις δημοσκοπήσεις κατά 6,9% βλέπω τον ΣΥΡΙΖΑ πρώτο κόμμα με πιθανότητες 55% και τη ΝΔ με πιθανότητες 45%
4)Αν είναι ο ΣΥΡΙΖΑ πρώτο κόμμα θα είναι με διαφορά από 1% έως 3,8% .Αν η ΝΔ είναι πρώτο κόμμα η διαφορά θα είναι από 1% έως 2,1%.
Βιβλιογραφία
1) WA Shewart;W Edwards Deming Washington ( 1939 )
2) D Huff How you say lies with statistics WW Norton & Company inc .New York ( 1954 )
3) OL Dovies . Statistic Methods in research and production .Oliver and Boyd. 4) P Gy Sampling of Particulate Material ,Theory and Practice 2nd Edition Elsevier,Amsterdam ( 1982 )