p-value = 0.051

Αυτό είναι το πρώτο από μια σειρά άρθρων για σφάλματα και παρανοήσεις σχετικά με τους στατιστικούς ελέγχους υποθέσεων.

Αν έχεις παρακολουθήσει τουλάχιστον ένα προπτυχιακό μάθημα Στατιστικής, τότε με πιθανότητα 5% να κάνω λάθος έχεις συναντήσει αυτό το p-value του τίτλου, κατά κόσμον παρατηρούμενο επίπεδο σημαντικότητας ενός στατιστικού ελέγχου υποθέσεων.

Πιθανότατα το μόνο που θυμάσαι γι’ αυτό είναι ότι πρέπει η τιμή του να είναι κάτω από 5% για αποδεχτείς μια υπόθεση διαφοράς, επίδρασης ή συσχέτισης και να απορρίψεις μια άλλη, την μηδενική. Έστω, λοιπόν, ότι επισκέφτηκες αρκετές φορές το καφενείο της Βουλής, εντόπισες 62 βουλευτές (άντρες και γυναίκες) και μέτρησες το IQ τους με ένα ειδικό τεστ ευφυΐας, γιατί είχες την υποψία ότι η ευφυΐα διαφέρει ανάμεσα στα δύο φύλα. Υποθέτεις λοιπόν ότι “οι γυναίκες της ελληνικής βουλής έχουν διαφορετικό δείκτη ευφυΐας από τους άντρες”.

Αφού συγκέντρωσες τα απαντημένα τεστ διαπίστωσες με γρήγορους υπολογισμούς ότι το μέσο IQ των γυναικών είναι 115, ενώ αυτό τον αντρών 100. Έχεις αρκετές ενδείξεις ότι ο δείκτης ευφυΐας των γυναικών της ελληνικής βουλής είναι σημαντικά διαφορετικός από αυτόν των αντρών; Μπορείς έτσι απλά να γενικεύσεις την παραπάνω διαπίστωση; Όχι, γιατί α. δεν είσαι δημοσιογράφος και β. δεν ήταν δυνατό να εντοπίσεις και τους 300 βουλευτές του ελληνικού κοινοβουλίου. Αποφασίζεις, λοιπόν, να βασιστείς σε έναν στατιστικό έλεγχο: θέτεις 5% την πιθανότητα να πεις ότι υπάρχει διαφορά στην ευφυΐα των δύο φύλων, ενώ στην πραγματικότητα αυτή δεν υπάρχει και στη συνέχεια αφήνεις την υπόλοιπη δουλειά σε ένα στατιστικό πακέτο. Στο output βλέπεις ότι p=0.02, δηλαδή η ποσοστιαία πιθανότητα να ισχυριστείς ότι υπάρχει διαφορά ενώ δεν υπάρχει είναι 2%, και αφού είναι κάτω από 5% γράφεις φαρδιά πλατιά στα συμπεράσματα της εργασίας σου “Υπάρχουν ενδείξεις ότι γυναίκες του ελληνικού κοινοβουλίου έχουν διαφορετικό δείκτη ευφυΐας από τους άντρες, όπως μετρήθηκε με το τεστ ευφυΐας των Marx & Spencer”. Συγχαρητήρια, γιατί αυτό είναι το μόνο που μπορείς συμπεράνεις από τη δειγματοληπτική σου έρευνα (έστω ότι το δείγμα σου ήταν αντιπροσωπευτικό – άλλη περίεργη υπόθεση αυτή).

- Αν δεν είχες καταλάβει ότι οι έλεγχοι υποθέσεων σου δίνουν μόνο ενδείξεις και όχι αποδείξεις για ένα αποτέλεσμα, θα έγραφες στα συμπεράσματα: “Οι γυναίκες του ελληνικού κοινοβουλίου είναι πιο έξυπνες από τους άντρες” ή “Η ευφυΐα των ελληνίδων βουλευτών είναι μεγαλύτερη από αυτή των αντρών”.

- Αν πάλι ήσουν δημοσιογράφος θα τιτλοφορούσες το άρθρο σου: “Η Βουλή είναι γυναικεία υπόθεση”, “Άντρες από κάτω: γιατί οι γυναίκες του κοινοβουλίου μας είναι πιο άξιες απ’ τους άντρες”, “Η επιστήμη επιβεβαιώνει τις επιλογές του Γιώργου” ή “Τρέμε Άδωνι”.

Περισσότερα: (για εις βάθος)

- Cohen, J. (1994). The earth is round (p < .05). American Psychologist, 49, 997-1003.

- Ioannidis, J.P. (2005). Why most published research findings are false. PLoS Med 2, e124

- Schervish, M.J. (1996). P values: What They Are and What They Are Not.” The American Statistician, Vol. 50, No. 3.

- Thompson, B. (2006). Foundations of univariate behavioral statistics. New York: Guilford.

- Γ. Μενεξές, Α. Οικονόμου (2002). Σφάλματα και παρανοήσεις στους στατιστικούς ελέγχους υποθέσεων. Υπέρβαση μέσω της Ανάλυσης Δεδομένων, Τετράδια Ανάλυσης Δεδομένων, τ.2.

Buzzdigmeblogspacedeliciousgoogle bookmarks

Popularity: 1% [?]

This work is licensed under a Creative Commons Attribution-Noncommercial-Share Alike 3.0 Unported License.
(c) 2010 amarkos|gr|blog | powered by WordPress with Barecity