p-value = 0.051

Αυτό είναι το πρώτο από μια σειρά άρθρων για σφάλματα και παρανοήσεις σχετικά με τους στατιστικούς ελέγχους υποθέσεων.

Αν έχεις παρακολουθήσει τουλάχιστον ένα προπτυχιακό μάθημα Στατιστικής, τότε με πιθανότητα 5% να κάνω λάθος έχεις συναντήσει αυτό το p-value του τίτλου, κατά κόσμον παρατηρούμενο επίπεδο σημαντικότητας ενός στατιστικού ελέγχου υποθέσεων.

Πιθανότατα το μόνο που θυμάσαι γι’ αυτό είναι ότι πρέπει η τιμή του να είναι κάτω από 5% για αποδεχτείς μια υπόθεση διαφοράς, επίδρασης ή συσχέτισης και να απορρίψεις μια άλλη, την μηδενική. Έστω, λοιπόν, ότι επισκέφτηκες αρκετές φορές το καφενείο της Βουλής, εντόπισες 62 βουλευτές (άντρες και γυναίκες) και μέτρησες το IQ τους με ένα ειδικό τεστ ευφυΐας, γιατί είχες την υποψία ότι η ευφυΐα διαφέρει ανάμεσα στα δύο φύλα. Υποθέτεις λοιπόν ότι “οι γυναίκες της ελληνικής βουλής έχουν διαφορετικό δείκτη ευφυΐας από τους άντρες”.

Αφού συγκέντρωσες τα απαντημένα τεστ διαπίστωσες με γρήγορους υπολογισμούς ότι το μέσο IQ των γυναικών είναι 115, ενώ αυτό τον αντρών 100. Έχεις αρκετές ενδείξεις ότι ο δείκτης ευφυΐας των γυναικών της ελληνικής βουλής είναι σημαντικά διαφορετικός από αυτόν των αντρών; Μπορείς έτσι απλά να γενικεύσεις την παραπάνω διαπίστωση; Όχι, γιατί α. δεν είσαι δημοσιογράφος και β. δεν ήταν δυνατό να εντοπίσεις και τους 300 βουλευτές του ελληνικού κοινοβουλίου. Αποφασίζεις, λοιπόν, να βασιστείς σε έναν στατιστικό έλεγχο: θέτεις 5% την πιθανότητα να πεις ότι υπάρχει διαφορά στην ευφυΐα των δύο φύλων, ενώ στην πραγματικότητα αυτή δεν υπάρχει και στη συνέχεια αφήνεις την υπόλοιπη δουλειά σε ένα στατιστικό πακέτο. Στο output βλέπεις ότι p=0.02, δηλαδή η ποσοστιαία πιθανότητα να ισχυριστείς ότι υπάρχει διαφορά ενώ δεν υπάρχει είναι 2%, και αφού είναι κάτω από 5% γράφεις φαρδιά πλατιά στα συμπεράσματα της εργασίας σου “Υπάρχουν ενδείξεις ότι γυναίκες του ελληνικού κοινοβουλίου έχουν διαφορετικό δείκτη ευφυΐας από τους άντρες, όπως μετρήθηκε με το τεστ ευφυΐας των Marx & Spencer”. Συγχαρητήρια, γιατί αυτό είναι το μόνο που μπορείς συμπεράνεις από τη δειγματοληπτική σου έρευνα (έστω ότι το δείγμα σου ήταν αντιπροσωπευτικό – άλλη περίεργη υπόθεση αυτή).

- Αν δεν είχες καταλάβει ότι οι έλεγχοι υποθέσεων σου δίνουν μόνο ενδείξεις και όχι αποδείξεις για ένα αποτέλεσμα, θα έγραφες στα συμπεράσματα: “Οι γυναίκες του ελληνικού κοινοβουλίου είναι πιο έξυπνες από τους άντρες” ή “Η ευφυΐα των ελληνίδων βουλευτών είναι μεγαλύτερη από αυτή των αντρών”.

- Αν πάλι ήσουν δημοσιογράφος θα τιτλοφορούσες το άρθρο σου: “Η Βουλή είναι γυναικεία υπόθεση”, “Άντρες από κάτω: γιατί οι γυναίκες του κοινοβουλίου μας είναι πιο άξιες απ’ τους άντρες”, “Η επιστήμη επιβεβαιώνει τις επιλογές του Γιώργου” ή “Τρέμε Άδωνι”.

Περισσότερα: (για εις βάθος)

- Cohen, J. (1994). The earth is round (p < .05). American Psychologist, 49, 997-1003.

- Ioannidis, J.P. (2005). Why most published research findings are false. PLoS Med 2, e124

- Schervish, M.J. (1996). P values: What They Are and What They Are Not.” The American Statistician, Vol. 50, No. 3.

- Thompson, B. (2006). Foundations of univariate behavioral statistics. New York: Guilford.

- Γ. Μενεξές, Α. Οικονόμου (2002). Σφάλματα και παρανοήσεις στους στατιστικούς ελέγχους υποθέσεων. Υπέρβαση μέσω της Ανάλυσης Δεδομένων, Τετράδια Ανάλυσης Δεδομένων, τ.2.

Buzzdigmeblogspacedeliciousgoogle bookmarks

Popularity: 1% [?]

Guitarras Nocturnas

Back from a short visit to Barcelona where I’ve been for a “Correspondence Analysis in R” workshop with Michael Greenacre and Oleg Nenadić. Even though we’ve been busy with R programming and stuff, we still managed to see some of the city and visit Gaudi’s Park Güell, Casa Milà and Sagrada Família.

Ευχαριστώ πολύ Michael for your kind invitation and your hospitality.


Guitarras Nocturnas is a street group born in Buenos Aires and Barcelona, improvising around charming melodies.

Buzzdigmeblogspacedeliciousgoogle bookmarks

Popularity: 1% [?]

Statistical Poetry & Songs

The Chinese National Bureau of Statistics asked its employees to craft poems to celebrate an anniversary [via Reuters Blogs]. Particularly liked these lines by Yu Jiao:

In the Sea of Numbers

No beautiful languages
But endless calls day after day
No flowers or applause
But doubts and suspicion from others
No melting sceneries
But a bunch of dry numbers flowing

Statistical Poetry can be amusing and fun, yet thoughtful. I recall the feeling of joy I got at listening Michael Greenacre’s Summertime (mp3):

Summertime

It’s summertime,
Statistical modelling is easy,
Data are fitting,
Explained variance is high.

Your data are rich,
And your model’s good-looking,
So hush, statisticians, don’t you cry

With a little google search it’s easy to discover that there’s a good tradition of Statistical Songs. Take, for example, Brad Carlin’s, Mark Glickman’s and Johannes Schult’s compositions and parodies. Some of these songs convey messages as well, such as the faith of their composers in a particular theory. Come take a taste of the Bayesian Believer:

Bayesian Believer
(The Monkees – I’m a Believer)

I thought inference was just a fairy tale,
Confused by stats and probability,
Frequentist approaches (doo-doot doo-doot)
made no sense to me (doo-doot doo-doot)
Summarizing evidence by p!

Then I saw Tom Bayes — Now I’m a believer,
Without a trace — of doubt in my mind,

[I'm a] Bayesian (ooooh) — Oh, I’m a believer –
I couldn’t p now if I tried!

Buzzdigmeblogspacedeliciousgoogle bookmarks

Popularity: unranked [?]

Next Page »
This work is licensed under a Creative Commons Attribution-Noncommercial-Share Alike 3.0 Unported License.
(c) 2010 amarkos|gr|blog | powered by WordPress with Barecity