p-value = 0.051

Αυτό είναι το πρώτο από μια σειρά άρθρων για σφάλματα και παρανοήσεις σχετικά με τους στατιστικούς ελέγχους υποθέσεων.

Αν έχεις παρακολουθήσει τουλάχιστον ένα προπτυχιακό μάθημα Στατιστικής, τότε με πιθανότητα 5% να κάνω λάθος έχεις συναντήσει αυτό το p-value του τίτλου, κατά κόσμον παρατηρούμενο επίπεδο σημαντικότητας ενός στατιστικού ελέγχου υποθέσεων.

Πιθανότατα το μόνο που θυμάσαι γι’ αυτό είναι ότι πρέπει η τιμή του να είναι κάτω από 5% για αποδεχτείς μια υπόθεση διαφοράς, επίδρασης ή συσχέτισης και να απορρίψεις μια άλλη, την μηδενική. Έστω, λοιπόν, ότι επισκέφτηκες αρκετές φορές το καφενείο της Βουλής, εντόπισες 62 βουλευτές (άντρες και γυναίκες) και μέτρησες το IQ τους με ένα ειδικό τεστ ευφυΐας, γιατί είχες την υποψία ότι η ευφυΐα διαφέρει ανάμεσα στα δύο φύλα. Υποθέτεις λοιπόν ότι “οι γυναίκες της ελληνικής βουλής έχουν διαφορετικό δείκτη ευφυΐας από τους άντρες”.

Αφού συγκέντρωσες τα απαντημένα τεστ διαπίστωσες με γρήγορους υπολογισμούς ότι το μέσο IQ των γυναικών είναι 115, ενώ αυτό τον αντρών 100. Έχεις αρκετές ενδείξεις ότι ο δείκτης ευφυΐας των γυναικών της ελληνικής βουλής είναι σημαντικά διαφορετικός από αυτόν των αντρών; Μπορείς έτσι απλά να γενικεύσεις την παραπάνω διαπίστωση; Όχι, γιατί α. δεν είσαι δημοσιογράφος και β. δεν ήταν δυνατό να εντοπίσεις και τους 300 βουλευτές του ελληνικού κοινοβουλίου. Αποφασίζεις, λοιπόν, να βασιστείς σε έναν στατιστικό έλεγχο: θέτεις 5% την πιθανότητα να πεις ότι υπάρχει διαφορά στην ευφυΐα των δύο φύλων, ενώ στην πραγματικότητα αυτή δεν υπάρχει και στη συνέχεια αφήνεις την υπόλοιπη δουλειά σε ένα στατιστικό πακέτο. Στο output βλέπεις ότι p=0.02, δηλαδή η ποσοστιαία πιθανότητα να ισχυριστείς ότι υπάρχει διαφορά ενώ δεν υπάρχει είναι 2%, και αφού είναι κάτω από 5% γράφεις φαρδιά πλατιά στα συμπεράσματα της εργασίας σου “Υπάρχουν ενδείξεις ότι γυναίκες του ελληνικού κοινοβουλίου έχουν διαφορετικό δείκτη ευφυΐας από τους άντρες, όπως μετρήθηκε με το τεστ ευφυΐας των Marx & Spencer”. Συγχαρητήρια, γιατί αυτό είναι το μόνο που μπορείς συμπεράνεις από τη δειγματοληπτική σου έρευνα (έστω ότι το δείγμα σου ήταν αντιπροσωπευτικό – άλλη περίεργη υπόθεση αυτή).

- Αν δεν είχες καταλάβει ότι οι έλεγχοι υποθέσεων σου δίνουν μόνο ενδείξεις και όχι αποδείξεις για ένα αποτέλεσμα, θα έγραφες στα συμπεράσματα: “Οι γυναίκες του ελληνικού κοινοβουλίου είναι πιο έξυπνες από τους άντρες” ή “Η ευφυΐα των ελληνίδων βουλευτών είναι μεγαλύτερη από αυτή των αντρών”.

- Αν πάλι ήσουν δημοσιογράφος θα τιτλοφορούσες το άρθρο σου: “Η Βουλή είναι γυναικεία υπόθεση”, “Άντρες από κάτω: γιατί οι γυναίκες του κοινοβουλίου μας είναι πιο άξιες απ’ τους άντρες”, “Η επιστήμη επιβεβαιώνει τις επιλογές του Γιώργου” ή “Τρέμε Άδωνι”.

Περισσότερα: (για εις βάθος)

- Cohen, J. (1994). The earth is round (p < .05). American Psychologist, 49, 997-1003.

- Ioannidis, J.P. (2005). Why most published research findings are false. PLoS Med 2, e124

- Schervish, M.J. (1996). P values: What They Are and What They Are Not.” The American Statistician, Vol. 50, No. 3.

- Thompson, B. (2006). Foundations of univariate behavioral statistics. New York: Guilford.

- Γ. Μενεξές, Α. Οικονόμου (2002). Σφάλματα και παρανοήσεις στους στατιστικούς ελέγχους υποθέσεων. Υπέρβαση μέσω της Ανάλυσης Δεδομένων, Τετράδια Ανάλυσης Δεδομένων, τ.2.

Buzzdigmeblogspacedeliciousgoogle bookmarks

Popularity: 1% [?]

How to build an R package in Windows

Let’s suppose you ‘re in the mood to create an R package and then upload it to CRAN as an ideal way of making sure others have access to your work. I don’t know if the following guide will really help you cause the R package mechanism is rather complex, but I’m quite sure it’ll be better than nothing.

A. Toolbox (necessary pieces of software you have to install first)

0. Latest version of R.
1. rtools: a minimal set of Unix utilities
2. ActivePerl: a scripting language
3. MinGW: Compiler system, uses GCC to produce Windows programs
4. Microsoft’s HTML Compiler: It’s called htmlhelp.exe and includes hhc.exe
5. A version of TeX (I use MiKTeX)

B. Change your Windows Path “environmental variable”

To set the path, right click on the “My Computer” icon on your desktop. Choose properties and click on the “advanced” tab. Click the environmental variables button and you will see a new window. Change the system variable “Path”. To do so, click on the variable and select the edit button. Change the path so that the directories containing MikTeX, Rtools, minGW, perl, R and the html help compiler. You will need to be very careful to type the path names correctly. See below for an example of the beginning of the path as set on my machine:

C:\Perl\site\bin;C:\Perl\bin;C:\Program Files\R\R-2.10.1\bin;c:\Rtools\bin;c:\Rtools\MinGW\bin;c:\Perl\bin;C:\Program Files\MiKTeX 2.7\miktex\bin

Restart your machine.

C. Build your hello package (eventually)

- Open a “Command Prompt” window. Check if path is correct (type path).
- Run R through the command prompt (type R)
- Type package.skeleton("hello",code_="hello.r")
- Exit R (type q() )
(the hello directory was created and now you have to carefully edit the DESCRIPTION file which is under the hello directory and the hello.Rd file which is under the man directory, search for examples of these files in other package installations, you can find plenty of them in the lib directory, which is under your R installation directory)

- Back to the command prompt window, type R CMD build hello (hello.tar.gz was created)
- Type R CMD INSTALL --build hello (hello.zip was created)
- Type R CMD check hello for an extensive check of your package installation

In the unlikely event that everything went fine so far (no errors, no warnings) you just have to upload the hello.tar.gz file to ftp://cran.r-project.org/incoming/ and send an email to cran@r-project.org that you did it. Otherwise, google the bad news and hope for the best.

Other resources for building R packages:
[Making packages under Windows]
[Creating R packages: a tutorial]
[An introduction to the R package mechanism]
[Create packages for R]

Buzzdigmeblogspacedeliciousgoogle bookmarks

Popularity: 1% [?]

This work is licensed under a Creative Commons Attribution-Noncommercial-Share Alike 3.0 Unported License.
(c) 2010 amarkos|gr|blog | powered by WordPress with Barecity