Στατιστικά δοκιμής t μαθητή

Η δοκιμασία t του μαθητή, στα στατιστικά, μια μέθοδος δοκιμής υποθέσεων σχετικά με τον μέσο όρο ενός μικρού δείγματος που αντλείται από έναν κανονικά κατανεμημένο πληθυσμό όταν η τυπική απόκλιση του πληθυσμού είναι άγνωστη.

Το 1908, ο William Sealy Gosset, ένας Άγγλος εκδότης με το ψευδώνυμο Student, ανέπτυξε το t-test και τη διανομή t. Η κατανομή t είναι μια οικογένεια καμπυλών στις οποίες ο αριθμός των βαθμών ελευθερίας (ο αριθμός των ανεξάρτητων παρατηρήσεων στο δείγμα μείον μία) καθορίζει μια συγκεκριμένη καμπύλη. Καθώς αυξάνεται το μέγεθος του δείγματος (και συνεπώς οι βαθμοί ελευθερίας), η κατανομή t πλησιάζει το σχήμα καμπάνας της τυπικής κανονικής κατανομής. Στην πράξη, για δοκιμές που περιλαμβάνουν το μέσο όρο ενός δείγματος μεγέθους μεγαλύτερο από 30, συνήθως εφαρμόζεται η κανονική κατανομή.

Είναι συνηθισμένο πρώτα να διατυπώνεται μια μηδενική υπόθεση, η οποία δηλώνει ότι δεν υπάρχει αποτελεσματική διαφορά μεταξύ του παρατηρούμενου μέσου δείγματος και του υποθετικού ή δηλωμένου μέσου πληθυσμού - δηλαδή, ότι οποιαδήποτε μετρούμενη διαφορά οφείλεται μόνο στην τύχη. Σε μια γεωργική μελέτη, για παράδειγμα, η μηδενική υπόθεση θα μπορούσε να είναι ότι η εφαρμογή λιπάσματος δεν είχε καμία επίδραση στην απόδοση των καλλιεργειών και θα διεξαχθεί ένα πείραμα για να ελεγχθεί εάν έχει αυξήσει τη συγκομιδή. Σε γενικές γραμμές, μια δοκιμασία t μπορεί να είναι είτε δύο όψεων (επίσης ονομαζόμενη δίπλευρη), δηλώνοντας απλώς ότι τα μέσα δεν είναι ισοδύναμα, είτε μονόπλευρα, προσδιορίζοντας εάν ο παρατηρούμενος μέσος όρος είναι μεγαλύτερος ή μικρότερος από τον υποθετικό μέσο όρο. Στη συνέχεια υπολογίζεται το στατιστικό τεστ t. Εάν το παρατηρούμενο t-στατιστικό είναι πιο ακραίο από την κρίσιμη τιμή που καθορίζεται από την κατάλληλη κατανομή αναφοράς, η μηδενική υπόθεση απορρίπτεται. Η κατάλληλη κατανομή αναφοράς για το t-στατιστικό είναι η κατανομή t. Η κρίσιμη τιμή εξαρτάται από το επίπεδο σπουδαιότητας του τεστ (η πιθανότητα εσφαλμένης απόρριψης της μηδενικής υπόθεσης).

Για παράδειγμα, ας υποθέσουμε ότι ένας ερευνητής επιθυμεί να δοκιμάσει την υπόθεση ότι ένα δείγμα μεγέθους n = 25 με μέσο x = 79 και τυπική απόκλιση s = 10 σχεδιάστηκε τυχαία από έναν πληθυσμό με μέση μ = 75 και άγνωστη τυπική απόκλιση. Χρησιμοποιώντας τον τύπο για το t-στατιστικό, ο υπολογισμός t ισούται με 2. Για μια δοκιμή δύο όψεων σε κοινό επίπεδο σημασίας α = 0,05, οι κρίσιμες τιμές από την κατανομή t σε 24 μοίρες ελευθερίας είναι −2,064 και 2,064. Το υπολογιζόμενο t δεν υπερβαίνει αυτές τις τιμές, επομένως η μηδενική υπόθεση δεν μπορεί να απορριφθεί με 95% εμπιστοσύνη. (Το επίπεδο εμπιστοσύνης είναι 1 - α.)

Μια δεύτερη εφαρμογή της κατανομής t ελέγχει την υπόθεση ότι δύο ανεξάρτητα τυχαία δείγματα έχουν τον ίδιο μέσο όρο. Η κατανομή t μπορεί επίσης να χρησιμοποιηθεί για την κατασκευή διαστημάτων εμπιστοσύνης για τον πραγματικό μέσο όρο ενός πληθυσμού (την πρώτη εφαρμογή) ή για τη διαφορά μεταξύ δύο μέσων δείγματος (η δεύτερη εφαρμογή). Δείτε επίσης την εκτίμηση διαστήματος.