238όπου zα / 2 το α / 2 -άνω ποσοστιαίο σηµείο της τυποποιηµένης κανονικής N (0,1) , βλ.Πίνακα Β1. Το διάστηµα αυτό ισχύει προσεγγιστικά, οποιαδήποτε και αν είναι ηκατανοµή του δείγµατος.Απόδειξη. (α) Αφού X1, Χ 2 , ..., X v ~ N (µ, σ 2 ) έχουµε από το Θεώρηµα 2.2 ότι Τν−1 = ν(Χ − µ) ~ tv−1 . SΆρα P(−tv−1;α / 2 ≤ Tv−1 ≤ tv−1;α / 2 ) = 1 − α .Η παραπάνω ισότητα γράφεται ισοδύναµα P⎝⎜⎛⎜ − tv−1;α / 2 ≤ v(X − µ) ≤ tv−1;α / 2 ⎟⎟⎠⎞ = 1− α , S P⎝⎜⎜⎛ − S tv−1;α / 2 ≤ X − µ ≤ S t v −1; α / 2 ⎟⎠⎞⎟ = 1− α , v v P⎝⎜⎜⎛ − X − S tv−1;α / 2 ≤ −µ ≤ −X + S t v −1; α /2 ⎠⎟⎟⎞ = 1 − α , v v P⎝⎜⎛⎜ X − S tv−1;α / 2 ≤ µ ≤ X + S t v −1; α / 2 ⎟⎞⎠⎟ = 1− α . v v Η τελευταία σχέση µας λέει ότι η πιθανότητα να περιέχεται το (άγνωστο) µ στο ⎡ Χ − S tv−1;α / 2 , X + S tv−1;α / 2 ⎤ ⎣⎢ v v ⎦⎥είναι 1 − a , δηλαδή το ζητούµενο.(β) ∆ουλεύουµε οµοίως, µόνο που αντί της σχέσης P(−tv−1;α / 2 ≤ Tv−1 ≤ tv−1;α / 2 )χρησιµοποιούµε την προσεγγιστική σχέση P(−zα / 2 ≤ Zv ≤ zα / 2 ) ≈ 1 − α , όπουZv = v(X − µ) (βλ. Θεώρηµα 2.5 (α)) και zα / 2 το α / 2 -άνω ποσοστιαίο σηµείο Sτης τυποποιηµένης κανονικής N (0,1) .Παράδειγµα 3.1. Καλαθοσφαιριστής έχει πετύχει 80 βολές στις 100. Νακατασκευαστεί 95% δ.ε. για το άγνωστο ποσοστό p = P (επιτυχηµένης βολής τουκαλαθοσφαιριστή).
239 Εδώ X1, Χ 2 , ..., X v ~ b( p) όπου p άγνωστο. Άρα τα δεδοµένα δεν προέρχονταιαπό την κανονική, αφού X i = 0 ή 1 (αποτυχία ή επιτυχία). Είναι όµως v = 100(µεγάλο). Έτσι µπορούµε να εφαρµόσουµε το Θεώρηµα 3.1 (β). Για το σκοπό αυτό υπολογίζουµε τις ποσότητες X και S 2 ως εξής: ∑ ∑X= 1 v Xi = 1 100 Xi = 80 = 0.8 , v i=1 100 i=1 100 1 v X )2 1 ⎝⎜⎛⎜ v ⎟⎟⎞⎠ v −1 − i=1 (Xi i=1 ∑ ∑S 2= − = X 2 − vX 2 i v 1 (επειδή Xi = X 2 ) ∑= 1 ⎝⎛⎜⎜ v Xi − vX 2 ⎟⎞⎟⎠ i − i=1 v 1 v ( )= v 1 vX − vX 2) −1 (επειδή ∑ X i = vX ) i=1 = v v X (1 − X ) −1 = 100 ⋅ (0.8) ⋅ (0.2) = 0.16162 99και συνεπώς, S = S 2 = 0.16162 = 0.402 . Εδώ θέλουµε 95% δ.ε., άρα α = 0.05(έτσι ώστε 1− α = 0.95) και α / 2 = 0.025 . Από τον Πίνακα Β1 της τυποποιηµένης κανονικής βρίσκουµε zα / 2 = z0.025 = 1.96 (αφού P(Z ≤ 1.96) = Φ(1.96) = 0.975)και συνεπώς Χ− S zα / 2 = 0.8 − 0.402 ⋅ (1.96) = 0.7212 v 100και X+ S zα / 2 = 0.8 + 0.402 (1.96) = 0.8788 . v 100Άρα, το διάστηµα [0.7212, 0.8788] = [72.12%, 87.88%]είναι ένα 95% (προσεγγιστικό) δ.ε. για το άγνωστο p του καλαθοσφαιριστή. Όπως θαλέγαµε απλούστερα, είµαστε κατά 95% βέβαιοι ότι το πραγµατικό ποσοστό p(άγνωστο φυσικά) βρίσκεται ανάµεσα στα δύο παραπάνω όρια.
240Παρατήρηση 3.1. Όπως γίνεται φανερό από το παραπάνω παράδειγµα, όταν τοτυχαίο δείγµα προέρχεται από την Bernoulli b( p) , τότε ∑S 2= 1 v − X )2 = v X (1 − X). v −1 v −1 (Xi i=1Η ποσότητα v για µεγάλο ν είναι κοντά στο 1 ⎜⎛ lim v v 1 = 1⎞⎟ , συνεπώς v −1 ⎝ − ⎠ v→∞S 2 ≈ X (1 − X ) και S ≈ X (1 − X ) . Έτσι, πολλές φορές για την b( p)χρησιµοποιείται το δ.ε. ⎡ X (1 − X ) , X + zα/2 X (1 − X ) ⎤ ⎢X − zα/2 v ⎥ ⎢⎣ v ⎦⎥που είναι περίπου ίσο µε αυτό που βρήκαµε στο Παράδειγµα 3.1. Εφαρµόζονταςαυτόν τον τύπο στα δεδοµένα του Παραδείγµατος 3.1 βρίσκουµε το δ.ε. [72.16%, 87.84%]που είναι σχεδόν ίδιο µε αυτό του παραδείγµατος.Παρατήρηση 3.2. Όταν X1, X 2 ,..., X v ~ N (µ, σ 2 ) µε σ 2 γνωστό, τότε προφανώς το100(1 − α)% δ.ε. για το µ είναι το ⎡ Χ − σ zα / 2 , Χ+ σ z α / 2 ⎤ . ⎣⎢ ν ν ⎥⎦Σηµειώνεται πάντως ότι η απαίτηση « σ 2 γνωστό» είναι συνήθως χωρίς πρακτικήσηµασία, και δεν θα πρέπει να χρησιµοποιείται στην ανάλυση πραγµατικώνδεδοµένων.Θεώρηµα 3.2. (∆ιάστηµα εµπιστοσύνης για το σ 2 από την κανονική) Έστω X1, X 2 ,..., X v ~ N (µ, σ 2 )µε µ και σ 2 άγνωστες παραµέτρους. Τότε ένα 100(1 − α)% δ.ε. για το σ 2 είναι το ⎡ (ν −1)S 2 , (ν −1)S 2 ⎤ , ⎢ χ ⎥ ⎣⎢ 2 χ 2 / 2 ⎦⎥ ν−1;α / 2 ν−1;1−αόπου χ 2 α είναι το α-άνω ποσοστιαίο σηµείο της χ 2 -κατανοµής µε n βαθµούς n;ελευθερίας (βλ. Πίνακα Β3), δηλ. αν Wn ~ χ 2 τότε P(Wn > χ 2 α ) = α. n n;
241Απόδειξη. Αφού (ν −1)S 2 ~ χ 2 (βλ. Θεώρηµα 2.1 (β)), έπεται ότι σ2 ν−1 P⎜⎛⎜⎝ χ 2 / 2 ≤ (v −1)S 2 ≤ χ 2 α / 2 ⎠⎞⎟⎟ = 1− α . ν−1;1−α σ2 ν−1;Λύνοντας τις παραπάνω ανισότητες ως προς σ 2 , έπεται η αποδεικτέα.Θεώρηµα 3.3. (∆ιάστηµα εµπιστοσύνης για το σ12 / σ 2 σε δύο ανεξάρτητα 2κανονικά δείγµατα) Θεωρούµε δύο ανεξάρτητα τυχαία δείγµατα Χ1, X 2 , ..., Χ ν ~ Ν (µ1, σ12 ) και Υ1,Y2 , ...,Υν2 ~ Ν ( µ2 , σ 2 ) 2όπου σ12 >0 και σ 2 > 0 . Ένα 100(1 − α)% δ.ε. για το πηλίκο σ12 / σ 2 είναι το 2 2 ⎡1 S12 , Fv2 −1,v1−1;α / 2 S12 ⎤ , ⎢ ⎥ ⎢⎣ Fv1 −1,v2 −1; α / 2 S 2 S 2 ⎥⎦ 2 2όπου Fn,m;α είναι το α-άνω ποσοστιαίο σηµείο της Fn,m κατανοµής (βλ. Πίνακα Β4),δηλαδή αν Wn,m ~ Fn,m , τότε P(Wn,m > Fn,m;a ) = α . Ας σηµειωθεί ότι ισχύει η σχέση 1 = Fm,n;1−α για κάθε α ∈ (0,1) και n, m = 1, 2,... , Fn,m ; αέτσι ώστε να µπορούµε να γράψουµε το παραπάνω διάστηµα και ως ⎡ S12 Fv2 −1,v1−1;1−α / 2 , S12 Fv2 −1,v1−1; α / 2 ⎤ . ⎢ ⎥ ⎣ S 2 S 2 ⎦ 2 2Απόδειξη. Από το Θεώρηµα 2.3, Wv1−1,v2 −1 = S12 / S 2 ~ Fv1−1,v2 −1 , 2 σ12 / σ 2 2που σηµαίνει ότι P(Fv1−1,v2 −1;1−α / 2 ≤ Wv1−1,v2 −1 ≤ Fv1−1,v2 −1;α / 2 ) = 1 − α .Αντικαθιστώντας στην παραπάνω σχέση την Wv1−1,v2 −1 = (S12 / S 2 ) (σ12 / σ 2 ) και 2 2λύνοντας ως προς σ12 / σ 2 , παίρνουµε τη σχέση 2 P⎜⎛⎝⎜ S12 / S 2 ≤ σ12 ≤ S12 / S 2 ⎟⎞ = 1− α Fv1−1,v2 2 2 ⎠⎟ −1; α / 2 σ 2 Fv1−1,v2 −1;1−α / 2 2
242και επειδή 1 = Fv2 −1,v1−1;α / 2 , έπεται το ζητούµενο. Fv1−1,v2 −1;1−α / 2Θεώρηµα 3.4. (∆ιάστηµα εµπιστοσύνης για το µ1 − µ2 σε δύο κανονικάανεξάρτητα δείγµατα µε ίσες αλλά άγνωστες διασπορές) Θεωρούµε τα ανεξάρτηταδείγµατα Χ1, Χ 2 , ..., Χ ν1 ~ N (µ1, σ 2 ) και Υ1,Υ2 ,...,Υν2 ~ N (µ2 , σ 2 )(σ 2 κοινή αλλά άγνωστη). Τότε, ένα 100(1 − α)% δ.ε. για τη διαφορά µ1 − µ2 είναιτο ⎡⎢( Χ − Υ ) − S p 1 + 1 tv1+v2 −2;α / 2 , (X −Y)+ Sp 1 + 1 t v1 +v2 −2; α / 2 ⎤ ⎣ v1 v2 v1 v2 ⎥ ⎦όπου ( )S p = 1 v1 + v2 −2 (v1 − 1)S12 + (v2 − 2) S 2 . 2Απόδειξη. Από το Θεώρηµα 2.4, (X − Y ) − (µ1 − µ2 ) ~ tv1+v2 −2 Sp 11 v1 + v2και συνεπώς ⎜⎛ ⎟⎞ P⎜⎜ − tv1+v2 −2;α / 2 (X − Y ) − (µ1 − µ2 ) ⎟ ⎜ ≤ ≤ t v1 + v2 ⎟ = 1− α . ⎜⎝ 1 1 −2;α / 2 v1 v2 Sp + ⎟ ⎟⎠Λύνοντας τις παραπάνω ανισότητες ως προς µ1 − µ2 , συνάγεται το ζητούµενο.Παρατήρηση 3.3. Το παραπάνω διάστηµα για το µ1 − µ2 µπορεί να εφαρµοστείµόνο όταν υποθέτουµε ότι τα ανεξάρτητα δείγµατα προέρχονται από την κανονικήκαι ότι έχουν ίδια διασπορά. Σε κάθε άλλη περίπτωση, είναι αρκετά επικίνδυνο ναεφαρµόζεται και µπορεί να εξάγει εσφαλµένα συµπεράσµατα.Παράδειγµα 3.2. Τα παρακάτω δεδοµένα παριστάνουν τις βαθµολογίες 9 µαθητώνΛυκείου σε ένα test µαθηµατικών: 3, 8, 4, 11, 8, 6, 9, 10, 5.Επίσης, στο ίδιο test τα αποτελέσµατα 6 µαθητριών ήταν
243 16, 13, 20, 16, 15, 13. Να βρεθεί διάστηµα εµπιστοσύνης συντελεστού εµπιστοσύνης 95% για τηδιαφορά µ1 − µ2 του µέσου βαθµού στους πληθυσµούς µαθητών και µαθητριών. Εδώ υποθέτουµε ότι τα δεδοµένα προέρχονται από κανονικήκατανοµή, Ν (µ1, σ 2 ) και Ν (µ2 , σ 2 ) για τους µαθητές, µαθήτριες αντίστοιχα (αςσηµειωθεί ότι αυτό δεν ισχύει επειδή οι βαθµοί παίρνουν ακέραιες τιµές – σε µίαπρώτη προσέγγιση όµως µπορούµε να το χρησιµοποιήσουµε). Επίσης υποθέτουµεκοινή διασπορά. Τότε ν1 = 9 , ν2 = 6 και Χ = 7.11, S12 = 7.67 , Y = 15.5 , S 2 = 6.7 . 2Άρα ( )S p = 1 2 v1 + v2 −2 (v1 − 1)S12 + (v2 − 1)S 2 = 1 (8 ⋅ (7.67) + 5 ⋅ (6.7)) 13 = 2.7 ,και (βλ. Πίνακα Β2) tv1+v2 −2;α / 2 = t13;0.025 = 2.16 .Άρα το 95% δ.ε. για το µ1 − µ2 είναι ⎢⎡( Χ − Υ ) − S p 1 + 1 tv1+v2 −2;α / 2 , (X −Y)+ Sp 1 + 1 t v1 +v2 −2 ; α / 2 ⎤ ⎣ v1 v2 v1 v2 ⎥ ⎦ = [−8.39 − 3.07, − 8.39 + 3.07] = [−11.46, − 5.32]. Συµπεραίνουµε ότι (αν οι υποθέσεις κανονικότητας, ίσων διασπορών κ.λπ. είναισωστές) µε πιθανότητα 95% η διαφορά µ1 − µ2 περιέχεται στο [−11.46, − 5.32] .Φυσικά, αυτό είναι ισοδύναµο µε το ότι η διαφορά µ2 − µ1 περιέχεται στο[5.32, 11.46] µε πιθανότητα 95%.Παρατήρηση 3.4. Αν θεωρήσουµε δύο ανεξάρτητα κανονικά δείγµατα µε γνωστέςδιασπορές σ12 >0 και σ 2 > 0 , αντίστοιχα, δηλ. 2 Χ1, X 2 , ..., Χ ν ~ Ν (µ1, σ12 ) και Υ1,Y2 , ...,Υν2 ~ Ν ( µ2 , σ 2 ) , 2
244τότε η τ.µ. Ζ = ( X − Y ) − (µ1 − µ2 ) ~ Ν (0,1) σ12 σ 2 v1 + 2 v2(βλ. (2.5)). Συνεπώς, αντικαθιστώντας την τ.µ. Ζ στη σχέση P(−zα /2 ≤ Z ≤ zα /2 ) = 1− ακαι λύνοντας ως προς µ1 − µ2 , προκύπτει το 100(1 − α)% δ.ε. για το µ1 − µ2 : ⎡ σ12 + σ 2 zα / 2 , (Χ −Υ)+ σ12 + σ 2 ⎤ ⎢(Χ − Υ ) − ν1 2 ν1 2 zα/2 ⎥ . ⎢⎣ ν2 ν2 ⎦⎥Για το διάστηµα αυτό απαιτείται εκτός από την κανονικότητα, τα σ12 και σ 2 να είναι 2γνωστά, πράγµα που δεν συµβαίνει στην πράξη (πρβλ. Παρατήρηση 3.2).Θεώρηµα 3.5. (∆ιάστηµα εµπιστοσύνης για το µ1 − µ2 σε δύο ανεξάρτηταδείγµατα µεγάλου µεγέθους) Θεωρούµε τα ανεξάρτητα δείγµατα Χ1, Χ 2 , ..., Χ ν1 και Υ1,Υ2 , ...,Υν2προερχόµενα από οποιεσδήποτε κατανοµές F1 και F2 µε µέσους µ1, µ2 καιδιασπορές σ12 , σ 2 >0 αντίστοιχα. Υποθέτουµε ότι τα v1, v2 είναι µεγάλα (θεωρητικά 2v1, v2 → ∞ , στην πράξη v1, v2 ≥ 30) . Τότε ένα προσεγγιστικό δ.ε. για το µ1 − µ2 µε σ.ε. 100(1 − α)% είναι το ⎡ S12 S 2 , S12 S 2 ⎤ ⎢( Χ −Υ ) zα / 2 v1 2 (X − Y ) + zα/2 v1 2 ⎥ ⎣⎢ − + + ⎦⎥ v2 v2όπου zα / 2 είναι το α / 2 -άνω ποσοστιαίο σηµείο της τυποποιηµένης κανονικής.Απόδειξη. Από το Θεώρηµα 2.5, Z v1,v2 = (X − Y ) − (µ1 − µ2 ) → N (0,1) , καθώς v1, v2 → ∞ . S12 + S 2 v1 2 v2Άρα, για µεγάλα v1 και v2 , P(−zα / 2 ≤ Z v1,v2 ≤ zα / 2 ) ≈ 1 − α .
245Αντικαθιστώντας στην παραπάνω σχέση την τ.µ. Zv1,v2 και λύνοντας ως προςµ1 − µ2 , προκύπτει το ζητούµενο.Παράδειγµα 3.3. Ένας καλαθοσφαιριστής ευστόχησε σε 80 βολές από τις 100, ενώένας δεύτερος ευστόχησε σε 140 από τις 200. Αν p1 και p2 είναι τα αντίστοιχα(άγνωστα) ποσοστά, να βρεθεί 95% δ.ε. για τη διαφορά p1 − p2 . Εδώ X1, X 2 , ..., X v1 ~ b( p1) και Y1,Y2 , ...,Yv2 ~ b( p2 ) όπου v1 = 100 , v2 = 200και άρα ούτε κανονικότητα έχουµε, ούτε ίσες διασπορές (είναι σ12 = p1(1 − p1) ενώσ 2 = p2 (1 − p2 ) ). Όµως τα δειγµατικά µεγέθη v1, v2 είναι µεγάλα, και έτσι 2µπορούµε να εφαρµόσουµε το Θεώρηµα 3.5. Βρίσκουµε ∑X = 1 v1 Xi = 80 = 0.8 και S12 = v1 X (1 − X) = 0.16162 . v1 i=1 100 v1 − 1Οµοίως, Y = 140 = 0.7 , S 2 = v2 1 Y (1 − Y ) = 0.2111 200 2 v2 −(αυτοί οι απλοί τύποι για τα S12 και S 2 ισχύουν στην Bernoulli, βλ. Παρατήρηση 23.1). Έτσι, αφού zα / 2 = z0.025 =1.96 , έχουµε το προσεγγιστικό 95% δ.ε. για τοp1 − p2 (διότι εδώ µ1 = p1 , µ2 = p2 ) ⎡ S12 S 2 zα / 2 , (X −Y)+ S12 S 2 zα ⎤ ⎢(X − Y ) − v1 2 v1 2 ⎥ ⎣⎢ + + / 2 ⎦⎥ v2 v2 = [0.1 − 0.1197, 0.1 + 0.1197] = [−0.0197, 0.2197] = [−1.97%, 21.97%] .Άρα, είµαστε κατά 95% βέβαιοι ότι η διαφορά p1 − p2 των ποσοστών ευστοχίας τωνκαλαθοσφαιριστών είναι από − 2% έως 22% περίπου.ΑΣΚΗΣΕΙΣ ΚΕΦ. 9 1. Η µέτρηση του ύψους, σε ένα δείγµα 20 ατόµων από έναν πληθυσµό έδωσε ταπαρακάτω αποτελέσµατα σε εκατοστά: 173, 166, 168, 166, 169, 166, 173, 170, 170, 173 166, 161, 166, 170, 168, 158, 173, 166, 165, 165.
246 (α) Αν είναι γνωστό ότι τα ύψη ακολουθούν κανονική κατανοµή N (µ, σ 2 ) µετυπική απόκλιση σ = 5 εκατοστά, να κατασκευαστεί ένα 95% διάστηµαεµπιστοσύνης για το µέσο ύψος µ του πληθυσµού. (β) Να απαντήσετε στο ερώτηµα (α) αν είναι γνωστό ότι τα ύψη ακολουθούνκανονική κατανοµή µε άγνωστη διασπορά σ 2 > 0 . 2. Για να εκτιµηθεί η µέση βαθµολογία των φοιτητών στις εξετάσεις κάποιουµαθήµατος, παίρνουµε ένα δείγµα 16 φοιτητών και καταγράφουµε τη βαθµολογίατους: 10, 3, 5, 4, 7, 8, 9, 9, 8, 5, 5, 8, 6, 6, 9, 10.Να εκτιµηθεί το µ (i) σηµειακά, (ii) µε διάστηµα εµπιστοσύνης συντελεστούεµπιστοσύνης 90%. Υποθέστε ότι η βαθµολογία στις εξετάσεις ακολουθεί κανονικήκατανοµή: (α) N (µ,4) , (δηλ. σ 2 = 4 , γνωστό) και (β) Ν (µ, σ 2 ) , σ 2 άγνωστο. 3. Κάθε χρόνο οι φοιτήτριες που τελειώνουν το Α΄ έτος σπουδών υποβάλλονται σ’ένα έλεγχο φυσικής κατάστασης και βαθµολογούνται. Τα προηγούµενα χρόνια οµέσος όρος βαθµολογίας ήταν 180. Από την αρχή της φετινής χρονιάς εφαρµόστηκεένα πρόγραµµα βελτίωσης της φυσικής κατάστασης. Στο τέλος του χρόνουεπιλέχτηκαν 50 από αυτές, βαθµολογήθηκαν µετά από έλεγχο και έδωσαν µέσο όρο190 βαθµών µε τυπική απόκλιση 35.2. Να κατασκευάσετε ένα 99% δ.ε. για τη µέσηβαθµολογία των φοιτητριών που προετοιµάστηκαν µε το νέο πρόγραµµα βελτίωσης. 4. Ένα τυχαίο δείγµα από 10 µαθητές και ένα τυχαίο δείγµα από 10 µαθήτριεςέδωσαν µέσο ύψος αντίστοιχα 152 και 149 εκατοστά. (i) Να εκτιµηθεί η διαφορά των µέσων τιµών των πληθυσµών των µαθητών καιµαθητριών. (ii) Να κατασκευαστεί το 95% διάστηµα εµπιστοσύνης της διαφοράς των µέσωντιµών των πληθυσµών αυτών. Υποθέστε: (α) ότι το ύψος του πληθυσµού των µαθητών ακολουθεί κανονικήκατανοµή µε διασπορά 25 ενώ το ύψος των µαθητριών κανονική κατανοµή µεδιασπορά 49. (β) Τα ύψη των µαθητών και µαθητριών προέρχονται από κανονικές κατανοµές µεάγνωστες αλλά ίσες διασπορές, ενώ οι δειγµατικές διασπορές των υψών των 10µαθητών και µαθητριών είναι αντίστοιχα 20 και 30.
247 5. Ένας ερευνητής επιθυµεί να εκτιµήσει το µέσο βάρος των νεογέννητων αγοριώνσε κάποιο µαιευτήριο. Πόσα νεογέννητα αγόρια πρέπει να ζυγίσει, ώστε νακατασκευάσει ένα δ.ε. για το µέσο βάρος συντελεστού εµπιστοσύνης 99% και µεπλάτος το πολύ 1 κιλό, όταν γνωρίζει ότι η τυπική απόκλιση είναι 1 κιλό; 6. Πόσους φοιτητές του Βιολογικού Τµήµατος πρέπει να ρωτήσουµε για το βαθµότους στα Βιοµαθηµατικά ώστε να κατασκευάσουµε ένα δ.ε. συντελεστούεµπιστοσύνης 99% για το µέσο βαθµό τους µε απόλυτο σφάλµα εκτίµησης το πολύ1/2, όταν η τυπική απόκλιση είναι 3; 7. Ο πληθυσµός των τιµών της πιέσεως του αίµατος 25-χρονων ανδρών έχει µέσητιµή µ και τυπική απόκλιση 15. Ένα τυχαίο δείγµα 100 φαινοµενικά κανονικών 25-χρονων ανδρών έδωσε µέση τιµή 125. Να βρεθούν (i) ένα δ.ε. συντελεστού εµπιστοσύνης 90% για το µ, και (ii) ένα δ.ε. συντελεστού εµπιστοσύνης 95% για το µ. 8. Ένα τυχαίο δείγµα 10 δωδεκάχρονων κοριτσιών και ένα τυχαίο δείγµα 10δωδεκάχρονων αγοριών έδωσαν µέσες τιµές υψών 149.5 cm και 146.25 cmαντίστοιχα. Εάν οι τιµές των υψών ακολουθούν κανονικές κατανοµές µε µέσες τιµέςµ1 και µ2 και τυπικές αποκλίσεις 2cm και 3cm αντίστοιχα, να βρεθούν διαστήµαταεµπιστοσύνης για τη διαφορά µ1 − µ2 ( i) µε συντελεστή εµπιστοσύνης 90% (ii) µε συντελεστή εµπιστοσύνης 95%, και (iii) µε συντελεστή εµπιστοσύνης 99%. 9. ∆ηµοσκόπηση σε µία συγκεκριµένη αστική περιοχή αποκάλυψε ότι από τα 180ερωτηθέντα νοικοκυριά στο 87% των περιπτώσεων τουλάχιστον ένα από τα µέλη τωννοικοκυριών έχει κάποιο είδος ασφάλειας ζωής. Να βρεθούν διαστήµαταεµπιστοσύνης για το πληθυσµιακό ποσοστό των νοικοκυριών που κάποιο από ταµέλη τους έχει ασφάλεια ζωής. (i) µε συντελεστή εµπιστοσύνης 90% (ii) µε συντελεστή εµπιστοσύνης 95%, και (iii) µε συντελεστή εµπιστοσύνης 99%. 10. Σε δηµοσκόπηση που έγινε σε δύο τοµείς µιας µεγάλης πόλης παρατηρήθηκαντα επόµενα αποτελέσµατα σχετικά µε την κανονικότητα της πιέσεως του αίµατος:
248 Τοµέας Αριθµός ατόµων Αριθµός ατόµων µε που ερωτήθηκαν κάποια ανωµαλία 1 2 300 25 350 42Να βρεθούν δ.ε. για τη διαφορά p1 − p2 των πληθυσµιακών ποσοστών (i) µε συντελεστή εµπιστοσύνης 90% (ii) µε συντελεστή εµπιστοσύνης 95%, και(iii) µε συντελεστή εµπιστοσύνης 99%. 11. Ένα τυχαίο δείγµα 18 δεκάχρονων κοριτσιών έδωσε µέσο βάρος 34,5 κιλάκαι τυπική απόκλιση 4 κιλά. Εάν οι τιµές του βάρους ακολουθούν την κανονικήκατανοµή N (µ, σ 2 ) , να βρεθούν δ.ε. για το µ µε συντελεστή εµπιστοσύνης 90%,95% και 99%. 12. Με τα δεδοµένα της ασκήσεως 11 να βρεθεί 95% δ.ε. για το σ 2 , καθώς καιγια το σ. 13. Σε τυχαίο δείγµα 20 εργαζοµένων, κατοίκων της Αθήνας, βρέθηκε ότι οχρόνος µετάβασης (σε λεπτά της ώρας) στον χώρο εργασίας τους ήταν (για την 18η∆εκεµβρίου 2002): Λεπτά Συχνότητα Λεπτά Συχνότητα 00-10 1 50-60 2 10-20 2 60-70 2 20-30 3 70-80 2 30-40 4 80-90 1 40-50 2 90-100 1 (α) Να υπολογιστεί ο δειγµατικός µέσος και η δειγµατική διασπορά από ταπαραπάνω (οµαδοποιηµένα) δεδοµένα. (β) Αν υποθέσουµε ότι ο χρόνος µετάβασης ενός εργαζόµενου, κατοίκου τηςΑθήνας, στην εργασία του ακολουθεί κανονική κατανοµή, να κατασκευαστείδιάστηµα εµπιστοσύνης συντελεστού εµπιστοσύνης 90% για το µέσο χρόνοµετάβασης. 14. Τυχαίο δείγµα 200 µαθητών χωρίστηκε τυχαία σε δύο οµάδες O1 και O2 των120 και 80 ατόµων αντίστοιχα. Στη συνέχεια όλοι οι µαθητές διδάχτηκαν κοινή ύλη,µόνο που στην οµάδα O1 εφαρµόστηκε η διδακτική µέθοδος Α ενώ στην O2εφαρµόστηκε η διδακτική µέθοδος Β. Μετά το τέλος της διδασκαλίας και τη
249διεξαγωγή εξετάσεων σε κοινά θέµατα, οι µαθητές της O1 έλαβαν βαθµούς επίδοσηςX1, X 2 ,..., X120 , ενώ αυτοί της O2 έλαβαν βαθµούς Y1,Y2 ,...,Y80 . Από την επεξεργασία των βαθµών µέσω ηλεκτρονικού υπολογιστή προέκυψε ότι: 120 120 2 ∑X i 6025.2 ∑ X i = 840 , = i=1 i=1και οµοίως, 80 80 2 4580 . j ∑Y j = 600 , ∑Y = j =1 j =1(α) Να υπολογιστούν οι δειγµατικοί µέσοι X ,Y καθώς και οι δειγµατικέςτυπικές αποκλίσεις S1 , S2 των δύο δειγµάτων. (β) Έστω µ1 και µ2 οι θεωρητικοί µέσοι των δύο µεθόδων. Να κατασκευαστείένα 95% δ.ε. για το µ1 , για το µ2 και για τη διαφορά µ1 − µ2 . (γ) Τι ποσοστό (περίπου) των µαθητών που διδάσκονται σύµφωνα µε την Αµέθοδο θα πάρει βαθµό µεταξύ 7 και 9; Ποιο είναι το αντίστοιχο ποσοστό για τηνµέθοδο Β; 15. Η ποσότητα οινοπνεύµατος στο αίµα (σε mg/lt) 120 τυχαία επιλεγµένωνοδηγών µιας πόλης Χ και 80 τυχαία επιλεγµένων οδηγών µιας πόλης Υ βρέθηκε:X1, X 2 ,..., X120 και Y1,Y2 ,...,Y80 . Μετά από επεξεργασία των δεδοµένων προέκυψεότι 120 120 2 ∑X i 300 ∑ X i = 120 , = i=1 i=1και οµοίως, 80 80 2 ∑Y j 600 . ∑Y j = 100 , = j =1 j =1(α) Να υπολογιστούν οι δειγµατικοί µέσοι X ,Y καθώς και οι δειγµατικέςτυπικές αποκλίσεις S1 , S2 των δύο δειγµάτων. (β) Έστω µ1 και µ2 οι θεωρητικοί µέσοι στις δύο πόλεις. Να κατασκευαστεί ένα95% δ.ε. για το µ1 , για το µ2 και για τη διαφορά µ1 − µ2 .16. ∆ύο ανεξάρτητα τυχαία δείγµατα X1, X 2 ,..., X 8 και Y1,Y2 ,...,Y5 µε κανονικέςκατανοµές N (µ1, σ12 ) και Ν ( µ2 , σ 2 ) , αντίστοιχα, έδωσαν 2 8 8 2 ∑X i = 1194 ∑ X i = 96 , i=1 i=1και οµοίως,
250 5 5 2 ∑Y j 504 . ∑Y j = 50 , = j =1 j =1 (α) Να κατασκευαστεί 95% δ.ε. για τη διαφορά µ1 − µ2 . (β) Να κατασκευαστεί 95% δ.ε. για το πηλίκο σ12 / σ 2 και 2 (γ) Να κατασκευαστούν 95% δ.ε. για το µ1 και για το σ2 . 17. Μετά από µία διαφηµιστική καµπάνια ρωτήθηκαν 150 καπνιστές καιβρέθηκαν 20 να καπνίζουν τα τσιγάρα µάρκας Α. Να βρεθεί 95% διάστηµαεµπιστοσύνης για το ποσοστό των καπνιστών που καπνίζουν τα τσιγάρα µάρκας Α. 18. Σε µία επιδηµία γρίπης, 140 παιδιά από µία τάξη 380 παιδιών, αρρώστησαν. (i) Να βρεθεί 95% δ.ε. για το ποσοστό των παιδιών που προσβάλλει η γρίπη. (ii) Να βρεθεί 95% δ.ε. αν είχαν αρρωστήσει 70 παιδιά, σε µία τάξη 190παιδιών. 19. Σε 9 παρατηρήσεις X1, X 2 ,...,X 9 σε ισάριθµους φοιτητές για τη διάρκεια 9∑µελέτης ενός προβλήµατος, βρήκαµε X = 35.22 (ώρες), ( X i − X )2 = 195.59 . Nα i=1βρεθεί 95% δ.ε. για το µ (υποθέτουµε ότι τα δεδοµένα ακολουθούν κανονικήκατανοµή Ν (µ, σ 2 ) ). 20. Μετρήσεις του ύψους ατόµων δύο διαφορετικών κρατών έδωσαν ταπαρακάτω αποτελέσµατα: v1 = 130 , X = 173 cm S1 = 9 cm v2 = 250 , Y = 170 cm S2 = 8 cm.Βρείτε 90% διάστηµα εµπιστοσύνης για τη διαφορά µ1 − µ2 . 21. Έγινε η εξής ερώτηση σε 800 φοιτητές: «Αγοράσατε τουλάχιστον έναζευγάρι παπούτσια στο χρονικό διάστηµα µεταξύ των µηνών Σεπτεµβρίου καιΙουνίου;» Ο αριθµός των θετικών απαντήσεων ήταν 100. (α) Βρείτε 95% διάστηµα εµπιστοσύνης για το ποσοστό των φοιτητών πουαγόρασαν τουλάχιστον ένα ζευγάρι παπούτσια, το παραπάνω χρονικό διάστηµα(a = 0.05) . (β) Υποθέτουµε ότι στους φοιτητές, παράλληλα µε την προηγούµενη ερώτηση,ερωτήθηκε και η τιµή κάθε ζευγαριού παπουτσιών που αγόρασαν. Βρέθηκε ότι
251X = 37.21 Ευρώ και S = 11.32 Ευρώ. Βρείτε 95% διάστηµα εµπιστοσύνης για τηνµέση τιµή αγοράς παπουτσιών από όλους τους φοιτητές. 22. Συγκεντρώνονται δείγµατα βράχων από µία γεωλογική περιοχή καιεξετάζεται η περιεκτικότητά τους σε cadmium. Ύστερα από την ανάλυση 25 τέτοιωνδειγµάτων βράχων, βρήκαµε τη µέση τιµή και τη διασπορά 10.2 και 3.1 αντίστοιχα.Βρείτε ένα 99% διάστηµα εµπιστοσύνης για την πραγµατική µέση τιµή και τηδιασπορά της περιεκτικότητας σε cadmium της γεωλογικής περιοχής, υποθέτονταςότι οι µετρήσεις προέρχονται από κανονική κατανοµή. 23. Μετρήθηκε η διάρκεια ζωής σε ένα τυχαίο δείγµα από 10 µπαταρίες καιέδωσε τυπική απόκλιση S = 7 ώρες. Να βρεθεί 95% δ.ε. για την τυπική απόκλιση στου πληθυσµού, υποθέτοντας ότι τα δεδοµένα προέρχονται από κανονική κατανοµή. 24. Σ’ ένα παιχνίδι baseball, ένας παίκτης έκανε συνολικά 233 βολές, απ’ τιςοποίες οι 84 ήταν επιτυχηµένες. Ένας άλλος, πέτυχε στις 103 από τις 350 βολές.Βρείτε ένα 99% διάστηµα εµπιστοσύνης για τη διαφορά των πιθανοτήτωνεπιτυχηµένης βολής ανάµεσα στους δύο παίκτες.
ΚΕΦΑΛΑΙΟ 10ΕΛΕΓΧΟΙ ΣΤΑΤΙΣΤΙΚΩΝ ΥΠΟΘΕΣΕΩΝ1. ΓΕΝΙΚΑ ΠΕΡΙ ΕΛΕΓΧΩΝ Ένα από τα σηµαντικότερα ερωτήµατα, στο οποίο καλείται να απαντήσει οεφαρµοσµένος επιστήµονας είναι αυτό της λήψης απόφασης σε κάποιο επιστηµονικόπρόβληµα. Φυσικά, όπως και στην καθηµερινή ζωή, η λήψη της τελικής απόφασης σεκάποιο πρόβληµα µπορεί να είναι λανθασµένη και, συνήθως, αυτό αποδεικνύεταιπολύ αργότερα. Εντούτοις, ακόµα και σε αυτή την περίπτωση εσφαλµένης απόφασης, οεφαρµοσµένος ερευνητής θα πρέπει να είναι σε θέση να υπολογίσει την πιθανότητασφάλµατος. Το κατάλληλο θεωρητικό υπέδαφος γι αυτού του είδους τα προβλήµαταπροσφέρεται από τη Στατιστική, και συγκεκριµένα τον κλάδο εκείνο της Στατιστικήςπου καλείται «Έλεγχος Στατιστικών Υποθέσεων». Το επόµενο είναι ένα τυπικό παράδειγµα στο οποίο θα πρέπει να γίνειστατιστικός έλεγχος υπόθεσης.Παράδειγµα 1.1. Πριν τις εκλογές, ο Α, υποψήφιος δήµαρχος µιας µεγάλης πόλης,παρήγγειλε δηµοσκόπηση από την οποία προέκυπτε ότι, σε σύνολο 1000ερωτηθέντων, 600 άτοµα θα τον ψηφίσουν. Από το ποσοστό αυτό (60%) φαίνεται«λογικό» πως ο Α θα εκλεγεί από την πρώτη Κυριακή. Είναι αυτό σωστό; Πώς θαπρέπει να το ελέγξει η εταιρεία δηµοσκοπήσεων; Στο παράδειγµα αυτό (που είναι παρόµοιο µε το Παράδειγµα 1.1 του Κεφ. 9, µετη µόνη διαφορά ότι αντί για «εύστοχες βολές» εδώ έχουµε «θετικές ψήφους για τονυποψήφιο δήµαρχο»), θα πρέπει να ληφθεί κάποια απόφαση από τον ερευνητή( = εταιρεία δηµοσκοπήσεων), σχετικά µε το αν θα εκλεγεί ο Α ή όχι. Έχουµε λοιπόνδύο αντικρουόµενες απόψεις, που µπορούν να διατυπωθούν ως εξής:H 0 : Ο Α δεν θα εκλεγεί την πρώτη Κυριακή. (1.1)H1 : Ο Α θα εκλεγεί την πρώτη Κυριακή. Φυσικά, θα µπορούσε κάποιος να εναλλάξει τις υποθέσεις, πράγµα το οποίο δενείναι ισοδύναµο, όπως θα γίνει φανερό στη συνέχεια.
254 Στο παραπάνω παράδειγµα, όπως και σε όλους τους στατιστικούς ελέγχους, ηH0 ονοµάζεται µηδενική υπόθεση ενώ η H1 εναλλακτική υπόθεση. Στη διεθνή επιστηµονική πρακτική έχουν καθιερωθεί δύο βασικοί κανόνεςσύµφωνα µε τους οποίους καθορίζεται η H 0 (δηλ. η µηδενική – η εναλλακτική H1καθορίζεται αυτόµατα ως η άρνηση της H 0 ).Κανόνας 1ος. Τίθεται ως µηδενική η υπόθεση εκείνη της οποίας η εσφαλµένηαπόρριψη εγκυµονεί τους περισσότερους κινδύνους, καιΚανόνας 2ος (και απλούστερος). Ως µηδενική τίθεται εκείνη η υπόθεση που επιθυµείνα απορρίψει ο ερευνητής (ώστε να αποφασίσει υπέρ της H1 ). Φυσικά, και οι δύο κανόνες είναι εµπειρικοί και δεν µπορούν να αξιολογηθούνεπιστηµονικά – εναπόκεινται στην κρίση και την εµπειρία του ερευνητή. Υπάρχουνόµως περιπτώσεις, όπως στο Παράδειγµα 1.1, όπου είναι σαφές ότι ο Κανόνας 2οδηγεί στην συγκεκριµένη επιλογή µηδενικής, όπως ήδη έχει διατυπωθεί στην (1.1). Η γενική στρατηγική που ακολουθείται για τον έλεγχο της υπόθεσης H 0 έναντιτης εναλλακτικής της H1 (όπως στο Παράδειγµα 1.1) είναι η ακόλουθη:(1ο βήµα): Καθορίζεται η µηδενική υπόθεση H 0 (σύµφωνα µε τον Κανόνα 1 ή 2).(2ο βήµα): Καθορίζεται µία «µικρή» πιθανότητα α ∈ (0,1) (συνήθως α = 0.01 = 1% ή α = 0.05 = 5% ή α = 0.10 = 10% ή α = 0.001 = 0.1% ), η οποία είναι η µέγιστη αποδεκτή πιθανότητα εσφαλµένης απόρριψης της µηδενικής H 0 , και η οποία καλείται επίπεδο σηµαντικότητας του ελέγχου.(3ο βήµα): Λαµβάνεται ένα τυχαίο δείγµα X1, X 2 , ..., X v , το οποίο υποτίθεται ότι ακολουθεί τέτοια κατανοµή που να δικαιολογείται η H 0 και κατασκευάζεται κατάλληλη στατιστική συνάρτηση T = T ( X1, X 2 , ..., X v ) . Υπό την H 0 , η κατανοµή της Τ είναι συνήθως γνωστή.(4ο βήµα): Ανάλογα µε τη µορφή της H 0 , υπολογίζονται σταθερές c0 ή c1, c2 (που ονοµάζονται σταθερές αποκοπής) για τις οποίες P(T < c0 ) ≥ 1 − α , ή P(T > c0 ) ≥ 1 − α , ή P(c1 < T < c2 ) ≥ 1 − α .
255 Η µορφή της H 0 καθορίζει ποια από τις 3 παραπάνω περιπτώσεις πρέπει να χρησιµοποιηθεί.(5ο βήµα): Ανάλογα µε τη µορφή της Η 0 , απορρίπτουµε την Η 0 (και αποφασίζουµε υπέρ της Η1 ) όταν για την τιµή της Τ = Τ ( Χ1, X 2 , ..., Χ ν ) ισχύει: Τ ≥ c0 (στην πρώτη περίπτωση), T ≤ c0 (στην δεύτερη περίπτωση), ή T ≤ c1 ή T ≥ c2 (στην τρίτη περίπτωση). Για παράδειγµα, αν είµαστε στην πρώτη περίπτωση που P(T < c0 ) ≥ 1 − α , αυτόσηµαίνει ότι όταν ισχύει η Η 0 , η P(T ≥ c0 ) ≤ α , δηλαδή η σχέση T ≥ c0 ισχύει µόνοστο 100 ⋅ α% των περιπτώσεων που θα λάβουµε τυχαίο δείγµα (εφόσον ισχύει ηµηδενική). Αυτή λοιπόν την πιθανότητα τη θεωρούµε αρκετά µικρή, και έτσιαποφασίζουµε (µε ρίσκο το πολύ α) ότι δεν ισχύει η Η 0 . Φυσικά, µπορεί και νακάνουµε λάθος, αλλά το λάθος αυτό δεν θα συµβεί µε πιθανότητα µεγαλύτερη του α(ελεγχόµενο σφάλµα), που είναι το επίπεδο σηµαντικότητας του ελέγχου πουπραγµατοποιούµε. Αν π.χ. εκλέξουµε α = 0.05 = 5% , τότε η σταθερά αποκοπής θαικανοποιεί τη σχέση P(T < c0 ) ≥ 0.95 (όταν ισχύει η H 0 ), δηλαδή P(T ≥ c0 ) ≤ 0.05 .Άρα, το ενδεχόµενο T ≥ c0 έχει πιθανότητα το πολύ 5%. Αν τελικά η τιµή της Τξεπεράσει τη σταθερά αποκοπής c0 , τότε είµαστε βέβαιοι ότι ακριβώς ένα από ταπαρακάτω συνέβη:(i) είτε τα δεδοµένα µας δεν προέρχονται από την H 0 (δεν ισχύει η H 0 ), ή(ii) τα δεδοµένα µας προέρχονται από την H 0 , αλλά κατά τύχη (µάλλον, από ατυχία!) προέκυψε µία «σπάνια» τιµή της Τ (T ≥ c0 ) , η οποία συµβαίνει µε πιθανότητα το πολύ 5%. Έτσι, αποφασίζοντας για την απόρριψη της H 0 όταν T ≥ c0 , ή θα έχουµεαποφασίσει ορθά (περίπτωση (i)) ή θα έχουµε αποφασίσει εσφαλµένα (περίπτωση(ii)) επειδή είµαστε αρκετά «άτυχοι», ενδεχόµενο που δεν θα συµβεί σε περισσότερεςαπό 5% των περιπτώσεων. Είναι φανερό ότι υπάρχουν οι παρακάτω 4 δυνατές περιπτώσεις στη λήψη µιαςαπόφασης: Ισχύει η H 0 Ισχύει η H1Αποφασίζουµε υπέρ της H 0 Ορθή αποδοχή της H 0 Σφάλµα τύπου ΙΙ
256 Αποφασίζουµε υπέρ της H1 Σφάλµα τύπου Ι Ορθή απόρριψη της H 0 Όπως φαίνεται στον παραπάνω πίνακα, η εσφαλµένη απόρριψη της H 0ονοµάζεται Σφάλµα τύπου Ι, και εµείς ορίσαµε ως επίπεδο σηµαντικότητας (ε.σ.)του ελέγχου την πιθανότητά του, δηλ. P( Σφάλµατος τύπου Ι) = P( Εσφαλµένης απόρριψης της H 0 ) ≤ α .Φυσικά η απόφασή µας µπορεί να οδηγήσει και σε εσφαλµένη αποδοχή της Η 0 ,Σφάλµα τύπου ΙΙ, η πιθανότητα του οποίου συνήθως δεν µπορεί να ελεγχθεί. Έτσι,καταλήγουµε στον καθορισµό µίας µέγιστης τιµής (πιθανότητας) α που ρυθµίζει τησυµπεριφορά του Σφάλµατος τύπου Ι, και ονοµάζεται επίπεδο σηµαντικότητας(ε.σ.) του ελέγχου, ενώ ταυτόχρονα δεν ασχολούµαστε µε το Σφάλµα τύπου ΙΙ. Αυτό έχει την εξής συνέπεια:(α) Όταν απορρίπτουµε την H 0 , σε ε.σ. α, τότε είµαστε κατά τουλάχιστον 100(1 − α)% βέβαιοι ότι δεν ισχύει η Η 0 (ισοδύναµα, ισχύει η Η1) .(β) Όταν αποδεχόµαστε την Η 0 σε ε.σ. α, τότε απλώς δεν κατορθώσαµε να την απορρίψουµε, δηλ. δεν έχουµε επαρκή στοιχεία από τα δεδοµένα µας κατά της Η 0 . Με άλλα λόγια, τα δεδοµένα µας δεν οδηγούν σε συµπεράσµατα αντίθετα προς την Η 0 . ΄Οµως αυτό δεν σηµαίνει ότι ισχύει η Η 0 . Απλώς, δεν έχουµε ουσιώδη στοιχεία εναντίον της. Ακριβώς το ίδιο φαινόµενο παρατηρείται στις δικαστικές αίθουσες. Εκεί οιδικαστές θέτουν ως Η 0 την υπόθεση ότι ο κατηγορούµενος είναι αθώος, και ως Η1ότι ο κατηγορούµενος είναι ένοχος. Αν απορριφθεί η Η 0 (αυτό γίνεται πάντα µεεπαρκή στοιχεία), τότε λαµβάνεται καταδικαστική απόφαση. Αν, αντίθετα, δενυπάρχουν ουσιώδη και επαρκή στοιχεία που να τεκµηριώνουν την απόρριψη της Η 0 ,τότε λαµβάνεται αθωωτική απόφαση, χωρίς αυτό να σηµαίνει ότι υπάρχουν στοιχείαπου να συνηγορούν υπέρ της Η 0 . Απλώς, δεν υπάρχουν ουσιώδη καταδικαστικάεπιχειρήµατα (αθώωση λόγω αµφιβολιών). Το ίδιο συµβαίνει και στους στατιστικούςελέγχους: Αποδοχή της Η 0 δεν σηµαίνει ότι αποδείχθηκε κάτι. Απλώς, δεναποδείχθηκε το αντίθετό του.2. ΕΛΕΓΧΟΙ ΥΠΟΘΕΣΕΩΝ ΓΙΑ ΤΟΝ ΜΕΣΟ ΤΟΥ ΠΛΗΘΥΣΜΟΥ Η γενική θεωρία στατιστικών ελέγχων γίνεται κυρίως µε βάση την κανονικήκατανοµή. Αυτό συµβαίνει διότι, για µεγάλο µέγεθος δείγµατος ν (v → ∞) , η
257δειγµατική κατανοµή του τυποποιηµένου δειγµατικού µέσου προσεγγίζει τηντυποποιηµένη κανονική (Κ.Ο.Θ.). Έτσι, η εφαρµοσιµότητα των αποτελεσµάτων είναιαρκετά ευρεία, και η κανονική κατανοµή καλύπτει τις περισσότερες ενδιαφέρουσεςπεριπτώσεις.Θεώρηµα 2.1. (Έλεγχος για τον µέσο κανονικής µε γνωστή διασπορά) ΈστωX1, X 2 ,..., X v ένα τυχαίο δείγµα από την κανονική κατανοµή N (µ, σ 2 ) µε µ ∈ ·και σ 2 > 0 . Υποθέτουµε ότι το σ 2 είναι γνωστό (αυτό δεν είναι ρεαλιστικό, αλλάγίνεται µόνο για θεωρητικούς λόγους). Τότε:(α) Για τον έλεγχο της H 0 : µ ≤ µ0 έναντι της Η1 : µ > µ0σε ε.σ. α, (όπου µ0 γνωστή σταθερά), απορρίπτουµε την Η 0 όταν Χ ≥ µ0 + σ zα , νόπου zα το α-άνω ποσοστιαίο σηµείο της τυποποιηµένης κανονικής.(β) Για τον έλεγχο της Η 0 : µ ≥ µ0 έναντι της Η1 : µ < µ0 ,σε ε.σ. α, απορρίπτουµε την Η 0 όταν Χ ≤ µ0 − σ zα . ν(γ) Για τον (δίπλευρο) έλεγχο της H 0 : µ = µ0 έναντι της Η1 : µ ≠ µ0σε ε.σ. α, απορρίπτουµε την Η 0 όταν | Χ − µ0 |≥ σ zα / 2 , νδηλ. όταν Χ ≤ µ0 − σ zα / 2 ή Χ ≥ µ0 + σ zα/2 , ν νόπου zα / 2 το α / 2 -άνω ποσοστιαίο σηµείο της τυποποιηµένης κανονικής.Απόδειξη: (α) Εδώ το σ 2 είναι γνωστό, και άρα το σ = σ 2 > 0 είναι γνωστό. Αφού Ζ= ν ( Χ − µ) ~ Ν (0,1) , σ
258έχουµε ότι P(Z < zα ) = P⎜⎜⎝⎛ v(X − µ) < zα ⎟⎠⎟⎞ = 1− ακαι συνεπώς, σ P⎛⎜ X < µ + σ zα ⎟⎞ = 1− α . ⎝ ν ⎠Όµως, υπό την Η 0 , µ ≤ µ0 και άρα µ+ σ zα ≤ µ0 + σ zα που σηµαίνει ότι ν ν P⎜⎛⎜⎝ X < µ0 + σ zα ⎟⎠⎞⎟ ≥ P⎝⎛⎜⎜ X < µ + σ zα ⎠⎞⎟⎟ = 1− α , ν νδηλαδή P⎜⎝⎛⎜ X < µ0 + σ zα ⎟⎠⎟⎞ ≥ 1− α , νή ισοδύναµα, P⎜⎜⎛⎝ X ≥ µ0 + σ zα ⎟⎟⎞⎠ ≤ α. νΑπό την προηγούµενη σχέση βλέπουµε ότι για την T = X και τη σταθεράc0 = µ0 + σ zα (η σταθερά c0 µπορεί να υπολογιστεί αφού το µ0 δίδεται στην Η0, ντο σ είναι γνωστό και το zα υπολογίζεται από τον Πίνακα Β1 της τυποποιηµένηςκανονικής) ισχύει υπό την Η 0 ότι P(T ≥ c0 ) ≤ α .Άρα, το ενδεχόµενο Τ ≥ c0 , δηλ. το X ≥ µ0 + σ zα έχει το πολύ πιθανότητα α (υπό ντην Η 0 ), και συνεπώς απορρίπτουµε την Η 0 σε ε.σ. α όταν Χ ≥ µ0 + σ zα . ν(β) Αποδεικνύεται οµοίως, µε µόνη διαφορά ότι χρησιµοποιούµε τη σχέση P(Z > −zα ) = P⎜⎝⎜⎛ v(X − µ) > −zα ⎟⎠⎞⎟ = 1− α σπου συνεπάγεται την
259 P⎝⎛⎜⎜ X > µ− σ zα ⎟⎞⎟⎠ = 1− α νκαι επειδή µ ≥ µ0 υπό την Η 0 , P⎛⎜⎝⎜ X > µ0 − σ zα ⎞⎟⎠⎟ ≥ 1− α. ν(γ) Εδώ, όταν ισχύει η Η 0 , Ζ= ν ( Χ − µ0 ) ~ Ν (0,1) , σοπότε P(−zα / 2 < Ζ < zα / 2 ) = P(| Z |< zα / 2 ) = 1− α ,δηλαδή P⎜⎝⎛⎜ v | X− µ0 | < zα / 2 ⎟⎠⎟⎞ = P⎜⎜⎝⎛ | X − µ0 |< σ zα / 2 ⎟⎠⎞⎟ =1− α , σ νοπότε P⎜⎜⎝⎛| X − µ0 |≥ σ zα / 2 ⎞⎟⎟⎠ = α. νΣυνεπώς, απορρίπτουµε την Η 0 σε ε.σ. α όταν | Χ − µ0 |≥ σ zα/2 . νΠαρατήρηση 2.1. Αν και στην πράξη το σ 2 δεν είναι γνωστό, το προηγούµενοθεώρηµα παραδοσιακά περιλαµβάνεται στη στατιστική βιβλιογραφία, λόγω τηςαπλότητάς του. Σηµειώνεται ότι ακόµα και η υπόθεση κανονικότητας µπορεί να µηνισχύει, ή είναι δύσκολο να ελεγχθεί.Παρατήρηση 2.2. Οι έλεγχοι Η 0 : µ ≤ µ0 και Η 0 : µ ≥ µ0 ονοµάζονται µονόπλευροι,σε αντίθεση µε τον έλεγχο της H 0 : µ = µ0 ο οποίος ονοµάζεται δίπλευρος. Ηονοµασία «µονόπλευρος» για τον έλεγχο της Η 0 : µ ≤ µ0 π.χ., προέρχεται από τογεγονός ότι η εναλλακτική του Η1 : µ > µ0 απορρίπτεται όταν υπάρχουν σηµαντικέςενδείξεις, και οι ενδείξεις αυτές δικαιολογούνται για «µεγάλες τιµές» του Χ , δηλ.όταν Χ ≥ µ0 + σ zα . Έτσι, όταν ο Χ ανήκει στο χωρίο απόρριψης ν
260 R = ⎡ µ0 + σ zα ,+∞ ⎟⎠⎞⎟ , ⎢⎣ ντότε απορρίπτεται η H 0 : µ ≤ µ0 υπέρ της Η1 : µ > µ0 . Οµοίως, το χωρίο απόρριψηςστην δεύτερη περίπτωση που Η 0 : µ ≥ µ0 είναι το R = ⎜⎝⎛⎜ − ∞, µ0 − σ zα ⎤ , ν ⎥⎦και πάλι «µονόπλευρο». Όµως στην περίπτωση που έχουµε τον δίπλευρο έλεγχο τηςΗ 0 : µ = µ0 , το χωρίο απόρριψης είναι το R = ⎜⎜⎝⎛ − ∞, µ0 − σ z α / 2 ⎤ ∪ ⎡ µ0 + σ zα / 2 ,+∞⎠⎞⎟⎟ , ν ⎥⎦ ⎢⎣ νδηλ. απορρίπτεται η H 0 υπέρ της H1 : µ ≠ µ0 είτε για «πολύ µικρές» ή για «πολύµεγάλες» τιµές του Χ . Το χωρίο απόρριψης γενικά ονοµάζεται και κρίσιµη περιοχή.Θεώρηµα 2.2. (Έλεγχος για τον µέσο κανονικής µε άγνωστη διασπορά) ΈστωΧ1, Χ 2 ,..., Χ ν ~ Ν (µ, σ 2 ) όπως στο Θεώρηµα 2.1, µόνο που υποθέτουµε ότι ηδιασπορά σ 2 είναι άγνωστη. Τότε,(α) Για τον έλεγχο της H 0 : µ ≤ µ0 έναντι της Η1 : µ > µ0 σε ε.σ. α, απορρίπτουµε την H 0 όταν X ≥ µ0 + S t v −1; α , v όπου tv−1;α είναι το α-άνω ποσοστιαίο σηµείο της tv−1 , και ∑S = v 1 v (Xi − X )2 −1 i=1 η δειγµατική διασπορά.(β) Για τον έλεγχο της H 0 : µ ≥ µ0 έναντι της Η1 : µ < µ0 σε ε.σ. α, απορρίπτουµε την Η 0 όταν Χ ≤ µ0 − S t v −1;α . v
261(γ) Για τον (δίπλευρο) έλεγχο της Η 0 : µ = µ0 έναντι της Η1 : µ ≠ µ0σε ε.σ. α, απορρίπτουµε την Η 0 όταν | Χ − µ0 |≥ S tv−1;α / 2 , v όπου tv−1;α / 2 το α / 2 -άνω ποσοστιαίο σηµείο της tv−1 .Απόδειξη. (α) ∆ουλεύουµε όπως στην απόδειξη του Θεωρήµατος 2.1 (α), µόνο που η Tv−1 = v(X − µ) ~ tv−1 . S(β) Όµοια µε το (α).(γ) Όπως στην απόδειξη του Θεωρήµατος 2.1 (β), µε µόνη διαφορά ότι Tv−1 = v(X − µ0 ) ~ tv−1 Sυπό την H 0 .Θεώρηµα 2.3. (Έλεγχος για τον µέσο µ από οποιαδήποτε κατανοµή F, για µεγάλοµέγεθος δείγµατος ν) Έστω X1, X 2 ,..., X v ~ F (οποιαδήποτε) µε µέσο µ = Ε( Χ i )και διασπορά σ 2 = Var( X i ) > 0 . Υποθέτουµε ότι το µέγεθος δείγµατος ν είναι«µεγάλο» (θεωρητικά ν → ∞ , στην πράξη v ≥ 30) .(α) Για τον έλεγχο της H 0 : µ ≤ µ0 έναντι της Η1 : µ > µ0σε ε.σ. α, απορρίπτουµε την H 0 όταν X ≥ µ0 + S zα , v όπου S η δειγµατική τυπική απόκλιση και zα τα α-άνω ποσοστιαίο σηµείο της τυποποιηµένης κανονικής.(β) Για τον έλεγχο της H 0 : µ ≥ µ0 έναντι της Η1 : µ < µ0 σε ε.σ. α, απορρίπτουµε την Η 0 όταν
262 Χ ≤ µ0 − S zα . v(γ) Για τον (δίπλευρο) έλεγχο της Η 0 : µ = µ0 έναντι της Η1 : µ ≠ µ0 , σε ε.σ. α, απορρίπτουµε την Η 0 όταν | Χ − µ0 |≥ S zα/2 . vΑπόδειξη. Όπως στο Θεώρηµα 2.1, µε τη µόνη διαφορά ότι χρησιµοποιούµε τογεγονός ότι (βλ. Θεώρηµα 2.5 (α) του Κεφ. 9) Ζν = ν(Χ − µ) ~ N (0,1) Sκατά προσέγγιση, για v → ∞ , από το Κ.Ο.Θ. και τον νόµο των µεγάλων αριθµών, σεσυνδυασµό µε το Θεώρηµα Slutsky.Παρατήρηση 2.3. Οι έλεγχοι του Θεωρήµατος 2.3 είναι επιπέδου σηµαντικότητας ακατά προσέγγιση. Αυτό συµβαίνει διότι η κατανοµή της Zv = v ( X − µ) / S είναικατά προσέγγιση N (0,1) . Άρα, χρειάζεται κάποια προσοχή στην εφαρµογή του, καιοπωσδήποτε αρκετά µεγάλο ν (v ≥ 30) . Πάντως πρέπει να σηµειωθεί ότι το Θεώρηµα2.3 είναι το µόνο (για τον έλεγχο του µέσου) που µπορεί να εφαρµοστεί στην πράξηµε αρκετή ασφάλεια, αφού ούτε κανονικότητα υποτίθεται, ούτε γνωστή διασπορά. Μία σπουδαία εφαρµογή δίδεται στο παρακάτωΠόρισµα 3.1. (Έλεγχος για το άγνωστο ποσοστό p στην κατανοµή Bernoulli)Έστω X1, X 2 ,..., X v ~ b( p) , p άγνωστο, και ας υποθέσουµε ότι v ≥ 30 .(α) Για τον έλεγχο της H 0 : p ≤ p0 έναντι της Η1 : p > p0 σε ε.σ. α, απορρίπτουµε την H 0 όταν X ≥ p0 + X (1 − X ) zα , v(β) Για τον έλεγχο της H 0 : p ≥ p0 έναντι της Η1 : p < p0 σε ε.σ. α, απορρίπτουµε την Η 0 όταν
263Χ ≤ p0 − X (1 − X ) zα . v
263(γ) Για τον (δίπλευρο) έλεγχο της Η 0 : p = p0 έναντι της Η1 : p ≠ p0 , σε ε.σ. α, απορρίπτουµε την Η 0 όταν | Χ − p0 |≥ X (1 − X ) zα / 2 . vΑπόδειξη. Εδώ X i = 0 ή 1, και P( X i = 1) = p , P( Χ i = 0) = 1 − p . Επίσηςµ = Ε( X i ) = p . Άρα, η υπόθεση H 0 : p ≤ p0 είναι ισοδύναµη µε την H 0 : µ ≤ p0 , καισυνεπώς πρόκειται για έλεγχο που αφορά τον µέσο. Αν υπολογίσουµε τη δειγµατικήδιασπορά S 2 , βρίσκουµε (βλ. Παρατήρηση 3.1 του Κεφ. 9)=∑S 21 v − X )2 = v v 1 X (1 − X) ≈ X (1 − X) v −1 − (Xi i=1για µεγάλο ν. Αντικαθιστώντας το µ0 µε p0 και το S µε το X (1 − X ) στοΘεώρηµα 2.3, παίρνουµε το επιθυµητό αποτέλεσµα. Με βάση τα παραπάνω µπορούµε να δώσουµε µία επιστηµονικά τεκµηριωµένηαπάντηση για το Παράδειγµα 1.1.Παράδειγµα 2.1. (Συνέχεια του Παραδείγµατος 1.1). Έστω X i = 1 αν ο i -οστόςψηφοφόρος ψηφίζει τον Α και X i = 0 αν δεν τον ψηφίζει. Έστω p το ποσοστό που θαπάρει ο Α την πρώτη Κυριακή. Τότε οι υποθέσεις H 0 και H1 της (1.1) γράφονταιισοδύναµα H 0 : p ≤ 0.5 = p0 και H1 : p > 0.5 .Άρα, επιθυµούµε να ελέγξουµε σε κάποιο επίπεδο σηµαντικότητος α την H 0 : p ≤ 0.5 έναντι της H1 : p > 0.5 .Αν επιλέξουµε α = 0.05 = 5% , έχουµε από τα δεδοµένα µας∑X = 1 v Xi = X1 + X 2 +L+ Xv = 600 = 0.6 v i=1 v 1000και X (1 − X ) = (0.6) ⋅ (0.4) = 0.24 . Άρα, θα απορρίψουµε την H 0 ανX ≥ p0 + X (1 − X) z 0.05 = 0.5 + 0.24 ⋅ (1.645) = 0.525 v 1000
264(η τιµή z0.05 = 1.645 υπολογίζεται από τον Πίνακα Β1 της τυποποιηµένηςκανονικής). Αφού X = 0.6 ≥ 0.525 ,έπεται ότι ο X ανήκει στην κρίσιµη περιοχή, και συνεπώς απορρίπτουµε την H 0 σεε.σ. α = 5% . Με άλλα λόγια είµαστε κατά τουλάχιστον 95% βέβαιοι ότι ο Α θαεκλεγεί από την πρώτη Κυριακή. Αν κάναµε τον έλεγχο σε ε.σ. α = 0.001 = 0.1% ,το µόνο που θα άλλαζε θα ήταν η σταθερά αποκοπής, αφού zα = z0.001 = 3.09 , καιέτσι η σταθερά αποκοπής γίνεται p0 + X (1 − X) zα = 0.5 + 0,24 ⋅ (3.09) = 0.548 . v 1000Αφού Χ = 0.6 ≥ 0.548 ,και πάλι απορρίπτουµε την H 0 , άρα είµαστε κατά τουλάχιστον 99.9% σίγουροιότι θα εκλεγεί ο Α από την πρώτη Κυριακή.Παρατήρηση 2.4. Είναι φανερό από το παραπάνω παράδειγµα ότι, όσο µικραίνουµετο ε.σ. α, τόσο πιο δύσκολο γίνεται να απορριφθεί η H 0 (αφού γινόµαστε«ανελαστικότεροι», δεχόµενοι ολοένα και µικρότερη πιθανότητα Σφάλµατος τύπουΙ). Η µικρότερη τιµή του α για την οποία απορρίπτεται η H 0 ονοµάζεται p-value τουελέγχου. Έτσι, στο προηγούµενο παράδειγµα, η p-value του ελέγχου είναι µικρότερητου 0.1% = 0.001, αφού ακόµα και για α = 0.001 απορρίπτεται η Η 0 . Όταν τα δεδοµένα µας επεξεργάζονται µε ηλεκτρονικό υπολογιστή, συνήθως τοπρόγραµµα δίνει την p-value. Αν, για παράδειγµα, τα δεδοµένα του Παραδείγµατος2.1 ελέγχονταν µε κάποιο στατιστικό πακέτο, τότε το εξαγόµενο αποτέλεσµα θα ήτανµία τιµή (p-value) του τύπου p-value = 0.0002*** ,η οποία θα σήµαινε ότι η H 0 απορρίπτεται µέχρι και για α = 0.0002 . (Ένα αστεράκι(*) τοποθετείται όταν τα αποτελέσµατα απορρίπτουν την Η 0 για α = 0.1, δύοαστεράκια (**) για α = 0.01 και τρία αστέρια (***) για α = 0.001). Έτσι, αν η τιµήτης p-value βρίσκεται στο διάστηµα (0.01, 0.1] , τότε έχουµε σηµαντικάαποτελέσµατα (*), αν η τιµή της p-value βρίσκεται στο (0.001, 0.01] , τότε έχουµεπολύ σηµαντικά αποτελέσµατα (**), και αν η τιµή βρίσκεται στο (0, 0.001] , τότεέχουµε εξαιρετικά σηµαντικά αποτελέσµατα (***).
265 Γενικά, τιµή της p-value µεγαλύτερη του 0.1 δεν θεωρείται σηµαντική (και δενσηµειώνεται αστεράκι).Παράδειγµα 2.2. Είναι γνωστό ότι κάποιο φάρµακο (ασπιρίνη) πετυχαίνει να ρίξειτον πυρετό σε ποσοστό 80% των ατόµων. Ένα νέο φάρµακο δοκιµάστηκε σε 10000ασθενείς, και είχε θετικά αποτελέσµατα στους 8100. Να ελεγχθεί σε ε.σ. α = 1% ανείναι καλύτερο από την ασπιρίνη. Εδώ θέλουµε να ελέγξουµε την Η 0 : p ≤ p0 = 0.8 έναντι της H1 : p > 0.8σε ε.σ. α = 0.01. Γενικά, σε αυτές τις περιπτώσεις, η εσφαλµένη απόρριψη της Η 0εγκυµονεί τους περισσότερους κινδύνους (βλ. Κανόνα 1ο), αφού αν απορρίψουµεεσφαλµένα την υπόθεση p ≤ 0.8 και αποφασίσουµε λανθασµένα ότι p > 0.8 , τότεδιακινδυνεύουµε να κυκλοφορήσει στην αγορά ένα νέο φάρµακο το οποίο δεν είναικαλύτερο του υπάρχοντος. Βρίσκουµε τελικά X = 8100 = 0.81 και 10000 p0 + X (1 − X) zα = 0.8 + (0.81)(0.19) ⋅ z 0.01 v 10000 = 0.8 + (0.00392) ⋅ (2.33) = 0.809 .Αφού X = 0.81 ≥ 0.809 , απορρίπτουµε την H 0 , και συνεπώς είµαστε κατάτουλάχιστον 99% σίγουροι ότι το νέο φάρµακο είναι αποτελεσµατικότερο. Ανόµως κάνουµε τον έλεγχο σε α = 0.001 = 0.1% , τότε zα = z0.001 = 3.09 , και ησταθερά αποκοπής γίνεται p0 + X (1 − X) zα = 0.8 + (0.00392) ⋅ (3.09) = 0.812 , vοπότε Χ = 0.81 ≥/ 0.812 , που σηµαίνει ότι αποδεχόµαστε την H 0 διότι δενπροκύπτει ότι το νέο φάρµακο είναι καλύτερο σε ε.σ. α = 0.1% . Άρα, η p-valueανήκει στο διάστηµα (0.001, 0.01], και τα αποτελέσµατα είναι πολύ σηµαντικά (**).Αν επιθυµούµε να τεκµηριώσουµε ιδιαίτερα σηµαντικά αποτελέσµατα (στοα = 0.1% (***)), θα πρέπει να ληφθεί ακόµα µεγαλύτερο δείγµα.3. ΕΛΕΓΧΟΙ ΓΙΑ ΤΗ ∆ΙΑΦΟΡΑ ΤΩΝ ΜΕΣΩΝ ΑΠΟ ∆ΥΟ ∆ΕΙΓΜΑΤΑ Μία άλλη σηµαντική εφαρµογή στους ελέγχους υπόθεσης έχουµε όταν πρόκειταινα συγκρίνουµε δύο ανεξάρτητους πληθυσµούς Π1 , Π2 µε βάση δύο αντίστοιχαανεξάρτητα δείγµατα
266 Χ1, Χ 2 ,..., Χ ν1 ~ F1 και Y1,Y2 ,...,Yv2 ~ F2 ,όπου F1 και F2 οι σ.κ. των Π1 και Π2 . Τέτοιες εφαρµογές παρουσιάζονται όταν π.χ.συγκρίνουµε δύο νέα φάρµακα, δύο νέες διδακτικές µεθόδους, δύο νέα τεχνολογικάπροϊόντα κ.ο.κ., και ο ερευνητής θα πρέπει να προτιµήσει κάποιο από αυτά. Η γενικήθεωρία δεν διαφέρει από αυτήν της προηγούµενης παραγράφου. Τα βασικάαποτελέσµατα περιγράφονται στα επόµενα θεωρήµατα.Θεώρηµα 3.1. (Έλεγχος για τη διαφορά δύο µέσων από την κανονική, µε γνωστέςδιασπορές) Έστω τα ανεξάρτητα δείγµατα X1, X 2 ,...,X v1 ~ N (µ1, σ12 ) και Υ1,Υ2 ,...,Υv1 ~ N ( µ2 , σ 2 ) , 2όπου µ1, µ2 ∈ ·, σ12 > 0 , σ 2 > 0 , σ12 , σ 2 γνωστά (εδώ ισχύουν οι ίδιες 2 2παρατηρήσεις όπως στο Θεώρηµα 2.1).(α) Για τον έλεγχο της Η 0 : µ1 − µ2 ≤ δ0 έναντι της Η1 : µ1 − µ2 > δ0 σε ε.σ. α, απορρίπτουµε την Η 0 όταν Χ − Υ ≥ δ0 + σ12 + σ 2 zα . ν1 2 ν2(β) Για τον έλεγχο της Η 0 : µ1 − µ2 ≥ δ0 έναντι της Η1 : µ1 − µ2 < δ0 , σε ε.σ. α, απορρίπτουµε την Η 0 όταν Χ − Υ ≤ δ0 − σ12 + σ 2 zα .(γ) Για τον (δίπλευρο) έλεγχο της ν1 2 ν2 Η 0 : µ1 − µ2 = δ0 έναντι της Η1 : µ1 − µ2 ≠ δ0 σε ε.σ. α, απορρίπτουµε την Η 0 όταν σ12 + σ 2 zα/2 . | (Χ − Υ ) − δ0 |≥ ν1 2 ν2 Στους παραπάνω ελέγχους συνήθως παίρνουµε δ0 = 0 , οπότε στην ουσίαελέγχεται υπόθεση της µορφής H 0 : µ1 − µ2 ≥ 0 δηλ. H 0 : µ1 ≥ µ2 κ.ο.κ.
267Απόδειξη. (α) Αφού Χ ~ Ν ⎜⎜⎛⎝ µ1 , σ12 ⎟⎠⎟⎞ και Υ ~ Ν ⎜⎛⎜⎝ µ2 , σ 2 ⎞⎟⎟⎠ και οι τ.µ. Χ ,Υ είναι ν1 2 ν2ανεξάρτητες, έχουµε Χ −Υ ~ Ν ⎝⎜⎛⎜ µ1 − µ2 , σ12 + σ 2 ⎞⎟⎠⎟ , ν1 2 ν2δηλαδή Ζ = ( Χ − Y ) − (µ1 − µ2 ) ~ Ν (0,1) . σ12 σ 2 ν1 + 2 ν2Άρα ⎜⎛ ⎟⎞ ⎜ ⎟ P(Z < zα ) = P⎜ (X − Y ) − (µ1 − µ2 ) < zα ⎟ =1− α , ⎟ ⎜ σ12 + σ 2 ⎟ ⎜ ν1 2 ⎠ ⎝ ν2και συνεπώς, P⎛⎜⎜ X − Y < (µ1 − µ2 ) + σ12 + σ 2 z ⎟⎞ =1−α . ⎝ ν1 2 ⎟ α ν2 ⎠Αφού υπό την Η 0 , µ1 − µ2 ≤ δ0 , έχουµε ότι (µ1 − µ2 ) + σ12 + σ 2 zα ≤ δ0 + σ12 + σ 2 zα ν1 2 ν1 2 ν2 ν2και συνεπώς P⎜⎜⎛ X − Y < δ0 + σ12 + σ 2 z ⎞⎟ ≥ P⎛⎜⎝⎜ X −Y < ( µ1 − µ2 ) + σ12 + σ 2 z ⎟⎞ . ⎝ ν1 2 ⎟ ν1 2 ⎟ α α ν2 ν2 ⎠ ⎠Από την προηγούµενη ανισότητα προκύπτει ότι P⎛⎜⎜ X − Y < δ0 + σ12 + σ 2 zα ⎞⎟ ≥ 1− α . ⎝ ν1 2 ⎟⎠ ν2Η παραπάνω σχέση γράφεται ισοδύναµα
268 P⎛⎜⎜ X − Y ≥ δ0 + σ12 + σ 2 zα ⎟⎞ ≤ α , ⎝ ν1 2 ⎟ ⎠ ν2και ισχύει πάντα όταν ισχύει η H 0 . Άρα, η πιθανότητα Σφάλµατος τύπου Ι δενµπορεί να ξεπεράσει το ε.σ. α όταν ισχύει η H 0 , και συνεπώς µπορούµε νααπορρίψουµε την H 0 όταν X − Y ≥ δ0 + σ12 + σ 2 zα ν1 2 ν2χωρίς να έχουµε πιθανότητα Σφάλµατος τύπου Ι µεγαλύτερη του α. Αυτό αποδεικνύειτο ζητούµενο.(β) Όµοια µε το (α).(γ) Όταν ισχύει η H 0 : µ1 − µ2 = δ0 , η τ.µ. Ζ = ( X − Υ ) − δ0 ~ Ν (0,1) , σ12 σ 2 ν1 + 2 v2οπότε P(−zα / 2 < Ζ < zα / 2 ) = 1− α ,και άρα P(| Z |≥ zα/2 ) = α ,από την οποία προκύπτει το ζητούµενο.Θεώρηµα 3.2. (∆ύο ανεξάρτητα δείγµατα από κανονικές µε άγνωστες αλλά ίσεςδιασπορές) Έστω τα ανεξάρτητα δείγµατα X1, X 2 ,..., X v1 ~ N ( µ1, σ 2 ) και Υ1,Υ2 ,...,Υν2 ~ Ν (µ2 , σ 2 )όπου σ 2 > 0 άγνωστη. Θέτουµε 1 v1 2 1 v2 −Y )2 v1 − i=1 2 v2 −1 ∑ ∑S12 = 1 ( X i − X )2 , S = (Y j j =1και 2 1 ⎛⎜ v1 X )2 v2 2 ⎟⎞ ∑ ∑S p = + v2 ⎝⎜ i=1 ( X i − + − Y ) ⎠⎟ v1 − 2 (Y j j =1 ( )= 1 2 v1 + v2 − 2 (v1 − 1)S12 + (v2 − 1)S 2 .
269Τότε(α) Για τον έλεγχο της Η 0 : µ1 − µ2 ≤ δ0 έναντι της Η1 : µ1 − µ2 > δ0 σε ε.σ. α, απορρίπτουµε την Η 0 όταν Χ − Υ ≥ δ0 + S p 1 + 1 tv1+v2 −2;α . ν1 ν2(β) Για τον έλεγχο της Η 0 : µ1 − µ2 ≥ δ0 έναντι της Η1 : µ1 − µ2 < δ0 , σε ε.σ. α, απορρίπτουµε την Η 0 όταν Χ − Υ ≤ δ0 − S p 1 + 1 tv1+v2 −2;α .(γ) Για τον (δίπλευρο) έλεγχο της ν1 ν2 Η 0 : µ1 − µ2 = δ0 έναντι της Η1 : µ1 − µ2 ≠ δ0 σε ε.σ. α, απορρίπτουµε την Η 0 όταν | (Χ − Υ ) − δ0 |≥ S p 1 + 1 tv1+v2 −2;α / 2 . ν1 ν2Απόδειξη. Εδώ χρησιµοποιούµε το γεγονός ότι η τ.µ. Tv1+v2 −2 = (Χ − Υ ) − (µ1 − µ2 ) ~ tv1+v2 −2 Sp 11 v1 + v2(βλ. Θεώρηµα 2.4 του Κεφ. 9), και δουλεύουµε ακριβώς όπως στο Θεώρηµα 3.1, µεµόνη διαφορά ότι οι σταθερές αποκοπής βρίσκονται µε βάση τις τιµές tv1+v2−2;α καιtv1+v2 −2;α / 2 αντί των zα και zα / 2 , αντίστοιχα.Θεώρηµα 3.3. (∆ύο ανεξάρτητα δείγµατα, µε ν1 , ν2 → ∞ ) Έστω ότι τα ανεξάρτηταδείγµατα X1, X 2 ,..., X v1 ~ F1 και Y1,Y2 ,...,Yv2 ~ F2µε E(Xi ) = µ1 , E(Υ j ) = µ2 και Var( X i ) = σ12 , Var(Υ j ) = σ 2 µε 0 < σ12 , σ 2 < ∞. 2 2 Υποθέτουµε ότι τα δειγµατικά µεγέθη v1, v2 είναι «µεγάλα» (θεωρητικάv1, v2 → ∞ , στην πράξη v1, v2 ≥ 30 ). Τότε
270(α) Για τον έλεγχο της Η 0 : µ1 − µ2 ≤ δ0 έναντι της Η1 : µ1 − µ2 > δ0 σε ε.σ. α, απορρίπτουµε την Η 0 όταν Χ − Υ ≥ δ0 + S12 + S 2 zα , ν1 2 ν2 S12 1 v1 X )2 2 1 v2 −Y )2 v1 −1 2 v2 −1 ∑όπου= (Xi − , ∑S = (Y j , οι δειγµατικές i=1 j =1 διασπορές.(β) Για τον έλεγχο της Η 0 : µ1 − µ2 ≥ δ0 έναντι της Η1 : µ1 − µ2 < δ0 , σε ε.σ. α, απορρίπτουµε την Η 0 όταν Χ − Υ ≤ δ0 − S12 + S 2 zα .(γ) Για τον (δίπλευρο) έλεγχο της ν1 2 ν2 Η 0 : µ1 − µ2 = δ0 έναντι της Η1 : µ1 − µ2 ≠ δ0 σε ε.σ. α, απορρίπτουµε την Η 0 όταν S12 + S 2 zα/2 . | (Χ − Υ ) − δ0 |≥ ν1 2 ν2Απόδειξη. Όµοια µε την απόδειξη του Θεωρήµατος 3.1, µε µόνη διαφορά ότι η τ.µ. Z v1,v2 = (X − Y ) − (µ1 − µ2 ) ~ N (0,1) S12 + S 2 v1 2 v2κατά προσέγγιση, καθώς v1, v2 → ∞ , όπως προκύπτει από το νόµο των µεγάλωναριθµών, το Κ.Ο.Θ. και το Θεώρηµα Slutsky (βλ. Θεώρηµα 2.5 του Κεφ. 9). Μία σηµαντική εφαρµογή του Θεωρήµατος 3.3 έχουµε στην περίπτωση ελέγχουτης διαφοράς δύο άγνωστων ποσοστών από την κατανοµή Bernoulli.Πόρισµα 3.1. (Έλεγχος για τη διαφορά των ποσοστών από ανεξάρτητα δείγµαταBernoulli) Θεωρούµε τα ανεξάρτητα δείγµατα X1, X 2 ,..., X v1 ~ b( p1) καιY1,Y2 ,...,Yv2 ~ b( p2 ) , µε p1, p2 άγνωστα. Υποθέτουµε ότι v1, v2 → ∞ (στην πράξηv1, v2 ≥ 30 ). Τότε
271(α) Για τον έλεγχο της Η 0 : p1 − p2 ≤ δ0 έναντι της Η1 : p1 − p2 > δ0 σε ε.σ. α, απορρίπτουµε την Η 0 όταν Χ − Υ ≥ δ0 + X (1 − X ) + Y (1 − Y ) zα .(β) Για τον έλεγχο της ν1 ν2Η 0 : p1 − p2 ≥ δ0 έναντι της Η1 : p1 − p2 < δ0 ,σε ε.σ. α, απορρίπτουµε την Η 0 όταν Χ − Υ ≤ δ0 − X (1 − X ) + Y (1 − Y ) zα .(γ) Για τον (δίπλευρο) έλεγχο της ν1 ν2Η 0 : p1 − p2 = δ0 έναντι της Η1 : p1 − p2 ≠ δ0σε ε.σ. α, απορρίπτουµε την Η 0 όταν | (Χ − Υ ) − δ0 |≥ X (1 − X ) + Y (1 − Y ) zα / 2 . ν1 ν2Απόδειξη. Εφαρµόζουµε το Θεώρηµα 3.3, αφού E( X i ) = µ1 = p1 καιE(Y j ) = µ2 = p2 , παρατηρώντας ότι=∑S121 v1 − X )2 = v1 X (1 − X) ≈ X (1 − X) v1 − 1 v1 − 1 (Xi i=1για µεγάλο v1 (επειδή X i = 0 ή 1) και, οµοίως, S 2 ≈ Y (1 − Y ) , 2για τον ίδιο λόγο (βλ. Παρατήρηση 3.1 του Κεφ. 9).Παράδειγµα 3.1. Πριν τη διαφηµιστική εκστρατεία, 300 ψηφοφόροι θα ψήφιζαν ένακόµµα σε σύνολο 1000 ερωτηθέντων. Μετά τη διαφηµιστική εκστρατεία, σεανεξάρτητο δείγµα 2000 ψηφοφόρων, οι 700 θα ψήφιζαν το κόµµα. Μπορούµε ναπούµε ότι απέδωσε η διαφήµιση; Εδώ X1, X 2 ,..., X v1 ~ b( p1) , όπου p1 το (άγνωστο) ποσοστό των ψηφοφόρων(στο σύνολο του πληθυσµού) που θα ψήφιζαν το κόµµα πριν τη διαφηµιστικήεκστρατεία, και Y1,Y2 ,...,Yv2 ~ b( p2 ) ,όπου p2 το (άγνωστο) ποσοστό των
272ψηφοφόρων (στο σύνολο του πληθυσµού) που θα ψήφιζαν το κόµµα µετά τηνδιαφηµιστική εκστρατεία. Από τα δεδοµένα µας έχουµε X = 300 = 0.3 , Y = 700 = 0.35 1000 2000και v1 = 1000 , v2 = 2000 (πολύ µεγάλα!). Ο έλεγχος που θα πρέπει να πραγµατοποιήσουµε είναι Η 0 : p1 − p2 ≥ 0 έναντι της Η1 : p1 − p2 < 0(αφού, αύξηση του ποσοστού µετά τη διαφήµιση ισοδυναµεί µε p2 > p1 δηλ.p1 − p2 < 0 , και αυτό επιθυµούµε να αποδείξουµε – Kανόνας 2). Εκλέγοντας ε.σ. α = 5% , έχουµε zα = z0.05 = 1.645 , και σύµφωνα µε τοΘεώρηµα 3.3 (β), θα απορρίψουµε την H 0 εάν X − Y ≤ δ0 − Χ (1 − Χ ) + Υ (1 − Υ ) zα ν1 ν2 =0− (0.3)(0.7) + (0.35)(0.65) ⋅ (1.645) 1000 2000 = −0.0296 .Εδώ Χ − Υ = 0.30 − 0.35 = −0.05 , και επειδή − 0.05 < −0.0296 , απορρίπτουµε τηνΗ 0 , δηλαδή είµαστε κατά τουλάχιστον 95% βέβαιοι ότι απέδωσε η διαφήµιση.Παράδειγµα 3.2. Οι βαθµολογίες 100 και 200 φοιτητών που διδάχθηκαν µε τηµέθοδο Α, Β, αντίστοιχα, ήταν Α: Χ1, Χ 2 ,...,Χ100 , Β: Υ1,Υ2 ,...,Υ200 .Από τα δεδοµένα µας παρατηρήθηκε ότι 100 200 100 2 200 Yi2 = 20000 . ∑ ∑∑X i = 780 , Y j = 1400 , ∑X i = 10000 και i=1 j=1 i=1 j =1Μπορούµε να συµπεράνουµε ότι η µέθοδος Α οδηγεί σε καλύτερα αποτελέσµατα, σεε.σ. α = 5% ; Εδώ έχουµε δύο ανεξάρτητα δείγµατα, και αν µ1, µ2 είναι οι (άγνωστοι)πληθυσµιακοί µέσοι των µεθόδων Α, Β, η έκφραση «καλύτερα αποτελέσµατα» γιατην Α σηµαίνει µ1 > µ2 . Άρα, επιθυµούµε να ελέγξουµε (Κανόνας 2) την
273 Η 0 : µ1 − µ2 ≤ 0 έναντι της Η1 : µ1 − µ2 > 0σε ε.σ. α = 0.05 . Από τα δεδοµένα µας, 100 200 ∑Χ = Xi = 780 = 7.8 , ∑Y = Yj = 1400 =7, 100 200 i=1 j =1 100 200και 1 v1 1 ⎜⎝⎜⎛ v1 2 ⎟⎟⎞⎠ v1 − 1 v1 − i=1 (Xi i=1 =∑ ∑S12 − X )2 = 1 X 2 − v1 X i ∑= 1 ⎜⎝⎜⎛ 100 X 2 − 100 ⋅ (7.8)2 ⎟⎞⎠⎟ = 1 (10000 − 6084) = 39.56 , 99 i=1 i 99 2 1 ⎜⎛ v2 2 2 ⎟⎞ 1 (20000 2 v2 −1 ⎜⎝ j ⎟⎠ 199 ∑S = Y − v2Y = − 9800) = 51.26 . j =1 Σύµφωνα µε το Θεώρηµα 3.3 (α), απορρίπτουµε την H 0 όταν X − Y ≥ δ0 + S12 + S 2 zα , v1 2 v2όπου, στο παράδειγµά µας, δ0 = 0 , α = 0.05 (οπότε zα = z0.05 = 1.645 ). Έτσι, τοχωρίο απόρριψης γίνεται X −Y ≥ 0+ 39.56 + 51.26 (1.645) = 1.328 , 100 200ενώ από τα δεδοµένα µας, X − Y = 0.8≥/ 1.328 . Συνεπώς, δεν έχουµε αρκετά στοιχεία ώστε να αποφανθούµε υπέρ τηςµεθόδου Α σε ε.σ. α = 5% .Παράδειγµα 3.3. Μετρήθηκε η αρτηριακή πίεση σε δύο ανεξάρτητες οµάδες,αποτελούµενες από 8 και 10 παιδιά, αντίστοιχα. Τα παιδιά στην πρώτη οµάδα έχουνυπερτασικούς γονείς, ενώ στην δεύτερη οι γονείς των παιδιών δεν παρουσιάζουνυπέρταση.
274 Τα δεδοµένα είναι τα εξής:Οµάδα 1 100, 102, 96, 106, 110, 120, 112, 90(υπερτασικοί γονείς)Οµάδα 2 104, 88, 100, 98, 102, 92, 96, 100, 96, 97.(κανονικοί γονείς) (α) Υποθέτουµε ότι τα δεδοµένα µας ακολουθούν κανονική κατανοµή Ν (µ1, σ12 )και Ν ( µ 2 , σ 2 ) µε σ12 = 70 και σ 2 = 22 . Να κατασκευαστεί δ.ε. για το µ1 − µ2 µε 2 2σ.ε. 95% και να ελεγχθεί εάν µ1 > µ2 σε ε.σ. α = 5% . (β) Να επαναλάβετε το ερώτηµα (α) όταν είναι γνωστό ότι οι διασπορές είναιίσες αλλά άγνωστες, υποθέτοντας και πάλι κανονικότητα. (α) Σύµφωνα µε την Παρατήρηση 3.4 του Κεφ. 9, το 95% δ.ε. για το µ1 − µ2 θαδίδεται από τον τύπο ⎡ σ12 σ 2 zα / 2 , (Χ −Υ) + σ12 σ 2 zα ⎤ ⎢(Χ − Υ ) − ν1 2 ν1 2 ⎥ ⎣⎢ + + / 2 ⎥⎦ ν2 ν2όπου ν1 = 8, ν2 = 10 , σ12 = 70 , σ 2 = 22 , α = 0.05 (οπότε zα / 2 = z0.025 = 1.96 ). Από 2τα δεδοµένα X = 104.5 , Y = 97.3 , οπότε το 95% δ.ε. για το µ1 − µ2 είναι το ⎡⎢7.2 − 70 + 22 (1.96), 7.2 + 70 + 22 (1.96)⎥⎤ = [0.714, 13.686] . ⎣ 8 10 8 10 ⎦Οµοίως, για τον έλεγχο της H 0 : µ1 − µ2 ≤ 0 , έναντι της H1 : µ1 − µ2 > 0 ,σε ε.σ. α = 5% , θα απορρίψουµε την Η 0 όταν (εδώ zα = z0.05 = 1.645 ) X − Y ≥ δ0 + σ12 + σ 2 zα =0+ 70 + 22 (1.645) = 5.443 . ν1 2 8 10 ν2Από τα δεδοµένα βρίσκουµε Χ − Υ = 7.2 ≥ 5.443 ,οπότε, πράγµατι, απορρίπτουµε την H 0 , και συµπεραίνουµε ότι, αν ισχύουν οιπαραπάνω υποθέσεις (δηλ. αν τα δείγµατα προέρχονται από την N (µ1,70) καιΝ (µ2,22) , αντίστοιχα), τότε είµαστε κατά τουλάχιστον 95% βέβαιοι ότι τα παιδιάµε υπερτασικούς γονείς παρουσιάζουν µεγαλύτερη µέση αρτηριακή πίεση.
275 (β) Θα πρέπει πρώτα να υπολογίσουµε την S 2 . Βρίσκουµε: p 8 10 2 ∑ ∑X 2 Y j 94873 , i = 88000 και = i=1 j=1οπότε S12 = 1 (88000 − 8 ⋅ (104.5) 2 ) = 91.143 , 7 S 2 = 1 (94873 − 10 ⋅ (97.3) 2 ) = 22.233 , 2 9και άρα ( )S 1 2 1 2 = v1 + v2 −2 (v1 − 1)S12 + (v2 − 1)S 2 = 16 (638 + 200.1) = 52.381 p(η εκτιµήτρια της κοινής διασποράς σ2 είναι η τιµή 52.381 της S 2 ). p Σύµφωνα µε το Θεώρηµα 3.4 του Κεφ. 9, το 95% δ.ε. για το µ1 − µ2 θα δίδεταιαπό τον τύπο ⎡⎢( Χ − Υ ) − S p 1 + 1 tv1+v2 −2;α , (Χ −Υ)+ Sp 1 + 1 t v1+v2 −2 ; α / 2 ⎤ ⎣ v1 v2 v1 v2 ⎥ ⎦µε v1 = 8, v2 = 10 , S p = 52.381 = 7.2375 και α = 5% = 0.05 . Από τον Πίνακα Β2της t-κατανοµής του Student βρίσκουµε tv1+v2−2;α / 2 = t16;0.025 = 2.12 . Συνεπώς, το95% δ.ε. για το µ1 − µ2 είναι το ⎡⎢7.2 − (7.2375) 1 + 1 (2.12), 7.2 + (7.2375) 1 + 1 (2.12)⎤⎥ ⎣ 8 10 8 10 ⎦ = [7.2 − 7.278, 7.2 + 7.278] = [−0.078, 14.478] .Τέλος, για τον έλεγχο της Η 0 : µ1 − µ2 ≤ 0 έναντι της H1 : µ1 − µ2 > 0σε ε.σ. α = 0.05 , το χωρίο απόρριψης θα είναι, σύµφωνα µε το Θεώρηµα 3.2 (α), το X − Y ≥ δ0 + S p 1 + 1 tv1+v2 −2;α , v1 v2όπου δ0 = 0 , tv1+v2 −2;α = t16;0.05 = 1.746 . Εποµένως, το χωρίο απόρριψης είναι
276 X − Y ≥ 0 + (7.2375) 1 + 1 ⋅ (1.746) = 5.994 . 8 10Αφού X − Y = 7.2 ≥ 5.994 , και πάλι απορρίπτουµε την H 0 σε ε.σ. α = 0.05 , δηλαδήσυµπεραίνουµε και πάλι ότι µε πιθανότητα σφάλµατος το πολύ 5%, υπάρχειδιαφορά στην µέση αρτηριακή πίεση των παιδιών µε υπερτασικούς γονείς.Παρατήρηση 3.1. Θα πρέπει να σηµειωθεί ότι τα 95% δ.ε. στις παραπάνωπεριπτώσεις (α) και (β) του Παραδείγµατος 3.3 είναι διαφορετικά. Αυτό οφείλεταιστο γεγονός ότι υποτίθενται διαφορετικές συνθήκες (γνωστές διασπορές στο (α),άγνωστες αλλά ίσες διασπορές στο (β)). Κατά τον ίδιο τρόπο, θα µπορούσε να συµβείτο «περίεργο» γεγονός να απορρίπτεται η H 0 στο (α) και να γίνεται αποδεκτή στο(β), ή αντίστροφα. Σηµειώνουµε στο σηµείο αυτό ότι τα πάντα εξαρτώνται από τιςσυνθήκες που υποθέτουµε στα δεδοµένα µας. Έτσι, ο ερευνητής θα πρέπει να είναιαρκετά προσεκτικός και επιφυλακτικός µε τους στατιστικούς ελέγχους, αφούσυµβαίνει πολλές φορές να συνάγονται συµπεράσµατα κάτω από αυθαίρετεςπαραδοχές (κανονικότητα, ίσες διασπορές, κ.ο.κ.), χωρίς αυτό να δικαιολογείται απόπροηγούµενες µελέτες. Άρα, στα στοχαστικά µοντέλα ελέγχου υποθέσεων θα πρέπεινα µην επιβάλλονται πολλές τεχνικές παραδοχές (όπως γνωστές διασπορές,κανονικότητα, ίσες διασπορές, κ.λπ.), διότι σε αντίθετη περίπτωση υπάρχει σοβαρόςκίνδυνος τα συµπεράσµατα να είναι αναξιόπιστα. Στην περίπτωση που αυτό δενµπορεί να αποφευχθεί λόγω έλλειψης πληροφοριών (µικρά δείγµατα), στη στατιστικήανάλυση θα πρέπει οπωσδήποτε να αναφέρονται οι ακριβείς υποθέσεις του µοντέλουπου χρησιµοποιείται.ΑΣΚΗΣΕΙΣ ΚΕΦ. 10 1. Η µέτρηση του ύψους, σε ένα δείγµα 20 ατόµων από έναν πληθυσµό έδωσε ταπαρακάτω αποτελέσµατα σε εκατοστά: 173, 166, 168, 166, 169, 166, 173, 170, 170, 173 166, 161, 166, 170, 168, 158, 173, 166, 165, 165. (α) Αν είναι γνωστό ότι τα ύψη ακολουθούν κανονική κατανοµή N (µ, σ 2 ) µετυπική απόκλιση σ = 5 εκατοστά, να ελεγχθεί σε επίπεδο σηµαντικότητας 5% αν τοµέσο ύψος του πληθυσµού είναι µεγαλύτερο των 165 εκατοστών. (β) Να απαντήσετε στο ερώτηµα (α) αν είναι γνωστό ότι τα ύψη ακολουθούνκανονική κατανοµή µε άγνωστη διασπορά σ 2 > 0 .
277 2. Για να εκτιµηθεί η µέση βαθµολογία των φοιτητών στις εξετάσεις κάποιουµαθήµατος, παίρνουµε ένα δείγµα 16 φοιτητών και καταγράφουµε τη βαθµολογίατους: 10, 3, 5, 4, 7, 8, 9, 9, 8, 5, 5, 8, 6, 6, 9, 10.Υποθέστε ότι η βαθµολογία στις εξετάσεις ακολουθεί κανονική κατανοµή: (α) N (µ,4) , (δηλ. σ 2 = 4 , γνωστό) και (β) Ν (µ, σ 2 ) , σ 2 άγνωστο.Να ελεγχθεί σε επίπεδο σηµαντικότητας 5%, ο ισχυρισµός ότι η µέση βαθµολογίαστις εξετάσεις είναι διαφορετική του 6.5. 3. Κάθε χρόνο οι φοιτήτριες που τελειώνουν το Α΄ έτος σπουδών υποβάλλονται σ’ένα έλεγχο φυσικής κατάστασης και βαθµολογούνται. Τα προηγούµενα χρόνια οµέσος όρος βαθµολογίας ήταν 180. Από την αρχή της φετινής χρονιάς εφαρµόστηκεένα νέο πρόγραµµα βελτίωσης της φυσικής κατάστασης. Στο τέλος του χρόνουεπιλέχτηκαν 50 από αυτές, βαθµολογήθηκαν µετά από έλεγχο και έδωσαν µέσο όρο190 βαθµών µε τυπική απόκλιση 35.2. Να ελεγχθεί σε επίπεδο σηµαντικότηταςα = 0.01 αν µπορούµε να ισχυριστούµε ότι είχαµε αύξηση της µέσης βαθµολογίαςτων Α-ετών φοιτητριών, δηλαδή βελτίωση της φυσικής τους κατάστασης που ναοφείλεται στο πρόγραµµα. 4. Ένα τυχαίο δείγµα από 10 µαθητές και ένα τυχαίο δείγµα από 10 µαθήτριεςέδωσαν µέσο ύψος αντίστοιχα 152 και 149 εκατοστά. Να ελεγχθεί σε ε.σ. α = 10% ο ισχυρισµός ότι οι µαθητές είναι ψηλότεροι από τιςµαθήτριες. Υποθέστε: (α) ότι το ύψος του πληθυσµού των µαθητών ακολουθεί κανονικήκατανοµή µε διασπορά 25 ενώ το ύψος των µαθητριών κανονική κατανοµή µεδιασπορά 49. (β) Τα ύψη των µαθητών και µαθητριών προέρχονται από κανονικές κατανοµές µεάγνωστες αλλά ίσες διασπορές, ενώ οι δειγµατικές διασπορές των υψών των 10µαθητών και µαθητριών είναι αντίστοιχα 20 και 30. 5. Σε µία χώρα το 20% του πληθυσµού προσβλήθηκε από ένα συγκεκριµένο ιόγρίπης. Σε µία πόλη 3400 κατοίκων οι 800 προσβλήθηκαν από τη γρίπη αυτή.Μπορούµε να ισχυρισθούµε σε ε.σ. 2% ότι στην πόλη αυτή το ποσοστό είναιµεγαλύτερο από 20%;
278 6. Σε τυχαίο δείγµα 20 εργαζοµένων, κατοίκων της Αθήνας, βρέθηκε ότι οχρόνος µετάβασης (σε λεπτά της ώρας) στον χώρο εργασίας τους ήταν (για την 18η∆εκεµβρίου 2002): Λεπτά Συχνότητα Λεπτά Συχνότητα 00-10 1 50-60 2 10-20 2 60-70 2 20-30 3 70-80 2 30-40 4 80-90 1 40-50 2 90-100 1 (α) Να υπολογιστεί ο δειγµατικός µέσος και η δειγµατική διασπορά από ταπαραπάνω (οµαδοποιηµένα) δεδοµένα. (β) Αν υποθέσουµε ότι ο χρόνος µετάβασης ενός εργαζόµενου, κατοίκου τηςΑθήνας, στην εργασία του ακολουθεί κανονική κατανοµή, να εξετασθεί σε ε.σ. 5%αν ο µέσος χρόνος µετάβασης ενός εργαζόµενου, κατοίκου της Αθήνας, στην εργασίατου υπερβαίνει τα 35 λεπτά. 7. Ο ιδιοκτήτης ενός πολυκαταστήµατος ισχυρίζεται ότι οι πελάτες πληρώνουνλογαριασµούς που κατά µέσο όρο δεν υπερβαίνουν τα 30 Ευρώ. Σε ένα τυχαίο δείγµα15 πελατών διαπιστώθηκε µέσο ποσό αγορών 29 Ευρώ. (α) Υποθέτοντας ότι οι λογαριασµοί ακολουθούν κανονική κατανοµή µεδιασπορά σ 2 = 4 , να εξεταστεί σε επίπεδο σηµαντικότητας α = 0.10 ο ισχυρισµόςτου ιδιοκτήτη. (β) Σε ποιο συµπέρασµα καταλήγετε αν υποθέσετε κανονικότητα µε άγνωστηδιασπορά, και αν η δειγµατική διασπορά ισούται µε S 2 = 4 ; 8. Τυχαίο δείγµα 200 µαθητών χωρίστηκε τυχαία σε δύο οµάδες O1 και O2 των120 και 80 ατόµων αντίστοιχα. Στη συνέχεια όλοι οι µαθητές διδάχτηκαν κοινή ύλη,µόνο που στην οµάδα O1 εφαρµόστηκε η διδακτική µέθοδος Α ενώ στην O2εφαρµόστηκε η διδακτική µέθοδος Β. Μετά το τέλος της διδασκαλίας και τηδιεξαγωγή εξετάσεων σε κοινά θέµατα, οι µαθητές της O1 έλαβαν βαθµούς επίδοσηςX1, X 2 ,..., X120 , ενώ αυτοί της O2 έλαβαν βαθµούς Y1,Y2 ,...,Y80 . Από την επεξεργασία των βαθµών µέσω ηλεκτρονικού υπολογιστή προέκυψε ότι: 120 120 2 ∑X i 6025.2 ∑ X i = 840 , = i=1 i=1και οµοίως, 80 80 2 ∑Y j 4580 . ∑Y j = 600 , = j =1 j =1
279 (α) Να υπολογιστούν οι δειγµατικοί µέσοι X ,Y καθώς και οι δειγµατικέςτυπικές αποκλίσεις S1 , S2 των δύο δειγµάτων. (β) Έστω µ1 και µ2 οι θεωρητικοί µέσοι των δύο µεθόδων. Να ελέγξετε σε ε.σ.α = 5% την Η 0 : µ1 ≥ µ2 έναντι της Η1 : µ1 < µ2 ,και να αναλύσετε τα συµπεράσµατά σας. 9. Η ποσότητα οινοπνεύµατος στο αίµα (σε mg/lt) 120 τυχαία επιλεγµένωνοδηγών µιας πόλης Χ και 80 τυχαία επιλεγµένων οδηγών µιας πόλης Υ βρέθηκε:X1, X 2 ,..., X120 και Y1,Y2 ,...,Y80 . Μετά από επεξεργασία των δεδοµένων προέκυψεότι 120 120 2 ∑X i 300 ∑ X i = 120 , = i=1 i=1και οµοίως, 80 80 2 ∑Y j 600 . ∑Y j = 100 , = j =1 j =1(α) Να υπολογιστούν οι δειγµατικοί µέσοι X ,Y καθώς και οι δειγµατικέςτυπικές αποκλίσεις S1 , S2 των δύο δειγµάτων. (β) Έστω µ1 και µ2 οι θεωρητικοί µέσοι στις δύο πόλεις. Ελέγξτε την υπόθεση Η 0 : µ1 ≥ µ2 έναντι της Η1 : µ1 < µ2σε ε.σ. α = 5% και αναλύστε το συµπέρασµα.10. ∆ύο ανεξάρτητα τυχαία δείγµατα X1, X 2 ,..., X 8 και Y1,Y2 ,...,Y5 µε κανονικέςκατανοµές N (µ1, σ12 ) και Ν ( µ2 , σ 2 ) , αντίστοιχα, έδωσαν 2 8 8 2 ∑X i = 1194 ∑ X i = 96 , i=1 i=1και οµοίως, 5 5 2 ∑Y j 504 . ∑Y j = 50 , = j =1 j =1Ελέγξτε σε ε.σ. α = 10% την υπόθεση H 0 :σ1 ≤ 2σ 2 έναντι της Η1 :σ1 > 2σ 2 ,χρησιµοποιώντας το Θεώρηµα 2.3 του Κεφ. 9 και κατάλληλο θεωρητικό αποτέλεσµαγια το Σφάλµα τύπου Ι.
280 11. Μετά από µία διαφηµιστική καµπάνια ρωτήθηκαν 150 καπνιστές καιβρέθηκαν 20 να καπνίζουν τα τσιγάρα µάρκας Α. Η εταιρεία που κατασκευάζει τηνµάρκα Α ισχυρίζεται ότι το 15% των καπνιστών χρησιµοποιούν την µάρκα Α. Είναισωστός ο ισχυρισµός της εταιρείας; (α = 5%) . 12. Το µέσο βάρος των µοσχαριών µιας φάρµας πριν από τη σφαγή, ταπροηγούµενα χρόνια ήταν 180 κιλά. Φέτος, σε 50 µοσχάρια εφαρµόσθηκε µίακαινούργια δίαιτα. Υποθέτουµε ότι τα 50 αυτά µοσχάρια αποτελούν ένα δείγµα απόένα πληθυσµό στον οποίο όλα τα µοσχάρια έχουν ακολουθήσει αυτή τη δίαιτα ή θατην ακολουθήσουν στο µέλλον. Χρησιµοποιώντας σαν δείγµα αυτά τα 50 µοσχάριαγια τα οποία βρέθηκε Χ = 190 και S = 35.2 να ελεγθεί αν η µέση τιµή µ τουπληθυσµού µεγάλωσε. (α = 0.01) 13. Θέλουµε να µελετήσουµε αν το νήµα που βγάζουν δύο µηχανές µιαςκλωστοβιοµηχανίας έχει το ίδιο πάχος παντού. Για το σκοπό αυτό, διαλέξαµε τυχαία12 κουβαράκια µήκους 100 µέτρων από την πρώτη και 10 κουβαράκια µήκους 100µέτρων από τη δεύτερη µηχανή. Μετρήσαµε τα βάρη τους και βρήκαµε ότι Χ − Υ = 7.3 , S12 = 4.1, S 2 = 3.2 . 2Υποθέτουµε ότι τα δεδοµένα µας προέρχονται από κανονικές κατανοµές µε κοινήδιασπορά σ 2 . Είναι αλήθεια ότι η πρώτη µηχανή παράγει κλωστές µε µεγαλύτεροµέσο πάχος; ( α = 5% ) 14. Σε δύο εξεταστικές περιόδους σ’ ένα µάθηµα εξετάστηκαν 80 και 110φοιτητές και πέρασαν το µάθηµα 60 και 80 αντίστοιχα. Να εξετασθεί αν ηπιθανότητα επιτυχίας και στις δύο περιόδους είναι η ίδια. (α = 5%) 15. Το Ινστιτούτο Καταναλωτών για να εξακριβώσει αν τα κουτιά των 100 grκαφέ περιέχουν πραγµατικά 100 gr, πήρε 9 κουτιά τυχαία από διάφορα καταστήµατακαι βρήκε Χ = 96 gr και S = 1.8 gr. Είναι αρκετά τα δεδοµένα για να υποστηρίξουµεότι τα κουτιά των 100 gr είναι ελλιποβαρή; (α = 5%) [Να διατυπωθούν επακριβώς οιυποθέσεις που χρησιµοποιήσατε για την πραγµατοποίηση του παραπάνω ελέγχου.] 16. Από 150 ασθενείς στους 80 δώσαµε χάπι µε ζάχαρη και στους 70 δώσαµεασπιρίνη. Μετά από µία εβδοµάδα βρέθηκε ότι βελτιώθηκε η υγεία 48 ασθενών πουπήραν χάπι ζάχαρης και 56 που πήραν ασπιρίνη.
281 (α) Μπορούµε να αποδείξουµε ότι η θεραπεία µε ασπιρίνες είναι προτιµότερη;(α = 5%) (β) Να κατασκευαστεί 95% δ.ε. για τη διαφορά των ποσοστών p1, p2 , όπου p1η πιθανότητα να γιατρευτεί ένας ασθενής χρησιµοποιώντας ζάχαρη και p2 ηαντίστοιχη πιθανότητα για την ασπιρίνη. 17. Σε 42 γεωτρήσεις που έγιναν σε µία περιοχή οι 12 έδωσαν θετικάαποτελέσµατα για την εκµετάλλευσή της. (α) Να εξετασθεί αν είναι αποδεκτός ο ισχυρισµός των ειδικών ότι το ποσοστότων γεωτρήσεων µε θετικά αποτελέσµατα είναι τουλάχιστον 25% (α = 5%) . (β) Να δοθεί 95% δ.ε. για το ποσοστό των γεωτρήσεων µε θετικό αποτέλεσµα.18. Ελέγχουµε δύο τύπους αυτοκινήτων Α και Β. Σε 10 αυτοκίνητα τύπου Α ηµέση κατανάλωση βενζίνης ήταν X = 11.2 lt µε διασπορά S12 = 2 , ενώ σε 12αυτοκίνητα τύπου Β η µέση κατανάλωση ήταν Y = 12 lt µε S 2 = 2.25 . Μπορούµε να 2υποθέσουµε ότι και οι δύο τύποι αυτοκινήτων καταναλώνουν κατά µέσο όρο την ίδιαποσότητα βενζίνης; (α = 5%) 19. Το βάρος των νεογέννητων (σε kg) σε δύο διαφορετικές χώρες Α και Β ήταν:Χώρα Α 3.120 4.135 2.830 3.160 2.525 3.220 3.840 3.655Χώρα Β 2.830 3.150 3.180 2.755 2.940 3.245 3.410 3.110 2.860.Τι συµπεραίνετε; 20. Ένα εντοµοκτόνο σκοτώνει το 60% του πληθυσµού ενός είδους µύγας. Σεπόσες µύγες πρέπει να χορηγήσουµε το φάρµακο για να είµαστε κατά 95% σίγουροιότι το ποσοστό των εντόµων που σκοτώθηκαν είναι µεταξύ 58% και 62%; 21. Σ’ ένα παιχνίδι baseball, ένας παίκτης έκανε συνολικά 233 βολές, απ’ τιςοποίες οι 84 ήταν επιτυχηµένες. Ένας άλλος, πέτυχε στις 103 από τις 350 βολές. Οπρώτος παίκτης ισχυρίζεται ότι είναι καλύτερος. Είναι αλήθεια αυτό; (α = 5%)
ΠΑΡΑΡΤΗΜΑΤΑΑ – ΤΥΠΟΛΟΓΙΟΒ – ΣΤΑΤΙΣΤΙΚΟΙ ΠΙΝΑΚΕΣ
ΠΑΡΑΡΤΗΜΑ Α - ΤΥΠΟΛΟΓΙΟ1. ΠΙΘΑΝΟΤΗΤΕΣI. ΒΑΣΙΚΕΣ ∆ΙΑΚΡΙΤΕΣ ΚΑΤΑΝΟΜΕΣ1. ∆ιωνυµική f (x) = ⎝⎛⎜ v ⎞⎠⎟ p x (1 − p)v−x x = 0,1,...,v . xb(v, p) E( X ) = vp , Var( X ) = vp(1 − p)(Bernoulli b( p) ≡ b(1, p))2. Αρνητική διωνυµική f (x) = ⎝⎜⎛ x −−11⎟⎞⎠ pr (1 − p) x−r x = r , r + 1,... (ή Pascal) NB(r, p) r E(X ) = r , Var( X ) = r(1 − p) p p2(Γεωµετρική: G( p) ≡ NB(1, p))3. Υπεργεωµετρική f ( x) = ⎛⎜⎝ Λx ⎠⎟⎞⎛⎝⎜ M x ⎞⎠⎟ x = 0,1, ..., v . ν− ⎠⎞⎟ YΓ ( Λ, Μ , ν)4. Poisson ⎜⎝⎛ Λ + Μ ν P( λ) E(X ) = ν Λ Λ , Var( X ) = v Λ Λ Μ Λ+Μ −ν +Μ +Μ Λ+Μ Λ+ Μ −1 f (x) = e−λ λx x = 0,1,... x! E(X ) = λ , Var(X ) = λΙΙ. ΒΑΣΙΚΕΣ ΣΥΝΕΧΕΙΣ ΚΑΤΑΝΟΜΕΣ1. Οµοιόµορφη f (x) = ⎪⎧ β 1 α α≤ x≤ β U(α, β) ⎨ − ⎩⎪ 0 αλλού E(X ) = α + β , Var( X ) = (β − α)2 2 122. Εκθετική f (x) = ⎧θe −θx x≥0 Ε(θ) ≡ Ε(1,θ) ≡ Γ (1,θ) ⎨ ⎩ 0 αλλού E(X ) = 1 , Var( X ) = 1 θ θ23. Erlang f (x) = ⎧⎪ θν x ν−1e −θx x≥0 Ε(ν,θ) ≡ Γ(ν,θ) ⎨ (ν −1)! αλλού ⎩⎪ 0 E(X ) = ν , Var( X ) = ν θ θ2
2844. Γάµµα f (x) ⎧⎪ θα x α−1e −θx x≥0 ⎨ Γ (α) αλλού Γ (α, θ ) =5. Κανονική ⎪⎩ 0 Ν (µ,σ 2 ) E(X ) = α , Var( X ) = α θ θ2 f (x) = 1 e−(x−µ)2 (2σ2) −∞< x<∞ σ 2π E( X ) = µ , Var( X ) = σ 2ΙΙΙ. ΚΕΝΤΡΙΚΟ ΟΡΙΑΚΟ ΘΕΩΡΗΜΑ (Κ.Ο.Θ.) Αν X1, X 2 ,..., X v ,...ανεξάρτητες και ισόνοµες µε κοινή συνάρτηση κατανοµής F και E( X i ) = µ .Var( X i ) = σ 2 , τότε v(X − µ) → Ν (0,1) και v(X − µ) → Ν (0,1) καθώς v→∞ ( v ≥ 30 ). σ S 2. ΣΤΑΤΙΣΤΙΚΗΙ. ∆ΙΑΣΤΗΜΑΤΑ ΕΜΠΙΣΤΟΣΥΝΗΣ ΣΥΝΤΕΛΕΣΤΟΥ ΕΜΠΙΣΤΟΣΥΝΗΣ 100(1 − α)%1. ∆είγµατα από κανονική κατανοµή(*)(*) Τα διαστήµατα που σηµειώνονται µε (*) ισχύουν προσεγγιστικά από οποιαδήποτεκατανοµή και αν προέρχεται το δείγµα ή τα δείγµατα.1α. ∆ιάστηµα εµπιστοσύνης για το µ από δείγµα µεγέθους ν⎡ X − σ zα / 2 , X+ σ zα / 2 ⎤ σ 2 γνωστό⎢⎣ v v ⎦⎥ σ 2 άγνωστο, v < 30 .⎡ X − S tv−1;α / 2 , X+ S tv−1;α / 2 ⎤ Αν v ≥ 30, tv−1;α / 2 ≈ zα / 2⎢⎣ v v ⎥⎦ σ 2 άγνωστο, v ≥ 30⎡ X − S zα / 2 , X+ S zα / 2 ⎤ *⎣⎢ v v ⎦⎥1β. ∆ιάστηµα εµπιστοσύνης για το σ 2 από δείγµα µεγέθους ν⎡(v −1)S 2 , (v −1)S 2 ⎤⎢ ⎥⎣⎢ χ 2 / 2 χ 2 / 2 ⎦⎥ v−1;α ν−1;1−α
2851γ. ∆ιάστηµα εµπιστοσύνης για τη διαφορά µ1 − µ2 , από δύο ανεξάρτητα δείγµατα µεγέθους ν1, ν2⎡ σ12 σ 2 Χ −Υ + zα/2 σ12 σ 2 ⎤⎢Χ −Υ zα / 2 ν1 2 , ν1 2 ⎥ σ12 2⎣⎢ − + + ⎥⎦ , σ 2 γνωστά ν2 ν2 σ12 = σ 2 = σ 2 άγνωστο 2 X −Y ±Sp 11 tv1+v2 −2;α / 2 v1, v2 < 30 , v1 + v2 S 2 = (v1 − 1)S12 + (v2 − 1) S 2 p 2 v1 + v2 − 2⎡ −Υ S12 S 2 S12 S 2 ⎤ * σ12 , σ 2 άγνωστα⎢Χ zα / 2 ν1 2 , Χ − Υ + zα/2 ν1 2 ⎥ 2⎣⎢ − + + ν2 ν2 ⎥⎦ v1, v2 ≥ 30 ,1δ. ∆ιάστηµα εµπιστοσύνης για το πηλίκο σ 2 /σ 2 , από δύο ανεξάρτητα δείγµατα 1 2 µεγέθους v1, v2⎡ S12 Fv2 −1,v1−1;1−α / 2 , S12 Fv2 −1,v1−1;α / 2 ⎤ 1 = Fv1−1,v2 −1;1−α / 2⎢ ⎥ Fv2 −1,v1−1;α / 2⎣ S 2 S 2 ⎦ 2 22. ∆είγµατα από την κατανοµή Bernoulli2α. ∆ιάστηµα εµπιστοσύνης για την πιθανότητα p από δείγµα µεγέθους ν⎡ X (1 − X ) , X + zα/2 X (1 − X ) ⎤ v ≥ 30⎢X − zα/2 v ⎥⎣⎢ v ⎦⎥2β. ∆ιάστηµα εµπιστοσύνης για τη διαφορά p1 − p2 , από δύο ανεξάρτητα δείγµατα µεγέθους v1, v2X −Y ± zα/2 X (1 − X ) + Y (1 − Y ) v1, v2 ≥ 30 v1 v2ΙΙ. ΕΛΕΓΧΟΙ ΥΠΟΘΕΣΕΩΝH 0 η µηδενική υπόθεση, H1 η εναλλακτική. Αν η τιµή της στατιστικής συνάρτησηςανήκει στην κρίσιµη περιοχή R απορρίπτουµε την H 0 , ενώ όταν δεν ανήκει στην Rαποδεχόµαστε την H 0 .
2861. Έλεγχος για τη µέση τιµή µ της N ( µ, σ 2 ) από δείγµα µεγέθους ν(*)(*) Οι έλεγχοι που σηµειώνονται µε (*) ισχύουν προσεγγιστικά από οποιαδήποτεκατανοµή και αν προέρχεται το δείγµα ή τα δείγµατα.H0 : µ ≤ µ0 H0 : µ ≥ µ0 H0 :µ = µ0H1 : µ > µ0 H1 : µ < µ0 H1:µ ≠ µ0R = {Z > zα } R = {Z < −zα } R = {| Z |> zα / 2} σ 2 γνωστό Z = (X − µ0 ) v σ σ 2 άγνωστοR = {Z > zα }(*) R = {Z < −zα } (*) R = {| Z |> zα / 2} (*) v ≥ 30 Z ≈ (X − µ0 ) v SR = {T > tv−1;α } R = {T < −tv−1;α } R = {| T |> tv−1;α / 2} σ 2 άγνωστο v < 30 T = (X − µ0 ) v S2. Έλεγχος για τη διαφορά µ1 − µ2 από ανεξάρτητα κανονικά δείγµατα µεγέθουςv1 , v2 (*)(*) Οι έλεγχοι που σηµειώνονται µε (*) ισχύουν προσεγγιστικά από οποιαδήποτεκατανοµή και αν προέρχεται το δείγµα ή τα δείγµατα.H 0 : µ1 − µ2 ≥ δ0 H 0 : µ1 − µ2 = δ0 H 0 : µ1 − µ2 ≤ δ0 συνήθωςH 0 : µ1 − µ2 < δ0 H 0 : µ1 − µ2 ≠ δ0 H1 : µ1 − µ2 > δ0 δ0 = 0 σ 2 ,σ 2 , γνωστά, 1 2R = {Z < −zα } R = {| Z | > zα / 2 } R = {Z > zα } Z = X −Y − δ0 2 2 σ 1 + σ 2 v1 v2 σ 2 ,σ 2 , άγνωστα, 1 2R = {Z < −zα } (*) R = {| Z | > zα / 2}(*) R = {Z > zα } (*) Z ≈ X − Y − δ0 S12 S 2 v1 + 2 v2 v1 , v2 ≥ 30 σ 1 = σ 2 = σ άγνωστο, v1 < 30 , v2 < 30R = {T < −tv1+v2 −2;α } R = {| T | > tv1 +v2 − 2;α / 2} R = {T > tv1+v2 −2;α } Sp = (v1 − 1) S12 + (v2 − 1)S 2 2 v1 + v2 − 2 T = X −Y − δ0 1 1 Sp v1 + v2
2873. Έλεγχος για τη διασπορά σ 2 της N ( µ, σ 2 )H0 :σ 2 ≤ σ 2 H0 :σ 2 ≥ σ 2 H0 :σ 2 = σ 2 χ2 = (ν −1)S 2 0 0 0H0 :σ 2 > σ 2 H1 :σ 2 < σ 2 H1 :σ 2 ≠ σ 2 σ 2 0 0 0 0R = {χ 2 > χ 2 α } R = {χ2 < χ 2 α } R = {χ2 < χ 2 / 2 ή ν−1; ν−1; ν−1;1−α χ2 > χ 2 α / 2 } ν−1;4. Σύγκριση διασπορών δύο κανονικών κατανοµών από ανεξάρτητα δείγµατα µεγέθους ν1 , ν2H0 :σ12 ≤ σ 2 H 0 :σ12 = σ 2 Η0 :σ12 ≥ σ 2 2 2 2H 1 :σ 2 > σ 2 H1 :σ12 ≠ σ 2 H1 :σ12 < σ 2 1 2 2 2R = ⎧ S12 > Fv2 −1,v1−1;α ⎫ R = ⎧ S12 > Fv2 −1,v1−1;α / 2 ή R = ⎧ S 2 > Fv1−1,v2 −1;α ⎫ ⎨ ⎬ ⎨ ⎨ 2 ⎬ ⎩ ⎩ ⎩ S 2 ⎭ S 2 S12 ⎭ 2 2 S 2 > Fv1−1,v2 −1;α / 2 ⎫ 2 ⎬ S12 ⎭5. Έλεγχος για το p της κατανοµής BernoulliH0 : p ≤ p0 H0 : p ≥ p0 H0 : p = p0 v ≥ 30 , Z ≈ (X − p0 ) vH1 : p > p0 H1 : p < p0 H1 : p ≠ p0 X (1 − X ) R = {| Z | > zα / 2}R = {Z > zα } R = {Z < −zα }6. Σύγκριση των πιθανοτήτων, από δύο ανεξάρτητα δείγµατα µεγέθους v1 , v2 από την κατανοµή BernoulliH 0 : p1 ≤ p2 H 0 : p1 ≥ p2 H 0 : p1 = p2H1 : p1 > p2 H1 : p1 < p2 H1 : p1 ≠ p2R = {Z > zα } R = {Z < −zα } R = {| Z | > zα / 2} v1, v2 ≥ 30όπου Z ≈ X −Y X (1 − X ) + Y (1 − Y ) v1 v2
Search
Read the Text Version
- 1
- 2
- 3
- 4
- 5
- 6
- 7
- 8
- 9
- 10
- 11
- 12
- 13
- 14
- 15
- 16
- 17
- 18
- 19
- 20
- 21
- 22
- 23
- 24
- 25
- 26
- 27
- 28
- 29
- 30
- 31
- 32
- 33
- 34
- 35
- 36
- 37
- 38
- 39
- 40
- 41
- 42
- 43
- 44
- 45
- 46
- 47
- 48
- 49
- 50
- 51
- 52
- 53
- 54
- 55
- 56
- 57
- 58
- 59
- 60
- 61
- 62
- 63
- 64
- 65
- 66
- 67
- 68
- 69
- 70
- 71
- 72
- 73
- 74
- 75
- 76
- 77
- 78
- 79
- 80
- 81
- 82
- 83
- 84
- 85
- 86
- 87
- 88
- 89
- 90
- 91
- 92
- 93
- 94
- 95
- 96
- 97
- 98
- 99
- 100
- 101
- 102
- 103
- 104
- 105
- 106
- 107
- 108
- 109
- 110
- 111
- 112
- 113
- 114
- 115
- 116
- 117
- 118
- 119
- 120
- 121
- 122
- 123
- 124
- 125
- 126
- 127
- 128
- 129
- 130
- 131
- 132
- 133
- 134
- 135
- 136
- 137
- 138
- 139
- 140
- 141
- 142
- 143
- 144
- 145
- 146
- 147
- 148
- 149
- 150
- 151
- 152
- 153
- 154
- 155
- 156
- 157
- 158
- 159
- 160
- 161
- 162
- 163
- 164
- 165
- 166
- 167
- 168
- 169
- 170
- 171
- 172
- 173
- 174
- 175
- 176
- 177
- 178
- 179
- 180
- 181
- 182
- 183
- 184
- 185
- 186
- 187
- 188
- 189
- 190
- 191
- 192
- 193
- 194
- 195
- 196
- 197
- 198
- 199
- 200
- 201
- 202
- 203
- 204
- 205
- 206
- 207
- 208
- 209
- 210
- 211
- 212
- 213
- 214
- 215
- 216
- 217
- 218
- 219
- 220
- 221
- 222
- 223
- 224
- 225
- 226
- 227
- 228
- 229
- 230
- 231
- 232
- 233
- 234
- 235
- 236
- 237
- 238
- 239
- 240
- 241
- 242
- 243
- 244
- 245
- 246
- 247
- 248
- 249
- 250
- 251
- 252
- 253
- 254
- 255
- 256
- 257
- 258
- 259
- 260
- 261
- 262
- 263
- 264
- 265
- 266
- 267
- 268
- 269
- 270
- 271
- 272
- 273
- 274
- 275
- 276
- 277
- 278
- 279
- 280
- 281
- 282
- 283
- 284
- 285
- 286
- 287
- 288
- 289
- 290
- 291
- 292
- 293
- 294
- 295
- 296
- 297
- 298
- 299
- 300
- 301
- 302
- 303
- 304
- 305
- 306
- 307
- 308
- 309
- 310
- 311