Statistikos pagrindai

I Uždavinys

Žinoma n= 50 tiriamo požymio reikšmių. Sudaryti intervalinę statistinę

lentelę, kai intervalų skaičius k= 5 ir nubrėžti santykinių dažnių

histogramą. Apskaičiuoti imties vidurkį [pic], dispersiją S2 , patikslintą

dispersiją [pic]ir vidutinius kvadratinius nuokrypius S, S1.

n= 50

|1 |[0.2; 1.0) |4 |0.08 |0.1 |

|2 |[1.0; 1.8) |13 |0.26 |0.325 |

|3 |[1.8; 2.6) |23 |0.46 |0.575 |

|4 |[2.6; 3.4) |6 |0.12 |0.15 |

|5 |[3.4; 4.2] |4 |0.08 |0.1 |

|∑ | |50 |1 | |

Santykinių dažnių histograma

[pic]

II uždavinys

a)

Žinoma 50 normaliojo atsitiktinio dydžio reikšmių. Pasirinkę pasikliovimo

lygmenį

γ=0.99 rasime pparametro α pasikliautinąjį intervalą, kai vidutinis

kvadratinis nuokrypis σ žinomas ir lygus S1, imant su vienu ženklu po

kablelio neapvalinant.

Parametras a surandamas :

[pic] ;[pic]

Standartinio normaliojo skirstinio kritinė reikšmė

[pic]

imties didumas n=50, vidurkis [pic]=2.04, vidutinis kvadratinis nuokrypis

S1=0.8733. Todėl σ =0.8. Tuomet:

[pic]= 2.576*0.8/√50

δ=0.2914

Taigi α pasikliautinasis intervalas 0.01 tikslumu yra (1.749;2.33)

b) Žinoma 50 normaliojo atsitiktinio dydžio reikšmių. Pasirinkę

pasikliovimo lygmenį γ=0.95 rasime normaliojo skirstinio parametro a

pasikliautinąjį intervalą kai vidutinis kvadratinis nuokrypis σ nežinomas,

taikydami išraiškas:

[pic]; [pic]

Čia imties didumas n=50, imties vidurkis [pic]=2.04, vidutinis kvadratinis

nuokrypis S1=0.8733, Stjūdento skirstinio kritinė rreikšmė :

[pic] = [pic]= t0,025;49 = 2.010

[pic]

δ=2.010*0.8733/√50

δ=0.248

α pasikliautinasis intervalas 0.01 tikslumu yra: (1.792; 2.288)

[pic]=2.04-0.248 = 1.792

[pic]=2.04+0.248 = 2.288

Dabar rasime pasikliautinąjį intervalą [pic]), kai a nežinomas. Šio

intervalo išraiška:

[pic],

čia

[pic]= X20.025;49 = 70.222

[pic] = X20.975;49 = 31.555

yra X2 skirstinio kritinės rreikšmės.

Vidutinis kvadratinis nuokrypis S1 = 0.8733.

Taigi σ pasikliautinasis intervalas :

[pic]= (0.736;1.089)

c) Žinoma nedidelė normaliojo atsitiktinio dydžio imtis (I uždavinio 2

pvz.) ir kontrolinė suma

K∑5 = [pic]+ α + σ = 6.815

I uždavinio 2 pavyzdys:

Žinoma nedidelė imtis:

0.3; 1.7; 2.0; 2.3; 2.5; 2.7; 3.7; 3.8; 3.8; 3.9;4.1;

4.2; 4.3; 4.5; 4.5; 5.4; 5.6; 5.7; 5.9; 7.1; 8.8

ir kontrolinė suma

[pic]=11.34998

Šios imties didumas n=21

Imties vidurkis [pic]

[pic]= 1/21*86.8

[pic]= 4.133

Skaičiuosime dispersiją

[pic]S2=[pic] [pic]= 73.92667

S2=1/21* 73.92667

S2=3.52

Patikslinta dispersija

S21=[pic]

S21=1/20*73.92667

S21=3.6963

Vidutiniai kvadratiniai nuokrypiai

S=[pic]; S1=[pic]

S=√3.52

S=1.876

S1=[pic]

S1=1.922

[pic]= 4.133+3.52+3.6963= 11.3493

Pasirinkę pasikliovimo lygmenį γ=0.95, rasime:

• parametro α pasikliautinąjį intervalą kai vidutinis kvadratinis

nuokrypis σ nežinomas,

• parametro σ pasikliautinąjį intervalą kai vidutinis kvadratinis

nuokrypis α nežinomas,

Taikykime α pasikliautinąjį intervalą kai σ nežinomas, išraiškas:

[pic] [pic];

čia imties didumas n= 21, imties vidurkis [pic]= 4.133, vidutinis

kvadratinis nuokrypis S1=1.922, Stjūdento skirstinio kkritinė reikšmė [pic]=

[pic]= t0,025;20 = 2.086

Apskaičiuojame:

[pic]

δ=2.086*1.922/√20

δ=0.8965

Taigi α pasikliautinasis intervalas:

0.001 tikslumu-(3.237; 5.029)

0.01 tikslumu-(3.24; 5.02)

Raskime σ pasikliautinąjį intervalą, kai α nežinomas.

Šio intervalo išraiška:

[pic]

čia X2 skirstinio reikšmės yra:

[pic]= X20.025;20 = 34.170;

[pic] = X20.975;20 = 9.591.

Tuomet σ pasikliautinasis intervalas:

[pic]

0.001 tikslumu-(1.470; 2.775)

0.01 tikslumu-(1.47; 2.77)

Skaičiavimo rezultatų patikra:

K∑5 = [pic]+ α + σ = 2.086+3.24+1.470= 6.796

III uždavinys

Žinoma 50 požymio reikšmių. Atsižvelgę į santykinių dažnių histogramos

pavidalą, formuluojame neparametrinę hipotezę H1: X~N(α٫σ) ir ją

patikrinkime, parinkę reikšmingumo lygmenį α= 0.05 ir pritaikę χ2

suderinamumo kriterijų.

Ar apskaičiuota teisingai, ppasitikrinsime pagal kontrolines sumas:

K∑3= p1+p2+p3=0.738

K∑4= [pic]+[pic]+[pic]=2.1745

Esame sudarę intervalinę eilutę:

|Numeris i |Intervalai |Dažniai ni |

|1 |[0.2; 1.0) |4 |

|2 |[1.0; 1.8) |13 |

|3 |[1.8; 2.6) |23 |

|4 |[2.6; 3.4) |6 |

|5 |[3.4; 4.2] |4 |

|∑ | |50 |

Imties vidurkis [pic]=2.04, vidutinis kvadratinis nuokrypis S=0.864

Apskaičiuojame ui=[pic]; 0.01 tikslumu:

U1=[pic]= [pic]≈ – 1.203

U2=[pic]=[pic]≈ – 0.277

U3=[pic]=[pic]≈ 0.648

U4=[pic]=[pic]≈ 1.574

Randame Laplaso funkcijos reikšmes:

[pic]- 0.3849

[pic]- 0.1064

[pic]0.2389

[pic]0.4418

Apskaičiuojame tikimybes pi. Jos lygios Laplaso funkcijos reikšmių

skirtumui:

[pic]= – 0.3849+0.5= 0.1151

[pic]= – 0.1064-(- 0.3849) = 0.2785

[pic]= 0.2389-(- 0.1064) = 0.3453

[pic]= 0.4418- ( 0.2389) = 0.2029

[pic]= 0.5 – 0.4418 = 0.0582

Kontrolinė suma:

K∑3= p1+p2+p3= 0.1151+0.2785+0.3453= 0.738

Apskaičiuojame sandaugas n*pi, reiškiančias reikšmių patekimo į i-tąjį

intervalą teorinius dažnius, χ2 kriterijaus narius [pic] ir χ2sk

|Numeris i |Intervalai|Dažniai ni|pi |npi |χ2i |

|1 |[0.2; 1.0)|4 |0.1151 |5.755 |0.535 |

|2 |[1.0; 1.8)|13 |0.2785 |13.925 |0.061 |

|3 |[1.8; 2.6)|23 |0.3453 |17.265 |1.905 |

|4 |[2.6; 3.4)|6 |0.2029 |10.145 |1.693 |

|5 |[3.4; 4.2]|4 |0.0582 |2.91 |0.408 |

|∑ | |50 |1 |50 |4.602 |

Kontrolinė suma:

K∑4= [pic]+[pic]+[pic]=2.501

Parikę reikšmingumo lygmenį α= 0.05 ir normaliojo skirstinio atveju

apskaičiavę laisvės laipsnių skaičių v= k-r-1= 5-2-1= 2, χ2 skirstinio

reikšmių lentelėje randame χ2kr = 5.991 Kadangi χ2sk< χ2kr, tai hipotezė

H1: X~N(2.04; 0.864)

b)

Žinoma 50 požymio reikšmių ir kontrolinės sumos:

|1 |[0; 1.0) |18 |0.36 |0.36 |

|2 |[1.0; 2.0)|14 |0.28 |0.28 |

|3 |[2.0; 3.0)|9 |0.18 |0.18 |

|4 |[3.0; 4.0)|5 |0.1 |0.1 |

|5 |[4.0; 5.0]|4 |0.08 |0.08 |

|∑ | |50 |1 | |

Pasitikriname dažnius pagal kontrolinę sumą: K∑1=41

Apskaičiuojame imties vidurkį [pic];

[pic]

[pic]= 1/50*85.7

[pic]= 1.714

Tuomet λ*= 1/[pic]= 0.5834

[pic]

Atsižvelgę į dažnius arba į histogramos pavidalą, suformuluokime

neparametrinę hipotezę H2 :X~ε(0.5834) ir ją patikrinkime, pasirinkę

reikšmingumo lygmenį α= 0.05 ir pritaikę χ2 suderinamumo kriterijų.

Ieškome tikimybių:

[pic]= 1-0.557= 0.442

[pic]= 0.557-0.311= 0.2456

[pic]= 0.311-0.1737= 0.1373

[pic]= 0.1737-0.096= 0.0777

[pic]= 0.096-0= 0.096

Tikriname tikimybes:

K∑2= p1+p2+p3= 0.824

Radę tikimybes pi apskaičiuojame npi ir χ2:

|Numeris i |Intervalai|Dažniai ni|pi |npi |χ2i |

|1 |[0; 1.0) |18 |0.442 |22.1 |0.760633 |

|2 |[1.0; 2.0)|14 |0.2456 |12.28 |0.240912 |

|3 |[2.0; 3.0)|9 |0.1373 |6.865 |0.66398 |

|4 |[3.0; 4.0)|5 |0.0777 |3.885 |0.320006 |

|5 |[4.0; 5.0]|4 |0.096 |4.8 |0.133333 |

|∑ | |50 |1 |50 |2.118866 |

Patikriname χ2sk pagal kontroline suma:

K∑3=[pic]+[pic]+[pic]= 1.65

Taigi χ2s= 2.118

Pasirinkę reikšmingumo lygmenį α= 0.05 ir apskaičiavę rodiklinio skirstinio

atveju laisvės laipsnių skaičių v= k-r-1= 5-1-1= 3, χ2 skirstinio reikšmių

lentelėje randame χ2kr= 7.815

Kadangi χ2sk< χ2kr, tai hipotezė H2: X~ ε(0.5834) priimama.

c)

Žinoma 50 požymio reikšmių ir kontrolinės sumos:

|1 |[0.7; 3.3)|14 |0.28 |0.107692 |

|2 |[3.3; 5.9)|7 |0.14 |0.053846 |

|3 |[5.9; 8.5)|12 |0.24 |0.092308 |

|4 |[8.5; |8 |0.16 |0.061538 |

| |11.1) | | | |

|5 |[11.1; |9 |0.18 |0.069231 |

| |13.7] | | | |

|∑ | |50 |1 | |

Patikriname dažnius K∑3= n1+n2+n3=33

Brėžiame histograma:

[pic]

Atsižvelgę ii dažnius arba i histogramą suformuluokime neparametrinę

hipotezę

H3: X~ υ([0.7; 13.7]) ir ją patikrinkime, parinkę reikšmingumo lygmenį α=

0.05 pritaikę χ2 suderinamumo kriterijų.

Tikimybės pi, reiškiančios kad X įgis reikšmę i-tajame intervale, šiuo

atveju yra lygios, t.y. pi=0.2 ir npi= 10

Todėl:

Apskaičiuojame statistikos X2 narius ir gauname χ2sk

|Numeris i |Intervalai|Dažniai ni|pi |npi |χ2i |

|1 |[0.7; 3.3)|14 |0.2 |10 |1.6 |

|2 |[3.3; 5.9)|7 |0.2 |10 |0.9 |

|3 |[5.9; 8.5)|12 |0.2 |10 |0.4 |

|4 |[8.5; |8 |0.2 |10 |0.4 |

| |11.1) | | | | |

|5 |[11.1; |9 |0.2 |10 |0.1 |

| |13.7] | | | | |

|∑ | |50 |1 |50 |3.4 |

Patikriname X2 narius pagal kontrolinę sumą

K∑4= [pic]+[pic]+[pic]=2.9

Pasirinkę reikšmingumo lygmenį α= 0.05 ir apskaičiavę laisvės laipsnių

skaičių

v=k-r-1 = 5-2-1= 2 nustatome χ2kr = 5.991. Kadangi χ2sk< χ2kr, tai

hipotezė H3: X~ υ([0.7; 13.7]) yra priimama.

d)

Tarkime, kad diskrečiojo a. d. X reikšmės ir jų dažniai yra:

|0 |5 |0.0246 |4.1328 |0.181968 |

|1 |14 |0.091 |15.288 |0.108513 |

|2 |30 |0.168 |28.224 |0.111755 |

|3 |31 |0.208 |34.944 |0.445145 |

|4 |33 |0.192 |32.256 |0.017161 |

|5 |25 |0.142 |23.856 |0.05486 |

|6 |12 |0.0879 |14.7672 |0.518541 |

|7 |18 |0.0865 |14.532 |0.827623 |

|∑ | | |168 |2.265565 |

Patikriname X2 narius pagal kontrolinę sumą

K∑4= [pic]+[pic]+[pic]=0,391

Gauname χ2sk 2.265

Kai α= 0.05, ir apskaičiavę laisvės laipsnių skaičių

v=k-r-1 =

8-1-1= 6 nustatome χ2kr = 12.592

Toliau tikriname, ar χ2sk 2.265 patenka į kritinę sritį [12,592;+∞).

Matome, kad patenka. Todėl hipotezę, kad atsitiktinis dydis X pasiskirstęs

pagal Puansono skirstinį.

IV Uždavinys

a)

Žinoma 50 normaliojo atsitiktinio dydžio reikšmių, α0 ir σ. Reikšmė α0 yra

imties vidurkio sveikoji dalis; σ lygus S1 su vienu ženklu po kablelio

neapvalinant. Patikrinkime parametrinę hipotezę H0 : α= α0, parinkę

reikšmingumo lygmenį α= 0.01 ir dvi alternatyviąsias hipotezes. Hipotezė H0

: α= α0 tikrinama taikant standartinį normalųjį reikšmingumo kriterijų

[pic];

Esame gavę imties vidurkį [pic]=2.04, vidutinį kvadratinį nnuokrypį

S1=0.8733

Todėl α0=2, σ=0.8.

Apskaičiuojame kriterijaus U reikšmę Usk = 0.353

Iš pradžių parenkama bendroji alternatyva Ha= α≠ α0.

Šiuo atveju taikoma dvipusė kritinė sritis:

[pic]= (-∞;-2.576]U[2.576; +∞)

Matome, kad paskaičiuota Usk nepatenka į KS. Todėl nulinė hipotezė H0 : α=

α0 priimama.

Kadangi galioja nelygybė [pic]> α0, dar parenkama alternatyvioji hipotezė

H0 : α> α0.

Šiuo atveju taikoma vienpusė kairioji dešinioji sritis:

[Ua; +∞)= [2.327; +∞)

Matome, kad paskaičiuota Usk nepatenka į KS. Todėl nulinė hipotezė H0 : α=

α0 priimama.

b)

Žinoma, kad atsitiktinis dydis X yra normalusis, t.y. X ~N(α٫σ). Jo

parametrai α iir σ nežinomi. Turime 50 normaliojo atsitiktinio dydžio

reikšmių. Esame gavę imties vidurkį [pic]=2.04, vidutinį kvadratinį

nuokrypį S1=0.8733. Reikšmė α0 yra imties vidurkio sveikoji dalis, todėl

α0=2 σ0 lygus S1 su vienu ženklu po kablelio neapvalinant, ir plius 0.2

todėl σ0 lygus 1.0.

Patikrinkime dvi nnulines hipotezes:

H0 : α= α0 H0 : σ= σ0,

Parinkę reikšmingumo lygmenį α= 0.05 ir dvi alternatyviąsias hipotezes.

Hipotezė H0 : α= α0 tikrinama taikant Stjūdento reikšmingumo kriterijų

[pic]

Tsk=0.324

Iš pradžių parenkame bendrąją alternatyvą Ha:α≠ α0.

Šiuo atveju taikoma dvipusė kritinė sritis:

[pic]= (-∞;-2.010]U[2.010; +∞).

Matome, kad paskaičiuota Stjūdento statistikos reikšmė Tsk nepatenka į KS.

Todėl nulinė hipotezė H0 : α= α0 priimama.

Kadangi galioja nelygybė [pic]> α0, dar parenkama alternatyvioji hipotezė

H0 : α> α0. Šiuo atveju taikoma vienpusė dešinioji kritinė sritis:

[ta; +∞)= [1.677; +∞)

Matome, kad paskaičiuota Tsk nepatenka į KS. Todėl H0 : α= α0 priimama.

Hipotezė H0 : σ= σ0, tikrinama taikant χ2 kriterijų

[pic]C(n-1).

Apskaičiuojame χ2sk = 37.369

Iš pradžių parenkame bendrąją alternatyvą H0 : σ≠σ0

Šiuo atveju taikoma dvipusė kritinė sritis:

[pic]=(0; 31.555]U[70.222; +∞).

Matome, kad paskaičiuota χ2sk nepatenka į KS, nors yyra netoli nuo 31.555.

Todėl nulinė hipotezė H0 priimama, bet eksperimentą geriau pakartoti.

Esame gavę S1=0.8733 ir pastebime kad galioja nelygybė S1< σ0 ir taikoma

vienpusė kairioji kritinė sritis:

[pic]= (0; 33.930]

šiuo atveju χ2sk nepatenka į KS todėl nulinė hipotezė H0 : α= α0 priimama.

c)

Žinoma nedidelė imtis n=18 α0 ir σ. Reikšmė α0 yra imties vidurkio sveikoji

dalis; σ lygus S1 su vienu ženklu po kablelio neapvalinant plius 0.2.

Patikrinkime dvi nulines parametrines hipotezes:

H0 : α= α0 H0 : σ= σ0,

Parinkę reikšmingumo lygmenį α= 0.05 ir ddvi alternatyviąsias hipotezes.

Esame gavę kad [pic]= 4.133 ir S1=1.922

Todėl :

α0 =4, σ =2.1

Hipotezė H0 : α= α0 tikrinama taikant Stjūdento reikšmingumo kriterijų.

[pic]

Apskaičiuojame Tsk= 0.489

Iš pradžių parenkame bendrąją alternatyvą Ha:α≠ α0.

Šiuo atveju taikoma dvipusė kritinė sritis:

[pic]= (-∞;-2.010]U[2.010; +∞).

Matome, kad paskaičiuota Stjūdento statistikos reikšmė Tsk= 0.489 nepatenka

į KS. Todėl nulinė hipotezė H0 : α= α0 priimama.

Kadangi galioja nelygybė [pic]> α0, parenkama alternatyvioji hipotezė Ha :

α> α0. Šiuo atveju taikoma vienpusė dešinioji kritinė sritis:

[ta; +∞)= [1.740; +∞)

Matome, kad paskaičiuota Tsk= 0.489 nepatenka į KS. Todėl H0 : α= α0

priimama.

Hipotezė H0 : σ= σ0, tikrinama, taikant χ2 reikšmingumo kriterijų

[pic]C(n-1).

Žinome, kad S21=3.6963.

Todėl χ2sk = 14.247

Iš pradžių parenkame bendrąją alternatyvą H0 : σ≠σ0

Šiuo atveju taikoma dvipusė kritinė sritis:

KS=[pic]=(0; 7.564]U[30.191; +∞).

Matome, kad paskaičiuota χ2sk nepatenka į KS. Todėl nulinė hipotezė H0

priimama.

Kadangi galioja nelygybė S1< σ0, tai parenkama alternatyvioji hipotezė Ha :

σ< σ0, ir taikoma vienpusė kairioji kritinė sritis:

[pic]= (0; 8.672]

matome, kad ir šiuo atveju χ2sk nepatenka į KS todėl nulinė hipotezė H0

priimama.

V Uždavinys

Žinomos dviejų normaliųjų atsitiktinių dydžių X~N(ax, σx), Y~N(ay, σy)

imtys:

|45 |6 |5 | | |

|56 |5 |7 |4 | |

|65 | |10 |10 |1 |

|76 | |2 |7 |4 |

|85 | | |3 |6 |

Ir kontrolinės sumos

K∑1=[pic]+ Sx= 76.861

K∑2=[pic]+ Sy+r = 90.294

K∑3= V0sk+ V0.8sk+z1+z2= 8.864

Iš pradžių aapskaičiuokime koreliacijos koeficientą r ir raskime regresijos

tiesės lygtį [pic]x= a0+ a1x.

Todėl papildykime turimą koreliacinę lentelę eilute ny ir stulpeliu nx:

|xy |65 |76 |85 |95 |nx |

|45 |6 |5 | | |11 |

|56 |5 |7 |4 | |16 |

|65 | |10 |10 |1 |21 |

|76 | |2 |7 |4 |13 |

|85 | | |3 |6 |9 |

|ny |11 |24 |24 |11 |70 |

Apskaičiuokime vidurkius:

[pic]= 45*11+56*16+65*21+76*13+85*9/70= 64.41

[pic]= 452*11+562*16+652*21+762*13+852*9/70= 4304.12

[pic]= 65*11+76*24+85*24+95*11/70= 80.34

[pic]= 652*11+762*24+852*24+952*11/70=6539.628

[pic][pic]=5261.214

Sx=12.47

Sy=9.22

Kontrolinė suma:

K∑1=[pic]+ Sx= 76.88

Imties koreliacijos koeficientas

r = [pic]

r = 0.752

Kontrolinė suma:

K∑2=[pic]+ Sy+r = 90.3

Regresijos koeficientas a1= [pic]= 0.556,

o regresijos tiesės lygties [pic]x= a0+a1*x laisvasis narys a0=[pic]-

a1*[pic]

a0= 44.528

Pasirinkę pasikliovimo lygmenį γ= 0.95, raskime koreliacijos koeficiento ρ

pasikliautinąjį intervalą taikydami jo išraišką: thz1