PROGNOZAVIMO PAGRINDŲ PRAKTINIAI DARBAI

1 UŽDUOTIS

Užduoties tikslas – išmokti atlikti vienfaktorę dispersinę analizę, taikant skaičiuoklės Microsoft Excel duomenų analizės posistemio Data Analysis uždavinį Anova: Single Factor.

1 lentelė

ANOVA duomenys

14 variantas

Faktoriaus A lygiai Atsitiktinės imtys

1 2 3 4

1 0,145 0,144 0,143 0,144

2 0,154 0,155 0,156 0,155

3 0,170 0,169 0,168 0,171

4 0,178 0,179 0,179 0,177

Norint patikrinti, ar yra statistiškai patikima priklausomybė tarp faktoriaus A lygių ir atsitiktinių imčių, keliama nulinė hipotezė, kad faktoriaus lygių vidurkiai yra lygūs:

H0 : 1 = 2 = 3=4.

Gauname tokius Anova: Single Factor skaičiavimų rezultatus:

SUMMARY

Groups Count Sum Average Variance

Row 1 4 0,58 0,144 0,000001

Row 2 4 0,62 0,155 0,000001

Row 3 4 0,68 0,1695 0,000002

Row 4 4 0,71 0,17825 0,000001

ANOVA

Source of Variation SS df MS F P-value F crit

Between Groups 0,002772 3 0,000924 943,5532 1,66E-14 3,4903

Within Groups 1,18E-05 12 9,79E-07

Total 0,002783 15

Šiuo atveju nulinę hipotezę HH0 : 1 = 2 = 3=4 atmetame, nes F > Fα ir p<α (α=0,05).

Norint patikrinti, ar pakartojimai neturi įtakos rezultatinio rodiklio kitimui, keliama nulinė hipotezė:

H0 : µ1 = µ2 = µ3 = µ4

Gauname tokius Anova: Single Factor skaičiavimų rezultatus:

SUMMARY

Groups Count Sum Average Variance

Column 1 4 0,65 0,16 0,00022

Column 2 4 0,65 0,16 0,00024

Column 3 4 0,65 0,16 0,00024

Column 4 4 0,65 0,16 0,00023

ANOVA

Source of Variation SS df MS F P-value F crit

Between Groups 1,88E-07 3 6,25E-08 0,000269 0,999994 3,4903

Within Groups 0,002783 12 0,000232

Total 0,002783 15

Šiuo atveju nulinės hipitezės H0 : 1 = 2 = 3=4 atmesti neturime pagrindo, nes F < Fα ir

p > α (α = 0,05).

2 DARBAS

Užduoties tikslas – išmokti aatlikti dispersinę analizę, taikant Statsoft kompanijos programos STATISTICA modulį ANOVA/MANOVA.

2.1. Vienfaktorė dispersinė analizė

1 lentelė

ANOVA duomenys

14 variantas

Faktoriaus A lygiai Atsitiktinės imtys

1 2 3 4

1 0,145 0,144 0,143 0,144

2 0,154 0,155 0,156 0,155

3 0,170 0,169 0,168 0,171

4 0,178 0,179 0,179 0,177

Summary of all Effects; design: (new.sta)

GENERAL MANOVA 1-A

Effect df Effect MS

Effect Df Error MS

Error F p-level

1 3 0,000924 12 0,000001 943,5532 0,000000

Iš Summary of all Effect lentelėje gautų rezultatų galima teigti, kad nnulinę hipotezę

H0 : µ1 = µ2 = µ3 = µ4 turime atmesti, nes F>Fα (p<α), t.y. pripažįstame faktoriaus įtaką rezultatiniam rodikliui.

Atlikę komandą Means/Graphs Table of All Effects  Scrollsheet, ekrane matome priklausomojo kintamojo (atsitiktinės imties) vidurkius (jiems kėlėme nulinę hipotezę) pagal faktoriaus lygius.

Means

GENERAL MANOVA F(3,12)=943,55; p<,0000

A IMTYS

1 0,144000

2 0,155000

3 0,169500

4 0,178250

Kadangi nustatyta statistiškai reikšminga faktoriaus įtaka rezultatiniam rodikliui, tai turime nustatyti ir faktoriaus kiekvieno lygio įtaką..

Tukey HSD test; variable IMTYS

GENERAL MANOVA Probabilities for Post Hoc Tests

MAIN EFFECT: A

A {1} ,1440000 {2} ,1550000 {3} ,1695000 {4} ,1782500

1 {1} 0,000199 0,000199 0,000199

2 {2} 0,000199 0,000199 0,000199

3 {3} 0,000199 0,000199 0,000199

4 {4} 0,000199 0,000199 0,000199

Statistiškai reikšmingai skiriasi, kai p<α.

Mūsų pavyzdyje statistiškai reikšmingai tarpusavyje skiriasi 1-2; 1-3; 1-4; 2-3; 2-4; 3-4 faktoriaus A lygiai.

Levene’s Test for Homogeneity of Variances (new.sta)

GENERAL MANOVA (ANOVA on absolute within-cell deviation scores)

Degrees oof freedom for all F’s: 3,12

MS

Effect MS

Error F p-level

variable

IMTYS 0,000000 0,000000 0,785714 0,524611771

Matome lentelę, iš kurios rezultatų aišku, kad dispersijos lygios (išvados daromos remiantis p – reikšmėmis: jei p ≥α, tai neturime pagrindo atmesti nulinę hipotezę).

Means (new.sta) Standard Deviations (new.sta)

GENERAL MANOVA 1 Dependent Variable GENERAL MANOVA 1 Depend Variable

A IMTYS Valid N A IMTYS Valid N

G_1:1 0,144000 4 G_1:1 0,000816 4

G_2:2 0,155000 4 G_2:2 0,000816 4

G_3:3 0,169500 4 G_3:3 0,001291 4

G_4:4 0,178250 4 G_4:4 0,000957 4

All Groups 0,161687 16 All Groups 0,013622 16

Tai yra lentelės, kuriose yra pateikiami priklausamojo kintamojo vidurkiai (Means) ir standartiniai nuokrypiai (Standart Deviations) pagal faktoriaus kiekvieną lygį, taip pat atsitiktinių imčių skaičius kiekviename lygyje. Iš šių duomenų galime apskaičiuoti santykinį sklaidos apie vvidurkį rodiklį – variacijos koeficientą.

2.2. Daugiafaktorė dispersinė analizė

2 lentelė

Dviejų faktorių ANOVA duomenys

Variantas 14

Faktorius B

B1 B2

Fak.A Atsitiktines imtys Fak.A Atsitiktines imtys

1 2 3 4 1 2 3 4

A1 0,145 0,144 0,143 0,144 A1 0,131 0,130 0,129 0,130

A2 0,154 0,155 0,156 0,155 A2 0,139 0,140 0,140 0,140

A3 0,170 0,169 0,168 0,171 A3 0,153 0,152 0,151 0,154

A4 0,178 0,179 0,179 0,177 A4 0,160 0,161 0,161 0,159

Pagal turimus duomenis keliamos 3 hipotezės:

1. Keliama nulinė hipotezė, kad faktoriaus A įtakos nėra, ir alternatyvi hipotezė

H0 : µ1. = µ2. = µ3. = µ4.

H1 : bent du vidurkiai skiriasi

2. Keliama nulinė hipotezė,kad faktoriaus B įtakos nėra, ir alternatyvi hipotezė

H0 : µ.1 = µ.2 = µ.3 = µ.4

H1 : bent du vidurkiai skiriasi

3. Keliama nulinė hipotezė, kad faktorių A ir B tarpusavio sąveikos įtakos nėra, ir alternatyvi hipotezė

H0 : µ

Pagal turimus duomenis gauta Summary of all Effects lentelę:

Summary of all Effects; design: (new.sta)

GENERAL MANOVA 1-FAK_B, 2-FAK_A

df Effect MS Effect df Error MS Error F p- level

Effect

1 1 0,002064 24 0,000001 2226,371 0,000000

2 3 0,001637 24 0,000001 1766,056 0,000000

12 3 6,36E-06 24 0,000001 6,865169 0,001686

Iš joje esančių rezultatų galima teigti, kad abu faktoriai ir jų sąveika turi statistiškai reikšmingos įtakos rezultatiniam rodikliui, nes visais trimis atvejais p<α.

Toliau gaunamos trys lentelės, kuriose yra priklausomojo kintamojo atitinkami vidurkiai pagal pasirinkto faktoriaus lygius.

Means (unweighted) (new.sta)

GENERAL MANOVA F(1,24)=2226,37; p<,0000

FAK_B FAK_A Y

B1 .. 0,161687

B2 .. 0,145625

Šioje lentelėje parodyta, kaip priklauso Y veiksnys nuo faktoriaus B.

Means (unweighted) (new.sta)

GENERAL

MANOVA F(3,24)=1766,06; p<,0000

FAK_B FAK_A Y

.. A1 0,137000

.. A2 0,147375

.. A3 0,161000

.. A4 0,169250

Šioje lentelėje parodyta, kaip priklauso Y veiksnys nuo faktoriaus A.

Means (new.sta)

GENERAL

MANOVA F(3,24)=6,87; p<,0017

FAK_A FAK_B Y

B1 A1 0,144000

B1 A2 0,155000

B1 A3 0,169500

B1 A4 0,178250

B2 A1 0,130000

B2 A2 0,139750

B2 A3 0,152500

B2 A4 0,160250

Šioje lentelėje parodyta, kaip priklauso Y veiksnys nuo faktorių A ir faktoriaus B.

Kadangi vvisas iškeltąsias hipotezes atmetame, todėl turime nustatyti pasirinktų faktorių ir jų sąveikos kiekvieno lygio įtaką. Pagal Tjukio HSD kriterijų gauname rezultatų lentelę:

Tukey HSD test; variable Y (new.sta)

GENERAL MANOVA Probabilities for Post Hoc Tests MAIN EFFECT: FAK_B

{1} ,1616875 {2} ,1456250

FAK_B FAK_A

B1 .. {1} 0,000152

B2 .. {2} 0,000152

Čia statistiškai reikšmingi skirtumai tarp faktoriaus B: 1-2

Tukey HSD test; variable Y

GENERAL MANOVA Probabilities for Post Hoc Tests MAIN EFFECT: FAK_A

{1} ,1370000 {2} ,1473750 {3} ,1610000 {4} ,1692500

FAK_B FAK_A

.. A1 {1} 0,000161 0,000161 0,000161

.. A2 {2} 0,000161 0,000161 0,000161

.. A3 {3} 0,000161 0,000161 0,000161

.. A4 {4} 0,000161 0,000161 0,000161

Čia statistiškai reikšmingi skirtumai tarp faktoriaus A: 1-2, 1-3, 1-4; 2-3, 2-4; 3-4.

Tukey HSD test; variable Y (new.sta)

GENERAL MANOVA Probabilities for Post Hoc Tests INTERACTION: 1×2

{1} ,1440000 {2} ,1550000 {3} ,1695000 {4} ,1782500 {5} ,1300000 {6} ,1397500 {7} ,1525000 {8} ,1602500

FAK_B FAK_A

B1 A1 {1} 0,000147 0,000147 0,000147 0,000147 0,00018 0,000147 0,000147

B1 A2 {2} 0,000147 0,000147 0,000147 0,000147 0,000147 0,022536 0,000148

B1 A3 {3} 0,000147 0,000147 0,000147 0,000147 0,000147 0,000147 0,000147

B1 A4 {4} 0,000147 0,000147 0,000147 0,000147 0,000147 0,000147 0,000147

B2 A1 {5} 0,000147 0,000147 0,000147 0,000147 0,000147 0,000147 0,000147

B2 A2 {6} 0,00018 0,000147 0,000147 0,000147 0,000147 0,000147 0,000147

B2 A3 {7} 0,000147 0,022536 0,000147 0,000147 0,000147 0,000147 0,000147

B2 A4 {8} 0,000147 0,000148 0,000147 0,000147 0,000147 0,000147 0,000147

Čia matome statistiškai reikšmingus skirtumus tarp 1-2; 1-3; 1-4; 1-5; 1-6; 1-7; 2-3; 2-4; 2-5; 2-6; 2-8; 3-4; 3-5; 3-6; 3-7; 3-8; 4-5; 4-6; 4-7; 4-8; 5-6; 5-7; 5-8; 6-7; 6-8; 7-8 grupių.

Patikrinsime ar atsitiktinių imčių dispersijos yra lygios. Tam skaičiuosime pagal Levene‘s kriterijų:

Levene’s Test for Homogeneity of Variances (new.sta)

GENERAL MANOVA (ANOVA on absolute within-cell deviation scores) Degrees oof freedom for all F’s: 7,24

MS Effect MS Error F p-level

variable

Y 0,000000 0,000000 0,896103 0,525183

Iš gautos Levene’s Test Homogeneity of Variances lentelės rezultatų aišku, kad bandymų schema sudaryta teisingai, nes atsitiktinių imčių dispersijos lygios (p>α).

Standard Deviations (new.sta)

GENERAL MANOVA 1 Depend Variable

FAK_B FAK_A Y Valid N

B1 A1 0,000816 4

B1 A2 0,000816 4

B1 A3 0,001291 4

B1 A4 0,000957 4

B2 A1 0,000816 4

B2 A2 0,000500 4

B2 A3 0,001291 4

B2 A4 0,000957 4

All Groups 0,015045 32

Toliau gaunamos Means ir Standart deviations lentelės:

Means (new.sta)

GENERAL MANOVA 1 Depend Variable

FAK_B FAK_A Y Valid N

B1 A1 0,144000 4

B1 A2 0,155000 4

B1 A3 0,169500 4

B1 A4 0,178250 4

B2 A1 0,130000 4

B2 A2 0,139750 4

B2 A3 0,152500 4

B2 A4 0,160250 4

All Groups 0,153656 32

Šiose lentelėse yra pateikiami priklausomojo kintamojo vidurkiai ir standartiniai nuokrypiai pagal abiejų faktorių sąveikos kiekvieną lygį, taip pat atsitiktinių imčių skaičius kiekviename lygyje.

Analizė bus išsamesnė ir akivaizdesnė, jei panaudosime ir kitus Descriptive statistics & Graphs dialogo skygelyje nurodytus grafikus, pavyzdžiui, ūselinę diagramą (Categorized box – whisker plot):

3 UŽDUOTIS

Užduoties tikslas – išmokti atlikti vienfaktorę ir daugiafaktorę regresinę analizę, taikant skaičiuoklės Microsoft Excel statistines funkcijas TREND ir LINEST bei GROWTH ir LOGEST.

3.1. Vienfaktorė regresinė analizė

y x1 TREND LINEST GROWTH LOGEST

2,59 47,00 2,0422293 0,0483719 -0,2312519 2,0039375 1,027794 0,552468

1,66 38,90 1,6504166 0,0133583 0,5507255 1,6048942 0,008294 0,341948

1,53 32,50 1,3408362 0,4214544 0,3346109 1,3466312 0,377692 0,207761

2,20 47,50 2,0664153 13,1125009 18,0000000 2,0315950 10,92459 18

1,65 47,30 2,0567409 1,4681344 2,0153606 2,0204865 0,471557 0,776966

1,99 50,90 2,2308799 2,2300632

1,55 33,60 1,3940453 1,3878584

2,13 40,20 1,7133001 1,6631219

2,04 48,20 2,1002756 2,0709578

1,77 41,10 1,7568348 1,7046663

1,03 37,50 1,5826959 1,5444653

1,65 36,60 1,5391611 1,5068251

2,51 48,20 2,1002756 2,0709578

1,02 37,50 1,5826959 1,5444653

1,76 45,20 1,9551598 1,9074518

1,70 33,20 1,3746965 1,3727226

1,97 40,20 1,7133001 1,6631219

1,56 35,20 1,4714404 1,4500888

1,16 37,00 1,5585099 1,5234395

1,42 39,10 1,6600910 1,6137178

46 1,9938574 1,9497471

Iš statistinėmis funkcijomis gautų skaičiavimų, sudarome suvestinę lentelę.

1 lentelė

Statistinės charakteristikos

Rodikliai Funkcijos Rodikliai Funkcijos

LINEST LOGEST LINEST LOGEST

Koeficientas b

0,0483719 1,027794 Laisvasis narys a -0,2312519 0,552468

Koeficiento b standartinė paklaida

0,0133583 0,008294 Laisvojo nario a standartinė paklaida 0,5507255 0,341948

Determinacijos koeficientas

0,4214544 0,377692 Standartinė tikėtino y paklaida 0,3346109 0,207761

F kriterijaus faktiška reikšmė

13,1125009 10,92459 Laisvės

laipsnių skaičius 18 18

Regresinė kvadratų suma 1,4681344 2,0153606 Likutinė kvadratų suma 2,0153606 0,776966

Iš 1 lentelėje įrašytų skaičiavimo rezultatų galime tvirtinti, kad turime tokias funkcijas, aprašančias vasarinių javų derlingumo priklausomybę nuo žemės kokybės, ir papildomas statistines charakteristikas:

3.1.1. Tiesinės lygties (yx = -0,23125+0,04837x) analizė

• Determinacijos koeficientas r2 = 0,4214544 rodo, kad pasirinktas veiksnys – žemės kokybė – rezultatinio rodiklio (vasarinių javų derlingumo) lygį lėmė 42,1 proc.,kitiems veiksniams, neįtrauktiems į lygtį, esant vidutinio lygio.

• Koreliacijos koeficientas r = 0,6491952. Šį skaičių gauname iš determinacijos koeficiento ištraukę kvadratinę šaknį. Koreliacijos koeficiento ženklą nustatome ppagal regresijos koeficiento b ženklą. Koreliacijos koeficientas rodo, kad ryšiai tarp vasarinių rapsų derlingumo ir žemės kokybės yra tiesioginiai ir labai stiprūs. Tačiau ar jie yra ststistiškai reikšmingi, mes galime pasakyti tik patikrinę H0 : r = 0.

• Iškelta nulinė hipotezė H0 : r = 0 tikrinama Fišerio kriterijumi F.

Nulinė hipotezė atmetama, jei F > Fα. Šiuo atveju yra pripažįstama, kad ryšiai yra statistiškai reikšmingi.

Mūsų atveju F > Fα, tad ryšiai yra statistiškai reikšmingi.

• Regresijos statistiniam reikšmingumui įvertinti yra keliamos nulinės hipotezės HH0 : a = 0 ir H0 : b = 0.

Hipotezės yra tikrinamos Stjudento kriterijumi.

4.1.1.1. Patikrinamas, kuri iš dviejų funkcijų yra tinkamesnė priklausomybei aprašyti

0,4214544 – 0,377692 = 0,0868435 < 0,1, todėl priklausomybė tarp vasarinių javų derlingumo ir žemės kokybės yra ttiesinė.

3.1.1.2. Prognozuojamas vasarinių javų derlingumas (jei ūkininkai javus sėtų į 46 našumo balais įvertintą žemę.

Prognozuojamą vasarinių javų derligumas yra 1,9938574, t.y. 1,99 t/ha.

yx = -0,23125+0,04837x x = 46.

3.2. Daugiafaktorė regresinė analizė

y x1 x2 TREND LINEST

2,59 47,00 2,60 2,1405078 -0,4846008 0,0852034 -0,6040903

1,66 38,90 2,00 1,7411206 0,4208205 0,0346156 0,6346078

1,53 32,50 1,80 1,2927390 0,4633185 0,3316205 #N/A

2,20 47,50 2,70 2,1346494 7,3380729 17,0000000 #N/A

1,65 47,30 3,00 1,9722285 1,6139678 1,8695272 #N/A

1,99 50,90 3,40 2,0851204

1,55 33,60 2,00 1,2895426

2,13 40,20 2,20 1,7549649

2,04 48,20 2,80 2,1458317

1,77 41,10 2,10 1,8801081

1,03 37,50 2,00 1,6218359

1,65 36,60 2,00 1,5451528

2,51 48,20 2,80 2,1458317

1,02 37,50 2,30 1,4764556

1,76 45,20 3,00 1,7933013

1,70 33,20 1,90 1,3039213

1,97 40,20 2,30 1,7065048

1,56 35,20 1,80 1,5227882

1,16 37,00 1,80 1,6761543

1,42 39,10 2,20 1,6612412

46 4,00 1,3768633

Iš statistinėmis funkcijomis gautų skaičiavimų, sudarome suvestinę lentelę.

2 lentelė

Statistinės charakteristikos

Rodikliai Rodiklių reikšmės Rodikliai Rodiklių reikšmės

Koeficientas b1 0,0852034 Laisvasis narys α -0,6040903

Koeficiento b1 standartinė paklaida 0,0346156 Laisvojo nario α standartinė paklaida 0,6346078

Koeficientas b2 -0,4846008 Koeficiento b2 standartinė paklaida 0,4208205

Determinacijos koeficientas 0,4633185 Standartinė tikėtino y paklaida 0,3316205

F kriterijaus faktiška reikšmė 7,3380729 Laisvės laipsnių skaičius 17

Regresinė kvadratų suma 1,6139678 Likutinė kvadratų suma

2 lentelėje pateiktų rezultatų analizės algoritmas toks pats kaip vienafaktorinėje regresinėje analizėje. Iš skaičiavimo rezultatų galima tvirtinti, kad turime tokias funkcijas, aprašančias rugių derlingumo priklausomybę nuo žemės kokybės, ir papildomas statistines charakteristikas:

1. Tiesės lygtis yx = -0,6040903+0,0852034x

• Determinacijos koeficientas r2 =0,4633185 rodo, kad pasirinktas veiksnys – žemės kokybė – rezultatinio rrodiklio (javų derlingumo) lygį lėmė 46,3 proc., kitiems veiksniams, neįtrauktiems į lygtį, esant vidutiniame lygyje;

• Koreliacijos koeficientas r = 0,68067. Šį skaičių gauname iš determinacijos koeficiento ištraukę kvadratinę šaknį. Koreliacijos koeficiento ženklą nustatome pagal regresijos koeficiento b ženklą. Koreliacijos koeficientas rodo, kad ryšiai tarp javų derlingumo ir žemės kokybės yra tiesioginiai ir vidutiniai. Tačiau ar jie statistiškai reikšmingi, mes galime pasakyti tik patikrinę H0 : r = 0.

2. Eksponentės skaičiuoti negalime, nes neturime funkcijos LOGEST duomenų, taip pat negalime patikrinti, kuri iiš dviejų funkcijų yra tinkamesnė priklausomybei aprašyti.

3. Prognozuojame, koks būtų javų derlingumas, jei ūkininkai javus sėtų į 46 našumo balais įvertintą žemę

Į apskaičiuotą tiesės lygtį yx = -0,6040903+0,0852034x, įrašome x=46, ir turime, kad Y=3,3t/ha.

4 UŽDUOTIS

Užduoties tikslas – išmokti atlikti vienfaktorinę ir daugiafaktorinę regresinę analizę, taikant skaičiuoklės Microsoft Excel duomenų analizės posistemio Data Analysis uždavinį Regression.

4.1. Vienfaktorė regresinė analizė

Vasarinių javų derlingumas 1998m. t/ha Žemės ūkio naudmenų našumo balas

2,59 47

1,66 38,9

1,53 32,5

2,20 47,5

1,65 47,3

1,99 50,9

1,55 33,6

2,13 40,2

2,04 48,2

1,77 41,1

1,03 37,5

1,65 36,6

2,51 48,2

1,02 37,5

1,76 45,2

1,7 33,2

1,97 40,2

1,56 35,2

1,16 37

1,42 39,1

Reikia nustatyti, ar yra statistiškai patikima vasarinių javų derlingumo priklausomybė nuo žemės kokybės ir koks būtų javų derlingumas, jei žemės ūkio naudmenų našumo balas padidėtų iki 46 balų.

SUMMARY OUTPUT

Regression Statistics

Multiple R 0,649195207

R Square 0,421454417

Adjusted R Square 0,389312995

Standard Error 0,334610939

Observations 20

ANOVA

df SS MS F Significance F

Regression 1 1,468134 1,468134 13,11250 0,001953235

Residual 18 2,015361 0,111964

Total 19 3,483495

Coefficients Standard Error t Stat P-value Lower 95% Upper 95%

Intercept -0,231252 0,550725 -0,419904 0,679525 -1,388284 0,925780

X Variable 1 0,048372 0,013358 3,621119 0,001953 0,020307 0,076437

RESIDUAL OUTPUT

Observation Predicted Y Residuals Standard Residuals

1 2,042229 0,547771 1,681896

2 1,650417 0,009583 0,029425

3 1,340836 0,189164 0,580816

4 2,066415 0,133585 0,410164

5 2,056741 -0,406741 -1,248873

6 2,230880 -0,240880 -0,739607

7 1,394045 0,155955 0,478849

8 1,713300 0,416700 1,279451

9 2,100276 -0,060276 -0,185073

10 1,756835 0,013165 0,040423

11 1,582696 -0,552696 -1,697019

12 1,539161 0,110839 0,340324

13 2,100276 0,409724 1,258034

14 1,582696 -0,562696 -1,727723

15 1,955160 -0,195160 -0,599226

16 1,374697 0,325303 0,998824

17 1,713300 0,256700 0,788181

18 1,471440 0,088560 0,271917

19 1,558510 -0,398510 -1,223600

20 1,660091 -0,240091 -0,737185

Iš ANOVA lentelės galime patikrinti nulinę hipotezę H0 : r = 0.Tikrinama Fišerio kriterijumi F.

Nulinę hipotezę atmetame, nes F> Fα (p<α), taigi šiuo atveju yra pripažįstama ryšių reikšmingumas.

Regresijos statistiniam reikšmingumui įvertinti yra keliama nulinė hipotezė H0: b = 0.

Nulinę hipotezę atmetame, nes F > Fα (p < α) , taigi šiuo atveju yra pripažįstama ryšių reikšmingumas.

Kadangi naudojant šios programos uždavinį negalima gauti prognozuojamos rezultatinio rodiklio y reikšmės, tai išsikviesime statistinę funkciją Forecast ir atliksime prognozavimą.

Jeigu javus sėsime 46 balų kokybės, tai dderlingumas bus 1,99 t/ha.

4.2 Daugiafaktorė regresinė analizė

Vasarinių javų derlingumas 1998m. t/ha Žemės ūkio naudmenų našumo balas Įterpta mineralinių trąšų 100 kg/ha

2,59 47 2,60

1,66 38,9 2,00

1,53 32,5 1,80

2,20 47,5 2,70

1,65 47,3 3,00

1,99 50,9 3,40

1,55 33,6 2,00

2,13 40,2 2,20

2,04 48,2 2,80

1,77 41,1 2,10

1,03 37,5 2,00

1,65 36,6 2,00

2,51 48,2 2,80

1,02 37,5 2,30

1,76 45,2 3,00

1,7 33,2 1,90

1,97 40,2 2,30

1,56 35,2 1,80

1,16 37 1,80

1,42 39,1 2,20

Reikia nustatyti, ar yra statistiškai patikima žieminių rapsų derlingumo priklausomybė nuo žemės kokybė bei įterptų mineralinių trąšų kiekio ir koks būtų rapsų derlingumas, jei žemės ūkio naudmenų našumo balas padidėtų iki 46 balų ir į hektarą būtų įterpta 400kg mineralinių trąšų.

SUMMARY OUTPUT

Regression Statistics

Multiple R 0,680675

R Square 0,463319

Adjusted R Square 0,400180

Standard Error 0,331621

Observations 20

ANOVA

df SS MS F Significance F

Regression 2 1,613968 0,806984 7,338073 0,005042

Residual 17 1,869527 0,109972

Total 19 3,483495

Coefficients Standard Error t Stat P-value Lower 95% Upper 95%

Intercept -0,604090 0,634608 -0,951911 0,354481 -1,942998 0,734817

X Variable 1 0,085203 0,034616 2,461416 0,024829 0,012171 0,158236

X Variable 2 -0,484601 0,420821 -1,151562 0,265440 -1,372456 0,403254

RESIDUAL OUTPUT

Observation Predicted Y Residuals Standard Residuals

1 2,140508 0,449492 1,432957

2 1,741121 -0,081121 -0,258608

3 1,292739 0,237261 0,756375

4 2,134649 0,065351 0,208334

5 1,972228 -0,322228 -1,027247

6 2,085120 -0,095120 -0,303239

7 1,289543 0,260457 0,830324

8 1,754965 0,375035 1,195591

9 2,145832 -0,105832 -0,337386

10 1,880108 -0,110108 -0,351018

11 1,621836 -0,591836 -1,886741

12 1,545153 0,104847 0,334247

13 2,145832 0,364168 1,160949

14 1,476456 -0,456456 -1,455156

15 1,793301 -0,033301 -0,106163

16 1,303921 0,396079 1,262677

17 1,706505 0,263495 0,840008

18 1,522788 0,037212 0,118629

19 1,676154 -0,516154 -1,645472

20 1,661241 -0,241241 -0,769064

.

5 UŽDUOTIS

Užduoties tikslas – išmokti atlikti vienfaktorę ir daugiafaktorę regresinę analizę, taikant Statsoft programos STATISTICA modulį Multiple Regression.

5.1.Vienfaktorė regresinė analizė

Naudojame 5 užduoties duomenis.

Means and Standard Deviations

MULTIPLE REGRESS Note: SD=sqrt (SS/N)

variable Mean St.dev. N

BALAI 40,845 5,601114 20

T_HA 1,7445 0,417342 20

Means and Standard Deviations

MULTIPLE REGRESS

Mean St.dev. N

BALAI 40,845 5,746621 20

T_HA 1,7445 0,428184 20

Correlations (new.sta)

MULTIPLE REGRESS

BALAI T_HA

BALAI 1 0,649195

T_HA 0,649195 1

Kadangi mums nepakanka vidurkio, standartinio nuokrypio ir koreliacinės matricos, tai gauname lentelę, kurioje yra regresinės analizės pagrindinės statistinės charakteristikos ir papildomos informacijos komandos.

Regression Summary for Dependent Variable: T_HA (new.sta)

MULTIPLE REGRESS R= ,64919521 R²= ,42145442 Adjusted R²= ,38931300

F(1,18)=13,113 p<,00195 Std.Error of estimate: ,33461

BETA St. Err of BETA B St. Err of B t(18) p-level

N=20

Intercpt -0,23125 0,550725 -0,4199 0,679525

BALAI 0,649195 0,17928 0,048372 0,013358 3,621119 0,001953

Analysis of Variance; DV: T_HA (new.sta)

MULTIPLE REGRESS Sums of Squares df Mean Squares F p-level

Regress. 1,468134 1 1,468134 13,1125 0,001953

Residual 2,015361 18 0,111964

Total 3,483495

Šioje lentelėje yra detalus Fišerio kriterijaus FF faktiškos reikšmės apskaičiavimas.

Nulinę hipotezę atmetam, nes F>Fα (p< α).

Jei norime prognozuoti vasarinių javų derlingumą, kai žinoma būsima žemės kokybės reikšmė, tai įrašome būsimą faktoriaus reikšmę (mūsų atveju 46).

Predicting Values for (new.sta)

MULTIPLE REGRESS variable: T_HA

B-Weight Value B-Weight * Value

variable

BALAI 0,048372 46 2,225109

Intercpt -0,231252

Predictd 1,993857

Iš lentelės duomenų matome, kad prognozuojamas vasarinių javų derlingumas (jei juos sėsime 46 našumo balų žemėje) – 1,99 t/ha.

Predicted & Residual Values (new.sta)

MULTIPLE REGRESS Dependent variable: T_HA

Observed Predictd Standard Standard Std.Err. Mahalns. Deleted Cook’s

Case No. Value Value Residual Pred. v. Residual Pred.Val Distance Residual Distance

1 2,59 2,042229 0,547771 1,071064 1,637037 0,111168 1,147178 0,615734 0,186878

2 1,66 1,650417 0,009583 -0,33846 0,02864 0,079204 0,114555 0,010152 2,58E-05

3 1,53 1,340836 0,189164 -1,45216 0,565325 0,134257 2,108762 0,22546 0,036544

4 2,2 2,066415 0,133585 1,158072 0,399224 0,116195 1,34113 0,151902 0,012425

5 1,65 2,056741 -0,406741 1,123269 -1,21556 0,114164 1,261733 -0,46033 0,110154

6 1,99 2,23088 -0,24088 1,749724 -0,71988 0,153751 3,061533 -0,30535 0,08791

7 1,55 1,394045 0,155955 -1,26074 0,466078 0,12233 1,589467 0,180015 0,019342

8 2,13 1,7133 0,4167 -0,11224 1,245327 0,075316 0,012598 0,438938 0,04359

9 2,04 2,100276 -0,060276 1,279882 -0,18014 0,123496 1,638099 -0,06978 0,002962

10 1,77 1,756835 0,013165 0,044374 0,039345 0,074899 0,001969 0,01386 4,3E-05

11 1,03 1,582696 -0,552696 -0,58208 -1,65176 0,087148 0,338818 -0,59291 0,106491

12 1,65 1,539161 0,110839 -0,73869 0,331247 0,093882 0,54567 0,12031 0,005088

13 2,51 2,100276 0,409724 1,279882 1,22448 0,123496 1,638099 0,474337 0,136864

14 1,02 1,582696 -0,562696 -0,58208 -1,68164 0,087148 0,338818 -0,60364 0,110379

15 1,76 1,95516 -0,19516 0,757837 -0,58324 0,094777 0,574316 -0,21218 0,01613

16 1,7 1,374696 0,325304 -1,33035 0,972184 0,1266 1,769823 0,37965 0,092139

17 1,97 1,7133 0,2567 -0,11224 0,767159 0,075316 0,012598 0,270399 0,016542

18 1,56 1,47144 0,08856 -0,98232 0,264664 0,106229 0,964945 0,098486 0,004366

19 1,16 1,55851 -0,39851 -0,66909 -1,19097 0,090754 0,44768 -0,43015 0,060784

20 1,42 1,660091 -0,240091 -0,30366 -0,71752 0,078368 0,092207 -0,25403 0,015807

Minimum 1,02 1,340836 -0,562696 -1,45216 -1,68164 0,074899 0,001969 -0,60364 2,58E-05

Maximum 2,59 2,23088 0,547771 1,749724 1,637037 0,153751 3,061533 0,615734 0,186878

Mean 1,7445 1,7445 7,81E-19 -6,4E-18 3,91E-09 0,103425 0,95 0,002543 0,053223

Median 1,68 1,686696 0,050862 -0,20795 0,152004 0,100503 0,769631 0,056173 0,027943

Šioje lentelėje yra faktiški ir teoriniai duomenys, liekanos, standartizuoti teoriniai duomenys, standartizuotos liekanos, teorinių reikšmių standartinė paklaida, pašalinamosios liekanos, Mahalanobis atstumas, Kuko atstumas.

Pagal standartizuotąją liekaną Mahalanobis ir Kuko atstumus galime spręsti, ar tarp stebinių nėra išskirčių. Pagal Kuko atstumo reikšmes galime teigti, kad išskirčių nėra, nes visi atstumai mažesni už vienetą.

Mus domina ar nėra autoregresijos.

Durbin-Watson d (new.sta)

MULTIPLE REGRESS and serial correlation of residuals

Durbin – Watson d Serial Corr

Estimate 1,786031127 0,018779062

Darbino – Watsono statistika d artima skaičiui 2. Tai rodo, kad yra tik nežymi teigiama regresijos paklaidų serijinė korealiacija.

Braižome teorinių ir faktiškų reikšmių sklaidos diagramą:

5.2 Daugiafaktorė regresinė analizė

Naudojame 5 užduoties duomenis.

Regresinės analizės pagrindinės statistinės charakteristikos

Kadangi mūsų netenkina tik aprašomosios statistikos charakteristikos, tai naudosimės ir kitomis regresinės analizės pagrindinėmis statistinėmis charakteristikomis. Šioje lentelėje yra papildomos informacijos (standartizuotų duomenų

regresijos tiesės lygties koeficiento beta standartinė paklaida ir kt.):

Regression Summary for Dependent Variable: T_HA (new.sta)

MULTIPLE REGRESS R= ,68067506 R²= ,46331854 Adjusted R²= ,40017955

F(2,17)=7,3381 p<,00504 Std.Error of estimate: ,33162

BETA St. Err. of BETA B St. Err. of B t(17) p-level

N=20

Intercpt -0,60409 0,634608 -0,95191 0,354481

BALAI 1,143507 0,464573 0,085203 0,034616 2,461416 0,024829

TRASOS -0,53498 0,464573 -0,4846 0,420821 -1,15156 0,26544

Analysis of Variance; DV: T_HA (new.sta)

MULTIPLE Sums of Mean

REGRESSs Squares df Squares F p-level

Regress. 1,613968 2 0,806984 7,338073 0,005042

Residual 1,869527 17 0,109972

Total 3,483495

Šioje lentelėje yra detalus Fišerio kriterijaus F faktiškos reikšmės apskaičiavimas.

Nulinę hipotezę atmetame, kadangi F>Fα (p< α).

Jei norime prognozuoti vasarinių javų derlingumą, kai žinomos būsimos žemės kokybės ir įterptų mineralinių ttrąšų kiekio reikšmės, tai įrašome būsimas faktorių reikšmes (mūsų atveju 46 bei 4).

Predicting Values for (new.sta)

MULTIPLE REGRESS variable: T_HA

B-Weight

variable B-Weight Value * Value

BALAI 0,085203 46 3,919357

TRASOS -0,4846 4 -1,9384

Intercpt -0,60409

Predictd 1,376863

Iš lentelės duomenų matome, kad prognozuojamas rugių derlingumas yra 1,37 t/ha.

Predicted & Residual Values

Dependent variable: T_HA

Observed Predictd Standard Standard Std.Err. Mahalns. Deleted Cook’s

Case. No. Value Value Residual Pred. v. Residual Pred.Val Distance Residual Distance

1 2,59 2,140508 0,449492 1,35873 1,355441 0,139363 2,405562 0,545903 0,159529

2 1,66 1,741121 -0,08112 -0,01159 -0,24462 0,111201 1,186444 -0,0914 0,002847

3 1,53 1,292739 0,237261 -1,55002 0,715459 0,139458 2,410156 0,288235 0,044535

4 2,2 2,134649 0,065351 1,338629 0,197065 0,129507 1,947726 0,077111 0,002749

5 1,65 1,972228 -0,32223 0,781352 -0,97168 0,134861 2,192277 -0,38608 0,074721

6 1,99 2,08512 -0,09512 1,168692 -0,28684 0,198091 5,829557 -0,14789 0,023655

7 1,55 1,289543 0,260457 -1,56099 0,785408 0,151439 3,012292 0,329085 0,068455

8 2,13 1,754965 0,375035 0,035906 1,130917 0,082949 0,238768 0,400066 0,030353

9 2,04 2,145832 -0,10583 1,376996 -0,31913 0,128627 1,908488 -0,12457 0,007077

10 1,77 1,880108 -0,11011 0,46528 -0,33203 0,130267 1,981826 -0,1302 0,007929

11 1,03 1,621836 -0,59184 -0,42087 -1,78468 0,092817 0,538408 -0,64214 0,097909

12 1,65 1,545153 0,104847 -0,68397 0,316166 0,093188 0,550347 0,113836 0,003102

13 2,51 2,145832 0,364168 1,376996 1,098148 0,128627 1,908488 0,428659 0,083792

14 1,02 1,476456 -0,45646 -0,91968 -1,37644 0,126377 1,80935 -0,53401 0,12553

15 1,76 1,793301 -0,0333 0,167441 -0,10042 0,169052 3,98756 -0,04499 0,001595

16 1,7 1,303921 0,396079 -1,51166 1,194373 0,139713 2,42244 0,481553 0,12476

17 1,97 1,706505 0,263495 -0,13036 0,794568 0,074876 0,018614 0,27765 0,011912

18 1,56 1,522788 0,037212 -0,76071 0,112212 0,114333 1,308456 0,042232 0,000643

19 1,16 1,676154 -0,51615 -0,2345 -1,55646 0,136112 2,25086 -0,62073 0,196747

20 1,42 1,661241 -0,24124 -0,28567 -0,72746 0,077674 0,09238 -0,25524 0,010834

Minimum 1,02 1,289543 -0,59184 -1,56099 -1,78468 0,074876 0,018614 -0,64214 0,000643

Maximum 2,59 2,145832 0,449492 1,376996 1,355441 0,198091 5,829557 0,545903 0,196747

Mean 1,7445 1,7445 -6,1E-19 -1,1E-08 2,98E-09 0,124927 1,9 0,000354 0,053934

Median 1,68 1,723813 0,001955 -0,07098 0,005896 0,129067 1,928107 -0,00138 0,027004

Šioje lentelėje yra faktiški ir teoriniai duomenys, liekanos, standartizuoti teoriniai duomenys, standartizuotos liekanos, teorinių reikšmių standartinė paklaida, pašalinamosios liekanos, Mahalanobis atstumas, Kuko atstumas.

Pagal standartizuotąją liekaną Mahalanobis ir Kuko aatstumus galime spręsti, ar tarp stebinių nėra išskirčių. Pagal Kuko atstumo reikšmes galime teigti, kad išskirčių nėra, nes visi atstumai mažesni už vienetą.

Mus domina ar nėra autoregresijos.

Durbin-Watson d (new.sta)

MULTIPLE REGRESS and serial correlation of residuals

Durbin- Serial

Watson d Corr.

Estimate 1,742248774 0,061179474

Darbino – Watsono statistika dd artima skaičiui 2. Tai rodo, kad yra tik nežymi teigiama regresijos paklaidų serijinė korealiacija.

Braižome teorinių ir faktiškų reikšmių sklaidos diagramą:

6 UŽDUOTIS

Užduoties tikslas – išmokti atlikti vienfaktorę regresinę analizę taikant StatSoft programos STATISTICA modulį Nonlinear estimation.

Naudojame 5 užduoties duomenis.

Turimų duomenų priklausomybės aprašymui pasirenkame pirmo tipo hiperbolės lygtį:

yx = b0+b1/x

Žemiau pavaizduotoje lentelėje pateikiamos pagrindinės statistinės charakteristikos. Gavome, kad esant kreivinei priklausomybei, ryšys tarp rezultatinio rodiklio ir faktoriaus yra stiprus η=0,56108, o rinktas faktorius (žemės naudmenų našumo balas) derlingumą lėmė 31,48 proc.

Galime pasirinkti kitus įvertinimo modelius ir palyginti jais gautas pagrindines charakteristikas (geriau tinka tas modelis, kurio apskaičiuoti kintamųjų priklausomybės matai didesni, o nuostolių funkcija mažesnė). Tačiau dažniausiai pats kompiuteris pasiūlo pasirinktai funkcijai tinkamiausią įvertinimo modelį.

Model: balai=b0+b1/t_ha (new.sta)

Dep. var: BALAI Loss: ((OBS-PRED)**2

Final loss: 429,91835196 R=,56108

Variance explained: 31,482%

N=20 B0 B1

Estimate 52,69650929 -19,4253277

Std.Err. 4,263524475 6,754719358

t(18) 12,35984679 -2,875815659

p-level 3,13171E-10 0,010056753

Šioje lentelėje turime pirmo tipo hiperbolės parametrų įverčius, jų standartines paklaidas, Stjudento kriterijų ir tikimybės p reikšę. Iš jų galima teigti, kad lygties koeficientas b (b1) yra statistiškai reikšmingas.

Residual Values

BALAI

C:1 1,803617

C:2 -2,0945

C:3 -7,50022

C:4 3,633185

C:5 6,376417

C:6 7,964962

C:7 -6,56404

C:8 -3,37664

C:9 5,02571

C:10 -0,62175

C:11 3,663032

C:12 -4,32358

C:13 3,242665

C:14 3,84793

C:15 3,540609

C:16 -8,06985

C:17 -2,63594

C:18 -5,04438

C:19 1,049463

C:20 0,083299

Predicted Values

BALAI

C:1 45,19638

C:2 40,9945

C:3 40,00022

C:4 43,86681

C:5 40,92358

C:6 42,93504

C:7 40,16404

C:8 43,57664

C:9 43,17429

C:10 41,72175

C:11 33,83697

C:12 40,92358

C:13 44,95734

C:14 33,65207

C:15 41,65939

C:16 41,26984

C:17 42,83594

C:18 40,24438

C:19 35,95054

C:20 39,0167

Means and Standard Deviations (new.sta)

mean st. dev. minimum maximum

T_HA 1,7445 0,428184 1,02 2,59

BALAI 40,845 5,746622 32,5 50,9

7 UŽDUOTIS

Užduoties tikslas – išmokti atlikti stacionarių laiko eilučių suglodinimą, taikant skaičiuoklės Microsoft Excel duomenų analizės posistemio Data Analysis uždavinį Moving Average.

Turime stacionarią laiko eilutę apie N – osios prekės ppardavimo apimtis:

Dienos 1 2 3 4 5 6 7 8 9 10 11 12 13 14

Kiekis kg 149,0 98,0 129,0 151,8 151,3 135,6 141,1 160,0 100,5 149,0 98,0 129,0 151,8 151,3

Dienos Kiekis kg Slenk.vidurkis Stand.paklaida

1 149 #N/A #N/A

2 98 #N/A #N/A

3 129 125,3333333 #N/A

4 151,8 126,2666667 #N/A

5 151,3 144,0333333 15,47255635

6 135,6 146,2333333 16,51083819

7 141,1 142,6666667 7,490586685

8 160 145,5666667 10,389792

9 100,5 133,8666667 21,00880768

10 149 136,5 22,19538657

11 98 115,8333333 23,00443597

12 129 125,3333333 12,75045388

13 151,8 126,2666667 18,10546265

14 151,3 144,0333333 15,47255635

Šioje lentelėje apskaičiuojamas slenkamasis vidurkis ir standartinė paklaida iš trijų reikšmių bei slenkamasis vidurkis ir standartinė paklaida iš penkių reikšmių. Kadangi skaičiuojant slenkamąjį vidurkį iš trijų reikšmių gauta mažesnė standartinė paklaida, tai išvadų darymui ir ateinančios dienos N – tosios prekės apyvartos numatymui naudosime 1 paveikslą.

8 UŽDUOTIS

Užduoties tikslas – išmokti atlikti stacionarių laiko eilučių suglodinimą ir prognozavimą, taikant skaičiuoklės Microsoft Excel duomenų analizės posistemio Data Analysis uždavinį Exponential Smoothing.

Naudojame 8 užduoties duomenis.

Dienos Kiekis kg damp factor = 0,9 damp factor = 0,5 damp factor = 0,3 damp factor = 0,1

1 149 #N/A #N/A #N/A #N/A #N/A #N/A #N/A #N/A

2 98 149 #N/A 149 #N/A 149 #N/A 149 #N/A

3 129 143,9 #N/A 123,5 #N/A 113,3 #N/A 103,1 #N/A

4 151,8 142,41 #N/A 126,25 #N/A 124,29 #N/A 126,41 #N/A

5 151,3 143,349 31,15115 139,025 33,08601 143,547 34,66165 149,261 36,13153

6 135,6 144,1441 11,15647 145,1625 16,67061 148,9741 18,82728 151,0961 20,97315

7 141,1 143,2897 8,648548 140,3813 17,27155 139,6122 18,21881 137,1496 17,21374

8 160 143,0707 6,856014 140,7406 8,993213 140,6537 8,966401 140,705 9,307564

9 100,5 144,7636 11,02114 150,3703 12,42151 154,1961 13,60589 158,0705 14,46874

10 149 140,3373 27,39018 125,4352 30,86793 116,6088 32,96344 106,257 35,1296

11 98 141,2036 27,81435 137,2176 33,73067 139,2826 37,88905 144,7257 42,87043

12 129 136,8832 36,05949 117,6088 39,07415 110,3848 43,34634 102,6726 49,41192

13 151,8 136,0949 25,84399 123,3044 27,2218 123,4154 32,14535 126,3673 39,59539

14 151,3 137,6654 26,92795 137,5522 28,75052 143,2846 30,85702 149,2567 34,26976

15 139,0289 12,84132 144,4261 19,41444 148,8954 20,13666 151,0957 21,16706

Išsirinkome grafiką, su gesinimo faktoriumi 0,9, nes šiuo atveju gauta mažiausia standartinė paklaida.

9 UŽDUOTIS

Užduoties tikslas – išmokti atlikti nestacionarios laiko eilutės vidutinės trukmės prognozę, taikant skaičiuoklės Microsoft Excel diagramų vedliu nubraižytas linijines diagramas.

Turimi duomenys apie N – ojo ūkininko ūkyje auginamų vasarinių javų derlingumą.

Metai 1997 1998 1999 2000 2001 2002 2003

Derlingumas t/ha 16,3 15,7 19,5 19,3 19,3 25,1 20,2

Tiesės lygtis y = 1,0821x+15,014

R2 = 0,581

Trečios eilės polinomas y= -0,1472×3+1,6345×2-3,8968x+18,729

R2=0,6899

Logoritmas y=3,3771Ln(x)+15,23

R2=0,5686

Rodiklinė funkcija y=15,44×0,1766

R2=0,6181

Eksponentė y=15,294e0,0561

R2=0,6216

Prognozuosime pagal analizuojamais metais susiklosčiusias tendencijas vasarinių javų derlingumą 2004m. ir 2005m.

Pasirinkau matematinę priklausomybę (trečios eilės polinomą), nes jis žymiai geriau atspindi rugių faktiško derlingumo kitimus (determinacijos koeficientas lygus 0,6899). Logiškai apsvarsčius 2005 metų prognozuojamą reikšmę kyla abejonių ar ji yra reali, nes trečios eilės polinomas yra sparčiai greitėjantis, ttodėl galbūt tiktų kita funkcija.

10 UŽDUOTIS

Užduoties tikslas – išmokti nustatyti nestacionarios laiko eilutės neatsitiktinės komponentės kitimo tendenciją ir prognozuoti būsimas reikšmes, taikant Microsoft Excel statistines funkcijas TREND, LINEST ir GROWTH, LOGEST.

Turimi duomesnys apie auginamų vasarinių javų derlingumą:

Metai 1997 1998 1999 2000 2001 2002 2003

Derlingumas t/ha 16,3 15,7 19,5 19,3 19,3 25,1 20,2

Prognozuosime pagal analizuojamais metais susikosčiusias tendencijas vasarinių javų derlingumą 2004m. ir 2005m.

10.1 Statistinių funkcijų TREND ir LINEST taikymas

Metai t/ha Laiko linkmė t TREND LINEST

1997 16,3 1 16,09643 1,082143 15,01429

1998 15,7 2 17,17857 0,410994 1,83802

1999 19,5 3 18,26071 0,580981 2,174774

2000 19,3 4 19,34286 6,932644 5

2001 19,3 5 20,425 32,78893 23,64821

2002 25,1 6 21,50714

2003 20,2 7 22,58929

2004 8 23,67143

2005 9 24,75357

Remdamiesi javų faktišku ir TREND apskaičiuotu derlingumu nubraižome linijinę diagramą (1 pav.).

10.2 Statistinių funkcijų GROWTH ir LOGEST taikymas

Metai t/ha Laiko linkmė t GROWTH LOGEST

1997 16,3 1 16,17729 1,057736 15,29426

1998 15,7 2 17,1113 0,019587 0,087595

1999 19,5 3 18,09923 0,621569 0,103644

2000 19,3 4 19,14421 8,212459 5

2001 19,3 5 20,24951 0,088218 0,05371

2002 25,1 6 21,41864

2003 20,2 7 22,65526

2004 8 23,96328

2005 9 25,34682

Remdamiesi javų faktišku ir TREND apskaičiuotu derlingumu nubraižome linijinę diagramą (2 pav.).

11 UŽDUOTIS

Užduoties tikslas – išmokti nustatyti nestacionarios laiko eilutės neatsitiktinės komponentės kitimo tendenciją ir prognozuoti būsimas reikšmes, taikant Microsoft Excel duomenų analizės posistemio Data Analysis uždavinį Regression.

Metai 100kg/ha Laiko linkmės

1997 16,3 1

1998 15,7 2

1999 19,5 3

2000 19,3 4

2001 19,3 5

2002 25,1 6

2003 20,2 7

SUMMARY OUTPUT

Regression Statistics

Multiple R 0,762221

R Square 0,580981

Adjusted R Square 0,497178

Standard Error 2,174774

Observations 7

ANOVA

df SS MS F Significance F

Regression 1 32,78893 32,78893 6,932644 0,046365847

Residual 5 23,64821 4,729643

Total 6 56,43714

Coefficients Standard Error t Stat P-value Lower 95% Upper 95%

Intercept 15,01428571 1,838019675 8,16873 0,000447 10,28951344 19,739058

X Variable 1 1,082142857 0,410993694 2,632991 0,046366 0,02565166 2,1386341

RESIDUAL OUTPUT

Observation Predicted Y Residuals

1 16,09642857 0,203571429

2 17,17857143 -1,478571429

3 18,26071429 1,239285714

4 19,34285714 -0,042857143

5 20,425 -1,125

6 21,50714286 3,592857143

7 22,58928571 -2,389285714

23,67142857

24,75357143

12 UŽDUOTIS

Užduoties tikslas – išmokti nustatyti nestacionarios laiko eilutės neatsitiktinės komponentės kitimo tendenciją ir prognozuoti būsimas reikšmes, taikant StatSoft programos STATISTICA modulį Multiple Regression.

Regression Summary for Dependent Variable: T_HA (new.sta)

MULTIPLE REGRESS R= ,76222134 R²= ,58098137 Adjusted R²= ,49717764

F(1,5)=6,9326 p<,04637 Std.Error of estimate: 2,1748

St. EErr. St. Err.

N=7 BETA of BETA B of B t(5) p-level

Intercpt 15,01429 1,83802 8,16873 0,000447

LAIKAS 0,762221 0,289489 1,082143 0,410994 2,632991 0,046366

Norėdami prognozuoti derlingumą 2002 m. ir 2003 m. (atitinka laiko linkmes t=8 ir t=9), reikia paspausti Predict dependent var., atsiranda pirmas prognozuojamo laiko langas, į kurį įrašom 2002 m. numatytą laiko linkmę t=8, o 2003 m. prognozavimas atliekamas taip pat, tik įrašoma t=9 ir gaunam prognozuojamas reikšmes 23,67 ir 24,7.

Predicting Values for (new.sta)

MULTIPLE REGRESS variable: T_HA

B-Weight

variable B-Weight Value * Value

LAIKAS 1,082143 8 8,657143

Intercpt 15,01429

Predictd 23,67143

Predicting Values for (new.sta)

MULTIPLE REGRESS variable: T_HA

B-Weight

variable B-Weight Value * Value

LAIKAS 1,082143 9 9,739285

Intercpt 15,01429

Predictd 24,75357

Predicted & Residual Values (new.sta)

MULTIPLE REGRESS Dependent variable: T_HA

Observed Predictd

Case. No. Value Value Residual

1 16,3 16,09643 0,203571

2 15,7 17,17857 -1,47857

3 19,5 18,26071 1,239286

4 19,3 19,34286 -0,04286

5 19,3 20,425 -1,125

6 25,1 21,50714 3,592857

7 20,2 22,58928 -2,38928

Minimum 15,7 16,09643 -2,38928

Maximum 25,1 22,58928 3,592857

Mean 19,34286 19,34286 1,36E-07

Median 19,3 19,34286 -0,04286

Šioje lentelėje parodytos faktiškos ir teorinės reikšmės, ir jų skirtumas arba liekana. Naudojantis šiais duomenimis galima nubraižyti grafiką.