PROGNOZAVIMO PAGRINDŲ PRAKTINIAI DARBAI
1 UŽDUOTIS
Užduoties tikslas – išmokti atlikti vienfaktorę dispersinę analizę, taikant skaičiuoklės Microsoft Excel duomenų analizės posistemio Data Analysis uždavinį Anova: Single Factor.
1 lentelė
ANOVA duomenys
14 variantas
Faktoriaus A lygiai Atsitiktinės imtys
1 2 3 4
1 0,145 0,144 0,143 0,144
2 0,154 0,155 0,156 0,155
3 0,170 0,169 0,168 0,171
4 0,178 0,179 0,179 0,177
Norint patikrinti, ar yra statistiškai patikima priklausomybė tarp faktoriaus A lygių ir atsitiktinių imčių, keliama nulinė hipotezė, kad faktoriaus lygių vidurkiai yra lygūs:
H0 : 1 = 2 = 3=4.
Gauname tokius Anova: Single Factor skaičiavimų rezultatus:
SUMMARY
Groups Count Sum Average Variance
Row 1 4 0,58 0,144 0,000001
Row 2 4 0,62 0,155 0,000001
Row 3 4 0,68 0,1695 0,000002
Row 4 4 0,71 0,17825 0,000001
ANOVA
Source of Variation SS df MS F P-value F crit
Between Groups 0,002772 3 0,000924 943,5532 1,66E-14 3,4903
Within Groups 1,18E-05 12 9,79E-07
Total 0,002783 15
Šiuo atveju nulinę hipotezę HH0 : 1 = 2 = 3=4 atmetame, nes F > Fα ir p<α (α=0,05).
Norint patikrinti, ar pakartojimai neturi įtakos rezultatinio rodiklio kitimui, keliama nulinė hipotezė:
H0 : µ1 = µ2 = µ3 = µ4
Gauname tokius Anova: Single Factor skaičiavimų rezultatus:
SUMMARY
Groups Count Sum Average Variance
Column 1 4 0,65 0,16 0,00022
Column 2 4 0,65 0,16 0,00024
Column 3 4 0,65 0,16 0,00024
Column 4 4 0,65 0,16 0,00023
ANOVA
Source of Variation SS df MS F P-value F crit
Between Groups 1,88E-07 3 6,25E-08 0,000269 0,999994 3,4903
Within Groups 0,002783 12 0,000232
Total 0,002783 15
Šiuo atveju nulinės hipitezės H0 : 1 = 2 = 3=4 atmesti neturime pagrindo, nes F < Fα ir
p > α (α = 0,05).
2 DARBAS
Užduoties tikslas – išmokti aatlikti dispersinę analizę, taikant Statsoft kompanijos programos STATISTICA modulį ANOVA/MANOVA.
2.1. Vienfaktorė dispersinė analizė
1 lentelė
ANOVA duomenys
14 variantas
Faktoriaus A lygiai Atsitiktinės imtys
1 2 3 4
1 0,145 0,144 0,143 0,144
2 0,154 0,155 0,156 0,155
3 0,170 0,169 0,168 0,171
4 0,178 0,179 0,179 0,177
Summary of all Effects; design: (new.sta)
GENERAL MANOVA 1-A
Effect df Effect MS
Effect Df Error MS
Error F p-level
1 3 0,000924 12 0,000001 943,5532 0,000000
Iš Summary of all Effect lentelėje gautų rezultatų galima teigti, kad nnulinę hipotezę
H0 : µ1 = µ2 = µ3 = µ4 turime atmesti, nes F>Fα (p<α), t.y. pripažįstame faktoriaus įtaką rezultatiniam rodikliui.
Atlikę komandą Means/Graphs Table of All Effects Scrollsheet, ekrane matome priklausomojo kintamojo (atsitiktinės imties) vidurkius (jiems kėlėme nulinę hipotezę) pagal faktoriaus lygius.
Means
GENERAL MANOVA F(3,12)=943,55; p<,0000
A IMTYS
1 0,144000
2 0,155000
3 0,169500
4 0,178250
Kadangi nustatyta statistiškai reikšminga faktoriaus įtaka rezultatiniam rodikliui, tai turime nustatyti ir faktoriaus kiekvieno lygio įtaką..
Tukey HSD test; variable IMTYS
GENERAL MANOVA Probabilities for Post Hoc Tests
MAIN EFFECT: A
A {1} ,1440000 {2} ,1550000 {3} ,1695000 {4} ,1782500
1 {1} 0,000199 0,000199 0,000199
2 {2} 0,000199 0,000199 0,000199
3 {3} 0,000199 0,000199 0,000199
4 {4} 0,000199 0,000199 0,000199
Statistiškai reikšmingai skiriasi, kai p<α.
Mūsų pavyzdyje statistiškai reikšmingai tarpusavyje skiriasi 1-2; 1-3; 1-4; 2-3; 2-4; 3-4 faktoriaus A lygiai.
Levene’s Test for Homogeneity of Variances (new.sta)
GENERAL MANOVA (ANOVA on absolute within-cell deviation scores)
Degrees oof freedom for all F’s: 3,12
MS
Effect MS
Error F p-level
variable
IMTYS 0,000000 0,000000 0,785714 0,524611771
Matome lentelę, iš kurios rezultatų aišku, kad dispersijos lygios (išvados daromos remiantis p – reikšmėmis: jei p ≥α, tai neturime pagrindo atmesti nulinę hipotezę).
Means (new.sta) Standard Deviations (new.sta)
GENERAL MANOVA 1 Dependent Variable GENERAL MANOVA 1 Depend Variable
A IMTYS Valid N A IMTYS Valid N
G_1:1 0,144000 4 G_1:1 0,000816 4
G_2:2 0,155000 4 G_2:2 0,000816 4
G_3:3 0,169500 4 G_3:3 0,001291 4
G_4:4 0,178250 4 G_4:4 0,000957 4
All Groups 0,161687 16 All Groups 0,013622 16
Tai yra lentelės, kuriose yra pateikiami priklausamojo kintamojo vidurkiai (Means) ir standartiniai nuokrypiai (Standart Deviations) pagal faktoriaus kiekvieną lygį, taip pat atsitiktinių imčių skaičius kiekviename lygyje. Iš šių duomenų galime apskaičiuoti santykinį sklaidos apie vvidurkį rodiklį – variacijos koeficientą.
2.2. Daugiafaktorė dispersinė analizė
2 lentelė
Dviejų faktorių ANOVA duomenys
Variantas 14
Faktorius B
B1 B2
Fak.A Atsitiktines imtys Fak.A Atsitiktines imtys
1 2 3 4 1 2 3 4
A1 0,145 0,144 0,143 0,144 A1 0,131 0,130 0,129 0,130
A2 0,154 0,155 0,156 0,155 A2 0,139 0,140 0,140 0,140
A3 0,170 0,169 0,168 0,171 A3 0,153 0,152 0,151 0,154
A4 0,178 0,179 0,179 0,177 A4 0,160 0,161 0,161 0,159
Pagal turimus duomenis keliamos 3 hipotezės:
1. Keliama nulinė hipotezė, kad faktoriaus A įtakos nėra, ir alternatyvi hipotezė
H0 : µ1. = µ2. = µ3. = µ4.
H1 : bent du vidurkiai skiriasi
2. Keliama nulinė hipotezė,kad faktoriaus B įtakos nėra, ir alternatyvi hipotezė
H0 : µ.1 = µ.2 = µ.3 = µ.4
H1 : bent du vidurkiai skiriasi
3. Keliama nulinė hipotezė, kad faktorių A ir B tarpusavio sąveikos įtakos nėra, ir alternatyvi hipotezė
H0 : µ
Pagal turimus duomenis gauta Summary of all Effects lentelę:
Summary of all Effects; design: (new.sta)
GENERAL MANOVA 1-FAK_B, 2-FAK_A
df Effect MS Effect df Error MS Error F p- level
Effect
1 1 0,002064 24 0,000001 2226,371 0,000000
2 3 0,001637 24 0,000001 1766,056 0,000000
12 3 6,36E-06 24 0,000001 6,865169 0,001686
Iš joje esančių rezultatų galima teigti, kad abu faktoriai ir jų sąveika turi statistiškai reikšmingos įtakos rezultatiniam rodikliui, nes visais trimis atvejais p<α.
Toliau gaunamos trys lentelės, kuriose yra priklausomojo kintamojo atitinkami vidurkiai pagal pasirinkto faktoriaus lygius.
Means (unweighted) (new.sta)
GENERAL MANOVA F(1,24)=2226,37; p<,0000
FAK_B FAK_A Y
B1 .. 0,161687
B2 .. 0,145625
Šioje lentelėje parodyta, kaip priklauso Y veiksnys nuo faktoriaus B.
Means (unweighted) (new.sta)
GENERAL
MANOVA F(3,24)=1766,06; p<,0000
FAK_B FAK_A Y
.. A1 0,137000
.. A2 0,147375
.. A3 0,161000
.. A4 0,169250
Šioje lentelėje parodyta, kaip priklauso Y veiksnys nuo faktoriaus A.
Means (new.sta)
GENERAL
MANOVA F(3,24)=6,87; p<,0017
FAK_A FAK_B Y
B1 A1 0,144000
B1 A2 0,155000
B1 A3 0,169500
B1 A4 0,178250
B2 A1 0,130000
B2 A2 0,139750
B2 A3 0,152500
B2 A4 0,160250
Šioje lentelėje parodyta, kaip priklauso Y veiksnys nuo faktorių A ir faktoriaus B.
Kadangi vvisas iškeltąsias hipotezes atmetame, todėl turime nustatyti pasirinktų faktorių ir jų sąveikos kiekvieno lygio įtaką. Pagal Tjukio HSD kriterijų gauname rezultatų lentelę:
Tukey HSD test; variable Y (new.sta)
GENERAL MANOVA Probabilities for Post Hoc Tests MAIN EFFECT: FAK_B
{1} ,1616875 {2} ,1456250
FAK_B FAK_A
B1 .. {1} 0,000152
B2 .. {2} 0,000152
Čia statistiškai reikšmingi skirtumai tarp faktoriaus B: 1-2
Tukey HSD test; variable Y
GENERAL MANOVA Probabilities for Post Hoc Tests MAIN EFFECT: FAK_A
{1} ,1370000 {2} ,1473750 {3} ,1610000 {4} ,1692500
FAK_B FAK_A
.. A1 {1} 0,000161 0,000161 0,000161
.. A2 {2} 0,000161 0,000161 0,000161
.. A3 {3} 0,000161 0,000161 0,000161
.. A4 {4} 0,000161 0,000161 0,000161
Čia statistiškai reikšmingi skirtumai tarp faktoriaus A: 1-2, 1-3, 1-4; 2-3, 2-4; 3-4.
Tukey HSD test; variable Y (new.sta)
GENERAL MANOVA Probabilities for Post Hoc Tests INTERACTION: 1×2
{1} ,1440000 {2} ,1550000 {3} ,1695000 {4} ,1782500 {5} ,1300000 {6} ,1397500 {7} ,1525000 {8} ,1602500
FAK_B FAK_A
B1 A1 {1} 0,000147 0,000147 0,000147 0,000147 0,00018 0,000147 0,000147
B1 A2 {2} 0,000147 0,000147 0,000147 0,000147 0,000147 0,022536 0,000148
B1 A3 {3} 0,000147 0,000147 0,000147 0,000147 0,000147 0,000147 0,000147
B1 A4 {4} 0,000147 0,000147 0,000147 0,000147 0,000147 0,000147 0,000147
B2 A1 {5} 0,000147 0,000147 0,000147 0,000147 0,000147 0,000147 0,000147
B2 A2 {6} 0,00018 0,000147 0,000147 0,000147 0,000147 0,000147 0,000147
B2 A3 {7} 0,000147 0,022536 0,000147 0,000147 0,000147 0,000147 0,000147
B2 A4 {8} 0,000147 0,000148 0,000147 0,000147 0,000147 0,000147 0,000147
Čia matome statistiškai reikšmingus skirtumus tarp 1-2; 1-3; 1-4; 1-5; 1-6; 1-7; 2-3; 2-4; 2-5; 2-6; 2-8; 3-4; 3-5; 3-6; 3-7; 3-8; 4-5; 4-6; 4-7; 4-8; 5-6; 5-7; 5-8; 6-7; 6-8; 7-8 grupių.
Patikrinsime ar atsitiktinių imčių dispersijos yra lygios. Tam skaičiuosime pagal Levene‘s kriterijų:
Levene’s Test for Homogeneity of Variances (new.sta)
GENERAL MANOVA (ANOVA on absolute within-cell deviation scores) Degrees oof freedom for all F’s: 7,24
MS Effect MS Error F p-level
variable
Y 0,000000 0,000000 0,896103 0,525183
Iš gautos Levene’s Test Homogeneity of Variances lentelės rezultatų aišku, kad bandymų schema sudaryta teisingai, nes atsitiktinių imčių dispersijos lygios (p>α).
Standard Deviations (new.sta)
GENERAL MANOVA 1 Depend Variable
FAK_B FAK_A Y Valid N
B1 A1 0,000816 4
B1 A2 0,000816 4
B1 A3 0,001291 4
B1 A4 0,000957 4
B2 A1 0,000816 4
B2 A2 0,000500 4
B2 A3 0,001291 4
B2 A4 0,000957 4
All Groups 0,015045 32
Toliau gaunamos Means ir Standart deviations lentelės:
Means (new.sta)
GENERAL MANOVA 1 Depend Variable
FAK_B FAK_A Y Valid N
B1 A1 0,144000 4
B1 A2 0,155000 4
B1 A3 0,169500 4
B1 A4 0,178250 4
B2 A1 0,130000 4
B2 A2 0,139750 4
B2 A3 0,152500 4
B2 A4 0,160250 4
All Groups 0,153656 32
Šiose lentelėse yra pateikiami priklausomojo kintamojo vidurkiai ir standartiniai nuokrypiai pagal abiejų faktorių sąveikos kiekvieną lygį, taip pat atsitiktinių imčių skaičius kiekviename lygyje.
Analizė bus išsamesnė ir akivaizdesnė, jei panaudosime ir kitus Descriptive statistics & Graphs dialogo skygelyje nurodytus grafikus, pavyzdžiui, ūselinę diagramą (Categorized box – whisker plot):
3 UŽDUOTIS
Užduoties tikslas – išmokti atlikti vienfaktorę ir daugiafaktorę regresinę analizę, taikant skaičiuoklės Microsoft Excel statistines funkcijas TREND ir LINEST bei GROWTH ir LOGEST.
3.1. Vienfaktorė regresinė analizė
y x1 TREND LINEST GROWTH LOGEST
2,59 47,00 2,0422293 0,0483719 -0,2312519 2,0039375 1,027794 0,552468
1,66 38,90 1,6504166 0,0133583 0,5507255 1,6048942 0,008294 0,341948
1,53 32,50 1,3408362 0,4214544 0,3346109 1,3466312 0,377692 0,207761
2,20 47,50 2,0664153 13,1125009 18,0000000 2,0315950 10,92459 18
1,65 47,30 2,0567409 1,4681344 2,0153606 2,0204865 0,471557 0,776966
1,99 50,90 2,2308799 2,2300632
1,55 33,60 1,3940453 1,3878584
2,13 40,20 1,7133001 1,6631219
2,04 48,20 2,1002756 2,0709578
1,77 41,10 1,7568348 1,7046663
1,03 37,50 1,5826959 1,5444653
1,65 36,60 1,5391611 1,5068251
2,51 48,20 2,1002756 2,0709578
1,02 37,50 1,5826959 1,5444653
1,76 45,20 1,9551598 1,9074518
1,70 33,20 1,3746965 1,3727226
1,97 40,20 1,7133001 1,6631219
1,56 35,20 1,4714404 1,4500888
1,16 37,00 1,5585099 1,5234395
1,42 39,10 1,6600910 1,6137178
46 1,9938574 1,9497471
Iš statistinėmis funkcijomis gautų skaičiavimų, sudarome suvestinę lentelę.
1 lentelė
Statistinės charakteristikos
Rodikliai Funkcijos Rodikliai Funkcijos
LINEST LOGEST LINEST LOGEST
Koeficientas b
0,0483719 1,027794 Laisvasis narys a -0,2312519 0,552468
Koeficiento b standartinė paklaida
0,0133583 0,008294 Laisvojo nario a standartinė paklaida 0,5507255 0,341948
Determinacijos koeficientas
0,4214544 0,377692 Standartinė tikėtino y paklaida 0,3346109 0,207761
F kriterijaus faktiška reikšmė
13,1125009 10,92459 Laisvės
laipsnių skaičius 18 18
Regresinė kvadratų suma 1,4681344 2,0153606 Likutinė kvadratų suma 2,0153606 0,776966
Iš 1 lentelėje įrašytų skaičiavimo rezultatų galime tvirtinti, kad turime tokias funkcijas, aprašančias vasarinių javų derlingumo priklausomybę nuo žemės kokybės, ir papildomas statistines charakteristikas:
3.1.1. Tiesinės lygties (yx = -0,23125+0,04837x) analizė
• Determinacijos koeficientas r2 = 0,4214544 rodo, kad pasirinktas veiksnys – žemės kokybė – rezultatinio rodiklio (vasarinių javų derlingumo) lygį lėmė 42,1 proc.,kitiems veiksniams, neįtrauktiems į lygtį, esant vidutinio lygio.
• Koreliacijos koeficientas r = 0,6491952. Šį skaičių gauname iš determinacijos koeficiento ištraukę kvadratinę šaknį. Koreliacijos koeficiento ženklą nustatome ppagal regresijos koeficiento b ženklą. Koreliacijos koeficientas rodo, kad ryšiai tarp vasarinių rapsų derlingumo ir žemės kokybės yra tiesioginiai ir labai stiprūs. Tačiau ar jie yra ststistiškai reikšmingi, mes galime pasakyti tik patikrinę H0 : r = 0.
• Iškelta nulinė hipotezė H0 : r = 0 tikrinama Fišerio kriterijumi F.
Nulinė hipotezė atmetama, jei F > Fα. Šiuo atveju yra pripažįstama, kad ryšiai yra statistiškai reikšmingi.
Mūsų atveju F > Fα, tad ryšiai yra statistiškai reikšmingi.
• Regresijos statistiniam reikšmingumui įvertinti yra keliamos nulinės hipotezės HH0 : a = 0 ir H0 : b = 0.
Hipotezės yra tikrinamos Stjudento kriterijumi.
4.1.1.1. Patikrinamas, kuri iš dviejų funkcijų yra tinkamesnė priklausomybei aprašyti
0,4214544 – 0,377692 = 0,0868435 < 0,1, todėl priklausomybė tarp vasarinių javų derlingumo ir žemės kokybės yra ttiesinė.
3.1.1.2. Prognozuojamas vasarinių javų derlingumas (jei ūkininkai javus sėtų į 46 našumo balais įvertintą žemę.
Prognozuojamą vasarinių javų derligumas yra 1,9938574, t.y. 1,99 t/ha.
yx = -0,23125+0,04837x x = 46.
3.2. Daugiafaktorė regresinė analizė
y x1 x2 TREND LINEST
2,59 47,00 2,60 2,1405078 -0,4846008 0,0852034 -0,6040903
1,66 38,90 2,00 1,7411206 0,4208205 0,0346156 0,6346078
1,53 32,50 1,80 1,2927390 0,4633185 0,3316205 #N/A
2,20 47,50 2,70 2,1346494 7,3380729 17,0000000 #N/A
1,65 47,30 3,00 1,9722285 1,6139678 1,8695272 #N/A
1,99 50,90 3,40 2,0851204
1,55 33,60 2,00 1,2895426
2,13 40,20 2,20 1,7549649
2,04 48,20 2,80 2,1458317
1,77 41,10 2,10 1,8801081
1,03 37,50 2,00 1,6218359
1,65 36,60 2,00 1,5451528
2,51 48,20 2,80 2,1458317
1,02 37,50 2,30 1,4764556
1,76 45,20 3,00 1,7933013
1,70 33,20 1,90 1,3039213
1,97 40,20 2,30 1,7065048
1,56 35,20 1,80 1,5227882
1,16 37,00 1,80 1,6761543
1,42 39,10 2,20 1,6612412
46 4,00 1,3768633
Iš statistinėmis funkcijomis gautų skaičiavimų, sudarome suvestinę lentelę.
2 lentelė
Statistinės charakteristikos
Rodikliai Rodiklių reikšmės Rodikliai Rodiklių reikšmės
Koeficientas b1 0,0852034 Laisvasis narys α -0,6040903
Koeficiento b1 standartinė paklaida 0,0346156 Laisvojo nario α standartinė paklaida 0,6346078
Koeficientas b2 -0,4846008 Koeficiento b2 standartinė paklaida 0,4208205
Determinacijos koeficientas 0,4633185 Standartinė tikėtino y paklaida 0,3316205
F kriterijaus faktiška reikšmė 7,3380729 Laisvės laipsnių skaičius 17
Regresinė kvadratų suma 1,6139678 Likutinė kvadratų suma
2 lentelėje pateiktų rezultatų analizės algoritmas toks pats kaip vienafaktorinėje regresinėje analizėje. Iš skaičiavimo rezultatų galima tvirtinti, kad turime tokias funkcijas, aprašančias rugių derlingumo priklausomybę nuo žemės kokybės, ir papildomas statistines charakteristikas:
1. Tiesės lygtis yx = -0,6040903+0,0852034x
• Determinacijos koeficientas r2 =0,4633185 rodo, kad pasirinktas veiksnys – žemės kokybė – rezultatinio rrodiklio (javų derlingumo) lygį lėmė 46,3 proc., kitiems veiksniams, neįtrauktiems į lygtį, esant vidutiniame lygyje;
• Koreliacijos koeficientas r = 0,68067. Šį skaičių gauname iš determinacijos koeficiento ištraukę kvadratinę šaknį. Koreliacijos koeficiento ženklą nustatome pagal regresijos koeficiento b ženklą. Koreliacijos koeficientas rodo, kad ryšiai tarp javų derlingumo ir žemės kokybės yra tiesioginiai ir vidutiniai. Tačiau ar jie statistiškai reikšmingi, mes galime pasakyti tik patikrinę H0 : r = 0.
2. Eksponentės skaičiuoti negalime, nes neturime funkcijos LOGEST duomenų, taip pat negalime patikrinti, kuri iiš dviejų funkcijų yra tinkamesnė priklausomybei aprašyti.
3. Prognozuojame, koks būtų javų derlingumas, jei ūkininkai javus sėtų į 46 našumo balais įvertintą žemę
Į apskaičiuotą tiesės lygtį yx = -0,6040903+0,0852034x, įrašome x=46, ir turime, kad Y=3,3t/ha.
4 UŽDUOTIS
Užduoties tikslas – išmokti atlikti vienfaktorinę ir daugiafaktorinę regresinę analizę, taikant skaičiuoklės Microsoft Excel duomenų analizės posistemio Data Analysis uždavinį Regression.
4.1. Vienfaktorė regresinė analizė
Vasarinių javų derlingumas 1998m. t/ha Žemės ūkio naudmenų našumo balas
2,59 47
1,66 38,9
1,53 32,5
2,20 47,5
1,65 47,3
1,99 50,9
1,55 33,6
2,13 40,2
2,04 48,2
1,77 41,1
1,03 37,5
1,65 36,6
2,51 48,2
1,02 37,5
1,76 45,2
1,7 33,2
1,97 40,2
1,56 35,2
1,16 37
1,42 39,1
Reikia nustatyti, ar yra statistiškai patikima vasarinių javų derlingumo priklausomybė nuo žemės kokybės ir koks būtų javų derlingumas, jei žemės ūkio naudmenų našumo balas padidėtų iki 46 balų.
SUMMARY OUTPUT
Regression Statistics
Multiple R 0,649195207
R Square 0,421454417
Adjusted R Square 0,389312995
Standard Error 0,334610939
Observations 20
ANOVA
df SS MS F Significance F
Regression 1 1,468134 1,468134 13,11250 0,001953235
Residual 18 2,015361 0,111964
Total 19 3,483495
Coefficients Standard Error t Stat P-value Lower 95% Upper 95%
Intercept -0,231252 0,550725 -0,419904 0,679525 -1,388284 0,925780
X Variable 1 0,048372 0,013358 3,621119 0,001953 0,020307 0,076437
RESIDUAL OUTPUT
Observation Predicted Y Residuals Standard Residuals
1 2,042229 0,547771 1,681896
2 1,650417 0,009583 0,029425
3 1,340836 0,189164 0,580816
4 2,066415 0,133585 0,410164
5 2,056741 -0,406741 -1,248873
6 2,230880 -0,240880 -0,739607
7 1,394045 0,155955 0,478849
8 1,713300 0,416700 1,279451
9 2,100276 -0,060276 -0,185073
10 1,756835 0,013165 0,040423
11 1,582696 -0,552696 -1,697019
12 1,539161 0,110839 0,340324
13 2,100276 0,409724 1,258034
14 1,582696 -0,562696 -1,727723
15 1,955160 -0,195160 -0,599226
16 1,374697 0,325303 0,998824
17 1,713300 0,256700 0,788181
18 1,471440 0,088560 0,271917
19 1,558510 -0,398510 -1,223600
20 1,660091 -0,240091 -0,737185
Iš ANOVA lentelės galime patikrinti nulinę hipotezę H0 : r = 0.Tikrinama Fišerio kriterijumi F.
Nulinę hipotezę atmetame, nes F> Fα (p<α), taigi šiuo atveju yra pripažįstama ryšių reikšmingumas.
Regresijos statistiniam reikšmingumui įvertinti yra keliama nulinė hipotezė H0: b = 0.
Nulinę hipotezę atmetame, nes F > Fα (p < α) , taigi šiuo atveju yra pripažįstama ryšių reikšmingumas.
Kadangi naudojant šios programos uždavinį negalima gauti prognozuojamos rezultatinio rodiklio y reikšmės, tai išsikviesime statistinę funkciją Forecast ir atliksime prognozavimą.
Jeigu javus sėsime 46 balų kokybės, tai dderlingumas bus 1,99 t/ha.
4.2 Daugiafaktorė regresinė analizė
Vasarinių javų derlingumas 1998m. t/ha Žemės ūkio naudmenų našumo balas Įterpta mineralinių trąšų 100 kg/ha
2,59 47 2,60
1,66 38,9 2,00
1,53 32,5 1,80
2,20 47,5 2,70
1,65 47,3 3,00
1,99 50,9 3,40
1,55 33,6 2,00
2,13 40,2 2,20
2,04 48,2 2,80
1,77 41,1 2,10
1,03 37,5 2,00
1,65 36,6 2,00
2,51 48,2 2,80
1,02 37,5 2,30
1,76 45,2 3,00
1,7 33,2 1,90
1,97 40,2 2,30
1,56 35,2 1,80
1,16 37 1,80
1,42 39,1 2,20
Reikia nustatyti, ar yra statistiškai patikima žieminių rapsų derlingumo priklausomybė nuo žemės kokybė bei įterptų mineralinių trąšų kiekio ir koks būtų rapsų derlingumas, jei žemės ūkio naudmenų našumo balas padidėtų iki 46 balų ir į hektarą būtų įterpta 400kg mineralinių trąšų.
SUMMARY OUTPUT
Regression Statistics
Multiple R 0,680675
R Square 0,463319
Adjusted R Square 0,400180
Standard Error 0,331621
Observations 20
ANOVA
df SS MS F Significance F
Regression 2 1,613968 0,806984 7,338073 0,005042
Residual 17 1,869527 0,109972
Total 19 3,483495
Coefficients Standard Error t Stat P-value Lower 95% Upper 95%
Intercept -0,604090 0,634608 -0,951911 0,354481 -1,942998 0,734817
X Variable 1 0,085203 0,034616 2,461416 0,024829 0,012171 0,158236
X Variable 2 -0,484601 0,420821 -1,151562 0,265440 -1,372456 0,403254
RESIDUAL OUTPUT
Observation Predicted Y Residuals Standard Residuals
1 2,140508 0,449492 1,432957
2 1,741121 -0,081121 -0,258608
3 1,292739 0,237261 0,756375
4 2,134649 0,065351 0,208334
5 1,972228 -0,322228 -1,027247
6 2,085120 -0,095120 -0,303239
7 1,289543 0,260457 0,830324
8 1,754965 0,375035 1,195591
9 2,145832 -0,105832 -0,337386
10 1,880108 -0,110108 -0,351018
11 1,621836 -0,591836 -1,886741
12 1,545153 0,104847 0,334247
13 2,145832 0,364168 1,160949
14 1,476456 -0,456456 -1,455156
15 1,793301 -0,033301 -0,106163
16 1,303921 0,396079 1,262677
17 1,706505 0,263495 0,840008
18 1,522788 0,037212 0,118629
19 1,676154 -0,516154 -1,645472
20 1,661241 -0,241241 -0,769064
.
5 UŽDUOTIS
Užduoties tikslas – išmokti atlikti vienfaktorę ir daugiafaktorę regresinę analizę, taikant Statsoft programos STATISTICA modulį Multiple Regression.
5.1.Vienfaktorė regresinė analizė
Naudojame 5 užduoties duomenis.
Means and Standard Deviations
MULTIPLE REGRESS Note: SD=sqrt (SS/N)
variable Mean St.dev. N
BALAI 40,845 5,601114 20
T_HA 1,7445 0,417342 20
Means and Standard Deviations
MULTIPLE REGRESS
Mean St.dev. N
BALAI 40,845 5,746621 20
T_HA 1,7445 0,428184 20
Correlations (new.sta)
MULTIPLE REGRESS
BALAI T_HA
BALAI 1 0,649195
T_HA 0,649195 1
Kadangi mums nepakanka vidurkio, standartinio nuokrypio ir koreliacinės matricos, tai gauname lentelę, kurioje yra regresinės analizės pagrindinės statistinės charakteristikos ir papildomos informacijos komandos.
Regression Summary for Dependent Variable: T_HA (new.sta)
MULTIPLE REGRESS R= ,64919521 R²= ,42145442 Adjusted R²= ,38931300
F(1,18)=13,113 p<,00195 Std.Error of estimate: ,33461
BETA St. Err of BETA B St. Err of B t(18) p-level
N=20
Intercpt -0,23125 0,550725 -0,4199 0,679525
BALAI 0,649195 0,17928 0,048372 0,013358 3,621119 0,001953
Analysis of Variance; DV: T_HA (new.sta)
MULTIPLE REGRESS Sums of Squares df Mean Squares F p-level
Regress. 1,468134 1 1,468134 13,1125 0,001953
Residual 2,015361 18 0,111964
Total 3,483495
Šioje lentelėje yra detalus Fišerio kriterijaus FF faktiškos reikšmės apskaičiavimas.
Nulinę hipotezę atmetam, nes F>Fα (p< α).
Jei norime prognozuoti vasarinių javų derlingumą, kai žinoma būsima žemės kokybės reikšmė, tai įrašome būsimą faktoriaus reikšmę (mūsų atveju 46).
Predicting Values for (new.sta)
MULTIPLE REGRESS variable: T_HA
B-Weight Value B-Weight * Value
variable
BALAI 0,048372 46 2,225109
Intercpt -0,231252
Predictd 1,993857
Iš lentelės duomenų matome, kad prognozuojamas vasarinių javų derlingumas (jei juos sėsime 46 našumo balų žemėje) – 1,99 t/ha.
Predicted & Residual Values (new.sta)
MULTIPLE REGRESS Dependent variable: T_HA
Observed Predictd Standard Standard Std.Err. Mahalns. Deleted Cook’s
Case No. Value Value Residual Pred. v. Residual Pred.Val Distance Residual Distance
1 2,59 2,042229 0,547771 1,071064 1,637037 0,111168 1,147178 0,615734 0,186878
2 1,66 1,650417 0,009583 -0,33846 0,02864 0,079204 0,114555 0,010152 2,58E-05
3 1,53 1,340836 0,189164 -1,45216 0,565325 0,134257 2,108762 0,22546 0,036544
4 2,2 2,066415 0,133585 1,158072 0,399224 0,116195 1,34113 0,151902 0,012425
5 1,65 2,056741 -0,406741 1,123269 -1,21556 0,114164 1,261733 -0,46033 0,110154
6 1,99 2,23088 -0,24088 1,749724 -0,71988 0,153751 3,061533 -0,30535 0,08791
7 1,55 1,394045 0,155955 -1,26074 0,466078 0,12233 1,589467 0,180015 0,019342
8 2,13 1,7133 0,4167 -0,11224 1,245327 0,075316 0,012598 0,438938 0,04359
9 2,04 2,100276 -0,060276 1,279882 -0,18014 0,123496 1,638099 -0,06978 0,002962
10 1,77 1,756835 0,013165 0,044374 0,039345 0,074899 0,001969 0,01386 4,3E-05
11 1,03 1,582696 -0,552696 -0,58208 -1,65176 0,087148 0,338818 -0,59291 0,106491
12 1,65 1,539161 0,110839 -0,73869 0,331247 0,093882 0,54567 0,12031 0,005088
13 2,51 2,100276 0,409724 1,279882 1,22448 0,123496 1,638099 0,474337 0,136864
14 1,02 1,582696 -0,562696 -0,58208 -1,68164 0,087148 0,338818 -0,60364 0,110379
15 1,76 1,95516 -0,19516 0,757837 -0,58324 0,094777 0,574316 -0,21218 0,01613
16 1,7 1,374696 0,325304 -1,33035 0,972184 0,1266 1,769823 0,37965 0,092139
17 1,97 1,7133 0,2567 -0,11224 0,767159 0,075316 0,012598 0,270399 0,016542
18 1,56 1,47144 0,08856 -0,98232 0,264664 0,106229 0,964945 0,098486 0,004366
19 1,16 1,55851 -0,39851 -0,66909 -1,19097 0,090754 0,44768 -0,43015 0,060784
20 1,42 1,660091 -0,240091 -0,30366 -0,71752 0,078368 0,092207 -0,25403 0,015807
Minimum 1,02 1,340836 -0,562696 -1,45216 -1,68164 0,074899 0,001969 -0,60364 2,58E-05
Maximum 2,59 2,23088 0,547771 1,749724 1,637037 0,153751 3,061533 0,615734 0,186878
Mean 1,7445 1,7445 7,81E-19 -6,4E-18 3,91E-09 0,103425 0,95 0,002543 0,053223
Median 1,68 1,686696 0,050862 -0,20795 0,152004 0,100503 0,769631 0,056173 0,027943
Šioje lentelėje yra faktiški ir teoriniai duomenys, liekanos, standartizuoti teoriniai duomenys, standartizuotos liekanos, teorinių reikšmių standartinė paklaida, pašalinamosios liekanos, Mahalanobis atstumas, Kuko atstumas.
Pagal standartizuotąją liekaną Mahalanobis ir Kuko atstumus galime spręsti, ar tarp stebinių nėra išskirčių. Pagal Kuko atstumo reikšmes galime teigti, kad išskirčių nėra, nes visi atstumai mažesni už vienetą.
Mus domina ar nėra autoregresijos.
Durbin-Watson d (new.sta)
MULTIPLE REGRESS and serial correlation of residuals
Durbin – Watson d Serial Corr
Estimate 1,786031127 0,018779062
Darbino – Watsono statistika d artima skaičiui 2. Tai rodo, kad yra tik nežymi teigiama regresijos paklaidų serijinė korealiacija.
Braižome teorinių ir faktiškų reikšmių sklaidos diagramą:
5.2 Daugiafaktorė regresinė analizė
Naudojame 5 užduoties duomenis.
Regresinės analizės pagrindinės statistinės charakteristikos
Kadangi mūsų netenkina tik aprašomosios statistikos charakteristikos, tai naudosimės ir kitomis regresinės analizės pagrindinėmis statistinėmis charakteristikomis. Šioje lentelėje yra papildomos informacijos (standartizuotų duomenų
regresijos tiesės lygties koeficiento beta standartinė paklaida ir kt.):
Regression Summary for Dependent Variable: T_HA (new.sta)
MULTIPLE REGRESS R= ,68067506 R²= ,46331854 Adjusted R²= ,40017955
F(2,17)=7,3381 p<,00504 Std.Error of estimate: ,33162
BETA St. Err. of BETA B St. Err. of B t(17) p-level
N=20
Intercpt -0,60409 0,634608 -0,95191 0,354481
BALAI 1,143507 0,464573 0,085203 0,034616 2,461416 0,024829
TRASOS -0,53498 0,464573 -0,4846 0,420821 -1,15156 0,26544
Analysis of Variance; DV: T_HA (new.sta)
MULTIPLE Sums of Mean
REGRESSs Squares df Squares F p-level
Regress. 1,613968 2 0,806984 7,338073 0,005042
Residual 1,869527 17 0,109972
Total 3,483495
Šioje lentelėje yra detalus Fišerio kriterijaus F faktiškos reikšmės apskaičiavimas.
Nulinę hipotezę atmetame, kadangi F>Fα (p< α).
Jei norime prognozuoti vasarinių javų derlingumą, kai žinomos būsimos žemės kokybės ir įterptų mineralinių ttrąšų kiekio reikšmės, tai įrašome būsimas faktorių reikšmes (mūsų atveju 46 bei 4).
Predicting Values for (new.sta)
MULTIPLE REGRESS variable: T_HA
B-Weight
variable B-Weight Value * Value
BALAI 0,085203 46 3,919357
TRASOS -0,4846 4 -1,9384
Intercpt -0,60409
Predictd 1,376863
Iš lentelės duomenų matome, kad prognozuojamas rugių derlingumas yra 1,37 t/ha.
Predicted & Residual Values
Dependent variable: T_HA
Observed Predictd Standard Standard Std.Err. Mahalns. Deleted Cook’s
Case. No. Value Value Residual Pred. v. Residual Pred.Val Distance Residual Distance
1 2,59 2,140508 0,449492 1,35873 1,355441 0,139363 2,405562 0,545903 0,159529
2 1,66 1,741121 -0,08112 -0,01159 -0,24462 0,111201 1,186444 -0,0914 0,002847
3 1,53 1,292739 0,237261 -1,55002 0,715459 0,139458 2,410156 0,288235 0,044535
4 2,2 2,134649 0,065351 1,338629 0,197065 0,129507 1,947726 0,077111 0,002749
5 1,65 1,972228 -0,32223 0,781352 -0,97168 0,134861 2,192277 -0,38608 0,074721
6 1,99 2,08512 -0,09512 1,168692 -0,28684 0,198091 5,829557 -0,14789 0,023655
7 1,55 1,289543 0,260457 -1,56099 0,785408 0,151439 3,012292 0,329085 0,068455
8 2,13 1,754965 0,375035 0,035906 1,130917 0,082949 0,238768 0,400066 0,030353
9 2,04 2,145832 -0,10583 1,376996 -0,31913 0,128627 1,908488 -0,12457 0,007077
10 1,77 1,880108 -0,11011 0,46528 -0,33203 0,130267 1,981826 -0,1302 0,007929
11 1,03 1,621836 -0,59184 -0,42087 -1,78468 0,092817 0,538408 -0,64214 0,097909
12 1,65 1,545153 0,104847 -0,68397 0,316166 0,093188 0,550347 0,113836 0,003102
13 2,51 2,145832 0,364168 1,376996 1,098148 0,128627 1,908488 0,428659 0,083792
14 1,02 1,476456 -0,45646 -0,91968 -1,37644 0,126377 1,80935 -0,53401 0,12553
15 1,76 1,793301 -0,0333 0,167441 -0,10042 0,169052 3,98756 -0,04499 0,001595
16 1,7 1,303921 0,396079 -1,51166 1,194373 0,139713 2,42244 0,481553 0,12476
17 1,97 1,706505 0,263495 -0,13036 0,794568 0,074876 0,018614 0,27765 0,011912
18 1,56 1,522788 0,037212 -0,76071 0,112212 0,114333 1,308456 0,042232 0,000643
19 1,16 1,676154 -0,51615 -0,2345 -1,55646 0,136112 2,25086 -0,62073 0,196747
20 1,42 1,661241 -0,24124 -0,28567 -0,72746 0,077674 0,09238 -0,25524 0,010834
Minimum 1,02 1,289543 -0,59184 -1,56099 -1,78468 0,074876 0,018614 -0,64214 0,000643
Maximum 2,59 2,145832 0,449492 1,376996 1,355441 0,198091 5,829557 0,545903 0,196747
Mean 1,7445 1,7445 -6,1E-19 -1,1E-08 2,98E-09 0,124927 1,9 0,000354 0,053934
Median 1,68 1,723813 0,001955 -0,07098 0,005896 0,129067 1,928107 -0,00138 0,027004
Šioje lentelėje yra faktiški ir teoriniai duomenys, liekanos, standartizuoti teoriniai duomenys, standartizuotos liekanos, teorinių reikšmių standartinė paklaida, pašalinamosios liekanos, Mahalanobis atstumas, Kuko atstumas.
Pagal standartizuotąją liekaną Mahalanobis ir Kuko aatstumus galime spręsti, ar tarp stebinių nėra išskirčių. Pagal Kuko atstumo reikšmes galime teigti, kad išskirčių nėra, nes visi atstumai mažesni už vienetą.
Mus domina ar nėra autoregresijos.
Durbin-Watson d (new.sta)
MULTIPLE REGRESS and serial correlation of residuals
Durbin- Serial
Watson d Corr.
Estimate 1,742248774 0,061179474
Darbino – Watsono statistika dd artima skaičiui 2. Tai rodo, kad yra tik nežymi teigiama regresijos paklaidų serijinė korealiacija.
Braižome teorinių ir faktiškų reikšmių sklaidos diagramą:
6 UŽDUOTIS
Užduoties tikslas – išmokti atlikti vienfaktorę regresinę analizę taikant StatSoft programos STATISTICA modulį Nonlinear estimation.
Naudojame 5 užduoties duomenis.
Turimų duomenų priklausomybės aprašymui pasirenkame pirmo tipo hiperbolės lygtį:
yx = b0+b1/x
Žemiau pavaizduotoje lentelėje pateikiamos pagrindinės statistinės charakteristikos. Gavome, kad esant kreivinei priklausomybei, ryšys tarp rezultatinio rodiklio ir faktoriaus yra stiprus η=0,56108, o rinktas faktorius (žemės naudmenų našumo balas) derlingumą lėmė 31,48 proc.
Galime pasirinkti kitus įvertinimo modelius ir palyginti jais gautas pagrindines charakteristikas (geriau tinka tas modelis, kurio apskaičiuoti kintamųjų priklausomybės matai didesni, o nuostolių funkcija mažesnė). Tačiau dažniausiai pats kompiuteris pasiūlo pasirinktai funkcijai tinkamiausią įvertinimo modelį.
Model: balai=b0+b1/t_ha (new.sta)
Dep. var: BALAI Loss: ((OBS-PRED)**2
Final loss: 429,91835196 R=,56108
Variance explained: 31,482%
N=20 B0 B1
Estimate 52,69650929 -19,4253277
Std.Err. 4,263524475 6,754719358
t(18) 12,35984679 -2,875815659
p-level 3,13171E-10 0,010056753
Šioje lentelėje turime pirmo tipo hiperbolės parametrų įverčius, jų standartines paklaidas, Stjudento kriterijų ir tikimybės p reikšę. Iš jų galima teigti, kad lygties koeficientas b (b1) yra statistiškai reikšmingas.
Residual Values
BALAI
C:1 1,803617
C:2 -2,0945
C:3 -7,50022
C:4 3,633185
C:5 6,376417
C:6 7,964962
C:7 -6,56404
C:8 -3,37664
C:9 5,02571
C:10 -0,62175
C:11 3,663032
C:12 -4,32358
C:13 3,242665
C:14 3,84793
C:15 3,540609
C:16 -8,06985
C:17 -2,63594
C:18 -5,04438
C:19 1,049463
C:20 0,083299
Predicted Values
BALAI
C:1 45,19638
C:2 40,9945
C:3 40,00022
C:4 43,86681
C:5 40,92358
C:6 42,93504
C:7 40,16404
C:8 43,57664
C:9 43,17429
C:10 41,72175
C:11 33,83697
C:12 40,92358
C:13 44,95734
C:14 33,65207
C:15 41,65939
C:16 41,26984
C:17 42,83594
C:18 40,24438
C:19 35,95054
C:20 39,0167
Means and Standard Deviations (new.sta)
mean st. dev. minimum maximum
T_HA 1,7445 0,428184 1,02 2,59
BALAI 40,845 5,746622 32,5 50,9
7 UŽDUOTIS
Užduoties tikslas – išmokti atlikti stacionarių laiko eilučių suglodinimą, taikant skaičiuoklės Microsoft Excel duomenų analizės posistemio Data Analysis uždavinį Moving Average.
Turime stacionarią laiko eilutę apie N – osios prekės ppardavimo apimtis:
Dienos 1 2 3 4 5 6 7 8 9 10 11 12 13 14
Kiekis kg 149,0 98,0 129,0 151,8 151,3 135,6 141,1 160,0 100,5 149,0 98,0 129,0 151,8 151,3
Dienos Kiekis kg Slenk.vidurkis Stand.paklaida
1 149 #N/A #N/A
2 98 #N/A #N/A
3 129 125,3333333 #N/A
4 151,8 126,2666667 #N/A
5 151,3 144,0333333 15,47255635
6 135,6 146,2333333 16,51083819
7 141,1 142,6666667 7,490586685
8 160 145,5666667 10,389792
9 100,5 133,8666667 21,00880768
10 149 136,5 22,19538657
11 98 115,8333333 23,00443597
12 129 125,3333333 12,75045388
13 151,8 126,2666667 18,10546265
14 151,3 144,0333333 15,47255635
Šioje lentelėje apskaičiuojamas slenkamasis vidurkis ir standartinė paklaida iš trijų reikšmių bei slenkamasis vidurkis ir standartinė paklaida iš penkių reikšmių. Kadangi skaičiuojant slenkamąjį vidurkį iš trijų reikšmių gauta mažesnė standartinė paklaida, tai išvadų darymui ir ateinančios dienos N – tosios prekės apyvartos numatymui naudosime 1 paveikslą.
8 UŽDUOTIS
Užduoties tikslas – išmokti atlikti stacionarių laiko eilučių suglodinimą ir prognozavimą, taikant skaičiuoklės Microsoft Excel duomenų analizės posistemio Data Analysis uždavinį Exponential Smoothing.
Naudojame 8 užduoties duomenis.
Dienos Kiekis kg damp factor = 0,9 damp factor = 0,5 damp factor = 0,3 damp factor = 0,1
1 149 #N/A #N/A #N/A #N/A #N/A #N/A #N/A #N/A
2 98 149 #N/A 149 #N/A 149 #N/A 149 #N/A
3 129 143,9 #N/A 123,5 #N/A 113,3 #N/A 103,1 #N/A
4 151,8 142,41 #N/A 126,25 #N/A 124,29 #N/A 126,41 #N/A
5 151,3 143,349 31,15115 139,025 33,08601 143,547 34,66165 149,261 36,13153
6 135,6 144,1441 11,15647 145,1625 16,67061 148,9741 18,82728 151,0961 20,97315
7 141,1 143,2897 8,648548 140,3813 17,27155 139,6122 18,21881 137,1496 17,21374
8 160 143,0707 6,856014 140,7406 8,993213 140,6537 8,966401 140,705 9,307564
9 100,5 144,7636 11,02114 150,3703 12,42151 154,1961 13,60589 158,0705 14,46874
10 149 140,3373 27,39018 125,4352 30,86793 116,6088 32,96344 106,257 35,1296
11 98 141,2036 27,81435 137,2176 33,73067 139,2826 37,88905 144,7257 42,87043
12 129 136,8832 36,05949 117,6088 39,07415 110,3848 43,34634 102,6726 49,41192
13 151,8 136,0949 25,84399 123,3044 27,2218 123,4154 32,14535 126,3673 39,59539
14 151,3 137,6654 26,92795 137,5522 28,75052 143,2846 30,85702 149,2567 34,26976
15 139,0289 12,84132 144,4261 19,41444 148,8954 20,13666 151,0957 21,16706
Išsirinkome grafiką, su gesinimo faktoriumi 0,9, nes šiuo atveju gauta mažiausia standartinė paklaida.
9 UŽDUOTIS
Užduoties tikslas – išmokti atlikti nestacionarios laiko eilutės vidutinės trukmės prognozę, taikant skaičiuoklės Microsoft Excel diagramų vedliu nubraižytas linijines diagramas.
Turimi duomenys apie N – ojo ūkininko ūkyje auginamų vasarinių javų derlingumą.
Metai 1997 1998 1999 2000 2001 2002 2003
Derlingumas t/ha 16,3 15,7 19,5 19,3 19,3 25,1 20,2
Tiesės lygtis y = 1,0821x+15,014
R2 = 0,581
Trečios eilės polinomas y= -0,1472×3+1,6345×2-3,8968x+18,729
R2=0,6899
Logoritmas y=3,3771Ln(x)+15,23
R2=0,5686
Rodiklinė funkcija y=15,44×0,1766
R2=0,6181
Eksponentė y=15,294e0,0561
R2=0,6216
Prognozuosime pagal analizuojamais metais susiklosčiusias tendencijas vasarinių javų derlingumą 2004m. ir 2005m.
Pasirinkau matematinę priklausomybę (trečios eilės polinomą), nes jis žymiai geriau atspindi rugių faktiško derlingumo kitimus (determinacijos koeficientas lygus 0,6899). Logiškai apsvarsčius 2005 metų prognozuojamą reikšmę kyla abejonių ar ji yra reali, nes trečios eilės polinomas yra sparčiai greitėjantis, ttodėl galbūt tiktų kita funkcija.
10 UŽDUOTIS
Užduoties tikslas – išmokti nustatyti nestacionarios laiko eilutės neatsitiktinės komponentės kitimo tendenciją ir prognozuoti būsimas reikšmes, taikant Microsoft Excel statistines funkcijas TREND, LINEST ir GROWTH, LOGEST.
Turimi duomesnys apie auginamų vasarinių javų derlingumą:
Metai 1997 1998 1999 2000 2001 2002 2003
Derlingumas t/ha 16,3 15,7 19,5 19,3 19,3 25,1 20,2
Prognozuosime pagal analizuojamais metais susikosčiusias tendencijas vasarinių javų derlingumą 2004m. ir 2005m.
10.1 Statistinių funkcijų TREND ir LINEST taikymas
Metai t/ha Laiko linkmė t TREND LINEST
1997 16,3 1 16,09643 1,082143 15,01429
1998 15,7 2 17,17857 0,410994 1,83802
1999 19,5 3 18,26071 0,580981 2,174774
2000 19,3 4 19,34286 6,932644 5
2001 19,3 5 20,425 32,78893 23,64821
2002 25,1 6 21,50714
2003 20,2 7 22,58929
2004 8 23,67143
2005 9 24,75357
Remdamiesi javų faktišku ir TREND apskaičiuotu derlingumu nubraižome linijinę diagramą (1 pav.).
10.2 Statistinių funkcijų GROWTH ir LOGEST taikymas
Metai t/ha Laiko linkmė t GROWTH LOGEST
1997 16,3 1 16,17729 1,057736 15,29426
1998 15,7 2 17,1113 0,019587 0,087595
1999 19,5 3 18,09923 0,621569 0,103644
2000 19,3 4 19,14421 8,212459 5
2001 19,3 5 20,24951 0,088218 0,05371
2002 25,1 6 21,41864
2003 20,2 7 22,65526
2004 8 23,96328
2005 9 25,34682
Remdamiesi javų faktišku ir TREND apskaičiuotu derlingumu nubraižome linijinę diagramą (2 pav.).
11 UŽDUOTIS
Užduoties tikslas – išmokti nustatyti nestacionarios laiko eilutės neatsitiktinės komponentės kitimo tendenciją ir prognozuoti būsimas reikšmes, taikant Microsoft Excel duomenų analizės posistemio Data Analysis uždavinį Regression.
Metai 100kg/ha Laiko linkmės
1997 16,3 1
1998 15,7 2
1999 19,5 3
2000 19,3 4
2001 19,3 5
2002 25,1 6
2003 20,2 7
SUMMARY OUTPUT
Regression Statistics
Multiple R 0,762221
R Square 0,580981
Adjusted R Square 0,497178
Standard Error 2,174774
Observations 7
ANOVA
df SS MS F Significance F
Regression 1 32,78893 32,78893 6,932644 0,046365847
Residual 5 23,64821 4,729643
Total 6 56,43714
Coefficients Standard Error t Stat P-value Lower 95% Upper 95%
Intercept 15,01428571 1,838019675 8,16873 0,000447 10,28951344 19,739058
X Variable 1 1,082142857 0,410993694 2,632991 0,046366 0,02565166 2,1386341
RESIDUAL OUTPUT
Observation Predicted Y Residuals
1 16,09642857 0,203571429
2 17,17857143 -1,478571429
3 18,26071429 1,239285714
4 19,34285714 -0,042857143
5 20,425 -1,125
6 21,50714286 3,592857143
7 22,58928571 -2,389285714
23,67142857
24,75357143
12 UŽDUOTIS
Užduoties tikslas – išmokti nustatyti nestacionarios laiko eilutės neatsitiktinės komponentės kitimo tendenciją ir prognozuoti būsimas reikšmes, taikant StatSoft programos STATISTICA modulį Multiple Regression.
Regression Summary for Dependent Variable: T_HA (new.sta)
MULTIPLE REGRESS R= ,76222134 R²= ,58098137 Adjusted R²= ,49717764
F(1,5)=6,9326 p<,04637 Std.Error of estimate: 2,1748
St. EErr. St. Err.
N=7 BETA of BETA B of B t(5) p-level
Intercpt 15,01429 1,83802 8,16873 0,000447
LAIKAS 0,762221 0,289489 1,082143 0,410994 2,632991 0,046366
Norėdami prognozuoti derlingumą 2002 m. ir 2003 m. (atitinka laiko linkmes t=8 ir t=9), reikia paspausti Predict dependent var., atsiranda pirmas prognozuojamo laiko langas, į kurį įrašom 2002 m. numatytą laiko linkmę t=8, o 2003 m. prognozavimas atliekamas taip pat, tik įrašoma t=9 ir gaunam prognozuojamas reikšmes 23,67 ir 24,7.
Predicting Values for (new.sta)
MULTIPLE REGRESS variable: T_HA
B-Weight
variable B-Weight Value * Value
LAIKAS 1,082143 8 8,657143
Intercpt 15,01429
Predictd 23,67143
Predicting Values for (new.sta)
MULTIPLE REGRESS variable: T_HA
B-Weight
variable B-Weight Value * Value
LAIKAS 1,082143 9 9,739285
Intercpt 15,01429
Predictd 24,75357
Predicted & Residual Values (new.sta)
MULTIPLE REGRESS Dependent variable: T_HA
Observed Predictd
Case. No. Value Value Residual
1 16,3 16,09643 0,203571
2 15,7 17,17857 -1,47857
3 19,5 18,26071 1,239286
4 19,3 19,34286 -0,04286
5 19,3 20,425 -1,125
6 25,1 21,50714 3,592857
7 20,2 22,58928 -2,38928
Minimum 15,7 16,09643 -2,38928
Maximum 25,1 22,58928 3,592857
Mean 19,34286 19,34286 1,36E-07
Median 19,3 19,34286 -0,04286
Šioje lentelėje parodytos faktiškos ir teorinės reikšmės, ir jų skirtumas arba liekana. Naudojantis šiais duomenimis galima nubraižyti grafiką.