Namų ūkio statistikos ir ekonometrijos kursinis
Turinys
Įvadas 3
Aprašomoji statistika 6
Diagramos 8
Namų ūkio dydis 8
Namų ūkio disponuojamos pajamos vienam namų ūkio nariui 8
Namų ūkio vartojimo išlaidos vienam namų ūkio nariu 9
Namų ūkių pajamų ir išlaidų palyginimas 9
Vieno namų ūkio nario vidutinių išlaidų pasiskirstymo įvertinimas 11
Hipotezių tikrinimas 11
Ar skiriasi vieno namų ūkio nario vidutinės išlaidos kaime ir mieste 13
Ar namų ūkio santaupos didėja 13
Regresinės analizės 14
Regresinė analizė Nr. 1 14
Determinacijos koeficiento įvertis 19
Regresijos koeficiento reikšmingumo patikrini 20
Regresinė analizė Nr. 2 20
Skurdo rodiklių įvertinimas 23
Skurstančiųjų gyventojų lygis šalyje 24
Žemų pajamų nuokrypis 25
Žemų pajamų indeksas 25
Kvadratinis skurdo nuokrypis 25
Išvados 26Įvadas
Terminas „ūkio statistika“ naudojamas vietoj termino „ekonominė statistika“.
Ūkio statistika:
tiria ūkinių procesų iir reiškinių kiekybę;
pateikia matų sistema konkretiems reiškiniams ir procesams apibūdinti, kompleksinės ūkinių reiškinių analizės būdais;
pateikia statistinių tyrimų atlikimo metodiką;
supažindina su statistinių metodų ir ekonometrinių modelių taikymo ūkiniams procesams analizuoti metodika.
Ekonometrija apjungia teoriniu rezultatus, metodus, modelius skirtus suteikti konkrečias skaitines reikšmes ekonominiams reiškiniams naudojantis: ekonomikos teorija, ekonometrine statistika, matematiniais statistiniais metodais.
Ekonometrijos tikslai:
ekonominių ir socialinių rodiklių analizė;
rodiklių prognozė;
šalies socialinio-ekonominio vystymosi imitavimas.
Ūkio statistikos ir ekonometrijos kursinio darbo tikslai ir uždaviniai:
• aprašyti duomenų statistiką;
• įvertinti vieno namų ūkio nario vidutinių išlaidų pasiskirstymą;
• patikrinti hipotezes;
• apskaičiuoti skurdo rodiklius;
• atlikti regresinę aanalizę;
• įvertinti determinacijos koeficientą;
• patikrinti regresijos koeficiento reikšmingumą.
Naudojamos sąvokos
Namų ūkiu laikomas atskirai gyvenantis vienas asmuo ar asmenų grupė, gyvenanti viename bute (name), turinti bendrą biudžetą ir kartu maitinasi. Namų ūkiu gali būti:
• šeima, susidedanti iš sutuoktinių ir vaikų ar be jų arba vieno sutuoktinio su vaikais;
• kartu gyvenantys ir bendrą biudžetą turintys giminaičiai;
• kartu gyvenantys ir bendru biudžetu susiję asmenys, neturintys giminystės ryšio
• vieniši asmenys, gyvenantys iš savo pajamų;
• šeimos, susidedančios iš kelių kartu gyvenančių sutuoktinių porų, turinčių bendrą biudžetą.
Asmenys, gyvenantys instituciniuose namų ūkiuose (senelių namuose, įkalinimo įstaigose, tarnaujantys armijoje ir pan.) nėra tiriami.
Namų ūkio galva – tai asmuo, turintis didžiausias pajamas. Asmuo, kuris, ūkio narių nuomone, per metus gauna didžiausias pajamas. Kai didžiausias pajamas gaunančio asmens išskirti negalima (pvz., visa šeima ūkininkauja ir pajamų negalima priskirti kuriam nors ūkio nariui), namų ūkio galva laikomas asmuo, kurį nurodo šeima.
Namų ūkių socialinės ekonominės grupės:
• žemdirbiai (namų ūkio galvos pagrindinis pajamų šaltinis yra asmeninis žemės ūkis);
• samdomieji darbuotojai (namų ūkio galvos pagrindinis pajamų šaltinis yra samdomas darbas visuomeniniame arba privačiame sektoriuje);
• verslininkai ((namų ūkio galvos pajamos yra iš verslo, amatų, laisvos profesinės veiklos);
• pensininkai (namų ūkio galvos pajamos yra pensija);
• kiti (namų ūkio galvos pagrindinis pajamų šaltinis yra įvairios pašalpos, stipendija, pajamos iš turto, bei kiti pajamų šaltiniai).
Namų ūkio tipas – nustatomas pagal namų ūkio demografinę sudėtį. Yra išskiriami šie tipai:
• vienišas asmuo;
• vienas suaugęs su vaikais iki 18 m.;
• sutuoktinių pora su vaikais iki 18 m.;
• kiti namų ūkiai su vaikais iki 18 m. Šiam tipui priklauso namų ūkiai, kuriuos sudaro tėvai su vaikais iki 18 metų iir vyresniais, kelių kartų namų ūkiai su vaikais iki 18 metų, seneliai su anūkais iki 18 metų ir pan.;
• sutuoktinių pora be vaikų;
• kiti namų ūkiai be vaikų.
Visi šalies namų ūkiai yra suskirstyti į 3 grupes:
• didieji miestai (Vilnius, Kaunas, Klaipėda, Šiauliai, Panevėžys);
• kiti miestai;
• kaimas.
Namų ūkio disponuojamos pajamos – tai visos piniginės ir natūrinės pajamos, kurios yra gautos už darbą iš ūkininkavimo, verslo, amatų, laisvos profesinės veiklos, taip pat pensijos, įvairios pašalpos, stipendijos, pajamos iš turto, renta ir kt.
Namų ūkio vartojimo išlaidos – tai piniginės ir natūrinės išlaidos, skirtos namų ūkių vartojimo poreikiams patenkinti: tai išlaidos maistui, drabužiams, avalynei, būstui, sveikatos priežiūrai, kultūros ir poilsio reikmėms ir kt.
Europos Konsiliume 1984 m. lapkričio 19 dieną buvo priimtas toks skurdo apibrėžimas: „skurdžiais vadinami asmenys, šeimos, asmenų grupės, kurių ištekliai (materialiniai, kultūrinia.i ir socialiniai) yra nepakankami savo šalyje susiklosčiusiam minimaliam gyvenimo būdui užtikrinti“.
Skurdo riba – tai kriterijus, kurio pagalba politikai ar tyrinėtojai suskirsto individus, šeimas ar namų ūkius į skurstančius ir neskurstančius. Yra trys pagrindiniai skurdo ribų tipai: absoliuti, santykinė, subjektyvi.
Skurdo rodikliai:
• skurstančiųjų gyventojų lygis šalyje – tai rodiklis, parodantis šalies gyventojų dalį, kurių pajamos yra žemiau skurdo ribos.
• žemų pajamų nuokrypis – tai rodiklis, kuris parodo, kiek vidutiniškai skurstančiųjų pajamos nukrypsta nuo skurdo ribos.
• žemų pajamų indeksas – tai rrodiklis, kuris parodo, kiek reikia lėšų panaikinti skurdą šalyje.
• kvadratinis skurdo nuokrypis – skurdo intensyvumo rodiklis, atspindintis pajamų pasiskirstymą tarp skurstančiųjų.Aprašomoji statistika
Pradiniai duomenys
Namų ūkio eilės nr. Namų ūkio dydis Namų ūkio disponuojamos pajamos (Lt) Namų ūkio vartojimo išlaidos (Lt) Pajamos vienam gyventojui (Lt) Išlaidos vienam gyventojui (Lt)
1 1 170,00 498,00 170,00 498,00
2 3 1206,00 898,00 402,00 299,33
3 5 446,00 842,00 89,20 168,40
4 2 655,00 739,00 327,50 369,50
5 3 887,00 791,00 295,67 263,67
6 3 1119,00 1041,00 373,00 347,00
7 1 335,00 427,00 335,00 427,00
8 4 872,00 859,00 218,00 214,75
9 3 636,00 612,00 212,00 204,00
10 4 847,00 863,00 211,75 215,75
11 2 603,00 804,00 301,50 402,00
12 1 346,00 321,00 346,00 321,00
13 5 1977,00 2238,00 395,40 447,60
14 4 1730,00 1797,00 432,50 449,25
15 4 1346,00 1179,00 336,50 294,75
16 4 1681,00 1653,00 420,25 413,25
17 4 1123,00 1003,00 280,75 250,75
18 3 1134,00 1220,00 378,00 406,67
19 4 708,00 932,00 177,00 233,00
20 3 2036,00 2037,00 678,67 679,00
21 2 781,00 1169,00 390,50 584,50
22 2 1038,00 757,00 519,00 378,50
23 2 895,00 1011,00 447,50 505,50
24 4 1015,00 618,00 253,75 154,50
25 3 1190,00 675,00 396,67 225,00
26 3 1096,00 1624,00 365,33 541,33
27 2 1552,00 1059,00 776,00 529,50
28 3 1691,00 2003,00 563,67 667,67
29 2 906,00 1340,00 453,00 670,00
30 2 1154,00 1560,00 577,00 780,00
Iš viso: 88 31175,00 32570,00 11.123,10 11.941,17
Vidurkis – tai visų stebėtų skaitinių duomenų suma, padalinta iš duomenų skaičiaus. Jis rodo vidutinę atsitiktinio dydžio reikšmę.
Mediana – tai skaičius, perskirstantis variacinę eilutę į dvi maždaug lygias dalis.
Moda – tai dažniausiai duomenų aibėje pasikartojanti reikšmė.
Vidutinis kvadratinis nuokrypis – tai kvadratinė šaknis iš dispersijos.
Dispersija – tai matas, aprašantis atsitiktinio dydžio sklaidą apie vidurkį.
Eksceso koeficientas – tai lėkštumo matas. Kai šis koeficientas:
• >0, tai sklaida apie vidurkį yra didesnė už normaliąją kreivę;
• =0, tai duomenų sklaida apie vidurkį yra tokia pati kaip ir normalios kreivės;
• <0, tai duomenų sklaida apie vidurkį yra mažesnė už normalios kreivės.
Asimetrijos koeficientas – tai simetrijos matas. KKai šis koeficientas:
• >0, tai asimetrija yra teigiama (dešinioji asimetrija);
• =0, tai rodo, kad yra simetrija;
• <0, tai asimetrija yra neigiama (kairioji asimetrija).
Duomenų plotis – tai maksimalios ir minimalios stebėjimų sekos duomenų reikšmių skirtumas, kuris parodo stebimų duomenų reikšmių diapazoną.
Minimali reikšmė – tai stebimų duomenų sekoje esanti mažiausia reikšmė.
Maksimali reikšmė – tai stebimų duomenų sekoje esanti didžiausia reikšmė.
GAVOM:
Charakteristikos N.Ū. Dydis N.Ū. Disponuojamos pajamos (Lt) Pajamos vienam n. ū. nariui Namų ūkio vartojimo išlaidos Išlaidos vienam n. ū. nariui
Vidurkis 2,93333333 1039,166667 370,77 1085,66667 398,03889
Standartinė paklaida 0,203042 86,57787782 27,3442819 90,4631929 30,615447
Mediana 3 1026,5 369,166667 967,5 390,25
Moda 3
Vidutinis kvadratinis nuokrypis 1,11210683 474,2065666 149,7708 495,487314 167,68771
Dispersija 1,23678161 224871,8678 22431,2926 245507,678 28119,168
Duomenų plotis 4 1866 686,8 1917 625,5
Minimali reikšmė 1 170 89,2 321 154,5
Maksimali reikšmė 5 2036 776 2238 780
Suma 88 31175 11123,1 32570 11941,167
Duomenų skaičius 30 30 30 30 30Diagramos
Namų ūkio dydis
Namų ūkio dydis Namų ūkio skaičius
1 3
2 8
3 9
4 8
5 2
Didžiausią dalį visų namų ūkių užima šeimos po 3 (29%), mažiausiai po 5 (7%) žmones.Namų ūkio disponuojamos pajamos vienam namų ūkio nariui
N.Ū. Disponuojamos pajamos vienam n. ū. nariui (Lt) Namų ūkių skaičius
iki 500 Lt 25
virš 500 Lt 5
Daugiausia yra namų ūkių, kurių disponuojamos pajamos vienam namų ūkio nariui yra iki 500Lt (83%).
Namų ūkių vartojimo išlaidos vienam namų ūkio nariui
Namų ūkio vartojimo išlaidos vienam n. ū. nariui Namų ūkių skaičius
iki 500 Lt 22
virš 500 Lt 8
Daugiausia yra namų ūkių, kurių išlaidos vienam namų ūkio nariui yra iki 500 Lt (73%), mažiausiai – kurių išlaidos yra virš 500 Lt (po 27%).Namų ūkių pajamų ir išlaidų palyginimas
Namų ūkio eilės nr. Pajamos
vienam n.ū. nariui (Lt) Išlaidos vienam n.ū. nariui (Lt)
1 170,00 498,00
2 402,00 299,33
3 89,20 168,40
4 327,50 369,50
5 295,67 263,67
6 373,00 347,00
7 335,00 427,00
8 218,00 214,75
9 212,00 204,00
10 211,75 215,75
11 301,50 402,00
12 346,00 321,00
13 395,40 447,60
14 432,50 449,25
15 336,50 294,75
16 420,25 413,25
17 280,75 250,75
18 378,00 406,67
19 177,00 233,00
20 678,67 679,00
21 390,50 584,50
22 519,00 378,50
23 447,50 505,50
24 253,75 154,50
25 396,67 225,00
26 365,33 541,33
27 776,00 529,50
28 563,67 667,67
29 453,00 670,00
30 577,00 780,00
Iš grafiko matyti, kad beveik pusės visų namų ūkių išlaidos vienam gyventojui viršija ppajamas vienam gyventojui.Vieno namų ūkio nario vidutinių išlaidų pasiskirstymo įvertinimas
Bin Frequency Cumulative %
119,75 0 0,00%
189,25 2 6,67%
258,75 6 26,67%
328,25 4 40,00%
397,75 3 50,00%
467,25 6 70,00%
536,75 3 80,00%
606,25 2 86,67%
675,75 2 93,33%
745,25 1 96,67%
814,75 1 100,00%
More 0 100,00%
Daugiausia yra namų ūkių, kurių išlaidos vienam ūkio nariui yra mažos ir vidutiniškos.Hipotezių tikrinimas
Bet koks tvirtinimas apie atsitiktinio dydžio pasiskirstymo formą ar apie pasiskirstymo parametrų reikšmes vadinamas statistine hipoteze. Pradinę hipotezę paprastai vadiname nuline hipoteze arba pagrindine (žymima H0), konkuruojančią hipotezę arba alternatyvą, vadiname hipotezę H1, priešingą nulinei hipotezei H0.
Statistiniais metodais tikrindami hipotezės H0 teisingumą, galime padaryti dviejų rūšių klaidas.
Pirmosios rūšies klaidą padarome tada, kai atmetame hipotezę H0, kai ji yyra teisinga.
Jei priimame hipotezę H0, nors ji yra klaidinga padarome antros rūšies klaidą.
Hipotezė Teisinga Klaidinga
Atmetama Pirmos rūšies klaida Teisingas sprendimas
Priimama Teisingas sprendimas Antros rūšies klaida
Taisyklę, pagal kurią iš imties duomenų darome išvadą apie hipotezės teisingumą ar klaidingumą vadiname statistiniu kriterijumi arba tiesiog kriterijumi. <
Hipotezės apie dviejų vidurkių lygybę tikrinimas
Tarkime, kad X ir Y yra normalieji atsitiktiniai dydžiai. Sprendžiant praktinius uždavinius, dažnai tenka atsakyti į klausimą: ar iš esmės skiriasi nagrinėjamųjų atsitiktinių dydžių vidurkiai EX ir EY?
Tegu x1, x2,., xm ir y1, y2,., yn yra šių atsitiktinių dydžių nepriklausomos imtys. Į suformuluotąjį klausimą galima atsakyti patikrinus hipotezę H0: EX = EY su alternatyva H1: EX ≠ EY (esant reikšmingumo lygmeniui a).
Jei imtys yra mažos ir vidutiniai kvadratiniai nuokrypiai s1 ir s2 nėra žinomi, hipotezei H0 su alternatyva H1 tikrinti taikomas Stjudento kriterijus. Tačiau šiuo atveju prireikia papildomos sąlygos: s1 = s2. Tada naudojamasi statistika
t =
kuri, galiojant hipotezei H0, yra Stjudento skirstinys. Pagal reikšmingumo lygmenį a ir laisvės laipsnių skaičių k = m + nn – 1.
Panašus priklausomų imčių kriterijus naudojamas ekonominiams skaičiavimams nustatant ekonominių rodiklių kitimo pobūdį. Tuo tikslu imtis x1, x2,., xn padalijama į dvi dalis x1, x2,., xm ir xm+1,., xn. Apskaičiavus šių imčių vidurkius ir , tikrinama hipotezė H0: = Jei ji teisinga, galima tvirtinti, kad nagrinėjamasis rodiklis nekinta.
Nežinant, ar imčių x1, x2,., xm ir y1, y2,., yn dispersijos lygios, natūralu pirmiau tikrinti hipotezę apie dispersijų lygybę: H0 . Šiai hipotezei tikrinti taikomas Fišerio kriterijus. Randama statistikos F = reikšmė, iiš Fišerio skirstinio lentelės pagal pasirinktąjį reikšmingumo lygmenį nustatoma kritinė sritis. Jei statistikos reikšmė patenka į kritinę sritį, hipotezė H0 atmetama; priešingu atveju – priimama.Ar skiriasi vieno namų ūkio nario vidutinės išlaidos kaime ir mieste
F-Test Two-Sample for Variances
Miestas Kaimas
Mean 427,600833 338,915
Variance 28057,0267 25548,65
Observations 20 10
df 19 9
F 1,0981804
P(F<=f) one-tail 0,46380901
F Critical one-tail 2,94765205
FAr namų ūkio santaupos didėja
Namų ūkio disponuojamos pajamos (Lt) Namų ūkio vartojimo išlaidos (Lt)
Mean 1039,166667 1085,666667
Variance 224871,8678 245507,6782
Observations 30 30
Pearson Correlation 0,841095513
Hypothesized Mean Difference 0
df 29
t Stat -0,929217757
P(T<=t) one-tail 0,18022341
t Critical one-tail 1,699126996
P(T<=t) two-tail 0,36044682
t Critical two-tail 2,045229611
Išvados: t Stat < t Critical, todėl H0 yra teisinga. Namų ūkio santaupos nedidėja.Regresinės analizės
Regresinė analizė – tai vieno kintamojo priklausomybės tyrimas nuo kitų kintamųjų. Regresinės analizės kintamieji skirstomi į:
• Priklausomus kintamuosius, kurie charakterizuoja rezultatą. Jų reikšmė formuojasi nagrinėjamo reiškinio viduje priklausomai nuo daugelio kitų kintamųjų reikšmių;
• Nepriklausomus kintamuosius, kurie aprašo nagrinėjamo reiškinio funkcionavimą, savybes, apsprendžia rezultatą.
Regresijos lygtis:
Y = θ0 + θ1X1 + θ2X2 + . + θnXn + εi, kur:
Y – priklausomas kintamasis;
X1, X2, ., Xn – nepriklausomieji kintamieji;
θ1, θ2, ., θn – nežinomieji kintamieji;
ε – atsitiktinis dydis, parodantis nukrypimus nuo taško iki tiesės.
Regresinė analizė Nr. 1
Šioje kursinio projekto dalyje ištirsiu namų ūkio vienam nariui tenkančių išlaidų priklausomybę nuo įvairių faktorių. Regresinėje analizėje Y – namų ūkio vieno nario išlaidos, o jas įtakojančių veiksnių priklausomybei ištirti pasirenku šiuos faktorius:
X2 – disponuojamos pajamos vienam namų ūkio nariui;
X1 –– namų ūkio dydis;
X3 – namų ūkio galvos lytis:
– moteris „0“
– vyras „1“
X4 – namų ūkio gyvenamoji vieta:
– miestas „1“
– kaimas „0“
X5 – namų ūkis
– su vaikais „1“
– be vaikų „0“.
Duomenys, reikalingi regresinei analizei atlikti.
Y X1 X2 X3 X4 X5
Išlaidos vienam gyventojui (Lt) Pajamos vienam gyventojui (Lt) Namų ūkio dydis Namų ūkio galvos lytis Miestas – Kaimas Namų ūkiai su vaikais ir be vaikų
498,00 170,00 1 0 0 0
299,33 402,00 3 0 1 0
168,40 89,20 5 1 0 1
369,50 327,50 2 0 1 0
263,67 295,67 3 1 1 0
347,00 373,00 3 0 1 0
427,00 335,00 1 0 1 0
214,75 218,00 4 0 1 0
204,00 212,00 3 0 1 0
215,75 211,75 4 0 0 1
402,00 301,50 2 1 0 0
321,00 346,00 1 0 1 0
447,60 395,40 5 1 1 1
449,25 432,50 4 1 1 1
294,75 336,50 4 1 1 1
413,25 420,25 4 0 1 0
250,75 280,75 4 0 1 1
406,67 378,00 3 0 1 1
233,00 177,00 4 1 0 1
679,00 678,67 3 0 1 0
584,50 390,50 2 1 0 0
378,50 519,00 2 0 0 0
505,50 447,50 2 1 1 0
154,50 253,75 4 1 0 1
225,00 396,67 3 0 0 1
541,33 365,33 3 0 1 0
529,50 776,00 2 1 0 0
667,67 563,67 3 1 1 1
670,00 453,00 2 1 1 0
780,00 577,00 2 0 1 0
Tikrinam koreliaciją:
X1 X2 X3 X4 X5
X1 1
X2 -0,30076 1
X3 0,042106 0,237879 1
X4 0,202803 0,021557 -0,23783 1
X5 -0,2646 0,679011 0,311749 -0,19565 1
Patikrinus koreliaciją gavom, kad koreliacija tarp regresorių neviršija 0,85. Iš čia seka, kad ryšys tarp iksų nestiprus ir regresoriai parinkti gerai.
Tikrinam regresiją:
SUMMARY OUTPUT
Regression Statistics
Multiple R 0,78658798
R Square 0,61872065
Adjusted R Square 0,53928745
Standard Error 113,81939
Observations 30
ANOVA
df SS MS F Significance F
Regression 5 504539,4 100907,9 7,789195 0,000178694
Residual 24 310916,5 12954,85
Total 29 815455,9
Coefficients Standard Error t Stat P-value Lower 95% Upper 95% Lower 95,0% Upper 95,0%
Intercept 236,025892 96,98714 2,433579 0,022768 35,85427459 436,1975 35,85427 436,1975
X1 0,63699142 0,154657 4,118744 0,00039 0,317795658 0,956187 0,317796 0,956187
X2 -48,224097 27,3334 -1,76429 0,090409 -104,6374567 8,189263 -104,637 8,189263
X3 60,169243 45,97585 1,308714 0,203025 -34,72025519 155,0587 -34,7203 155,0587
X4 64,7309053 48,42275 1,336787 0,193827 -35,20874334 164,6706 -35,2087 164,6706
X5 -5,2751869 62,10318 -0,08494 0,933012 -133,4498451 122,8995 -133,45 122,8995
Significance F < 0,05. Taigi, bent vienas regresorius yra reikšmingas. X5 išmetame, nes jo P-value lygi 0,933012, yra didžiausia iš visų reikšmių ir didesnė už 0,05.
SUMMARY OUTPUT
Regression Statistics
Multiple R 0,78651511
R Square 0,61860603
Adjusted R Square 0,55758299
Standard Error 111,536533
Observations 30
ANOVA
df SS MS F Significance F
Regression 4 504445,9 126111,5 10,13725 5,10876E-05
Residual 25 311010 12440,4
Total. 29 815455,9
Coefficients Standard Error t Stat P-value Lower 95% Upper 95% Lower 95,0% Upper 95,0%
Intercept 237,847311 92,68989 2,566054 0,016664 46,94890259 428,7457 46,9489 428,7457
X1 0,63771057 0,151328 4,214108 0,000285 0,326045694 0,949375 0,326046 0,949375
X2 -49,715981 20,52363 -2,42238 0,023 -91,9851839 -7,44678 -91,9852 -7,44678
X3 59,5545478 44,49212 1,338541 0,192767 -32,07869385 151,1878 -32,0787 151,1878
X4 65,6613049 46,22162 1,420575 0,167793 -29,53391013 160,8565 -29,5339 160,8565
Significance F < 0,05 (5,10876E-05). Taigi, bent vvienas regresorius yra reikšmingas. X3 išmetame, nes jo P-value lygi 0,192767, yra didžiausia iš visų reikšmių ir didesnė už 0,05.
SUMMARY OUTPUT
Regression Statistics
Multiple R 0,76894238
R Square 0,59127239
Adjusted R Square 0,54411151
Standard Error 113,221928
Observations 30
ANOVA
df SS MS F Significance F
Regression 3 482156,5 160718,8 12,53735 2,92781E-05
Residual 26 333299,3 12819,21
Total 29 815455,9
Coefficients Standard Error t Stat P-value Lower 95% Upper 95% Lower 95,0% Upper 95,0%
Intercept 237,497229 94,09013 2,524146 0,018042 44,092202 430,9023 44,0922 430,9023
X1 0,67579683 0,150874 4,479204 0,000133 0,36567021 0,985923 0,36567 0,985923
X2 -41,588368 19,9011 -2,08975 0,046567 -82,495654 -0,68108 -82,4957 -0,68108
X4 47,9535226 44,95723 1,066648 0,295936 -44,45739 140,3644 -44,4574 140,3644
Significance F < 0,05 (2,92781E-05). Taigi, bent vienas regresorius yra reikšmingas. X4 išmetame, nes jo P-value lygi 0,295936, yra didžiausia iš visų reikšmių ir didesnė už 0,05.
SUMMARY OUTPUT
Regression Statistics
Multiple R 0,7572231
R Square 0,57338683
Adjusted R Square 0,54178585
Standard Error 113,510354
Observations 30
ANOVA
df SS MS F Significance F
Regression 2 467571,7 233785,8 18,14459 1,0127E-05
Residual 27 347884,2 12884,6
Total 29 815455,9
Coefficients Standard Error t Stat P-value Lower 95% Upper 95% Lower 95,0% Upper 95,0%
Intercept 250,86504 93,4893 2,683356 0,012293 59,040848 442,6892 59,04085 442,6892
X1 0,7111206 0,14757 4,818873 4,96E-05 0,40833216 1,013909 0,408332 1,013909
X2 -39,711933 19,87369 -1,99822 0,055857 -80,489372 1,065506 -80,4894 1,065506
Significance F < 0,05 (1,0127E-05). Taigi, bent vienas regresorius yra reikšmingas. X2 išmetame, nes jo P-value lygi 0,055857, yra didžiausia iš visų reikšmių ir didesnė už 0,05.
SUMMARY OUTPUT
Regression Statistics
Multiple R 0,71435
R Square 0,5103
Adjusted R Square 0,49281
Standard Error 119,423
Observations 30
ANOVA
df SS MS F Significance F
Regression 1 416125,1 416125,1 29,17758 9,2606E-06
Residual 28 399330,7 14261,81
Total 29 815455,9
Coefficients Standard Error t Stat P-value Lower 95% Upper 95% Lower 95,0% Upper 95,0%
Intercept 101,49402 59,07041 1,718187 0,096803 -19,506216 222,4943 -19,5062 222,4943
X1 0,7998081 0,148068 5,401627 9,26E-06 0,4965046 1,103112 0,496505 1,103112
Significance F<0,05 (9,2606E-06). Regresorių su reikšmėm P-value >0,05 daugiau nėra. Iš čia seka, kad namų ūkio vartojimo išlaidos priklauso tik nuo disponuojamų pajamų.
Šią priklausomybę aprašo lygtis:
Y = 101,49402+0,7998081*X1
Y – išlaidos vienam ūkio nariui;
X1- namų ūkio disponuojamos pajamos vienam gyventojui.
Didžiausios išlaidos, tenkančios vienam ūkio nariui, kai jis gaus didžiausias pajamas. Užrašius regresijos lygtį galima apskaičiuoti, kokios bus išlaidos esant atitinkamoms pajamoms. Taigi didžiausias išlaidas namų ūkio narys patirs tada, kai jis
gaus didžiausias pajamas, t.y. 776,- Lt.
Y = 101,49402+0,7998081*776,00 = 722,15 Lt
Taip pat ir mažiausiai pinigų vartojimo išlaidoms namų ūkio narys išleis tada, kai gaus mažiausias pajamas 89,20 Lt.
Y = 101,49402+0,7998081*89,20 = 173,84 Lt.
RESIDUAL OUTPUT
Observation Predicted išlaidos vienam gyventojui Residuals
1 237,4614079 260,5385921
2 423,0168972 -123,6835639
.
3 172,8369099 -4,43690989
4 363,4311905 6,068809486
5 337,9706313 -74,30396461
6 399,822461 -52,82246105
7 369,4297516 57,57024841
8 275,8521988 -61,10219879
9 271,0533499 -67,05334993
10 270,8533979 -55,10339789
11 342,6361788 59,36382122
12 378,2276412 -57,22764117
13 417,7381635 29,86183653
14 447,4110456 1,838954405
15 370,6294638 -75,87946381
16 437,6133958 -24,36339584
17 326,0401598 -75,2901598
18 403,8215018 2,845164899
19 243,0600649 -10,0600649
20 644,2971503 34,70284972
21 413,8191036 170,6808964
22 516,59445 -138,09445
23 459,4081677 46,09183225
24 304,4453399 -149,9453399
25 418,7512538 -193,7512538
26 393,6905986 147,6427347
27 722,1451429 -192,6451429
28 552,3192138 115,3474529
29 463,8071125 206,1928875
30 562,9833223 217,0166777
Iš grafiko matyti, kad prognozuojamos išlaidos vienam ūkio nariui beveik visada sutampa su pajamomis vienam ūkio nariui.Determinacijos koeficiento įvertis
Determinacijos koeficientas – tai daugiamačio koreliacijos koeficiento kvadratas (R2).
Jis turi patekti į intervalą: 0 ≤ R2 ≥ 1.
Jis atspindi parinkto modelio tikslumą, t.y. kuo R2 artimesnis 11, tuo parinktas modelis geriau aprašo duomenis.
Gavau R2 0,9561. Pagal šį rezultatą galiu spręsti, kad mano pasirinktas modelis gerai aprašo duomenis, kadangi namų ūkio išlaidos 95,61% priklauso nuo namų ūkio pajamų, ir tik 4,39% – nuo kitų faktorių, kurie nebuvo nagrinėti.
Regresijos koeficiento reikšmingumo patikrinimas
• Regresijos koeficiento reikšmę (Significance F) reikia palyginti su a = 0,05.
• Significance F turi būti mažesnė už 0,05. Tai rodo, kad bent vienas iš tiriamų regresorių yra reikšmingas.
• Reikia atsižvelgti ir į kiekvieno regresoriaus P-value reikšmes. Jei P-value reikšmė ddidesnė už 0,05, tuomet regresorių galima laikyti nereikšmingu. Tačiau tik tą regresorių, kurio P-value yra didžiausia.
• Nereikšmingus regresorius reikia išmetinėti po vieną iš lentelės.
• Po to atlikti visas operacijas iš naujo, tol kol Significance F < 0,05 ir kada visos regresorių P-value bbus mažesnės už 0,05. Tokiu atveju visi likę regresoriai bus reikšmingi.
• Tyrimo metu Significance F buvo visada mažesnė už 0,05 ir toliau atlikinėjant veiksmus jis nuolat mažėjo. O tyrimą atlikinėjau tol, kol X1 (pajamos vienam namų ūkio nariui) P-value reikšmė buvo mažesnė už 0,05. Todėl tik šis regresorius buvo reikšmingas.
Regresinė analizė Nr. 2
Šioje kursinio projekto dalyje ištirsiu kuri namų ūkio charakteristika geriausiai nusako šeimos pajamas.
Regresinėje analizėje:
Y – namų ūkio disponuojamos pajamos;
X1 – gyvenamoji vieta:
– miestas „1“;
– kaimas „2“.
X2 – namų ūkio galvos išsimokslinimas:
– tik su viduriniu „1“;
– kitas išsilavinimas „2“.
X3 – pajamų šaltinis:
– pajamos susijusios su darbu „1“;
– pašalpos, stipendijos ir kt.
Duomenys, reikalingi regresinei analizei atlikti
Y X1 X2 X3
Namų ūkio disponuojamos pajamos Gyvenamoji vieta Pajamų šaltinis Namų ūkio galvos išsimokslinimas
170 2 1 2
1206 1 1 1
446 2 2 2
655 1 2 2
887 1 1 2
1119 1 2 2
335 1 2 2
872 1 1 2
636 1 2 2
847 2 2 2
603 2 2 2
346 1 2 1
1977 1 1 1
1730 1 1 2
1346 1 1 2
1681 1 1 2
1123 1 1 1
1134 1 1 2
708 2 1 2
2036 1 1 1
781 2 2 2
1038 2 1 2
895 1 2 2
1015 2 1 2
1190 2 1 1
1096 1 1 2
1552 2 2 2
1691 1 1 2
906 1 2 2
1154 1 1 1
Tikrinam koreliaciją:
X1 X2 X3
X1 1
X2 0,144338 1
X3 0,222911 0,28957 1
Patikrinus koreliaciją gavom, kad koreliacija tarp regresorių neviršija 0,85. Iš čia seka, kkad ryšys tarp iksų nestiprus ir regresoriai parinkti gerai.
Tikrinam regresiją:
SUMMARY OUTPUT
Regression Statistics
Multiple R 0,557955
R Square 0,311314
Adjusted R Square 0,23185
Standard Error 415,6145
Observations 30
ANOVA
df SS MS F Significance F
Regression 3 2030164 676721,5 3,917677 0,019659362
Residual 26 4491120 172735,4
Total 29 6521284
Coefficients Standard Error t Stat P-value Lower 95% Upper 95% Lower 95,0% Upper 95,0%
Intercept 2136,19449 376,9118 5,667624 5,83E-06 1361,441218 2910,948 1361,441 2910,948
X1 -218,42432 165,7285 -1,31796 0,19901 -559,084108 122,2355 -559,084 122,2355
X2 -400,0247 162,4183 -2,46293 0,02072 -733,880335 -66,1691 -733,88 -66,1691
X3 -139,1099 190,9609 -0,72847 0,472835 -531,635668 253,4159 -531,636 253,4159
Significance F < 0,05 (0,019659362). Taigi, bent vienas regresorius yra reikšmingas. X3 išmetame, nes jo P-value lygi 0,472835, yra didžiausia iš visų reikšmių ir didesnė už 0,05.
SUMMARY OUTPUT
Regression Statistics
Multiple R 0,54521294
R Square 0,29725715
Adjusted R Square 0,24520213
Standard Error 411,986416
Observations 30
ANOVA
df SS MS F Significance F
Regression 2 1938498 969249,2 5,710441 0,008545783
Residual 27 4582786 169732,8
Total 29 6521284
Coefficients Standard Error t Stat P-value Lower 95% Upper 95% Lower 95,0% Upper 95,0%
Intercept 1965,41489 292,5554 6,718094 3,27.E-07 1365,140772 2565,689 1365,141 2565,689
X1 -241,51064 161,2502 -1,49774 0,145802 -572,368681 89,3474 -572,369 89,3474
X2 -431,59574 155,1631 -2,78156 0,009744 -749,964045 -113,227 -749,964 -113,227
Significance F < 0,05 (0,008545783). Taigi, bent vvienas regresorius yra reikšmingas. X1 išmetame, nes jo P-value lygi 0,145802, yra didžiausia iš visų reikšmių ir didesnė už 0,05.
SUMMARY OUTPUT
Regression Statistics
Multiple R 0,48874501
R Square 0,23887169
Adjusted R Square 0,21168853
Standard Error 421,033339
Observations 30
ANOVA
df SS MS F Significance F
Regression 1 1557750 1557750 8,78749 0,006133847
Residual 28 4963534 177269,1
Total 29 6521284
Coefficients Standard Error t Stat P-value Lower 95% Upper 95% Lower 95,0% Upper 95,0%
Intercept 1690,3611 232,7349 7,263031 6,6E-08 1213,625215 2167,097 1213,625 2167,097
X2 -465,13889 156,9099 -2,96437 0,006134 -786,554165 -143,724 -786,554 -143,724
Significance F<0,05 (0,006133847). Regresorių su reikšmėm P-value >0,05 daugiau nėra. Iš čia seka, kad namų ūkio vartojimo išlaidos priklauso tik pajamų šaltinio.
Šią priklausomybę aprašo lygtis:
Y = 1690,3611-465,13889*X2
Y – namų ūkio disponuojamos pajamos;
X2- pajamų šaltinis.
Didžiausias pajamas namų ūkiai gauna, kai jų pajamos susijusios su darbu. Užrašius regresijos lygtį galima apskaičiuoti, kokios bus pajamos, kai pajamų šaltinis yra darbas.
Y = 1690,3611-465,13889*1 = 1225,22 Lt
Mažiausias pajamas namų ūkiai gauna, kai jų pajamos yra pašalpos, stipendijos ir kt.
Y = 1690,3611-465,13889*2 = 760,08 Lt.Skurdo rodiklių įvertinimas
Apskaičiuojam tokius skurdo rodiklius:
• Skurstančiųjų gyventojų lygį šalyje;
• Žemų pajamų nuokrypį
• Žemų pajamų indeksą;
• Kvadratinį skurdo nuokrypį.
Tam, kad apskaičiuoti ir įvertinti šiuos pasirinktus rodiklius, reikia rasti pajamas, tenkančias vienam namų ūkio nariui. Namų ūkio dydį vertinsiu pagal paprastąją skalę.
Duomenys, skurdo rodikliams apskaičiuoti
Namų ūkio eilės nr. Namų ūkio dydis Namų ūkio disponuojamos pajamos (Lt) Pajamos vienam namų ūkio nariui (Lt)
1 1 170,00 170,00
2 3 1206,00 402,00
3 5 446,00 89,20
4 2 655,00 327,50
5 3 887,00 295,67
6 3 1119,00 373,00
7 1 335,00 335,00
8 4 872,00 218,00
9 3 636,00 212,00
10 4 847,00 211,75
11 2 603,00 301,50
12 1 346,00 346,00
13 5 1977,00 395,40
14 4 1730,00 432,50
15 4 1346,00 336,50
16 4 1681,00 420,25
17 4 1123,00 280,75
18 3 1134,00 378,00
19 4 708,00 177,00
20 3 2036,00 678,67
21 2 781,00 390,50
22 2 1038,00 519,00
23 2 895,00 447,50
24 4 1015,00 253,75
25 3 1190,00 396,67
26 3 1096,00 365,33
27 2 1552,00 776,00
28 3 1691,00 563,67
29 2 906,00 453,00
30 2 1154,00 577,00
Iš vviso: 88 31175,00 11.123,10
Vidutinės pajamos vienam namų ūkio nariui gaunamos visas namų ūkių pajamas padalinus iš visų namų ūkių narių sumos, t.y. 31175,00/88 = 354,26Lt.
Skurdo riba nėra duota, todėl ją pasirenku kaip 62 % nuo vidutinių pajamų vienam namų ūkio nariui, t.y. z = 354,26*0.62 = 219,64 Lt.
Galima teigti, kad namų ūkiai, kuriuose vienam nariui tenka mažiau nei 219,64 Lt disponuojamų pajamų, yra žemiau skurdo ribos, ir tokių namų ūkių yra 6.Skurstančiųjų gyventojų lygis šalyje
Šį rodiklį, kuris parodo šalies gyventojų dalį, kurių pajamos yra žemiau skurdo ribos. Jis apskaičiuojamas:
L =
kur: q – skurstančiųjų gyventojų skaičius;
p – visų tiriamų gyventojų skaičius.
L = 21/88 = 0,2386
Apskaičiavus matyti, kad 23,86% stebimų gyventojų yra skurstantys, jie gyvena žemiau skurdo ribos.
Žemų pajamų nuokrypis – tai rodiklis, kuris parodo, kiek vidutiniškai skurstančiųjų pajamos nukrypsta nuo skurdo ribos. Šis rodiklis parodo skurdo gilumą.
Šį skurdo rodiklį apskaičiuoju pagal formulę:
N = = 0,0940
kur: yi – i-tojo skurstančiojo pajamos;
q – skurstančių tiriamųjų gyventojų skaičius;
z – skurdo riba.
Vidutiniškai 9.4 % skurstančiųjų pajamos nukrypsta nuo skurdo ribos.
Žemų pajamų indeksas – parodo kiek reikia lėšų eliminuoti skurdą šalyje.
Šį skurdo rodiklį apskaičiuosime:
I = L*N = 0,2386*0,0940 = 0,0224
Šis indeksas rodo, kad papildomai reikia 2.24% lėšų, kad panaikinti skurdą stebimuose namų ūkiuose.
Kvadratinis skurdo nnuokrypis – atspindi pajamų pasiskirstymą tarp skurstančiųjų. Kuo daugiau šalyje yra ypatingai skurstančiųjų žmonių, tuo didesnis bus šis rodiklis.
Paskutinįjį skurdą įvertinantį rodiklį apskaičiuoju pagal formulę:
Q = ;
kur: n – stebimų gyventojų skaičius;
z – skurdo riba.
Atlikus skaičiavimus gaunu Q = 0.0224
Taigi skurdo intensyvumo rodiklis yra 2,24 %. Tai rodo, kad pajamos tarp skurstančiųjų yra pasiskirstę šiuo procentu.Išvados
Didžiausią dalį visų namų ūkių užima šeimos po 3 (29%), mažiausiai po 5 (7%) žmones.
Daugiausia yra namų ūkių, kurių disponuojamos pajamos vienam namų ūkio nariui yra iki 500Lt (83%).
Daugiausia yra namų ūkių, kurių išlaidos vienam namų ūkio nariui yra iki 500 Lt (73%), mažiausiai – kurių išlaidos yra virš 500 Lt (po 27%).
Iš grafiko matyti, kad beveik pusės visų namų ūkių išlaidos vienam gyventojui viršija pajamas vienam gyventojui.
Daugiausia yra namų ūkių, kurių išlaidos vienam ūkio nariui yra mažos ir vidutiniškos.
Patikrinau hipotezes:
Ar skiriasi vieno namų ūkio nario vidutinės išlaidos kaime ir mieste
F