Namų ūkio statistikos ir ekonometrijos kursinis

Turinys

Įvadas 3

Aprašomoji statistika 6

Diagramos 8

Namų ūkio dydis 8

Namų ūkio disponuojamos pajamos vienam namų ūkio nariui 8

Namų ūkio vartojimo išlaidos vienam namų ūkio nariu 9

Namų ūkių pajamų ir išlaidų palyginimas 9

Vieno namų ūkio nario vidutinių išlaidų pasiskirstymo įvertinimas 11

Hipotezių tikrinimas 11

Ar skiriasi vieno namų ūkio nario vidutinės išlaidos kaime ir mieste 13

Ar namų ūkio santaupos didėja 13

Regresinės analizės 14

Regresinė analizė Nr. 1 14

Determinacijos koeficiento įvertis 19

Regresijos koeficiento reikšmingumo patikrini 20

Regresinė analizė Nr. 2 20

Skurdo rodiklių įvertinimas 23

Skurstančiųjų gyventojų lygis šalyje 24

Žemų pajamų nuokrypis 25

Žemų pajamų indeksas 25

Kvadratinis skurdo nuokrypis 25

Išvados 26Įvadas

Terminas „ūkio statistika“ naudojamas vietoj termino „ekonominė statistika“.

Ūkio statistika:

 tiria ūkinių procesų iir reiškinių kiekybę;

 pateikia matų sistema konkretiems reiškiniams ir procesams apibūdinti, kompleksinės ūkinių reiškinių analizės būdais;

 pateikia statistinių tyrimų atlikimo metodiką;

 supažindina su statistinių metodų ir ekonometrinių modelių taikymo ūkiniams procesams analizuoti metodika.

Ekonometrija apjungia teoriniu rezultatus, metodus, modelius skirtus suteikti konkrečias skaitines reikšmes ekonominiams reiškiniams naudojantis: ekonomikos teorija, ekonometrine statistika, matematiniais statistiniais metodais.

Ekonometrijos tikslai:

 ekonominių ir socialinių rodiklių analizė;

 rodiklių prognozė;

 šalies socialinio-ekonominio vystymosi imitavimas.

Ūkio statistikos ir ekonometrijos kursinio darbo tikslai ir uždaviniai:

• aprašyti duomenų statistiką;

• įvertinti vieno namų ūkio nario vidutinių išlaidų pasiskirstymą;

• patikrinti hipotezes;

• apskaičiuoti skurdo rodiklius;

• atlikti regresinę aanalizę;

• įvertinti determinacijos koeficientą;

• patikrinti regresijos koeficiento reikšmingumą.

Naudojamos sąvokos

Namų ūkiu laikomas atskirai gyvenantis vienas asmuo ar asmenų grupė, gyvenanti viename bute (name), turinti bendrą biudžetą ir kartu maitinasi. Namų ūkiu gali būti:

• šeima, susidedanti iš sutuoktinių ir vaikų ar be jų arba vieno sutuoktinio su vaikais;

• kartu gyvenantys ir bendrą biudžetą turintys giminaičiai;

• kartu gyvenantys ir bendru biudžetu susiję asmenys, neturintys giminystės ryšio

• vieniši asmenys, gyvenantys iš savo pajamų;

• šeimos, susidedančios iš kelių kartu gyvenančių sutuoktinių porų, turinčių bendrą biudžetą.

Asmenys, gyvenantys instituciniuose namų ūkiuose (senelių namuose, įkalinimo įstaigose, tarnaujantys armijoje ir pan.) nėra tiriami.

Namų ūkio galva – tai asmuo, turintis didžiausias pajamas. Asmuo, kuris, ūkio narių nuomone, per metus gauna didžiausias pajamas. Kai didžiausias pajamas gaunančio asmens išskirti negalima (pvz., visa šeima ūkininkauja ir pajamų negalima priskirti kuriam nors ūkio nariui), namų ūkio galva laikomas asmuo, kurį nurodo šeima.

Namų ūkių socialinės ekonominės grupės:

• žemdirbiai (namų ūkio galvos pagrindinis pajamų šaltinis yra asmeninis žemės ūkis);

• samdomieji darbuotojai (namų ūkio galvos pagrindinis pajamų šaltinis yra samdomas darbas visuomeniniame arba privačiame sektoriuje);

• verslininkai ((namų ūkio galvos pajamos yra iš verslo, amatų, laisvos profesinės veiklos);

• pensininkai (namų ūkio galvos pajamos yra pensija);

• kiti (namų ūkio galvos pagrindinis pajamų šaltinis yra įvairios pašalpos, stipendija, pajamos iš turto, bei kiti pajamų šaltiniai).

Namų ūkio tipas – nustatomas pagal namų ūkio demografinę sudėtį. Yra išskiriami šie tipai:

• vienišas asmuo;

• vienas suaugęs su vaikais iki 18 m.;

• sutuoktinių pora su vaikais iki 18 m.;

• kiti namų ūkiai su vaikais iki 18 m. Šiam tipui priklauso namų ūkiai, kuriuos sudaro tėvai su vaikais iki 18 metų iir vyresniais, kelių kartų namų ūkiai su vaikais iki 18 metų, seneliai su anūkais iki 18 metų ir pan.;

• sutuoktinių pora be vaikų;

• kiti namų ūkiai be vaikų.

Visi šalies namų ūkiai yra suskirstyti į 3 grupes:

• didieji miestai (Vilnius, Kaunas, Klaipėda, Šiauliai, Panevėžys);

• kiti miestai;

• kaimas.

Namų ūkio disponuojamos pajamos – tai visos piniginės ir natūrinės pajamos, kurios yra gautos už darbą iš ūkininkavimo, verslo, amatų, laisvos profesinės veiklos, taip pat pensijos, įvairios pašalpos, stipendijos, pajamos iš turto, renta ir kt.

Namų ūkio vartojimo išlaidos – tai piniginės ir natūrinės išlaidos, skirtos namų ūkių vartojimo poreikiams patenkinti: tai išlaidos maistui, drabužiams, avalynei, būstui, sveikatos priežiūrai, kultūros ir poilsio reikmėms ir kt.

Europos Konsiliume 1984 m. lapkričio 19 dieną buvo priimtas toks skurdo apibrėžimas: „skurdžiais vadinami asmenys, šeimos, asmenų grupės, kurių ištekliai (materialiniai, kultūrinia.i ir socialiniai) yra nepakankami savo šalyje susiklosčiusiam minimaliam gyvenimo būdui užtikrinti“.

Skurdo riba – tai kriterijus, kurio pagalba politikai ar tyrinėtojai suskirsto individus, šeimas ar namų ūkius į skurstančius ir neskurstančius. Yra trys pagrindiniai skurdo ribų tipai: absoliuti, santykinė, subjektyvi.

Skurdo rodikliai:

• skurstančiųjų gyventojų lygis šalyje – tai rodiklis, parodantis šalies gyventojų dalį, kurių pajamos yra žemiau skurdo ribos.

• žemų pajamų nuokrypis – tai rodiklis, kuris parodo, kiek vidutiniškai skurstančiųjų pajamos nukrypsta nuo skurdo ribos.

• žemų pajamų indeksas – tai rrodiklis, kuris parodo, kiek reikia lėšų panaikinti skurdą šalyje.

• kvadratinis skurdo nuokrypis – skurdo intensyvumo rodiklis, atspindintis pajamų pasiskirstymą tarp skurstančiųjų.Aprašomoji statistika

Pradiniai duomenys

Namų ūkio eilės nr. Namų ūkio dydis Namų ūkio disponuojamos pajamos (Lt) Namų ūkio vartojimo išlaidos (Lt) Pajamos vienam gyventojui (Lt) Išlaidos vienam gyventojui (Lt)

1 1 170,00 498,00 170,00 498,00

2 3 1206,00 898,00 402,00 299,33

3 5 446,00 842,00 89,20 168,40

4 2 655,00 739,00 327,50 369,50

5 3 887,00 791,00 295,67 263,67

6 3 1119,00 1041,00 373,00 347,00

7 1 335,00 427,00 335,00 427,00

8 4 872,00 859,00 218,00 214,75

9 3 636,00 612,00 212,00 204,00

10 4 847,00 863,00 211,75 215,75

11 2 603,00 804,00 301,50 402,00

12 1 346,00 321,00 346,00 321,00

13 5 1977,00 2238,00 395,40 447,60

14 4 1730,00 1797,00 432,50 449,25

15 4 1346,00 1179,00 336,50 294,75

16 4 1681,00 1653,00 420,25 413,25

17 4 1123,00 1003,00 280,75 250,75

18 3 1134,00 1220,00 378,00 406,67

19 4 708,00 932,00 177,00 233,00

20 3 2036,00 2037,00 678,67 679,00

21 2 781,00 1169,00 390,50 584,50

22 2 1038,00 757,00 519,00 378,50

23 2 895,00 1011,00 447,50 505,50

24 4 1015,00 618,00 253,75 154,50

25 3 1190,00 675,00 396,67 225,00

26 3 1096,00 1624,00 365,33 541,33

27 2 1552,00 1059,00 776,00 529,50

28 3 1691,00 2003,00 563,67 667,67

29 2 906,00 1340,00 453,00 670,00

30 2 1154,00 1560,00 577,00 780,00

Iš viso: 88 31175,00 32570,00 11.123,10 11.941,17

Vidurkis – tai visų stebėtų skaitinių duomenų suma, padalinta iš duomenų skaičiaus. Jis rodo vidutinę atsitiktinio dydžio reikšmę.

Mediana – tai skaičius, perskirstantis variacinę eilutę į dvi maždaug lygias dalis.

Moda – tai dažniausiai duomenų aibėje pasikartojanti reikšmė.

Vidutinis kvadratinis nuokrypis – tai kvadratinė šaknis iš dispersijos.

Dispersija – tai matas, aprašantis atsitiktinio dydžio sklaidą apie vidurkį.

Eksceso koeficientas – tai lėkštumo matas. Kai šis koeficientas:

• >0, tai sklaida apie vidurkį yra didesnė už normaliąją kreivę;

• =0, tai duomenų sklaida apie vidurkį yra tokia pati kaip ir normalios kreivės;

• <0, tai duomenų sklaida apie vidurkį yra mažesnė už normalios kreivės.

Asimetrijos koeficientas – tai simetrijos matas. KKai šis koeficientas:

• >0, tai asimetrija yra teigiama (dešinioji asimetrija);

• =0, tai rodo, kad yra simetrija;

• <0, tai asimetrija yra neigiama (kairioji asimetrija).

Duomenų plotis – tai maksimalios ir minimalios stebėjimų sekos duomenų reikšmių skirtumas, kuris parodo stebimų duomenų reikšmių diapazoną.

Minimali reikšmė – tai stebimų duomenų sekoje esanti mažiausia reikšmė.

Maksimali reikšmė – tai stebimų duomenų sekoje esanti didžiausia reikšmė.

GAVOM:

Charakteristikos N.Ū. Dydis N.Ū. Disponuojamos pajamos (Lt) Pajamos vienam n. ū. nariui Namų ūkio vartojimo išlaidos Išlaidos vienam n. ū. nariui

Vidurkis 2,93333333 1039,166667 370,77 1085,66667 398,03889

Standartinė paklaida 0,203042 86,57787782 27,3442819 90,4631929 30,615447

Mediana 3 1026,5 369,166667 967,5 390,25

Moda 3

Vidutinis kvadratinis nuokrypis 1,11210683 474,2065666 149,7708 495,487314 167,68771

Dispersija 1,23678161 224871,8678 22431,2926 245507,678 28119,168

Duomenų plotis 4 1866 686,8 1917 625,5

Minimali reikšmė 1 170 89,2 321 154,5

Maksimali reikšmė 5 2036 776 2238 780

Suma 88 31175 11123,1 32570 11941,167

Duomenų skaičius 30 30 30 30 30Diagramos

Namų ūkio dydis

Namų ūkio dydis Namų ūkio skaičius

1 3

2 8

3 9

4 8

5 2

Didžiausią dalį visų namų ūkių užima šeimos po 3 (29%), mažiausiai po 5 (7%) žmones.Namų ūkio disponuojamos pajamos vienam namų ūkio nariui

N.Ū. Disponuojamos pajamos vienam n. ū. nariui (Lt) Namų ūkių skaičius

iki 500 Lt 25

virš 500 Lt 5

Daugiausia yra namų ūkių, kurių disponuojamos pajamos vienam namų ūkio nariui yra iki 500Lt (83%).

Namų ūkių vartojimo išlaidos vienam namų ūkio nariui

Namų ūkio vartojimo išlaidos vienam n. ū. nariui Namų ūkių skaičius

iki 500 Lt 22

virš 500 Lt 8

Daugiausia yra namų ūkių, kurių išlaidos vienam namų ūkio nariui yra iki 500 Lt (73%), mažiausiai – kurių išlaidos yra virš 500 Lt (po 27%).Namų ūkių pajamų ir išlaidų palyginimas

Namų ūkio eilės nr. Pajamos

vienam n.ū. nariui (Lt) Išlaidos vienam n.ū. nariui (Lt)

1 170,00 498,00

2 402,00 299,33

3 89,20 168,40

4 327,50 369,50

5 295,67 263,67

6 373,00 347,00

7 335,00 427,00

8 218,00 214,75

9 212,00 204,00

10 211,75 215,75

11 301,50 402,00

12 346,00 321,00

13 395,40 447,60

14 432,50 449,25

15 336,50 294,75

16 420,25 413,25

17 280,75 250,75

18 378,00 406,67

19 177,00 233,00

20 678,67 679,00

21 390,50 584,50

22 519,00 378,50

23 447,50 505,50

24 253,75 154,50

25 396,67 225,00

26 365,33 541,33

27 776,00 529,50

28 563,67 667,67

29 453,00 670,00

30 577,00 780,00

Iš grafiko matyti, kad beveik pusės visų namų ūkių išlaidos vienam gyventojui viršija ppajamas vienam gyventojui.Vieno namų ūkio nario vidutinių išlaidų pasiskirstymo įvertinimas

Bin Frequency Cumulative %

119,75 0 0,00%

189,25 2 6,67%

258,75 6 26,67%

328,25 4 40,00%

397,75 3 50,00%

467,25 6 70,00%

536,75 3 80,00%

606,25 2 86,67%

675,75 2 93,33%

745,25 1 96,67%

814,75 1 100,00%

More 0 100,00%

Daugiausia yra namų ūkių, kurių išlaidos vienam ūkio nariui yra mažos ir vidutiniškos.Hipotezių tikrinimas

Bet koks tvirtinimas apie atsitiktinio dydžio pasiskirstymo formą ar apie pasiskirstymo parametrų reikšmes vadinamas statistine hipoteze. Pradinę hipotezę paprastai vadiname nuline hipoteze arba pagrindine (žymima H0), konkuruojančią hipotezę arba alternatyvą, vadiname hipotezę H1, priešingą nulinei hipotezei H0.

Statistiniais metodais tikrindami hipotezės H0 teisingumą, galime padaryti dviejų rūšių klaidas.

Pirmosios rūšies klaidą padarome tada, kai atmetame hipotezę H0, kai ji yyra teisinga.

Jei priimame hipotezę H0, nors ji yra klaidinga padarome antros rūšies klaidą.

Hipotezė Teisinga Klaidinga

Atmetama Pirmos rūšies klaida Teisingas sprendimas

Priimama Teisingas sprendimas Antros rūšies klaida

Taisyklę, pagal kurią iš imties duomenų darome išvadą apie hipotezės teisingumą ar klaidingumą vadiname statistiniu kriterijumi arba tiesiog kriterijumi. <

Hipotezės apie dviejų vidurkių lygybę tikrinimas

Tarkime, kad X ir Y yra normalieji atsitiktiniai dydžiai. Sprendžiant praktinius uždavinius, dažnai tenka atsakyti į klausimą: ar iš esmės skiriasi nagrinėjamųjų atsitiktinių dydžių vidurkiai EX ir EY?

Tegu x1, x2,., xm ir y1, y2,., yn yra šių atsitiktinių dydžių nepriklausomos imtys. Į suformuluotąjį klausimą galima atsakyti patikrinus hipotezę H0: EX = EY su alternatyva H1: EX ≠ EY (esant reikšmingumo lygmeniui a).

Jei imtys yra mažos ir vidutiniai kvadratiniai nuokrypiai s1 ir s2 nėra žinomi, hipotezei H0 su alternatyva H1 tikrinti taikomas Stjudento kriterijus. Tačiau šiuo atveju prireikia papildomos sąlygos: s1 = s2. Tada naudojamasi statistika

t =

kuri, galiojant hipotezei H0, yra Stjudento skirstinys. Pagal reikšmingumo lygmenį a ir laisvės laipsnių skaičių k = m + nn – 1.

Panašus priklausomų imčių kriterijus naudojamas ekonominiams skaičiavimams nustatant ekonominių rodiklių kitimo pobūdį. Tuo tikslu imtis x1, x2,., xn padalijama į dvi dalis x1, x2,., xm ir xm+1,., xn. Apskaičiavus šių imčių vidurkius ir , tikrinama hipotezė H0: = Jei ji teisinga, galima tvirtinti, kad nagrinėjamasis rodiklis nekinta.

Nežinant, ar imčių x1, x2,., xm ir y1, y2,., yn dispersijos lygios, natūralu pirmiau tikrinti hipotezę apie dispersijų lygybę: H0 . Šiai hipotezei tikrinti taikomas Fišerio kriterijus. Randama statistikos F = reikšmė, iiš Fišerio skirstinio lentelės pagal pasirinktąjį reikšmingumo lygmenį nustatoma kritinė sritis. Jei statistikos reikšmė patenka į kritinę sritį, hipotezė H0 atmetama; priešingu atveju – priimama.Ar skiriasi vieno namų ūkio nario vidutinės išlaidos kaime ir mieste

F-Test Two-Sample for Variances

Miestas Kaimas

Mean 427,600833 338,915

Variance 28057,0267 25548,65

Observations 20 10

df 19 9

F 1,0981804

P(F<=f) one-tail 0,46380901

F Critical one-tail 2,94765205

FAr namų ūkio santaupos didėja

Namų ūkio disponuojamos pajamos (Lt) Namų ūkio vartojimo išlaidos (Lt)

Mean 1039,166667 1085,666667

Variance 224871,8678 245507,6782

Observations 30 30

Pearson Correlation 0,841095513

Hypothesized Mean Difference 0

df 29

t Stat -0,929217757

P(T<=t) one-tail 0,18022341

t Critical one-tail 1,699126996

P(T<=t) two-tail 0,36044682

t Critical two-tail 2,045229611

Išvados: t Stat < t Critical, todėl H0 yra teisinga. Namų ūkio santaupos nedidėja.Regresinės analizės

Regresinė analizė – tai vieno kintamojo priklausomybės tyrimas nuo kitų kintamųjų. Regresinės analizės kintamieji skirstomi į:

• Priklausomus kintamuosius, kurie charakterizuoja rezultatą. Jų reikšmė formuojasi nagrinėjamo reiškinio viduje priklausomai nuo daugelio kitų kintamųjų reikšmių;

• Nepriklausomus kintamuosius, kurie aprašo nagrinėjamo reiškinio funkcionavimą, savybes, apsprendžia rezultatą.

Regresijos lygtis:

Y = θ0 + θ1X1 + θ2X2 + . + θnXn + εi, kur:

Y – priklausomas kintamasis;

X1, X2, ., Xn – nepriklausomieji kintamieji;

θ1, θ2, ., θn – nežinomieji kintamieji;

ε – atsitiktinis dydis, parodantis nukrypimus nuo taško iki tiesės.

Regresinė analizė Nr. 1

Šioje kursinio projekto dalyje ištirsiu namų ūkio vienam nariui tenkančių išlaidų priklausomybę nuo įvairių faktorių. Regresinėje analizėje Y – namų ūkio vieno nario išlaidos, o jas įtakojančių veiksnių priklausomybei ištirti pasirenku šiuos faktorius:

X2 – disponuojamos pajamos vienam namų ūkio nariui;

X1 –– namų ūkio dydis;

X3 – namų ūkio galvos lytis:

– moteris „0“

– vyras „1“

X4 – namų ūkio gyvenamoji vieta:

– miestas „1“

– kaimas „0“

X5 – namų ūkis

– su vaikais „1“

– be vaikų „0“.

Duomenys, reikalingi regresinei analizei atlikti.

Y X1 X2 X3 X4 X5

Išlaidos vienam gyventojui (Lt) Pajamos vienam gyventojui (Lt) Namų ūkio dydis Namų ūkio galvos lytis Miestas – Kaimas Namų ūkiai su vaikais ir be vaikų

498,00 170,00 1 0 0 0

299,33 402,00 3 0 1 0

168,40 89,20 5 1 0 1

369,50 327,50 2 0 1 0

263,67 295,67 3 1 1 0

347,00 373,00 3 0 1 0

427,00 335,00 1 0 1 0

214,75 218,00 4 0 1 0

204,00 212,00 3 0 1 0

215,75 211,75 4 0 0 1

402,00 301,50 2 1 0 0

321,00 346,00 1 0 1 0

447,60 395,40 5 1 1 1

449,25 432,50 4 1 1 1

294,75 336,50 4 1 1 1

413,25 420,25 4 0 1 0

250,75 280,75 4 0 1 1

406,67 378,00 3 0 1 1

233,00 177,00 4 1 0 1

679,00 678,67 3 0 1 0

584,50 390,50 2 1 0 0

378,50 519,00 2 0 0 0

505,50 447,50 2 1 1 0

154,50 253,75 4 1 0 1

225,00 396,67 3 0 0 1

541,33 365,33 3 0 1 0

529,50 776,00 2 1 0 0

667,67 563,67 3 1 1 1

670,00 453,00 2 1 1 0

780,00 577,00 2 0 1 0

Tikrinam koreliaciją:

X1 X2 X3 X4 X5

X1 1

X2 -0,30076 1

X3 0,042106 0,237879 1

X4 0,202803 0,021557 -0,23783 1

X5 -0,2646 0,679011 0,311749 -0,19565 1

Patikrinus koreliaciją gavom, kad koreliacija tarp regresorių neviršija 0,85. Iš čia seka, kad ryšys tarp iksų nestiprus ir regresoriai parinkti gerai.

Tikrinam regresiją:

SUMMARY OUTPUT

Regression Statistics

Multiple R 0,78658798

R Square 0,61872065

Adjusted R Square 0,53928745

Standard Error 113,81939

Observations 30

ANOVA

df SS MS F Significance F

Regression 5 504539,4 100907,9 7,789195 0,000178694

Residual 24 310916,5 12954,85

Total 29 815455,9

Coefficients Standard Error t Stat P-value Lower 95% Upper 95% Lower 95,0% Upper 95,0%

Intercept 236,025892 96,98714 2,433579 0,022768 35,85427459 436,1975 35,85427 436,1975

X1 0,63699142 0,154657 4,118744 0,00039 0,317795658 0,956187 0,317796 0,956187

X2 -48,224097 27,3334 -1,76429 0,090409 -104,6374567 8,189263 -104,637 8,189263

X3 60,169243 45,97585 1,308714 0,203025 -34,72025519 155,0587 -34,7203 155,0587

X4 64,7309053 48,42275 1,336787 0,193827 -35,20874334 164,6706 -35,2087 164,6706

X5 -5,2751869 62,10318 -0,08494 0,933012 -133,4498451 122,8995 -133,45 122,8995

Significance F < 0,05. Taigi, bent vienas regresorius yra reikšmingas. X5 išmetame, nes jo P-value lygi 0,933012, yra didžiausia iš visų reikšmių ir didesnė už 0,05.

SUMMARY OUTPUT

Regression Statistics

Multiple R 0,78651511

R Square 0,61860603

Adjusted R Square 0,55758299

Standard Error 111,536533

Observations 30

ANOVA

df SS MS F Significance F

Regression 4 504445,9 126111,5 10,13725 5,10876E-05

Residual 25 311010 12440,4

Total. 29 815455,9

Coefficients Standard Error t Stat P-value Lower 95% Upper 95% Lower 95,0% Upper 95,0%

Intercept 237,847311 92,68989 2,566054 0,016664 46,94890259 428,7457 46,9489 428,7457

X1 0,63771057 0,151328 4,214108 0,000285 0,326045694 0,949375 0,326046 0,949375

X2 -49,715981 20,52363 -2,42238 0,023 -91,9851839 -7,44678 -91,9852 -7,44678

X3 59,5545478 44,49212 1,338541 0,192767 -32,07869385 151,1878 -32,0787 151,1878

X4 65,6613049 46,22162 1,420575 0,167793 -29,53391013 160,8565 -29,5339 160,8565

Significance F < 0,05 (5,10876E-05). Taigi, bent vvienas regresorius yra reikšmingas. X3 išmetame, nes jo P-value lygi 0,192767, yra didžiausia iš visų reikšmių ir didesnė už 0,05.

SUMMARY OUTPUT

Regression Statistics

Multiple R 0,76894238

R Square 0,59127239

Adjusted R Square 0,54411151

Standard Error 113,221928

Observations 30

ANOVA

df SS MS F Significance F

Regression 3 482156,5 160718,8 12,53735 2,92781E-05

Residual 26 333299,3 12819,21

Total 29 815455,9

Coefficients Standard Error t Stat P-value Lower 95% Upper 95% Lower 95,0% Upper 95,0%

Intercept 237,497229 94,09013 2,524146 0,018042 44,092202 430,9023 44,0922 430,9023

X1 0,67579683 0,150874 4,479204 0,000133 0,36567021 0,985923 0,36567 0,985923

X2 -41,588368 19,9011 -2,08975 0,046567 -82,495654 -0,68108 -82,4957 -0,68108

X4 47,9535226 44,95723 1,066648 0,295936 -44,45739 140,3644 -44,4574 140,3644

Significance F < 0,05 (2,92781E-05). Taigi, bent vienas regresorius yra reikšmingas. X4 išmetame, nes jo P-value lygi 0,295936, yra didžiausia iš visų reikšmių ir didesnė už 0,05.

SUMMARY OUTPUT

Regression Statistics

Multiple R 0,7572231

R Square 0,57338683

Adjusted R Square 0,54178585

Standard Error 113,510354

Observations 30

ANOVA

df SS MS F Significance F

Regression 2 467571,7 233785,8 18,14459 1,0127E-05

Residual 27 347884,2 12884,6

Total 29 815455,9

Coefficients Standard Error t Stat P-value Lower 95% Upper 95% Lower 95,0% Upper 95,0%

Intercept 250,86504 93,4893 2,683356 0,012293 59,040848 442,6892 59,04085 442,6892

X1 0,7111206 0,14757 4,818873 4,96E-05 0,40833216 1,013909 0,408332 1,013909

X2 -39,711933 19,87369 -1,99822 0,055857 -80,489372 1,065506 -80,4894 1,065506

Significance F < 0,05 (1,0127E-05). Taigi, bent vienas regresorius yra reikšmingas. X2 išmetame, nes jo P-value lygi 0,055857, yra didžiausia iš visų reikšmių ir didesnė už 0,05.

SUMMARY OUTPUT

Regression Statistics

Multiple R 0,71435

R Square 0,5103

Adjusted R Square 0,49281

Standard Error 119,423

Observations 30

ANOVA

df SS MS F Significance F

Regression 1 416125,1 416125,1 29,17758 9,2606E-06

Residual 28 399330,7 14261,81

Total 29 815455,9

Coefficients Standard Error t Stat P-value Lower 95% Upper 95% Lower 95,0% Upper 95,0%

Intercept 101,49402 59,07041 1,718187 0,096803 -19,506216 222,4943 -19,5062 222,4943

X1 0,7998081 0,148068 5,401627 9,26E-06 0,4965046 1,103112 0,496505 1,103112

Significance F<0,05 (9,2606E-06). Regresorių su reikšmėm P-value >0,05 daugiau nėra. Iš čia seka, kad namų ūkio vartojimo išlaidos priklauso tik nuo disponuojamų pajamų.

Šią priklausomybę aprašo lygtis:

Y = 101,49402+0,7998081*X1

Y – išlaidos vienam ūkio nariui;

X1- namų ūkio disponuojamos pajamos vienam gyventojui.

Didžiausios išlaidos, tenkančios vienam ūkio nariui, kai jis gaus didžiausias pajamas. Užrašius regresijos lygtį galima apskaičiuoti, kokios bus išlaidos esant atitinkamoms pajamoms. Taigi didžiausias išlaidas namų ūkio narys patirs tada, kai jis

gaus didžiausias pajamas, t.y. 776,- Lt.

Y = 101,49402+0,7998081*776,00 = 722,15 Lt

Taip pat ir mažiausiai pinigų vartojimo išlaidoms namų ūkio narys išleis tada, kai gaus mažiausias pajamas 89,20 Lt.

Y = 101,49402+0,7998081*89,20 = 173,84 Lt.

RESIDUAL OUTPUT

Observation Predicted išlaidos vienam gyventojui Residuals

1 237,4614079 260,5385921

2 423,0168972 -123,6835639

3 172,8369099 -4,43690989

4 363,4311905 6,068809486

5 337,9706313 -74,30396461

6 399,822461 -52,82246105

7 369,4297516 57,57024841

8 275,8521988 -61,10219879

9 271,0533499 -67,05334993

10 270,8533979 -55,10339789

11 342,6361788 59,36382122

12 378,2276412 -57,22764117

13 417,7381635 29,86183653

14 447,4110456 1,838954405

15 370,6294638 -75,87946381

16 437,6133958 -24,36339584

17 326,0401598 -75,2901598

18 403,8215018 2,845164899

19 243,0600649 -10,0600649

20 644,2971503 34,70284972

21 413,8191036 170,6808964

22 516,59445 -138,09445

23 459,4081677 46,09183225

24 304,4453399 -149,9453399

25 418,7512538 -193,7512538

26 393,6905986 147,6427347

27 722,1451429 -192,6451429

28 552,3192138 115,3474529

29 463,8071125 206,1928875

30 562,9833223 217,0166777

Iš grafiko matyti, kad prognozuojamos išlaidos vienam ūkio nariui beveik visada sutampa su pajamomis vienam ūkio nariui.Determinacijos koeficiento įvertis

Determinacijos koeficientas – tai daugiamačio koreliacijos koeficiento kvadratas (R2).

Jis turi patekti į intervalą: 0 ≤ R2 ≥ 1.

Jis atspindi parinkto modelio tikslumą, t.y. kuo R2 artimesnis 11, tuo parinktas modelis geriau aprašo duomenis.

Gavau R2 0,9561. Pagal šį rezultatą galiu spręsti, kad mano pasirinktas modelis gerai aprašo duomenis, kadangi namų ūkio išlaidos 95,61% priklauso nuo namų ūkio pajamų, ir tik 4,39% – nuo kitų faktorių, kurie nebuvo nagrinėti.

Regresijos koeficiento reikšmingumo patikrinimas

• Regresijos koeficiento reikšmę (Significance F) reikia palyginti su a = 0,05.

• Significance F turi būti mažesnė už 0,05. Tai rodo, kad bent vienas iš tiriamų regresorių yra reikšmingas.

• Reikia atsižvelgti ir į kiekvieno regresoriaus P-value reikšmes. Jei P-value reikšmė ddidesnė už 0,05, tuomet regresorių galima laikyti nereikšmingu. Tačiau tik tą regresorių, kurio P-value yra didžiausia.

• Nereikšmingus regresorius reikia išmetinėti po vieną iš lentelės.

• Po to atlikti visas operacijas iš naujo, tol kol Significance F < 0,05 ir kada visos regresorių P-value bbus mažesnės už 0,05. Tokiu atveju visi likę regresoriai bus reikšmingi.

• Tyrimo metu Significance F buvo visada mažesnė už 0,05 ir toliau atlikinėjant veiksmus jis nuolat mažėjo. O tyrimą atlikinėjau tol, kol X1 (pajamos vienam namų ūkio nariui) P-value reikšmė buvo mažesnė už 0,05. Todėl tik šis regresorius buvo reikšmingas.

Regresinė analizė Nr. 2

Šioje kursinio projekto dalyje ištirsiu kuri namų ūkio charakteristika geriausiai nusako šeimos pajamas.

Regresinėje analizėje:

Y – namų ūkio disponuojamos pajamos;

X1 – gyvenamoji vieta:

– miestas „1“;

– kaimas „2“.

X2 – namų ūkio galvos išsimokslinimas:

– tik su viduriniu „1“;

– kitas išsilavinimas „2“.

X3 – pajamų šaltinis:

– pajamos susijusios su darbu „1“;

– pašalpos, stipendijos ir kt.

Duomenys, reikalingi regresinei analizei atlikti

Y X1 X2 X3

Namų ūkio disponuojamos pajamos Gyvenamoji vieta Pajamų šaltinis Namų ūkio galvos išsimokslinimas

170 2 1 2

1206 1 1 1

446 2 2 2

655 1 2 2

887 1 1 2

1119 1 2 2

335 1 2 2

872 1 1 2

636 1 2 2

847 2 2 2

603 2 2 2

346 1 2 1

1977 1 1 1

1730 1 1 2

1346 1 1 2

1681 1 1 2

1123 1 1 1

1134 1 1 2

708 2 1 2

2036 1 1 1

781 2 2 2

1038 2 1 2

895 1 2 2

1015 2 1 2

1190 2 1 1

1096 1 1 2

1552 2 2 2

1691 1 1 2

906 1 2 2

1154 1 1 1

Tikrinam koreliaciją:

X1 X2 X3

X1 1

X2 0,144338 1

X3 0,222911 0,28957 1

Patikrinus koreliaciją gavom, kad koreliacija tarp regresorių neviršija 0,85. Iš čia seka, kkad ryšys tarp iksų nestiprus ir regresoriai parinkti gerai.

Tikrinam regresiją:

SUMMARY OUTPUT

Regression Statistics

Multiple R 0,557955

R Square 0,311314

Adjusted R Square 0,23185

Standard Error 415,6145

Observations 30

ANOVA

df SS MS F Significance F

Regression 3 2030164 676721,5 3,917677 0,019659362

Residual 26 4491120 172735,4

Total 29 6521284

Coefficients Standard Error t Stat P-value Lower 95% Upper 95% Lower 95,0% Upper 95,0%

Intercept 2136,19449 376,9118 5,667624 5,83E-06 1361,441218 2910,948 1361,441 2910,948

X1 -218,42432 165,7285 -1,31796 0,19901 -559,084108 122,2355 -559,084 122,2355

X2 -400,0247 162,4183 -2,46293 0,02072 -733,880335 -66,1691 -733,88 -66,1691

X3 -139,1099 190,9609 -0,72847 0,472835 -531,635668 253,4159 -531,636 253,4159

Significance F < 0,05 (0,019659362). Taigi, bent vienas regresorius yra reikšmingas. X3 išmetame, nes jo P-value lygi 0,472835, yra didžiausia iš visų reikšmių ir didesnė už 0,05.

SUMMARY OUTPUT

Regression Statistics

Multiple R 0,54521294

R Square 0,29725715

Adjusted R Square 0,24520213

Standard Error 411,986416

Observations 30

ANOVA

df SS MS F Significance F

Regression 2 1938498 969249,2 5,710441 0,008545783

Residual 27 4582786 169732,8

Total 29 6521284

Coefficients Standard Error t Stat P-value Lower 95% Upper 95% Lower 95,0% Upper 95,0%

Intercept 1965,41489 292,5554 6,718094 3,27.E-07 1365,140772 2565,689 1365,141 2565,689

X1 -241,51064 161,2502 -1,49774 0,145802 -572,368681 89,3474 -572,369 89,3474

X2 -431,59574 155,1631 -2,78156 0,009744 -749,964045 -113,227 -749,964 -113,227

Significance F < 0,05 (0,008545783). Taigi, bent vvienas regresorius yra reikšmingas. X1 išmetame, nes jo P-value lygi 0,145802, yra didžiausia iš visų reikšmių ir didesnė už 0,05.

SUMMARY OUTPUT

Regression Statistics

Multiple R 0,48874501

R Square 0,23887169

Adjusted R Square 0,21168853

Standard Error 421,033339

Observations 30

ANOVA

df SS MS F Significance F

Regression 1 1557750 1557750 8,78749 0,006133847

Residual 28 4963534 177269,1

Total 29 6521284

Coefficients Standard Error t Stat P-value Lower 95% Upper 95% Lower 95,0% Upper 95,0%

Intercept 1690,3611 232,7349 7,263031 6,6E-08 1213,625215 2167,097 1213,625 2167,097

X2 -465,13889 156,9099 -2,96437 0,006134 -786,554165 -143,724 -786,554 -143,724

Significance F<0,05 (0,006133847). Regresorių su reikšmėm P-value >0,05 daugiau nėra. Iš čia seka, kad namų ūkio vartojimo išlaidos priklauso tik pajamų šaltinio.

Šią priklausomybę aprašo lygtis:

Y = 1690,3611-465,13889*X2

Y – namų ūkio disponuojamos pajamos;

X2- pajamų šaltinis.

Didžiausias pajamas namų ūkiai gauna, kai jų pajamos susijusios su darbu. Užrašius regresijos lygtį galima apskaičiuoti, kokios bus pajamos, kai pajamų šaltinis yra darbas.

Y = 1690,3611-465,13889*1 = 1225,22 Lt

Mažiausias pajamas namų ūkiai gauna, kai jų pajamos yra pašalpos, stipendijos ir kt.

Y = 1690,3611-465,13889*2 = 760,08 Lt.Skurdo rodiklių įvertinimas

Apskaičiuojam tokius skurdo rodiklius:

• Skurstančiųjų gyventojų lygį šalyje;

• Žemų pajamų nuokrypį

• Žemų pajamų indeksą;

• Kvadratinį skurdo nuokrypį.

Tam, kad apskaičiuoti ir įvertinti šiuos pasirinktus rodiklius, reikia rasti pajamas, tenkančias vienam namų ūkio nariui. Namų ūkio dydį vertinsiu pagal paprastąją skalę.

Duomenys, skurdo rodikliams apskaičiuoti

Namų ūkio eilės nr. Namų ūkio dydis Namų ūkio disponuojamos pajamos (Lt) Pajamos vienam namų ūkio nariui (Lt)

1 1 170,00 170,00

2 3 1206,00 402,00

3 5 446,00 89,20

4 2 655,00 327,50

5 3 887,00 295,67

6 3 1119,00 373,00

7 1 335,00 335,00

8 4 872,00 218,00

9 3 636,00 212,00

10 4 847,00 211,75

11 2 603,00 301,50

12 1 346,00 346,00

13 5 1977,00 395,40

14 4 1730,00 432,50

15 4 1346,00 336,50

16 4 1681,00 420,25

17 4 1123,00 280,75

18 3 1134,00 378,00

19 4 708,00 177,00

20 3 2036,00 678,67

21 2 781,00 390,50

22 2 1038,00 519,00

23 2 895,00 447,50

24 4 1015,00 253,75

25 3 1190,00 396,67

26 3 1096,00 365,33

27 2 1552,00 776,00

28 3 1691,00 563,67

29 2 906,00 453,00

30 2 1154,00 577,00

Iš vviso: 88 31175,00 11.123,10

Vidutinės pajamos vienam namų ūkio nariui gaunamos visas namų ūkių pajamas padalinus iš visų namų ūkių narių sumos, t.y. 31175,00/88 = 354,26Lt.

Skurdo riba nėra duota, todėl ją pasirenku kaip 62 % nuo vidutinių pajamų vienam namų ūkio nariui, t.y. z = 354,26*0.62 = 219,64 Lt.

Galima teigti, kad namų ūkiai, kuriuose vienam nariui tenka mažiau nei 219,64 Lt disponuojamų pajamų, yra žemiau skurdo ribos, ir tokių namų ūkių yra 6.Skurstančiųjų gyventojų lygis šalyje

Šį rodiklį, kuris parodo šalies gyventojų dalį, kurių pajamos yra žemiau skurdo ribos. Jis apskaičiuojamas:

L =

kur: q – skurstančiųjų gyventojų skaičius;

p – visų tiriamų gyventojų skaičius.

L = 21/88 = 0,2386

Apskaičiavus matyti, kad 23,86% stebimų gyventojų yra skurstantys, jie gyvena žemiau skurdo ribos.

Žemų pajamų nuokrypis – tai rodiklis, kuris parodo, kiek vidutiniškai skurstančiųjų pajamos nukrypsta nuo skurdo ribos. Šis rodiklis parodo skurdo gilumą.

Šį skurdo rodiklį apskaičiuoju pagal formulę:

N = = 0,0940

kur: yi – i-tojo skurstančiojo pajamos;

q – skurstančių tiriamųjų gyventojų skaičius;

z – skurdo riba.

Vidutiniškai 9.4 % skurstančiųjų pajamos nukrypsta nuo skurdo ribos.

Žemų pajamų indeksas – parodo kiek reikia lėšų eliminuoti skurdą šalyje.

Šį skurdo rodiklį apskaičiuosime:

I = L*N = 0,2386*0,0940 = 0,0224

Šis indeksas rodo, kad papildomai reikia 2.24% lėšų, kad panaikinti skurdą stebimuose namų ūkiuose.

Kvadratinis skurdo nnuokrypis – atspindi pajamų pasiskirstymą tarp skurstančiųjų. Kuo daugiau šalyje yra ypatingai skurstančiųjų žmonių, tuo didesnis bus šis rodiklis.

Paskutinįjį skurdą įvertinantį rodiklį apskaičiuoju pagal formulę:

Q = ;

kur: n – stebimų gyventojų skaičius;

z – skurdo riba.

Atlikus skaičiavimus gaunu Q = 0.0224

Taigi skurdo intensyvumo rodiklis yra 2,24 %. Tai rodo, kad pajamos tarp skurstančiųjų yra pasiskirstę šiuo procentu.Išvados

 Didžiausią dalį visų namų ūkių užima šeimos po 3 (29%), mažiausiai po 5 (7%) žmones.

 Daugiausia yra namų ūkių, kurių disponuojamos pajamos vienam namų ūkio nariui yra iki 500Lt (83%).

 Daugiausia yra namų ūkių, kurių išlaidos vienam namų ūkio nariui yra iki 500 Lt (73%), mažiausiai – kurių išlaidos yra virš 500 Lt (po 27%).

 Iš grafiko matyti, kad beveik pusės visų namų ūkių išlaidos vienam gyventojui viršija pajamas vienam gyventojui.

 Daugiausia yra namų ūkių, kurių išlaidos vienam ūkio nariui yra mažos ir vidutiniškos.

Patikrinau hipotezes:

Ar skiriasi vieno namų ūkio nario vidutinės išlaidos kaime ir mieste

 F