NAMŲ ŪKIO BIUDŽETO TYRIMO STATISTINIŲ DUOMENŲ ANALIZĖ ŪKIO STATISTIKOS IR EKONOMETRIJOS KURSINIS PROJEKTAS

Turinys

Įvadas…………………………3

1. BENDRA NAMŲ ŪKIO CHARAKTERISTIKA………………8

1.1. Kiekybiniai duomenys…………………………8

1.2. Kokybiniai duomenys…………………………10

2. Vieno namų ūkio nario vidutinis pajamų pasiskirstymas…………..14

3. Vieno šeimos nario išlaidų kaime ir mieste palyginimas…………..17

4. Patikrinimas: ar namų ūkio santaupos didėja………………..21

5. Skurdo rodiklių įvertinimas………………………..22

6. Namų ūkių nelygybės išanalizavimas: Lorenco kreivė, Gini koeficientas……25

6.1. Lorenco kreivė…………………………25

6.2. Gini koeficientas…………………………26

7. Regresinė analizė: išlaidų priklausomybės nuo kitų įvairių faktorių tyrimas…27

8. Nustatymas: ar vieno namų ūkio nario vidutinės pajamos tiesiškai nusako namų ūkio vieno nario vidutines išlaidas……………………..34

9. Pajamų, išlaidų, namų ūkio dydžio koreliacijos ir reikšmingumo įvertinimas…38

Išvados…………………………42Įvadas

Terminas „ūkio sstatistika“ yra termino „ekonominė statistika“ atitikmuo.

Ūkio statistika:

• tiria ūkinių procesų ir reiškinių kiekybę;

• pateikia statistinių tyrimų atlikimo metodiką;

• pateikia matų sistemą konkretiems reiškiniams ir procesams apibūdinti. Tam naudojami kompleksiniai reiškinių analizės būdai.

• supažindina su statistinių metodų ir ekonometrinių modelių taikymo ūkiniams procesams analizuoti metodika.

Ekonometrija tai atskira disciplina, kuri apjungia teorinius rezultatus, metodus, modelius skirtus suteikti konkrečias skaitines reikšmes ekonominiams reiškiniams naudojantis:

• ekonomikos teorija;

• ekonometrinė statistika;

• matematiniais statistiniais metodais.

Ekonometrija yra tarpinis ekonomikos, statistikos ir matematikos mokslas, t.y. mokslas, kuris nustato empirinius ekonomikos dėsnius. Nagrinėjami stebėjimo duomenys, kkurių pagrindu gaunamos kiekybinės ekonominių santykių išraiškos (priklausomybės), kuriami ekonominiai modeliai, įvertinami nežinomi jų parametrai, skaičiuojamos prognozės.

Ekonometrijos tikslai:

• ekonominių ir socialinių rodiklių analizė;

• rodiklių prognozė;

• šalies socialinio-ekonominio vystymosi imitavimas.

Šio kursinio darbo tikslai ir uždaviniai:

1. pateikti bendrą namų ūkių charakteristiką (aprašomoji statistika);

2. įvertinti vieno namų ūūkio nario vidutinių pajamų pasiskirstymą;

3. patikrinti ar skiriasi vieno šeimos nario išlaidos kaime ir mieste;

4. patikrinti ar namų ūkių santaupos didėja;

5. įvertinti skurdo rodiklius;

6. išanalizuoti namų ūkių nelygybę: Gini koeficientas, Lorenco kreivė;

7. ištirti išlaidų priklausomybę nuo kitų įvairių faktorių (regresinė analizė);

8. nustatyti, ar vieno namų ūkio nario vidutinės pajamos tiesiškai nusako namų ūkio vieno nario vidutines išlaidas;

9. įvertinti pajamų, išlaidų, namų ūkio dydžio koreliaciją ir jos reikšmingumą.

Šiame kursiniame darbe yra vartojamos tokios pagrindinės sąvokos:

Namų ūkis – tai gali būti:

• atskirai gyvenantis vienas asmuo;

• asmenų grupė, gyvenanti viename bute ar name ir turinti bendrą biudžetą.

Beje, asmenys, gyvenantys instituciniuose namų ūkiuose, nėra tiriami. Tai gali būti: senelių namai, įkalinimo įstaigos ir pan.

Namų ūkio galva – tai asmuo, turintis didžiausias pajamas. Tiksliau tariant, tai asmuo, kuris, ūkio narių nuomone, per metus ggauna didžiausias pajamas. Tačiau kai didžiausias pajamas gaunančio asmens išskirti negalima (pvz., visa šeima ūkininkauja ir pajamų negalima priskirti kuriam nors ūkio nariui), namų ūkio galva laikomas asmuo, kurį nurodo šeima.

Namų ūkio galvos socialinė-ekonominė grupė:

• ūkininkai (namų ūkio galvos pagrindinis pajamų šaltinis yra asmeninis žemės ūkis);

• samdomieji darbuotojai (namų ūki galvos pagrindinis pajamų šaltinis yra samdomas darbas visuomeniniame arba privačiame sektoriuje);

• verslininkai (namų ūkio galvos pajamos yra iš verslo, amatų, laisvos profesinės veiklos);

• pensininkai (namų ūkio galvos pajamos yra pensija);

• kiti (namų ūkio galvos pagrindinis ppajamų šaltinis yra įvairios pašalpos, stipendija, pajamos iš turto bei kiti pajamų šaltiniai).

Namų ūkio tipas. Jis nustatomas pagal namų ūkio demografinę sudėtį. Išskiriami šie tipai:

• vienišas asmuo;

• vienas suaugęs asmuo su vaikais iki 18 m.;

• sutuoktinių pora su vaikais iki 18 m.;

• kiti namų ūkiai su vaikais iki 18 m. Šiam tipui priklauso namų ūkiai, kuriuos sudaro tėvai su vaikais iki 18 m. ir vyresniais, kelių kartų namų ūkiai su vaikais iki 18 metų, seneliai su anūkais iki 18 metų ir pan.;

• sutuoktinių pora be vaikų;

• kiti namų ūkiai be vaikų.

Tačiau šiame kursiniame darbe nagrinėjami šie namų ūkio tipai:

• namų ūkis su vaikais 18 metų;

• namų ūkis be vaikų iki 18 metų.

Disponuojamos pajamos – tai visos piniginės ir natūrinės pajamos, kurios gali būti gaunamos:

• už darbą,

• iš ūkininkavimo,

• iš verslo,

• iš amatų,

• iš laisvos profesinės veiklos,

• taip pat pensijos, įvairios pašalpos, stipendijos,

• pajamos iš turto, re.nta ir t.t.

Vartojimo išlaidos – tai piniginės ir natūrinės išlaidos, skirtos namų ūkio vartojimo poreikiams patenkinti, t.y. išlaidos:

• maistui

• būstui

• drabužiams

• sveikatos priežiūrai ir t.t.

Skurdo riba – tai kriterijus, kurio pagalba analitikai suskirsto individus, šeimas, namų ūkius į:

• skurstančiuosius;

• neskurstančiuosius.

Reikia atkreipti dėmesį į tai jog skurdo sąvoka yra daugiaprasmė ir kinta vystantis visuomenei, taip pat gali būti labai skirtingai suprantama įvairiose šalyse. Tarkim Europos Konsiliume 1984 m. lapkričio 19 dieną skurdo sąvoka buvo apibrėžta taip: „„skurdžiais vadinami asmenys, šeimos, asmenų grupės, kurių ištekliai (materialiniai, kultūriniai ir socialiniai) yra nepakankami savo šalyje susiklosčiusiam minimaliam gyvenimo būdui užtikrinti.

Yra išskiriami 3 skurdo ribų tipai:

1. Absoliuti- tai minimalus pajamų ar išlaidų dydis būtinoms reikmėms patenkinti (Lietuvoj-MGL).

2. Santykinė- skurdo slenkstis siejamos su šalies vidutiniais pajamų/išlaidų rodikliais ir priklauso nuo jų.

3. Subjektyvi- atsižvelgiama į respondentų nuomonę apie juos pačius.

Skurdo rodikliai – skaičiuojant skurdo rodiklius, namų ūkio dydis gali būti įvertinamas pagal paprastą ir ekvivalentinę skales.

Pagrindiniai skurdo rodikliai:

• skurstančiųjų gyventojų lygis šalyje- rodiklis, parodantis šalies gyventojų dalį kurių pajamos yra žemiau skurdo ribos.

• žemų pajamų nuokrypis- parodo, kiek vidutiniškai skurstančiųjų pajamos nukrypsta nuo skurdo ribos (parodo skurdo gilumą).

• žemų pajamų indeksas- parodo, kiek lėšų reikia eliminuoti skurdą šalyje.

• kvadratinis skurdo nuokrypis- skurdo intensyvumo rodiklis, kuris atspindi pajamų pasiskirstymą tarp skurstančiųjų. Kuo daugiau šalyje yra skurstančiųjų, tuo didesnis šis rodiklis.

Duomenys, panaudoti šiame kursiniame darbe

Namų ūkio dydis

Namų ūkio disponuojamos pajamos (Lt)

Gyvenamoji vieta

1. 5 didieji miestai

2. Kiti miestai

3. Kaimas

Namų ūkiai su vaikais ir be vaikų

1. Namų ūkis su vaikais iki 18 metų

2. Namų ūkis be vaikų iki 18 metų

Namų ūkio galvos pagrindinis šaltinis

1. Darbas asmeniniame žemės ūkyje

2. Samdomas darbas žemės ūkio visuomeniniame sektoriuje

3. Samdomas darbas žemės ūkio privačiame sektoriuje

4. Pajamos iš verslo, amatų

5. Samdomas darbas ne žemės ūkio visuomeniniame sektoriuje

6. Samdomas darbas ne žemės ūkio privačiame sektoriuje

7. Pajamos iš laisvos profesinės veiklos

8. Bedarbio pašalpa

9. Stipendija

10. Pensija

11. Socialinės pašalpos

12. Išlaikytiniai

13. Kitas ppajamų šaltinis

Namų ūkio galvos lytis

1. Vyras

2. Moteris

Namų ūkio galvos socialinė-ekonominė grupė

1. Ūkininkai

2. Samdomi darbuotojai

3. Verslininkai

4. Pensininkai

5. Kita

Namų ūkio galvos išsimokslinimas

1. Neturi pradinio, pradinis

2. Pagrindinis

3. Bendras vidurinis

4. Aukštesnysis

5. Aukštasis

Namų ūkio galvos amžius (grupuotas)

1. iki 30 metų

2. 30-39 metai

3. 40-49 metai

4. 50-59 metai

5. 60 metų ir daugiau

Miestas-Kaimas

1. Miestas

2. Kaimas

Namų ūkio vartojimo išlaidos1. BENDRA NAMŲ ŪKIO CHARAKTERISTIKA

1.1. Kiekybiniai duomenys

Charakteristikų apibrėžimai:

1. Vidurkis – tai visų stebėtų skaitinių duomenų suma, padalinta iš duomenų skaičiaus. Jis rodo vidutinę atsitiktinio dydžio reikšmę.

2. Dispersija – tai išsibarstymo apie vidurkį matas. Tai skirtumų tarp stebėtų duomenų reikšmių ir vidurkio kvadratų vidurkis.

3. Vidutinis kvadratinis nuokrypis – tai kvadratinė šaknis iš dispersijos.

4. Mediana – tai vidurinis duomuo stebėjimų sekoje, išdėstytoje didėjimo tvarka, t.y. skaičius, perskirstantis variacinę eilutę į dvi maždaug lygias dalis.

5. Moda – tai reikšmė, kuri pasikartoja dažniausiai. Jei visi duomenys pasikartoja po vieną kartą, tai modos rasti negalime.

6. Asimetrijos koeficientas – parodo pasiskirstymo simetriškumą, Jei asimetrijos koeficientas:

• >0, tai asimetrija yra teigiama (dešinioji asimetrija);

• =0, tai rodo, kad yra asimetrija;

• <0, tai asimetrija yra neigiama (kairioji asimetrija).

7. Ekscesas – tai simetrijos koeficientas (matas). Kai šis koeficientas:

• >0, tai duomenų sklaida apie vidurkį yra didesnė už normaliąją kreivę;

• =0, tai duomenų sklaida apie vidurkį yra tokia pati kaip ir normalios kreivės;

• <0, tai duomenų sklaida apie vidurkį yra mažesnė už normaliąją kreivę.

8. Duomenų plotis – tai maksimalios ir minimalios stebėjimų sekos duomenų reikšmių skirtumas, kuris parodo stebimų duomenų reikšmių diapazoną.

9. Minimali reikšmė –

tai stebimų duomenų sekoje esanti mažiausia reikšmė.

10. Maksimali reikšmė – tai stebimų duomenų sekoje esanti didžiausia reikšmė.

Taigi rasiu šias pagrindines kiekybines charakteristikas šiems duomenims: namų ūkio dydis; namų ūkio disponuojamos pajamos; namų ūkio vartojimo išlaidos (žr. žemiau esančiose lentelėse). Ir padarysiu atitinkamas išvadas apie tai.

Namų ūkio dydis Namų ūkio disponuojamos pajamos (Lt) Namų ūkio vartojimo išlaidos (Lt)

3 175 1060

5 2348 2873

4 1058 2030

4 1171 1237

4 1944 1564

2 1092 867

4 611 868

2 748 804

1 1295 1131

2 955 1131

2 810 410

5 1580 495

2 744 485

4 700 829

4 534 1834

5 2229 1447

2 1970 1812

3 994 1040

1 1234 1030

1 331 321

3 1427 1773

3 647 1487

3 1555 1769

3 274 234

2 114 830

2 1247 1413

5 3990 6101

1 270 468

3 1333 1347

5 1168 1622

3 1229 1020

4 2270 2249

Pagrindinės charakteristikos Namų ūkio dydis Namų ūkio disponuojamos pajamos (Lt) Namų ūkio vartojimo išlaidos (Lt)

Vidurkis 3,03125 1188,96875 1361,90625

Standartinė paklaida 0,226671102 140,4037201 186,1173557

Mediana 3 1130 1131

Moda 3 negalima reikšmė 1131

Vidutinis kvadratinis nuokrypis 1,282245384 794,2433804 1052,838754

Dispersija 1,644153226 630822,5474 1108469,443

Eksceso koeficientas -1,019131513 3,724180142 13,14302642

Asimetrijos koeficientas 0,036244666 1,476204565 3,092761232

Duomenų plotis 4 3876 5867

Minimali reikšmė 1 114 234

Maksimali reikšmė 5 3990 6101

Suma 97 38047 43581

Duomenų skaičius 32 32 32

Vidurkio paklaida (95,0%) 0,462299017 286,3554347 379,5890612

Namų ūkio ddydis.

Apskaičiavus, t.y. ir kaip matyti pateiktoje lentelėje, vidutinis namų ūkio dydis yra 3,03125 (apytiksliai po tris asmenis). Mediana lygi 3, t.y. vidurinis duomuo namų ūkio dydžio stebėjimo sekoje, išdėstytoje didėjimo tvarka yra 3. Moda taip pat lygi 3, kas rodo, jog namų ūkiai šio stebėjimo sekoje su trimis nariais pasitaiko dažniausiai. Dispersija lygi 1,644153226, vidutinis kvadratinis nuokrypis 1,282245384. Asimetrijos koeficientas 0,036244666, tai simetrija yra teigiama (dešinioji asimetrija). Duomenų plotis lygus 4. Minimali stebėta reikšmė 1 (mažiausias iš visų stebimų namų ūūkių yra namų ūkis, kurį sudaro tik vienas asmuo), o maksimali 5 (didžiausias namų ūkis yra iš penkių asmenų). Bendras visų stebimų namų ūkių narių skaičius yra 97, iš viso stebimi 32 namų ūkiai.

Namų ūko disponuojamos pajamos.

Stebėjimų sekoje vidutinės disponuojamos ppajamos – 1188, 96875. Mediana lygi – 1130, tai reiškia, kad išdėsčius namų ūkių disponuojamas pajamas didėjimo tvarka, vidurį gausime 1130. Moda negalima. D.ispersija lygi 630822,5474, vidutinis kvadratinis nuokrypis 794,2433804. Asimetrijos koeficientas lygus 1,476204565 . Duomenų plotis – t.y. skirtumas tarp maksimumo ir minimumo, lygus 3876. Minimali stebėta reikšmė yra 114 (mažiausia namų ūkio disponuojamų pajamų suma), o maksimali 3990 (tokia didžiausia namų ūkio disponuojamų pajamų suma). Visų namų ūkių išlaidos sudaro 38047, iš viso yra 32 stebėjimai.

Namų ūkio vartojimo išlaidos.

Stebėjimų sekoje vidutinės vartojimo išlaidos – 1361,90625. Mediana lygi – 1131, tai reiškia, kad išdėsčius namų ūkių disponuojamas pajamas didėjimo tvarka, vidurį gausime 1131. Moda lygi medianai, t.y. lygi 1131, tai reiškia, kad tokios sumos vartojimo išlaidos pasitaiko dažniausiai. Dispersija llygi 1108469,443, vidutinis kvadratinis nuokrypis 1052,838754. Asimetrijos koeficientas lygus 3,092761232, tai reiškia, jog simetrija yra teigiama (dešinioji asimetrija). Duomenų plotis – t.y. skirtumas tarp maksimumo ir minimumo, lygus 5867. Minimali stebėta reikšmė yra 234 (mažiausia namų ūkio disponuojamų pajamų suma), o maksimali 6101 (tokia didžiausia namų ūkio disponuojamų pajamų suma). Visų namų ūkių vartojimo išlaidos sudaro 43581, iš viso yra 32 stebėjimai.1.2. Kokybiniai duomenys

Gyvenamoji vieta.

Mano kursinio darbo varianto duomenimis nagrinėjami 32 namų ūkiai. Iš jų:

• 5-kiuose didžiuosiuose miestuose gyvena 17 namų ūūkių;

• Kituose miestuose – 9 namų ūkiai;

• Kaimuose -6 namų ūkiai.

Taigi mažiausiai namų ūkių gyvena kaimuose (18,75 proc.), daugiausiai namų ūkių gyvena didžiuosiuose miestuose (53,125 proc.), o kituose miestuose gyvena 28,125 proc. visų stebimų namų ūkių (žr. į žemiau esančią diagramą).

Namų ūkio dydis.

Nagrinėjant namų ūkio dydį, galima įsigilinti, koks skaičius namų ūkių susideda iš vieno, dviejų, trijų, keturių ar penkių asmenų.

Namų ūkio dydis Namų ūkių skaičius

1 4

2 8

3 8

4 7

5 5

Taigi, kaip matyti iš aukščiau pateiktos lentelės bei skritulinės diagramos, iš nagrinėjamų 32 namų ūkių daugiausiai yra šeimų, susidedančių iš dviejų ir trijų asmenų (25 proc.), o mažiausią dalį iš visų nagrinėjamų namų ūkių užima šeimos, sudarytos iš vieno asmens (12,5 proc.).

Namų ūkių pajamų ir išlaidų palyginimas.

Namų ūkio

eilės nr. Namų ūkio

disponuojamos pajamos (Lt) Namų ūkio

vartojimo išlaidos (Lt)

1 175 1060

2 2348 2873

3 1058 2030

4 1171 1237

5 1944 1564

6 1092 867

7 611 868

8 748 804

9 1295 1131

10 955 1131

11 810 410

12 1580 495

13 744 485

14 700 829

15 534 1834

16 2229 1447

17 1970 1812

18 994 1040

19 1234 1030

20 331 321

21 1427 1773

22 647 1487

23 1555 1769

24 274 234

25 114 830

26 1247 1413

27 3990 6101

28 270 468

29 1333 1347

30 1168 1622

31 1229 1020

32 2270 2249

Akivaizdu, jog arti pusės tiriamų namų ūkių išlaidos viršija disponuojamas pajamas. Beje, 27-ojo pagal eilės numerį namų ūkio vartojimo išlaidos yra daugiau nei 2000 litų didesnės nei disponuojamos pajamos.

Namų ūkio galvos socialinė – ekonominė grupė.

Nagrinėdami namų ūkius pagal socialinę-ekonominę grupę, matome, kad:

1. Ūkininkai 0

2. Samdomi darbuotojai 22

3. Verslininkai 2

4. Pensininkai 7

5. Kita 1

Iš pateiktų duomenų matyti, jog didžiausią dalį sudaro samdomi darbuotojai, t.y. net 22 iš 32, mažiausią – ūkininkai ir kita, atitinkamai: 0 ir 1.2. Vieno namų ūkio nario vidutinis pajamų pasiskirstymas

Pirmiausiai aapskaičiuoju kiekvieno iš 32 stebimų namų ūkių vieno namų ūkio nario vidutinį pajamų pasiskirstymą (namų ūkio disponuojamos pajamos/namų ūkio dydis).

Namų ūkio dydis Namų ūkio disponuo-jamos pajamos (Lt) Vieno namų ūkio nario vidutinis pajamų pasiskirstymas (Lt)

3 175 58,3333

5 2348 469,6

4 1058 264,5

4 1171 292,75

4 1944 486

2 1092 546

4 611 152,75

2 748 374

1 1295 1295

2 955 477,5

2 810 405

5 1580 316

2 744 372

4 700 175

4 534 133,5

5 2229 445,8

2 1970 985

3 994 331,3333

1 1234 1234

1 331 331

3 1427 475,6667

3 647 215,6667

3 1555 518,3333

3 274 91,3333

2 114 57

2 1247 623,5

5 3990 798

1 270 270

3 1333 444,3333

5 1168 233,6

3 1229 409,6667

4 2270 567,5

Toliau atlieku tokius skaičiavimus:

• randu minimalią reikšmę iš rastų vieno namų ūkio nario vidutinio pajamų pasiskirstymo duomenų (litais). Gauta minimali reikšmė: 57 (Lt);

• randu maksimalią reikšmę iš to paties stulpelio duomenų. Maksimali reikšmė: 1295 (Lt);

• apskaičiuoju, kiek mano turimais duomenimis geriausia paimti intervalų. Pagal formulę: k=1+3,322lg*(n) gaunu, jog k yra apytiksliai lygus 6;

• apskaičiuoju intervalo dydį pagal formulę: ir gaunu, jog intervalo dydis (d)=206,333 (Lt)

• iš pradžių randu intervalų galus pagal tokias formules: ; ; ; . Tačiau apskaičiavusi , gaunu neigiamą skaičių. Todėl apskaičiuoju pagal tokią formulę: . Taigi randu tokius intervalų galus:

Randu intervalų galus:

t0 57

t1 263,3333

t2 469,6667

t3 676

t4 882,3333

t5 1088,6667

t6 1295

• šią sudarytą lentelę panaudoju tolimesniems skaičiavimams, t.y. gaunu tokius duomenis:

Bin Frequency

57 1

263,3333 7

469,6667 13

676 7

882,3333 1

1088,6667 1

1295 2

More 0

• kad galėčiau įvertinti vieno namų ūkio nario vidutinį pasiskirstymą, t.y. nubrėžti histogramą, sudarau tokias lenteles:

(57; 263,33] (263,33; 469,67] (469,67; 676] (676; 882,33] (882,33; 1088,67] (1088,67; 1295] Suma

Dažnis 8 13 7 1 1 2 32

Santykiniai dažniai 0,25 0,40625 0,21875 0,03125 0,03125 0,0625 1

Sukaupti sant.dažniai 0,25 0,65625 0,875 0,90625 0,9375 1

S1 S2 S3 S4 S5 S6

(0; 57] (57; 263,33] (263,33; 469,67] (469,67; 676] (676; 882,33] (882,33; 1088,67] (1088,67; 1295]

0 0

0,25 0,25

0,65625 0,65625

0,875 0,875

0,90625 0,90625

0,9375 0,9375

1 1

Gaunu tokį vieno namų ūkio nario vidutinį pajamų pasiskirstymą:3. Vieno šeimos nario išlaidų kaime ir mieste palyginimas

Patikrinimui, ar skiriasi vieno šeimos nario išlaidos kaime ir mieste, naudojami tokie pradiniai duomenys (žr. 3.1. lentelę), kurių pagalba, t.y. namų ūkio vartojimo išlaidas (Lt) padalijus iš namų ūkio dydžio, gaunu vieno namų ūkio nario duomenis kaime ir mieste (žr. 3.2. lentelę).

3.1. lentelė 3.2. lentelė

Namų ūkio dydis Namų ūkio vartojimo išlaidos (Lt)

3 1060

5 2873

4 2030

4 1237

4 1564

2 867

4 868

2 804

1 1131

2 1131

2 410

5 495

2 485

4 829

4 1834

5 1447

2 1812

3 1040

1 1030

1 321

3 1773

3 1487

3 1769

3 234

2 830

2 1413

5 6101

1 468

3 1347

5 1622

3 1020

4 2249

Vieno namų ūkio nario išlaidos (Lt) Miestas-kaimas

353,3333 2

574,6 1

507,5 2

309,25 1

391 1

433,5 1

217 1

402 1

1131 1

565,5 1

205 1

99 1

242,5 1

207,25 1

458,5 2

289,4 1

906 1

346,6667 1

1030 1

321 1

591 1

495,6667 1

589,6667 1

78 2

415 2

706,5 1

1220,2 1

468 1

449 1

324,4 2

340 1

562,25 1

Kad būtų įmanoma atlikti tolimesnius skaičiavimus, sudarau dar vieną lentelę, kurioje duomenys grupuojami taip:

Vieno namų ūkio nario išlaidos (Lt) Miestas-kaimas

574,6 1

309,25 1

391 1

433,5 1

217 1

402 1

1131 1

565,5 1

205 1

99 1

242,5 1

207,25 1

289,4 1

906 1

346,6667 1

1030 1

321 1

591 1

495,6667 1

589,6667 1

706,5 1

1220,2 1

468 1

449 1

340 1

562,25 1

353,3333 2

507,5 2

458,5 2

78 2

415 2

324,4 2

Statistinių hipotezių tikrinimas (teorijos apžvalga).

Bet koks tvirtinimas apie atsitiktinio dydžio pasiskirstymo formą ar apie pasiskirstymo parametrų reikšmes vadinamas statistine hipoteze. Pradinė hipotezė vadinama nuline hipoteze arba pagrindine ir žymima , priešinga šiai hipotezei yra alternatyvioji hipotezė, kuri žymima .

Statistiniais metodais tikrindami hipotezės teisingumą, galime padaryti dviejų rūšių klaidas. Pirmosios rūšies klaidą padarome tada, kai atmetame hipotezę , kai ji yra teisinga. Antros rūšies klaida padaroma, jei hipotezė priimama, nors ji ir yra klaidinga (žr. į žemiau esančią lentelę).

Hipotezė Teisinga Klaidinga

Atmetama Pirmos rūšies klaida Teisingas sprendimas

Priimama Teisingas sprendimas Antros rūšies klaida

Taisyklę, pagal kurią iš imties duomenų darome išvadą apie hipotezės teisingumą ar klaidingumą, vadiname statistiniu kriterijumi arba tiesiog kriterijumi.

Hipotezės apie dispersijų

ir dviejų vidurkių lygybę tikrinimas.

Tarkime, kad X ir Y yra normalieji atsitiktiniai dydžiai. Sprendžiant praktinius uždavinius, dažnai tenka atsakyti į klausimą: ar iš esmės skiriasi nagrinėjamų atsitiktinių dydžių vidurkiai EX ir EY.

Tegu , ,., ir , ,., yra šių atsitiktinių dydžių nepriklausomos imtys. Į suformuluotą klausimą galima atsakyti patikrinus hipotezę su alternatyva , esant reikšmingumo lygmeniui a.

Jei imtys yra mažos ir vidutiniai kvadratiniai nuokrypiai ir nėra žinomi, hipotezei su alternatyva tikrinti taikomas Stjudento kriterijus. Tačiau šiuo atveju prireikia papildomos sąlygos . Tada naudojamasi statistika, kuri galiojant hipotezei , yra Stjudento skirstinys.

t=

Pagal reikšmingumo lygmenį a ir laisvės laipsnių skaičių k=m+n-1.

Panašus priklausomų imčių kriterijus naudojamas ekonominiams skaičiavimams, nustatant ekonominių rodiklių kitimo pobūdį. Tuo tikslu imtis , , padalijama į dvi dalis: , , ir ,., . Apskaičiavus šių imčių vidurkius ir , tikrinama hipotezė . Jei ji teisinga, galima tvirtinti, kad nagrinėjamasis rodiklis nekinta.

Nežinant, ar imčių , ,., ir , ,., dispersijos lygios, natūralu pirmiau tikrinti hipotezę apie dispersijų lygybę, t.y. . Šiai hipotezei tikrinti taikomas Fišerio kriterijus. Randama statistikos reikšmė, iš Fišerio skirstinio lentelės pagal pasirinktąjį reikšmingumo lygmenį nustatoma kritinė sritis. Jei statistinė reikšmė patenka į kritinę sritį, hipotezė atmetama, priešingu atveju – priimama.

Hipotezė apie dviejų dispersijų lygybę.

.Tikrinu tokią hhipotezę:

F-Test Two-Sample for Variances

Mieste Kaime

Vidurkis 503,575 356,1222222

Dispersija 84252,45805 23045,8163

Observations 26 6

df 25 5

F 3,655867814

P(F<=f) one-tail 0,076711569

F Critical one-tail 4,520899211

Kaip matyti iš gautų duomenų, , todėl hipotezė priimama. Tai reiškia, jog dispersijos yra lygios.

Hipotezė apie dviejų vidurkių lygybę.

Kadangi gavau, kad dispersijos lygios, toliau tikrinu, ar vidurkiai yra lygūs, ar ne. Tikrinu tokią hipotezę:

t-Test: Two-Sample Assuming Equal Variances

Mieste Kaime

Vidurkis 503,575 356,122222

Dispersija 84252,45805 23045,8163

Observations 26 6

Pooled Variance 74051,35109

Hypothesized Mean Difference 0

df 30

t Stat 1,196392757

P(T<=t) one-tail 0,120456678

t Critical one-tail 1,697260851

P(T<=t) two-tail 0,240913355

t Critical two-tail 2,042272449

Išvados: , todėl hipotezę apie vidurkius galima priimti, nors išlaidų vidurkis mieste yra didesnis beveik 150 litų (147,45278 Lt).4. Patikrinimas: ar namų ūkio santaupos didėja

Norint patikrinti, ar namų ūkio santaupos didėja, pirmiausia reikia apskaičiuoti visų stebimų namų ūkių santaupas iš kiekvieno namų ūkio disponuojamų pajamų (litais) atitinkamai atėmus namų ūkio vartojimo išlaidas (litais) (žr. į žžemiau esančią lentelę).

Namų ūkio disponuojamos pajamos (Lt) Namų ūkio vartojimo išlaidos (Lt) Namų ūkio santaupos (Lt)

175 1060 -885

2348 2873 -525

1058 2030 -972

1171 1237 -66

1944 1564 380

1092 867 225

611 868 -257

748 804 -56

1295 1131 164

955 1131 -176

810 410 400

1580 495 1085

744 485 259

700 829 -129

534 1834 -1300

2229 1447 782

1970 1812 158

994 1040 -46

1234 1030 204

331 321 10

1427 1773 -346

647 1487 -840

1555 1769 -214

274 234 40

114 830 -716

1247 1413 -166

3990 6101 -2111

270 468 -198

1333 1347 -14

1168 1622 -454

1229 1020 209

2270 2249 21

Pirmiausiai tikrinu tokią hipotezę (žr. žemiau).

t-Test: Paired Two Sample for Means

Namų ūkio disponuojamos pajamos

(Lt) Namų ūkio vartojimo išlaidos (Lt)

Mean 1188,96875 1361,90625

Variance 630822,5474 1108469,443

Observations 32 32

Pearson Correlation 0,821580454

Hypothesized Mean Difference 0

df 31

t Stat -1,618678858

P(T<=t) one-tail 0,057823647

t Critical one-tail 1,695518742

P(T<=t) two-tail 0,115647294

t Critical two-tail 2,039513438

Išvados: , todėl H0 yra teisinga. Namų ūkio santaupos nedidėja. Todėl kitų hipotezių tikrinti nereikia.5. Skurdo rodiklių įvertinimas

Skurdo riba – tai kriterijus, kurio pagalba politikai ar kiti asmenys suskirsto gyventojus, ššeimas ar namų ūkius į skurstančius ir neskurstančius.

Norint apskaičiuoti skurdo rodiklius, reikalingi šie duomenys: namų ūkio dydis, disponuojamos pajamos ir disponuojamos pajamos vienam ūkio nariui.

Duomenys:

Namų ūkio eilės nr. Namų ūkio dydis Namų ūkio disponuojamos pajamos (Lt) Vieno namų ūkio nario disponuojamos pajamos (Lt)

1 3 175 58,3333

2 5 2348 469,6

3 4 1058 264,5

4 4 1171 292,75

5 4 1944 486

6 2 1092 546

7 4 611 152,75

8 2 748 374

9 1 1295 1295

10 2 955 477,5

11 2 810 405

12 5 1580 316

13 2 744 372

14 4 700 175

15 4 534 133,5

16 5 2229 445,8

17 2 1970 985

18 3 994 331,3333

19 1 1234 1234

20 1 331 331

21 3 1427 475,6667

22 3 647 215,6667

23 3 1555 518,3333

24 3 274 91,3333

25 2 114 57

26 2 1247 623,5

27 5 3990 798

28 1 270 270

29 3 1333 444,3333

30 5 1168 233,6

31 3 1229 409,6667

32 4 2270 567,5

Suma: 97 38047 13849,6667

Randu vidutines pajamas vienam namų ūkio nariui, kur: vidutinės pajamos vienam namų ūkio nariui = suma disponuojamų pajamų / suma namų ūkio dydžių.

Gauta reikšmė: 392,2371 (Lt).

Įvertinsiu šiuos skurdo rodiklius:

• skurdo ribą,

• skurdo lygį,

• skurdo gylį,

• žemų pajamų indeksą.

Skurdo riba:

Skurdo riba pasirenkama su 50 % nuo vidutinių pajamų vienam namų ūkio nariui.

r =0.5* vidutinės pajamos vienam namų ūkio nariui.

Skurdo riba: 196,1186 (Lt).

Skurdo lygis:

Skurstančių gyventojų lygis šalyje parodo šalies gyventojų dalį, kurių pajamos žemiau skurdo ribos.

Skurdo lygiui įvertinti naudojama formulė:

L 

Čia:

L – skurdo lygis,

q – skurstančių gyventojų skaičius,

n – visų gyventojų skaičius.

Nustatant skurstančių gyventojų skaičių atrenku tuos namų ūkius, kur vienam nariui tenka žemesnės pajamos už skurdo ribą.

Pagal nagrinėjamus duomenis yra 6 namų ūkiai, kuriuose pajamos žemiau skurdo ribos. Šiuos ūkius iš viso sudaro 20 gyventojų (tiek yra skurstančių gyventojų).

L=q/n=20/97= 0,206185567

Vadinasi , 20,62 proc. visų stebimų gyventojų pajamos yra žemiau skurdo ribos.

Skurdo gylis (žemų pajamų nuokrypis):

Žemų pajamų nuokrypis – tai rodiklis, kuris parodo, kiek vidutiniškai skurstančiųjų pajamos nukrypsta nuo skurdo ribos. Šis rodiklis parodo sskurdo gilumą.

Jis randamas:

Kur:

xi – i-tojo skurstančiojo pajamos

r – skurdo riba

ki – namų ūkio dydis

N=1/20*(((196,1186-58,333)/196,1186)*3+((196,1186-152,75)/196,1186)*4+((196,1186-175)/196,1186)*4+((196,1186-133,5)/196,1186)*4+((196,1186-91,3333)/196,1186)*3+((196,1186-57)/196,1186)*2)= 0,386086047, apytiksliai N=0,3861

Vadinasi, vidutiniškai 38,61 proc. skurstančiųjų pajamos nukrypsta nuo skurdo ribos.

Žemų pajamų indeksas:

Žemų pajamų indeksas parodo kiek reikia lėšų, norint eliminuoti skurdą šalyje.

Apskaičiuojamas pagal tokią formulę:

I = L * N

Kur:

L – skurdo lygis,

N – skurdo gylis.

I= 0,07960537

Reikia 7,96 proc. lėšų, norint eliminuoti skurdą šalyje.6. Namų ūkių nelygybės išanalizavimas: Lorenco kreivė, Gini koeficientas

6.1. Lorenco kreivė

Lorenco kreivė rodo, kurią pajamų dalį gauna tam tikra visuomenės dalis. Ši kreivė padeda įvertinti, kaip lygiai pasiskirsto pajamų grafinis vaizdas. Įstriža linija rodo idealiai lygų pajamų pasiskirstymą. Kuo toliau Lorenco kreivė yra nukrypusi nuo įstrižos linijos, tuo netolygesnis pajamų pasiskirstymas. Plotas, esantis tarp Lorenco kreivės ir absoliučios lygybės tiesės vadinamas koncentracijos plotu. Jis parodo skirtumus tarp siekiamos ir realios padėties pajamų pasiskirstymo atžvilgiu.

Sudarau lentelę, kurios apskaičiuotas duomenimis bus braižoma Lorenco kreivė:

Vieno šeimos nario pajamos (Lt) (didėjimo tvarka) Numeracija

Sukauptos vieno namų ūkio nario pajamos (Lt) (3)

0 0

57 1 57 0,03 0,004116

58,33 2 115,33 0,06 0,00832728

91,33 3 206,66 0,09 0,014921666

133,5 4 340,16 0,13 0,024560892

152,75 5 492,91 0,16 0,035590043

175 6 667,91 0,19 0,048225733

215,67 7 883,58 0,22 0,063797956

233,6 8 1117,18 0,25 0,080664796

264,5 9 1381,68 0,28 0,099762738

270 10 1651,68 0,31 0,119257801

292,75 11 1944,43 0,34 0,140395504

316 12 2260,43 0,38 0,163211949

331 13 2591,43 0,41 0,187111453

331,33 14 2922,76 0,44 0,211034784

372 15 3294,76 0,47 0,237894649

374 16 3668,76 0,50 0,264898922

405 17 4073,76 0,53 0,294141517

409,67 18 4483,43 0,56 0,323721304

444,33 19 4927,76 0,59 0,35580368

445,8 20 5373,56 0,63 0,387992196

469,6 21 5843,16 0,66 0,421899166

475,67 22 6318,83 0,69 0,456244413

477,5 23 6796,33 0,72 0,490721794

486 24 7282,33 0,75 0,525812908

518,33 25 7800,66 0,78 0,563238376

546 26 8346,66 0,81 0,602661726

567,5 27 8914,16 0,84 0,643637461

623,5 28 9537,66 0,88 0,688656617

798 29 10335,66 0,91 0,74627536

985 30 11320,66 0,94 0,817396239

1234 31 12554,66 0,97 0,9064959

1295 32 13849,66 1,00 1

13849,66

Pasitelkusi šiuos duomenis, t.y. 4 ir 5 stulpelių duomenimis braižau Lorenco kreivę:

Akivaizdu iš pateiktos Lorenco kreivės, jog tiriamų 32 namų ūkių pajamų pasiskirstymas nėra idealus, t.y. galima teigti, kad pajamų pasiskirstymas yra gana netolygus.6.2. Gini koeficientas

Gini koeficientas dažniausiai naudojamas kaip pajamų pasiskirstymo, netolygumo mmatas.

Kuo šis koeficientas yra didesnis, tuo pajamų pasiskirstymas yra netolygesnis. Esant absoliučiai pajamų pasiskirstymo lygybei, Gini koeficientas yra lygus nuliui. Jei visos pajamos tektų vienam namų ūkio nariui, tai Gini koeficientas būtų lygus vienam. Kai reikšmė mažesnė už 0,25, tai gyventojų pajamų diferenciacijos lygis yra labai mažas; tarp 0,25 – 0,30 – nedidelis; gautas koeficientas didesnis nei 0,30 rodo gyventojų pajamų diferenciacijos netolygumą.

Gini koeficientas skaičiuojamas pagal šią formulę:

;

Kur:

n – namų ūkių skaičius;

– vieno namų ūkio nario disponuojamų pajamų stulpelio vidurkis.

Sudarau tokią lentelę:

N (1) Vieno šeimos nario pajamos (Lt)(didėjimo tvarka) (2) (1)x(2)

32 57 1824

31 58,33 1808,23

30 91,33 2739,9

29 133,5 3871,5

28 152,75 4277

27 175 4725

26 215,67 5607,42

25 233,6 5840

24 264,5 6348

23 270 6210

22 292,75 6440,5

21 316 6636

20 331 6620

19 331,33 6295,27

18 372 6696

17 374 6358

16 405 6480

15 409,67 6145,05

14 444,33 6220,62

13 445,8 5795,4

12 469,6 5635,2

11 475,67 5232,37

10 477,5 4775

9 486 4374

8 518,33 4146,64

7 546 3822

6 567,5 3405

5 623,5 3117,5

4 798 3192

3 985 2955

2 1234 2468

1 1295 1295

432,801875 151355,6

= 432,801875 (Lt);

= 151355,6 (Lt);

n=32.

G(y)= 0,348220597.

Išvados: kadangi gautoji Gini koeficiento reikšmė yra daugiau nei 0,30, tai gyventojų pajamų pasiskirstymas, t.y. diferenciacija yra netolygi. 7. Regresinė analizė: išlaidų priklausomybės nuo kitų įvairių faktorių tyrimas

Regresinė analizė – tai vieno kintamojo priklausomybės tyrimas nuo kitų kintamųjų. Regresinės analizės kintamieji skirstomi į:

• priklausomus kintamuosius, kurie charakterizuoja rezultatą. Jų reikšmė formuojasi nagrinėjamo reiškinio viduje priklausomai nuo daugelio kitų kintamųjų reikšmių;

• nepriklausomus kintamuosius, kurie aprašo nagrinėjamo reiškinio funkcionavimą, savybes, apsprendžia rezultatą.

Regresijos lygtis:

kur:

Y – priklausomas kintamasis;

– nepriklausomieji kintamieji;

– nežinomieji kintamieji;

– atsitiktinis dydis, parodantis nukrypimus nuo taško iki tiesės.

Šioje kursinio darbo dalyje ištirsiu vienam namų ūkio nariui

tenkančių išlaidų priklausomybę nuo įvairių faktorių. Regresinėje analizėje Y – vieno namų ūkio nario išlaidos, jas įtakojančių veiksnių priklausomybei ištirti pasirenku šiuos faktorius (represorius):

1. X1 – namų ūkio disponuojamos pajamos vienam gyventojui (Lt);

2. X2 – namų ūkio galvos lytis (1 – vyras; 0 – moteris);

3. X3 – namų ūkio galvos išsimokslinimas (1 – aukštasis; 0 – kita, t.y. neturi pradinio, pradinis; pagrindinis; bendrasis vidurinis; aukštesnysis);

4. X4 – grupuotas namų ūkio galvos amžius (1 – 60 metų ir daugiau; 0 – mažiau nei 60 mmetų, t.y. amžius iki 60 metų);

5. X5 – namų ūkio galvos socialinė – ekonominė grupė (1 – pensininkai, 0 – kita, t.y. ūkininkai, samdomi darbuotojai, verslininkai).

Sudarau lentelę:

Y X1 X2 X3 X4 X5

Namų ūkio vartojimo išlaidos vienam gyventojui (Lt) Namų ūkio disponuojamos pajamos vienam gyventojui (Lt) Namų ūkio galvos lytis Namų ūkio galvos išsimokslinimas Namų ūkio galvos amžius (grupuotas) Namų ūkio galvos socialinė-ekonominė grupė

353,3333 58,3333 1 0 0 0

574,6 469,6 1 0 0 0

507,5 264,5 1 0 1 1

309,25 292,75 1 0 0 0

391 486 0 0 0 0

433,5 546 0 1 0 0

217 152,75 0 0 1 1

402 374 0 1 0 0

1131 1295 0 0 0 0

565,5 477,5 1 0 0 0

205 405 0 0 0 0

99 316 1 0 1 0

242,5 372 1 0 1 1

207,25 175 1 0 0 0

458,5 133,5 1 0 0 0

289,4 445,8 1 0 0 0

906 985 1 0 0 0

346,6667 331,3333 1 0 0 0

1030 1234 0 0 0 0

321 331 0 0 1 1

591 475,6667 0 0 0 0

495,6667 215,6667 0 0 0 0

589,6667 518,3333 1 1 0 0

78 91,3333 0 0 0 1

415 57 1 0 1 1

706,5 623,5 1 0 1 0

1220,2 798 1 1 0 0

468 270 0 0 1 1

449 444,3333 1 1 0 0

324,4 233,6 1 0 0 0

340 409,6667 0 0 0 0

562,25 567,5 1 0 0 0

Pirmiausia patikrinu, ar regresoriai tarpusavyje nėra koreliuoti (t.y. jie turi būti nepriklausomi). Šiam tikslui tikrinu koreliaciją:

X1 X2 X3 X4 X5 X6

X1 1

X2 0,824316441 1

X3 0,019792469 -0,143357898 1 <

X4 0,228087373 0,151875326 0,005476267 1

X5 -0,22234941 -0,265142603 0,036735918 -0,248451997 1

X6 -0,30341224 -0,38496402 -0,177964846 -0,227710017 0,741940827 1

Kadangi nėra reikšmės, viršijančios 0,85, tai reiškia, jog pasirinkti regresoriai nėra koreliuoti (jie nepriklausomi). Vadinasi, šie faktoriai (regresoriai) yra tinkamai parinkti.

Tikrinu regresiją:

SUMMARY OUTPUT

Regression Statistics

Multiple R 0,846597234

R Square 0,716726877

Adjusted R Square 0,662251277

Standard Error 159,2443604

Observations 32

ANOVA

df SS MS F Significance F

Regression 5 1668206,427 333641,2853 13,15684214 1,9358E-06

Residual 26 659327,9243 25358,76632

Total 31 2327534,351

Coefficients Standard Error t SStat P-value Lower 95% Upper 95% Lower 95,0% Upper 95,0%

Intercept 53,20841 80,182717 0,663589 0,512795 -111,609526 218,026342 -111,609526 218,026342

X1 0,798718 0,107980 7,396893 7,446E-08 0,576761 1,020674 0,576761 1,020674

X2 94,47842 62,238010 1,518018 0,141077 -33,453640 222,410481 -33,453640 222,410481

X3 80,75861 80,460233 1,003708 0,324770 -84,629762 246,146990 -84,629762 246,146990

X4 -49,02829 101,572884 -0,482691 0,633355 -257,814339 159,757762 -257,814339 159,757762

X5 94,05452 114,142740 0,824008 0,417430 -140,569239 328,678282 -140,569239 328,678282

Significant F<α (1,9358E-06<0,05), vadinasi bent vienas regresorius yra reikšmingas. Kadangi X4 (grupuotas .namų ūkio galvos amžius) P – value reikšmė yra didžiausia iš visų tiriamų regresorių reikšmių (P-value=0,633355) ir yra didesnė už reikšmingumo lygmenį α=0,05, šį regresorių, kaip nereikšmingą, išmetu iš tyrimo.

Sudarau naują lentelę (be X4) ir pakartoju operacijas iš naujo:

SUMMARY OUTPUT

Regression Statistics

Multiple R 0,845097

R Square 0,714188

Adjusted R Square 0,671846

Standard Error 156,9662

Observations 32

ANOVA

df SS MS F Significance F

Regression 4 1662298,1 415574,5 16,866958 4,8315E-07

Residual 27 665236,27 24638,38

Total 31 2327534,4

Coefficients Standard Error t Stat P-value Lower 95% Upper 95% Lower 95,0% Upper 95,0%

Intercept 56,28262 78,78589 0,714374 0,4811268 -105,37267 217,937908 -105,37267 217,937908

X1 0,793132 0,1058224 7,494936 4,614E-08 0,57600233 1,01026146 0,57600233 1,01026146

X2 86,34413 59,055982 1,462073 0,1552642 -34,828734 207,516994 -34,828734 207,516994

X3 85,55979 78,700797 1,087153 0,2865796 -75,920903 247,040485 -75,920903 247,040485

X5 53,66997 76,533593 0,70126 0,4891411 -103,36399 210,703928 -103,36399 210,703928

Significant F<α (4,8315E-07<0,05), vadinasi bent vienas regresorius yra reikšmingas. Kadangi X5 (namų ūkio galvos socialinė – ekonominė grupė) P – value reikšmė yra didžiausia iš visų tiriamų regresorių reikšmių (P-value=0,4891411) ir yra didesnė už reikšmingumo lygmenį α=0,05, šį regresorių, kaip nereikšmingą, išmetu iš tyrimo.

Sudarau naują llentelę (be X5) ir pakartoju operacijas vėl iš naujo:

SUMMARY OUTPUT

Regression Statistics

Multiple R 0,842011

R Square 0,708983

Adjusted R Square 0,677802

Standard Error 155,5351

Observations 32

ANOVA

df SS MS F Significance F

Regression 3 1650181,8 550060,6 22,738079 1,1558E-07

Residual 28 677352,59 24191,16

Total 31 2327534,4

Coefficients Standard Error t Stat P-value Lower 95% Upper 95% Lower 95,0% Upper 95,0%

Intercept 88,76827 63,146848 1,405743 0,1708004 -40,582183 218,118724 -40,582183 218,118724

X1 0,763343 0,0960383 7,948315 1,174E-08 0,56661716 0,96006825 0,56661716 0,96006825

X2 75,79992 56,589083 1,33948 0,1911864 -40,117563 191,717397 -40,117563 191,717397

X3 75,37164 76,642995 0,983412 0,3338265 -81,624413 232,367699 -81,624413 232,367699

Significant F<α (1,1558E-07<0,05), vadinasi bent vienas regresorius yra reikšmingas. Kadangi X3 (namų ūko galvos išsimokslinimas) P – value reikšmė yra didžiausia iš visų tiriamų regresorių reikšmių (P-value=0,3338265) ir yra didesnė už reikšmingumo lygmenį α=0,05, šį regresorių, kaip nereikšmingą, išmetu iš tyrimo.

Sudarau naują lentelę (be X3) ir pakartoju operacijas vėl iš naujo:

SUMMARY OUTPUT

Regression SStatistics

Multiple R 0,836021

R Square 0,698931

Adjusted R Square 0,678168

Standard Error 155,4468

Observations 32

ANOVA

df SS MS F Significance F

Regression 2 1626786,5 813393,3 33,661758 2,7584E-08

Residual 29 700747,84 24163,72

Total 31 2327534,4

Coefficients Standard Error t Stat P-value Lower 95% Upper 95% Lower 95,0% Upper 95,0%

Intercept 93,31927 62,941311 1,482639 0,1489569 -35,410167 222,048701 -35,410167 222,048701

X1 0,777911 0,094835 8,202791 4,809E-09 0,58395216 0,97187074 0,58395216 0,97187074

X2 77,35013 56,535026 1,368181 0,1817636 -38,276976 192,977241 -38,276976 192,977241

Significant F<α (2,7584E-08<0,05), vadinasi bent vienas regresorius yra reikšmingas. Kadangi X2 (namų ūkio galvos lytis) P – value reikšmė yra didžiausia iš visų tiriamų regresorių reikšmių (P-value=0,1817636) ir yra didesnė už reikšmingumo lygmenį α=0,05, šį regresorių, kaip nereikšmingą, išmetu iš tyrimo.

Sudarau naują lentelę (be X2) ir pakartoju operacijas vėl iš naujo:

SUMMARY OUTPUT

Regression Statistics

Multiple R 0,824316

R Square 0,679498

Adjusted R Square 0,668814

Standard Error 157,6896

Observations 32

ANOVA

df SS MS F Significance F

Regression 1 1581554 1581554 63,603042 6,6825E-09

Residual 30 745980,36 24866,01

Total 31 2327534,4

Coe.fficients Standard Error t Stat P-value Lower 95% Upper 95% Lower 95,0% Upper 95,0%

Intercept 147,2964 49,750082 2,960727 0,0059481 45,6931881 248,899633 45,6931881 248,899633

X1 0,759311 0,0952095 7,975152 6,683E-09 0,56486673 0,9537544 0,56486673 0,9537544

Significance F<α (6,6825E-09<0,05), vadinasi likęs regresorius X1 (namų ūkio disponuojamos pajamos vienam gyventojui) yra reikšmingas. Tai reiškia, kad vieno namų ūkio nario vartojimo išlaidos priklauso tik nuo jo disponuojamų pajamų. Šią priklausomybę aprašo lygtis:

Y = 147,2964 + 0,759311*X1

Y – vieno namų ūkio nario išlaidos, Lt;

X1 – vieno namų ūkio nario disponuojamos pajamos, Lt.

Didžiausios išlaidos, tenkančios vienam namų ūkio nariui, bus tada, kai jis gaus didžiausias pajamas:

Y = 147,2964 + 0,759311*X1 = 147,2964 + 0,759311*1295 = 1130,6

Mažiausios išlaidos, tenkančios vienam namų ūkio nariui, bus tada, kai jis gaus mažiausias pajamas:

Y = 147,2964 + 0,759311*X1 = 147,2964 + 0,759311*57 = 190,577

Išvados: remiantis gautais rezultatais, galima padaryti išvadą, jog vieno namų ūkio nario vartojamos iišlaidos nepriklauso nuo namų ūkio galvos lyties, išsimokslinimo, amžiaus bei socialinės – ekonominės grupės.

Determinacijos koeficiento įvertis.

Determinacijos koeficientas parodo, ar pasirinktas modelis gerai aprašo duomenis. Determinacijos koeficientas gali įgyti reikšmes iš intervalo:

08. Nustatymas: ar vieno namų ūkio nario vidutinės pajamos tiesiškai nusako namų ūkio vieno nario vidutines išlaidas

Duomenys:

X Y

Vieno namų ūkio nario pajamos (Lt) (didėjimo tvarka) Vieno namų ūkio nario išlaidos (Lt)

57 415

58,3333 353,3333

91,3333 78

133,5 458,5

152,75 217

175 207,25

215,6667 495,6667

233,6 324,4

264,5 507,5

270 468

292,75 309,25

316 99

331 321

331,3333 346,6667

372 242,5

374 402

405 205

409,6667 340

444,3333 449

445,8 289,4

469,6 574,6

475,6667 591

477,5 565,5

486 391

518,3333 589,6667

546 433,5

567,5 562,25

623,5 706,5

798 1220,2

985 906

1234 1030

1295 1131

Norint nustatyti, ar vieno namų ūkio nario vidutinės pajamos tiesiškai nusako vieno namų ūkio nario vidutines išlaidas, reikia apskaičiuoti koreliacijos koeficientą bei patikrinti, ar gautas koreliacijos koeficientas yra reikšmingas ar ne. Taip pat tuo pačiu tikslu sudarysiu regresijos lygtį ir rasiu determinacijos koeficientą.

Koreliacijos koeficientas:

Vieno namų ūkio nario pajamos (Lt) Vieno namų ūkio nario išlaidos (Lt)

Vieno namų ūkio nario pajamos (Lt) 1

Vieno namų ūkio nario išlaidos (Lt) 0,824316444 1

Išvada: gautas koreliacijos koeficientas yra arti vieneto, todėl priklausomybė tarp vieno namų ūkio nario pajamų (Lt) ir vieno namų ūkio nario išlaidų (Lt) yra labai stipri.

Beje, gautas koreliacijos koeficientas yra teigiamas, todėl tarp atsitiktinių dydžių vyrauja tiesinė priklausomybė, t.y. didėjant X, Y taip pat didėja, o mažėjant X, Y – irgi mažėja.

Vadinasi, didėjant vieno namų ūkio nario pajamoms (Lt), vieno namų ūkio nario išlaidos (Lt) taip pat didėja, ir atvirkščiai: mažėjant vieno namų ūkio nario pajamoms ((Lt), vieno namų ūkio nario išlaidos (Lt) taip pat mažėja.

Koreliacijos koeficiento reikšmingumo įvertinimas

Tikrinu hipotezę:

;

.

Koreliacijos koeficientas reikšmingas tuomet, kai . ( 0,01).

.

7,971412448.

.

.

Išvados: priklauso kritinei sričiai (KS), todėl palieku, t.y. gaunu, jog . Tai reiškia, kad koreliacijos koeficientas yra reikšmingas.

Regresijos lygtis

Duomenys:

SUMMARY OUTPUT

Regression Statistics

Multiple R 0,824316

R Square 0,679498

Adjusted R Square 0,668814

Standard Error 157,6896

Observations 32

ANOVA

df SS MS F Significance F

Regression 1 1581554 1581554 63,603042 6,6825E-09

Residual 30 745980,36 24866,01

Total 31 2327534,4

Coefficients Standard Error t Stat P-value Lower 95% Upper 95% Lower 95,0% Upper 95,0%

Intercept 147,2964 49,750082 2,960727 0,0059481 45,6931881 248,899633 45,6931881 248,899633

Vieno namų ūkio nario pajamos (Lt) 0,759311 0,0952095 7,975152 6,683E-09 0,56486673 0,9537544 0,56486673 0,9537544

Y = 147,2964 + 0,759311*X1

Y – vieno namų ūkio nario išlaidos, Lt;

X1 – vieno namų ūkio nario disponuojamos pajamos, Lt.

Didžiausios išlaidos, tenkančios vienam namų ūkio nariui, bus tada, kai jis gaus didžiausias pajamas:

Y = 147,2964 + 0,759311*X2 = 147,2964 + 0,759311*1295 = 1130,6

Mažiausios išlaidos, tenkančios vienam namų ūkio nariui, bus tada, kai jis gaus mažiausias pajamas:

Y = 147,2964 + 0,759311*X2 = 147,2964 + 0,759311*57 = 190,577

Išvada: kaip matyti iš pateiktos regresijos lygties, kuri nusako vieno namų ūkio nario išlaidų priklausomybę nuo jo gautų (disponuojamų) pajamų, parametro reikšmė: vieno namų ūkio nario pajamoms padidėjus bent vienu litu, jo išlaidos padidės 0,759311 (Lt).

Determinacijos koeficiento įvertis.

Determinacijos koeficientas – tai daugiamačio koreliacijos koeficiento kvadratas (R2).

Kaip jau minėjau 7 – oje šio kursinio darbo dalyje, determinacijos koeficientas turi patekti į intervalą: . Jis atspindi

parinkto modelio tikslumą, t.y. kuo artimesnis 1, tuo parinktas modelis geriau aprašo duomenis. Gaunu tokią determinacijos koeficiento reikšmę:

D= R2 = 0,8243162 = 0,679497198.

Išvada: modelyje aprašytas vieno namų ūkio nario pajamų vidurkis aprašo beveik 68 proc. vieno namų ūkio nario išlaidų vidurkį. Tai reiškia, kad vartojimo išlaidos (jų vidurkis) beveik 68 procentais priklauso nuo disponuojamų pajamų, o likusieji 32 procentai pri.klauso nuo kitų faktorių (neįvertintų reikšmių).

Regresijos tiesė (grafiškai)

Duomenys:

Vieno namų ūkio nario pajamos (Lt) (didėjimo tvarka) Vieno namų ūkio nario išlaidos (Lt) Predicted vieno nnamų ūkio nario vartojimo išlaidos (Lt)

57 415 190,5771165

58,3333 353,3333 191,5895053

91,3333 78 216,6467539

133,5 458,5 248,6643746

152,75 217 263,2811029

175 207,25 280,1757629

215,6667 495,6667 311,0544178

233,6 324,4 324,6713619

264,5 507,5 348,1340583

270 468 352,3102664

292,75 309,25 369,5845817

316 99 387,2385522

331 321 398,6282107

331,3333 346,6667 398,8812889

372 242,5 429,7599437

374 402 431,2785649

405 205 454,8171923

409,6667 340 458,3606669

444,3333 449 484,6833824

445,8 289,4 485,7970632

469,6 574,6 503,8686546

475,6667 591 508,475164

477,5 565,5 509,8672081

486 391 516,3213479

518,3333 589,6667 540,8723641

546 433,5 561,8799816

567,5 562,25 578,2051587

623,5 706,5 620,7265502

798 1220,2 753,2262434

985 906 895,2173186

1234 1030 1084,285649

1295 1131 1130,603593

Galutinės šios kursinio dalies išvados: Taigi, apskaičiavusi koreliacijos koeficientą, įvertinusi jo reikšmingumą, sudariusi regresijos lygtį bei apskaičiavusi determinacijos koeficientą, galiu drąsiai teigti, jog vieno namų ūkio nario vidutinės pajamos tiesiškai nusako vieno namų ūkio nario išlaidas. Beje, visa tai iliustruoja ir pateiktas grafikas.9. Pajamų, išlaidų, namų ūkio dydžio koreliacijos ir reikšmingumo įvertinimas

Duomenys:

Namų ūkio disponuojamos pajamos (Lt) Namų ūkio vartojimo išlaidos (Lt) Namų ūkio dydis

175 1060 3

2348 2873 5

1058 2030 4

1171 1237 4

1944 1564 4

1092 867 2

611 868 4

748 804 2

1295 1131 1

955 1131 2

810 410 2

1580 495 5

744 485 2

700 829 4

534 1834 4

2229 1447 5

1970 1812 2

994 1040 3

1234 1030 1

331 321 1

1427 1773 3

647 1487 3

1555 1769 3

274 234 3

114 830 2

1247 1413 2

3990 6101 5

270 468 1

1333 1347 3

1168 1622 5

1229 1020 3

2270 2249 4

Koreliacijos įvertinimas

Namų ūkio disponuojamos pajamos (Lt) Namų ūkio vartojimo išlaidos (Lt) Namų ūkio dydis

Namų ūkio ddisponuojamos pajamos (Lt) 1

Namų ūkio vartojimo išlaidos (Lt) 0,821580454 1

Namų ūkio dydis 0,500114034 0,493981601 1

Išvados:

1. gauta koreliacija tarp namų ūkio disponuojamų pajamų (Lt) ir namų ūkio vartojimo išlaidų (Lt) yra 0,821580454, t.y. arti vieneto, todėl priklausomybė tarp namų ūkio disponuojamų pajamų (Lt) ir nnamų ūkio vartojimo išlaidų (Lt) yra labai stipri.

Beje, gautas koreliacijos koeficientas yra teigiamas, todėl tarp atsitiktinių dydžių vyrauja tiesinė priklausomybė, t.y. didėjant X, Y taip pat didėja, o mažėjant X, Y – irgi mažėja.

Vadinasi, didėjant namų ūkio pajamoms (Lt), namų ūkio išlaidos (Lt) taip pat didėja, ir atvirkščiai: mažėjant namų ūkio pajamoms (Lt), namų ūkio išlaidos (Lt) taip pat mažėja.

2. gauta koreliacija tarp namų ūkio dydžio ir namų ūkio disponuojamų pajamų (Lt) yra 0,500114034, t.y. šiek tiek arčiau vieneto nei nulio, todėl galima teigti, jog priklausomybė tarp namų ūkio dydžio ir namų ūkio disponuojamų pajamų (Lt) yra nei stipri, nei silpna, t.y. vidutinė.

Beje, gautas koreliacijos koeficientas yra teigiamas, todėl tarp atsitiktinių dydžių vyrauja tiesinė priklausomybė, t.y. didėjant X, Y taip ppat didėja, o mažėjant X, Y – irgi mažėja.

Vadinasi, didėjant namų ūkio dydžiui, namų ūkio disponuojamos pajamos (Lt) taip pat didėja, ir atvirkščiai: mažėjant namų ūkio dydžiui, namų ūkio disponuojamos pajamos (Lt) taip pat mažėja.

3. gauta koreliacija tarp namų ūkio dydžio ir namų ūkio vartojimo išlaidų (Lt) yra 0,493981601, t.y. šiek tiek arčiau nulio nei vieneto, todėl galima teigti, jog priklausomybė yra nei stipri, nei silpna, t.y. vidutinė.

Beje, gautas koreliacijos koeficientas yra teigiamas, todėl tarp atsitiktinių dydžių vyrauja tiesinė priklausomybė, tt.y. didėjant X, Y taip pat didėja, o mažėjant X, Y – irgi mažėja.

Vadinasi, didėjant namų ūkio dydžiui, namų ūkio vartojimo išlaidos (Lt) taip pat didėja, ir atvirkščiai: mažėjant namų ūkio dydžiui, namų ūkio vartojimo išlaidos (Lt) taip pat mažėja.

Koreliacijos reikšmingumo įvertinimas

Tikrinu tris tokias hipotezes:

;

.

Koreliacijos koeficientas reikšmingas tuomet, kai . ( 0,01).

.

1. kai r = 0,821580454, tai:

7,971412448.

2. kai r = 0,500114034, tai:

3,163239389.

3. kai r = 0,493981601, tai:

3,111828273.

.

.

Išvados: visos gautosios trys priklauso kritinei sričiai (KS), todėl palieku, t.y. gaunu, jog . Tai reiškia, kad koreliacijos koeficientas tarp:

• namų ūkio disponuojamų pajamų (Lt) ir namų ūkio vartojimo išlaidų (Lt);

• namų ūkio dydžio ir namų ūkio disponuojamų pajamų (Lt);

• namų ūkio dydžio ir namų ūkio vartojimų išlaidų (Lt)

yra reikšmingas.Išvados

Bendra charakteristika. Kokybinių duomenų apibendrinimas. Buvo stebimi 32 namų ūkiai, iš kurių:

• daugiausiai gyvena 5 -iuose didžiuosiuose miestuose (net 17 namų ūkių iš 32);

• daugiausiai yra šeimų, susidedančių iš dviejų ir trijų asmenų (25 proc.);

• arti pusės tiriamų namų ūkių vartojimo išlaidos viršija disponuojamas pajamas;

• daugiausiai, t.y. net 22 tiriamų namų ūkių galvos socialinė – ekonominė grupė – samdomi darbuotojai.

Kiekybinių duomenų apibendrinimas. Stebėjimų sekoje:

• vidutinis namų ūkio dydis yra 3,03125 (apytiksliai po tris asmenis);

• vidutinės disponuojamos pajamos – 1188, 96875 (Lt);

• vidutinės vvartojimo išlaidos – 1361,90625 (Lt).

Vieno šeimos nario išlaidų kaime ir mieste palyginimas. Kad galėčiau nustatyti, ar skiriasi vieno šeimos nario išlaidos kaime ir mieste patikrinau šias hipotezes:

• Hipotezė apie dviejų dispersijų lygybę.

Išvada: , todėl hipotezė priimama. Tai reiškia, jog dispersijos yra lygios.

• Hipotezė apie dviejų vidurkių lygybę.

Išvada: , todėl hipotezę apie vidurkius galima priimti, nors išlaidų vidurkis mieste yra didesnis beveik 150 litų (147,45278 Lt).

Patikrinimas: ar namų ūkio santaupos didėja. Patikrinime: ar namų ūkių santaupos didėja gavau tokias išvadas: , todėl H0 yra teisinga. Namų ūkio santaupos nedidėja.

Skurdo rodiklių įvertinimas. Apskaičiavusi skurdo rodiklius, gavau, kad:

skurdo riba yra lygi 196,1186 (Lt);

20,62 proc. visų stebimų gyventojų pajamos yra žemiau skurdo ribos;

vidutiniškai 38,61 proc. skurstančiųjų pajamos nukrypsta nuo skurdo ribos;

reikia 7,96 proc. lėšų, norint eliminuoti skurdą šalyje.

Namų ūkių nelygybės išanalizavimas: Lorenco kreivė, Gini koeficientas. Išanalizavusi namų ūkio nelygybę, t.y. nubrėžus Lorenco kreivę bei apskaičiavus Gini koeficientą, priėjau tokią išvadą: stebimų 32 namų ūkių pajamų pasiskirstymas (diferenciacija) yra netolygus.

Regresinė analizė: išlaidų priklausomybės nuo kitų įvairių faktorių tyrimas. Atlikusi regresinę analizę, priėjau išvadą, jog vieno namų ūkio nario vartojimo išlaidos priklauso tik nuo jo disponuojamų pajamų, t.y. remiantis gautais rezultatais, galima padaryti išvadą, jog vieno namų ūkio nario vartojamos išlaidos nepriklauso nuo namų ūkio galvos lyties, iišsimokslinimo, amžiaus bei socialinės – ekonominės grupės. Gavau šią priklausomybę aprašančią lygtį:

Y = 147,2964 + 0,759311*X1

Determinacijos koeficientas. Gavau, kad R2 = 0,8243162 = 0,679497198. Tai reiškia, kad vartojimo išlaidos beveik 68 procentais priklauso nuo disponuojamų pajamų, o likusieji 32 procentai priklauso nuo kitų faktorių (neįvertintų reikšmių).

Nustatymas: ar vieno namų ūkio nario vidutinės pajamos tiesiškai nusako namų ūkio vieno nario vidutines išlaidas. Nustatyme ar vieno namų ūkio nario vidutinės pajamos tiesiškai nusako namų ūkio vieno nario vidutines išlaidas, t.y. apskaičiavusi koreliacijos koeficientą, įvertinusi jo reikšmingumą, sudariusi regresijos lygtį bei apskaičiavusi determinacijos koeficientą, priėjau tokią išvadą, jog vieno namų ūkio nario vidutinės pajamos tiesiškai nusako vieno namų ūkio nario išlaidas.

Pajamų, išlaidų, namų ūkio dydžio koreliacijos ir reikšmingumo įvertinimas. Galutinės šio kursinio darbo paskutinės dalies išvados: visos gautosios trys priklauso kritinei sričiai (KS), todėl palieku, t.y. gaunu, jog . Tai reiškia, kad koreliacijos koeficientas tarp:

• namų ūkio disponuojamų pajamų (Lt) ir namų ūkio vartojimo išlaidų (Lt);

• namų ūkio dydžio ir namų ūkio disponuojamų pajamų (Lt);

• namų ūkio dydžio ir namų ūkio vartojimų išlaidų (Lt)

yra reikšmingas.