NAMŲ ŪKIO BIUDŽETO TYRIMO STATISTINIŲ DUOMENŲ ANALIZĖ ŪKIO STATISTIKOS IR EKONOMETRIJOS KURSINIS PROJEKTAS
Turinys
Įvadas…………………………3
1. BENDRA NAMŲ ŪKIO CHARAKTERISTIKA………………8
1.1. Kiekybiniai duomenys…………………………8
1.2. Kokybiniai duomenys…………………………10
2. Vieno namų ūkio nario vidutinis pajamų pasiskirstymas…………..14
3. Vieno šeimos nario išlaidų kaime ir mieste palyginimas…………..17
4. Patikrinimas: ar namų ūkio santaupos didėja………………..21
5. Skurdo rodiklių įvertinimas………………………..22
6. Namų ūkių nelygybės išanalizavimas: Lorenco kreivė, Gini koeficientas……25
6.1. Lorenco kreivė…………………………25
6.2. Gini koeficientas…………………………26
7. Regresinė analizė: išlaidų priklausomybės nuo kitų įvairių faktorių tyrimas…27
8. Nustatymas: ar vieno namų ūkio nario vidutinės pajamos tiesiškai nusako namų ūkio vieno nario vidutines išlaidas……………………..34
9. Pajamų, išlaidų, namų ūkio dydžio koreliacijos ir reikšmingumo įvertinimas…38
Išvados…………………………42Įvadas
Terminas „ūkio sstatistika“ yra termino „ekonominė statistika“ atitikmuo.
Ūkio statistika:
• tiria ūkinių procesų ir reiškinių kiekybę;
• pateikia statistinių tyrimų atlikimo metodiką;
• pateikia matų sistemą konkretiems reiškiniams ir procesams apibūdinti. Tam naudojami kompleksiniai reiškinių analizės būdai.
• supažindina su statistinių metodų ir ekonometrinių modelių taikymo ūkiniams procesams analizuoti metodika.
Ekonometrija tai atskira disciplina, kuri apjungia teorinius rezultatus, metodus, modelius skirtus suteikti konkrečias skaitines reikšmes ekonominiams reiškiniams naudojantis:
• ekonomikos teorija;
• ekonometrinė statistika;
• matematiniais statistiniais metodais.
Ekonometrija yra tarpinis ekonomikos, statistikos ir matematikos mokslas, t.y. mokslas, kuris nustato empirinius ekonomikos dėsnius. Nagrinėjami stebėjimo duomenys, kkurių pagrindu gaunamos kiekybinės ekonominių santykių išraiškos (priklausomybės), kuriami ekonominiai modeliai, įvertinami nežinomi jų parametrai, skaičiuojamos prognozės.
Ekonometrijos tikslai:
• ekonominių ir socialinių rodiklių analizė;
• rodiklių prognozė;
• šalies socialinio-ekonominio vystymosi imitavimas.
Šio kursinio darbo tikslai ir uždaviniai:
1. pateikti bendrą namų ūkių charakteristiką (aprašomoji statistika);
2. įvertinti vieno namų ūūkio nario vidutinių pajamų pasiskirstymą;
3. patikrinti ar skiriasi vieno šeimos nario išlaidos kaime ir mieste;
4. patikrinti ar namų ūkių santaupos didėja;
5. įvertinti skurdo rodiklius;
6. išanalizuoti namų ūkių nelygybę: Gini koeficientas, Lorenco kreivė;
7. ištirti išlaidų priklausomybę nuo kitų įvairių faktorių (regresinė analizė);
8. nustatyti, ar vieno namų ūkio nario vidutinės pajamos tiesiškai nusako namų ūkio vieno nario vidutines išlaidas;
9. įvertinti pajamų, išlaidų, namų ūkio dydžio koreliaciją ir jos reikšmingumą.
Šiame kursiniame darbe yra vartojamos tokios pagrindinės sąvokos:
Namų ūkis – tai gali būti:
• atskirai gyvenantis vienas asmuo;
• asmenų grupė, gyvenanti viename bute ar name ir turinti bendrą biudžetą.
Beje, asmenys, gyvenantys instituciniuose namų ūkiuose, nėra tiriami. Tai gali būti: senelių namai, įkalinimo įstaigos ir pan.
Namų ūkio galva – tai asmuo, turintis didžiausias pajamas. Tiksliau tariant, tai asmuo, kuris, ūkio narių nuomone, per metus ggauna didžiausias pajamas. Tačiau kai didžiausias pajamas gaunančio asmens išskirti negalima (pvz., visa šeima ūkininkauja ir pajamų negalima priskirti kuriam nors ūkio nariui), namų ūkio galva laikomas asmuo, kurį nurodo šeima.
Namų ūkio galvos socialinė-ekonominė grupė:
• ūkininkai (namų ūkio galvos pagrindinis pajamų šaltinis yra asmeninis žemės ūkis);
• samdomieji darbuotojai (namų ūki galvos pagrindinis pajamų šaltinis yra samdomas darbas visuomeniniame arba privačiame sektoriuje);
• verslininkai (namų ūkio galvos pajamos yra iš verslo, amatų, laisvos profesinės veiklos);
• pensininkai (namų ūkio galvos pajamos yra pensija);
• kiti (namų ūkio galvos pagrindinis ppajamų šaltinis yra įvairios pašalpos, stipendija, pajamos iš turto bei kiti pajamų šaltiniai).
Namų ūkio tipas. Jis nustatomas pagal namų ūkio demografinę sudėtį. Išskiriami šie tipai:
• vienišas asmuo;
• vienas suaugęs asmuo su vaikais iki 18 m.;
• sutuoktinių pora su vaikais iki 18 m.;
• kiti namų ūkiai su vaikais iki 18 m. Šiam tipui priklauso namų ūkiai, kuriuos sudaro tėvai su vaikais iki 18 m. ir vyresniais, kelių kartų namų ūkiai su vaikais iki 18 metų, seneliai su anūkais iki 18 metų ir pan.;
• sutuoktinių pora be vaikų;
• kiti namų ūkiai be vaikų.
Tačiau šiame kursiniame darbe nagrinėjami šie namų ūkio tipai:
• namų ūkis su vaikais 18 metų;
• namų ūkis be vaikų iki 18 metų.
Disponuojamos pajamos – tai visos piniginės ir natūrinės pajamos, kurios gali būti gaunamos:
• už darbą,
• iš ūkininkavimo,
• iš verslo,
• iš amatų,
• iš laisvos profesinės veiklos,
• taip pat pensijos, įvairios pašalpos, stipendijos,
• pajamos iš turto, re.nta ir t.t.
Vartojimo išlaidos – tai piniginės ir natūrinės išlaidos, skirtos namų ūkio vartojimo poreikiams patenkinti, t.y. išlaidos:
• maistui
• būstui
• drabužiams
• sveikatos priežiūrai ir t.t.
Skurdo riba – tai kriterijus, kurio pagalba analitikai suskirsto individus, šeimas, namų ūkius į:
• skurstančiuosius;
• neskurstančiuosius.
Reikia atkreipti dėmesį į tai jog skurdo sąvoka yra daugiaprasmė ir kinta vystantis visuomenei, taip pat gali būti labai skirtingai suprantama įvairiose šalyse. Tarkim Europos Konsiliume 1984 m. lapkričio 19 dieną skurdo sąvoka buvo apibrėžta taip: „„skurdžiais vadinami asmenys, šeimos, asmenų grupės, kurių ištekliai (materialiniai, kultūriniai ir socialiniai) yra nepakankami savo šalyje susiklosčiusiam minimaliam gyvenimo būdui užtikrinti.
Yra išskiriami 3 skurdo ribų tipai:
1. Absoliuti- tai minimalus pajamų ar išlaidų dydis būtinoms reikmėms patenkinti (Lietuvoj-MGL).
2. Santykinė- skurdo slenkstis siejamos su šalies vidutiniais pajamų/išlaidų rodikliais ir priklauso nuo jų.
3. Subjektyvi- atsižvelgiama į respondentų nuomonę apie juos pačius.
Skurdo rodikliai – skaičiuojant skurdo rodiklius, namų ūkio dydis gali būti įvertinamas pagal paprastą ir ekvivalentinę skales.
Pagrindiniai skurdo rodikliai:
• skurstančiųjų gyventojų lygis šalyje- rodiklis, parodantis šalies gyventojų dalį kurių pajamos yra žemiau skurdo ribos.
• žemų pajamų nuokrypis- parodo, kiek vidutiniškai skurstančiųjų pajamos nukrypsta nuo skurdo ribos (parodo skurdo gilumą).
• žemų pajamų indeksas- parodo, kiek lėšų reikia eliminuoti skurdą šalyje.
• kvadratinis skurdo nuokrypis- skurdo intensyvumo rodiklis, kuris atspindi pajamų pasiskirstymą tarp skurstančiųjų. Kuo daugiau šalyje yra skurstančiųjų, tuo didesnis šis rodiklis.
Duomenys, panaudoti šiame kursiniame darbe
Namų ūkio dydis
Namų ūkio disponuojamos pajamos (Lt)
Gyvenamoji vieta
1. 5 didieji miestai
2. Kiti miestai
3. Kaimas
Namų ūkiai su vaikais ir be vaikų
1. Namų ūkis su vaikais iki 18 metų
2. Namų ūkis be vaikų iki 18 metų
Namų ūkio galvos pagrindinis šaltinis
1. Darbas asmeniniame žemės ūkyje
2. Samdomas darbas žemės ūkio visuomeniniame sektoriuje
3. Samdomas darbas žemės ūkio privačiame sektoriuje
4. Pajamos iš verslo, amatų
5. Samdomas darbas ne žemės ūkio visuomeniniame sektoriuje
6. Samdomas darbas ne žemės ūkio privačiame sektoriuje
7. Pajamos iš laisvos profesinės veiklos
8. Bedarbio pašalpa
9. Stipendija
10. Pensija
11. Socialinės pašalpos
12. Išlaikytiniai
13. Kitas ppajamų šaltinis
Namų ūkio galvos lytis
1. Vyras
2. Moteris
Namų ūkio galvos socialinė-ekonominė grupė
1. Ūkininkai
2. Samdomi darbuotojai
3. Verslininkai
4. Pensininkai
5. Kita
Namų ūkio galvos išsimokslinimas
1. Neturi pradinio, pradinis
2. Pagrindinis
3. Bendras vidurinis
4. Aukštesnysis
5. Aukštasis
Namų ūkio galvos amžius (grupuotas)
1. iki 30 metų
2. 30-39 metai
3. 40-49 metai
4. 50-59 metai
5. 60 metų ir daugiau
Miestas-Kaimas
1. Miestas
2. Kaimas
Namų ūkio vartojimo išlaidos1. BENDRA NAMŲ ŪKIO CHARAKTERISTIKA
1.1. Kiekybiniai duomenys
Charakteristikų apibrėžimai:
1. Vidurkis – tai visų stebėtų skaitinių duomenų suma, padalinta iš duomenų skaičiaus. Jis rodo vidutinę atsitiktinio dydžio reikšmę.
2. Dispersija – tai išsibarstymo apie vidurkį matas. Tai skirtumų tarp stebėtų duomenų reikšmių ir vidurkio kvadratų vidurkis.
3. Vidutinis kvadratinis nuokrypis – tai kvadratinė šaknis iš dispersijos.
4. Mediana – tai vidurinis duomuo stebėjimų sekoje, išdėstytoje didėjimo tvarka, t.y. skaičius, perskirstantis variacinę eilutę į dvi maždaug lygias dalis.
5. Moda – tai reikšmė, kuri pasikartoja dažniausiai. Jei visi duomenys pasikartoja po vieną kartą, tai modos rasti negalime.
6. Asimetrijos koeficientas – parodo pasiskirstymo simetriškumą, Jei asimetrijos koeficientas:
• >0, tai asimetrija yra teigiama (dešinioji asimetrija);
• =0, tai rodo, kad yra asimetrija;
• <0, tai asimetrija yra neigiama (kairioji asimetrija).
7. Ekscesas – tai simetrijos koeficientas (matas). Kai šis koeficientas:
• >0, tai duomenų sklaida apie vidurkį yra didesnė už normaliąją kreivę;
• =0, tai duomenų sklaida apie vidurkį yra tokia pati kaip ir normalios kreivės;
• <0, tai duomenų sklaida apie vidurkį yra mažesnė už normaliąją kreivę.
8. Duomenų plotis – tai maksimalios ir minimalios stebėjimų sekos duomenų reikšmių skirtumas, kuris parodo stebimų duomenų reikšmių diapazoną.
9. Minimali reikšmė –
tai stebimų duomenų sekoje esanti mažiausia reikšmė.
10. Maksimali reikšmė – tai stebimų duomenų sekoje esanti didžiausia reikšmė.
Taigi rasiu šias pagrindines kiekybines charakteristikas šiems duomenims: namų ūkio dydis; namų ūkio disponuojamos pajamos; namų ūkio vartojimo išlaidos (žr. žemiau esančiose lentelėse). Ir padarysiu atitinkamas išvadas apie tai.
Namų ūkio dydis Namų ūkio disponuojamos pajamos (Lt) Namų ūkio vartojimo išlaidos (Lt)
3 175 1060
5 2348 2873
4 1058 2030
4 1171 1237
4 1944 1564
2 1092 867
4 611 868
2 748 804
1 1295 1131
2 955 1131
2 810 410
5 1580 495
2 744 485
4 700 829
4 534 1834
5 2229 1447
2 1970 1812
3 994 1040
1 1234 1030
1 331 321
3 1427 1773
3 647 1487
3 1555 1769
3 274 234
2 114 830
2 1247 1413
5 3990 6101
1 270 468
3 1333 1347
5 1168 1622
3 1229 1020
4 2270 2249
Pagrindinės charakteristikos Namų ūkio dydis Namų ūkio disponuojamos pajamos (Lt) Namų ūkio vartojimo išlaidos (Lt)
Vidurkis 3,03125 1188,96875 1361,90625
Standartinė paklaida 0,226671102 140,4037201 186,1173557
Mediana 3 1130 1131
Moda 3 negalima reikšmė 1131
Vidutinis kvadratinis nuokrypis 1,282245384 794,2433804 1052,838754
Dispersija 1,644153226 630822,5474 1108469,443
Eksceso koeficientas -1,019131513 3,724180142 13,14302642
Asimetrijos koeficientas 0,036244666 1,476204565 3,092761232
Duomenų plotis 4 3876 5867
Minimali reikšmė 1 114 234
Maksimali reikšmė 5 3990 6101
Suma 97 38047 43581
Duomenų skaičius 32 32 32
Vidurkio paklaida (95,0%) 0,462299017 286,3554347 379,5890612
Namų ūkio ddydis.
Apskaičiavus, t.y. ir kaip matyti pateiktoje lentelėje, vidutinis namų ūkio dydis yra 3,03125 (apytiksliai po tris asmenis). Mediana lygi 3, t.y. vidurinis duomuo namų ūkio dydžio stebėjimo sekoje, išdėstytoje didėjimo tvarka yra 3. Moda taip pat lygi 3, kas rodo, jog namų ūkiai šio stebėjimo sekoje su trimis nariais pasitaiko dažniausiai. Dispersija lygi 1,644153226, vidutinis kvadratinis nuokrypis 1,282245384. Asimetrijos koeficientas 0,036244666, tai simetrija yra teigiama (dešinioji asimetrija). Duomenų plotis lygus 4. Minimali stebėta reikšmė 1 (mažiausias iš visų stebimų namų ūūkių yra namų ūkis, kurį sudaro tik vienas asmuo), o maksimali 5 (didžiausias namų ūkis yra iš penkių asmenų). Bendras visų stebimų namų ūkių narių skaičius yra 97, iš viso stebimi 32 namų ūkiai.
Namų ūko disponuojamos pajamos.
Stebėjimų sekoje vidutinės disponuojamos ppajamos – 1188, 96875. Mediana lygi – 1130, tai reiškia, kad išdėsčius namų ūkių disponuojamas pajamas didėjimo tvarka, vidurį gausime 1130. Moda negalima. D.ispersija lygi 630822,5474, vidutinis kvadratinis nuokrypis 794,2433804. Asimetrijos koeficientas lygus 1,476204565 . Duomenų plotis – t.y. skirtumas tarp maksimumo ir minimumo, lygus 3876. Minimali stebėta reikšmė yra 114 (mažiausia namų ūkio disponuojamų pajamų suma), o maksimali 3990 (tokia didžiausia namų ūkio disponuojamų pajamų suma). Visų namų ūkių išlaidos sudaro 38047, iš viso yra 32 stebėjimai.
Namų ūkio vartojimo išlaidos.
Stebėjimų sekoje vidutinės vartojimo išlaidos – 1361,90625. Mediana lygi – 1131, tai reiškia, kad išdėsčius namų ūkių disponuojamas pajamas didėjimo tvarka, vidurį gausime 1131. Moda lygi medianai, t.y. lygi 1131, tai reiškia, kad tokios sumos vartojimo išlaidos pasitaiko dažniausiai. Dispersija llygi 1108469,443, vidutinis kvadratinis nuokrypis 1052,838754. Asimetrijos koeficientas lygus 3,092761232, tai reiškia, jog simetrija yra teigiama (dešinioji asimetrija). Duomenų plotis – t.y. skirtumas tarp maksimumo ir minimumo, lygus 5867. Minimali stebėta reikšmė yra 234 (mažiausia namų ūkio disponuojamų pajamų suma), o maksimali 6101 (tokia didžiausia namų ūkio disponuojamų pajamų suma). Visų namų ūkių vartojimo išlaidos sudaro 43581, iš viso yra 32 stebėjimai.1.2. Kokybiniai duomenys
Gyvenamoji vieta.
Mano kursinio darbo varianto duomenimis nagrinėjami 32 namų ūkiai. Iš jų:
• 5-kiuose didžiuosiuose miestuose gyvena 17 namų ūūkių;
• Kituose miestuose – 9 namų ūkiai;
• Kaimuose -6 namų ūkiai.
Taigi mažiausiai namų ūkių gyvena kaimuose (18,75 proc.), daugiausiai namų ūkių gyvena didžiuosiuose miestuose (53,125 proc.), o kituose miestuose gyvena 28,125 proc. visų stebimų namų ūkių (žr. į žemiau esančią diagramą).
Namų ūkio dydis.
Nagrinėjant namų ūkio dydį, galima įsigilinti, koks skaičius namų ūkių susideda iš vieno, dviejų, trijų, keturių ar penkių asmenų.
Namų ūkio dydis Namų ūkių skaičius
1 4
2 8
3 8
4 7
5 5
Taigi, kaip matyti iš aukščiau pateiktos lentelės bei skritulinės diagramos, iš nagrinėjamų 32 namų ūkių daugiausiai yra šeimų, susidedančių iš dviejų ir trijų asmenų (25 proc.), o mažiausią dalį iš visų nagrinėjamų namų ūkių užima šeimos, sudarytos iš vieno asmens (12,5 proc.).
Namų ūkių pajamų ir išlaidų palyginimas.
Namų ūkio
eilės nr. Namų ūkio
disponuojamos pajamos (Lt) Namų ūkio
vartojimo išlaidos (Lt)
1 175 1060
2 2348 2873
3 1058 2030
4 1171 1237
5 1944 1564
6 1092 867
7 611 868
8 748 804
9 1295 1131
10 955 1131
11 810 410
12 1580 495
13 744 485
14 700 829
15 534 1834
16 2229 1447
17 1970 1812
18 994 1040
19 1234 1030
20 331 321
21 1427 1773
22 647 1487
23 1555 1769
24 274 234
25 114 830
26 1247 1413
27 3990 6101
28 270 468
29 1333 1347
30 1168 1622
31 1229 1020
32 2270 2249
Akivaizdu, jog arti pusės tiriamų namų ūkių išlaidos viršija disponuojamas pajamas. Beje, 27-ojo pagal eilės numerį namų ūkio vartojimo išlaidos yra daugiau nei 2000 litų didesnės nei disponuojamos pajamos.
Namų ūkio galvos socialinė – ekonominė grupė.
Nagrinėdami namų ūkius pagal socialinę-ekonominę grupę, matome, kad:
1. Ūkininkai 0
2. Samdomi darbuotojai 22
3. Verslininkai 2
4. Pensininkai 7
5. Kita 1
Iš pateiktų duomenų matyti, jog didžiausią dalį sudaro samdomi darbuotojai, t.y. net 22 iš 32, mažiausią – ūkininkai ir kita, atitinkamai: 0 ir 1.2. Vieno namų ūkio nario vidutinis pajamų pasiskirstymas
Pirmiausiai aapskaičiuoju kiekvieno iš 32 stebimų namų ūkių vieno namų ūkio nario vidutinį pajamų pasiskirstymą (namų ūkio disponuojamos pajamos/namų ūkio dydis).
Namų ūkio dydis Namų ūkio disponuo-jamos pajamos (Lt) Vieno namų ūkio nario vidutinis pajamų pasiskirstymas (Lt)
3 175 58,3333
5 2348 469,6
4 1058 264,5
4 1171 292,75
4 1944 486
2 1092 546
4 611 152,75
2 748 374
1 1295 1295
2 955 477,5
2 810 405
5 1580 316
2 744 372
4 700 175
4 534 133,5
5 2229 445,8
2 1970 985
3 994 331,3333
1 1234 1234
1 331 331
3 1427 475,6667
3 647 215,6667
3 1555 518,3333
3 274 91,3333
2 114 57
2 1247 623,5
5 3990 798
1 270 270
3 1333 444,3333
5 1168 233,6
3 1229 409,6667
4 2270 567,5
Toliau atlieku tokius skaičiavimus:
• randu minimalią reikšmę iš rastų vieno namų ūkio nario vidutinio pajamų pasiskirstymo duomenų (litais). Gauta minimali reikšmė: 57 (Lt);
• randu maksimalią reikšmę iš to paties stulpelio duomenų. Maksimali reikšmė: 1295 (Lt);
• apskaičiuoju, kiek mano turimais duomenimis geriausia paimti intervalų. Pagal formulę: k=1+3,322lg*(n) gaunu, jog k yra apytiksliai lygus 6;
• apskaičiuoju intervalo dydį pagal formulę: ir gaunu, jog intervalo dydis (d)=206,333 (Lt)
• iš pradžių randu intervalų galus pagal tokias formules: ; ; ; . Tačiau apskaičiavusi , gaunu neigiamą skaičių. Todėl apskaičiuoju pagal tokią formulę: . Taigi randu tokius intervalų galus:
Randu intervalų galus:
t0 57
t1 263,3333
t2 469,6667
t3 676
t4 882,3333
t5 1088,6667
t6 1295
• šią sudarytą lentelę panaudoju tolimesniems skaičiavimams, t.y. gaunu tokius duomenis:
Bin Frequency
57 1
263,3333 7
469,6667 13
676 7
882,3333 1
1088,6667 1
1295 2
More 0
• kad galėčiau įvertinti vieno namų ūkio nario vidutinį pasiskirstymą, t.y. nubrėžti histogramą, sudarau tokias lenteles:
(57; 263,33] (263,33; 469,67] (469,67; 676] (676; 882,33] (882,33; 1088,67] (1088,67; 1295] Suma
Dažnis 8 13 7 1 1 2 32
Santykiniai dažniai 0,25 0,40625 0,21875 0,03125 0,03125 0,0625 1
Sukaupti sant.dažniai 0,25 0,65625 0,875 0,90625 0,9375 1
S1 S2 S3 S4 S5 S6
(0; 57] (57; 263,33] (263,33; 469,67] (469,67; 676] (676; 882,33] (882,33; 1088,67] (1088,67; 1295]
0 0
0,25 0,25
0,65625 0,65625
0,875 0,875
0,90625 0,90625
0,9375 0,9375
1 1
Gaunu tokį vieno namų ūkio nario vidutinį pajamų pasiskirstymą:3. Vieno šeimos nario išlaidų kaime ir mieste palyginimas
Patikrinimui, ar skiriasi vieno šeimos nario išlaidos kaime ir mieste, naudojami tokie pradiniai duomenys (žr. 3.1. lentelę), kurių pagalba, t.y. namų ūkio vartojimo išlaidas (Lt) padalijus iš namų ūkio dydžio, gaunu vieno namų ūkio nario duomenis kaime ir mieste (žr. 3.2. lentelę).
3.1. lentelė 3.2. lentelė
Namų ūkio dydis Namų ūkio vartojimo išlaidos (Lt)
3 1060
5 2873
4 2030
4 1237
4 1564
2 867
4 868
2 804
1 1131
2 1131
2 410
5 495
2 485
4 829
4 1834
5 1447
2 1812
3 1040
1 1030
1 321
3 1773
3 1487
3 1769
3 234
2 830
2 1413
5 6101
1 468
3 1347
5 1622
3 1020
4 2249
Vieno namų ūkio nario išlaidos (Lt) Miestas-kaimas
353,3333 2
574,6 1
507,5 2
309,25 1
391 1
433,5 1
217 1
402 1
1131 1
565,5 1
205 1
99 1
242,5 1
207,25 1
458,5 2
289,4 1
906 1
346,6667 1
1030 1
321 1
591 1
495,6667 1
589,6667 1
78 2
415 2
706,5 1
1220,2 1
468 1
449 1
324,4 2
340 1
562,25 1
Kad būtų įmanoma atlikti tolimesnius skaičiavimus, sudarau dar vieną lentelę, kurioje duomenys grupuojami taip:
Vieno namų ūkio nario išlaidos (Lt) Miestas-kaimas
574,6 1
309,25 1
391 1
433,5 1
217 1
402 1
1131 1
565,5 1
205 1
99 1
242,5 1
207,25 1
289,4 1
906 1
346,6667 1
1030 1
321 1
591 1
495,6667 1
589,6667 1
706,5 1
1220,2 1
468 1
449 1
340 1
562,25 1
353,3333 2
507,5 2
458,5 2
78 2
415 2
324,4 2
Statistinių hipotezių tikrinimas (teorijos apžvalga).
Bet koks tvirtinimas apie atsitiktinio dydžio pasiskirstymo formą ar apie pasiskirstymo parametrų reikšmes vadinamas statistine hipoteze. Pradinė hipotezė vadinama nuline hipoteze arba pagrindine ir žymima , priešinga šiai hipotezei yra alternatyvioji hipotezė, kuri žymima .
Statistiniais metodais tikrindami hipotezės teisingumą, galime padaryti dviejų rūšių klaidas. Pirmosios rūšies klaidą padarome tada, kai atmetame hipotezę , kai ji yra teisinga. Antros rūšies klaida padaroma, jei hipotezė priimama, nors ji ir yra klaidinga (žr. į žemiau esančią lentelę).
Hipotezė Teisinga Klaidinga
Atmetama Pirmos rūšies klaida Teisingas sprendimas
Priimama Teisingas sprendimas Antros rūšies klaida
Taisyklę, pagal kurią iš imties duomenų darome išvadą apie hipotezės teisingumą ar klaidingumą, vadiname statistiniu kriterijumi arba tiesiog kriterijumi.
Hipotezės apie dispersijų
ir dviejų vidurkių lygybę tikrinimas.
Tarkime, kad X ir Y yra normalieji atsitiktiniai dydžiai. Sprendžiant praktinius uždavinius, dažnai tenka atsakyti į klausimą: ar iš esmės skiriasi nagrinėjamų atsitiktinių dydžių vidurkiai EX ir EY.
Tegu , ,., ir , ,., yra šių atsitiktinių dydžių nepriklausomos imtys. Į suformuluotą klausimą galima atsakyti patikrinus hipotezę su alternatyva , esant reikšmingumo lygmeniui a.
Jei imtys yra mažos ir vidutiniai kvadratiniai nuokrypiai ir nėra žinomi, hipotezei su alternatyva tikrinti taikomas Stjudento kriterijus. Tačiau šiuo atveju prireikia papildomos sąlygos . Tada naudojamasi statistika, kuri galiojant hipotezei , yra Stjudento skirstinys.
t=
Pagal reikšmingumo lygmenį a ir laisvės laipsnių skaičių k=m+n-1.
Panašus priklausomų imčių kriterijus naudojamas ekonominiams skaičiavimams, nustatant ekonominių rodiklių kitimo pobūdį. Tuo tikslu imtis , , padalijama į dvi dalis: , , ir ,., . Apskaičiavus šių imčių vidurkius ir , tikrinama hipotezė . Jei ji teisinga, galima tvirtinti, kad nagrinėjamasis rodiklis nekinta.
Nežinant, ar imčių , ,., ir , ,., dispersijos lygios, natūralu pirmiau tikrinti hipotezę apie dispersijų lygybę, t.y. . Šiai hipotezei tikrinti taikomas Fišerio kriterijus. Randama statistikos reikšmė, iš Fišerio skirstinio lentelės pagal pasirinktąjį reikšmingumo lygmenį nustatoma kritinė sritis. Jei statistinė reikšmė patenka į kritinę sritį, hipotezė atmetama, priešingu atveju – priimama.
Hipotezė apie dviejų dispersijų lygybę.
.Tikrinu tokią hhipotezę:
F-Test Two-Sample for Variances
Mieste Kaime
Vidurkis 503,575 356,1222222
Dispersija 84252,45805 23045,8163
Observations 26 6
df 25 5
F 3,655867814
P(F<=f) one-tail 0,076711569
F Critical one-tail 4,520899211
Kaip matyti iš gautų duomenų, , todėl hipotezė priimama. Tai reiškia, jog dispersijos yra lygios.
Hipotezė apie dviejų vidurkių lygybę.
Kadangi gavau, kad dispersijos lygios, toliau tikrinu, ar vidurkiai yra lygūs, ar ne. Tikrinu tokią hipotezę:
t-Test: Two-Sample Assuming Equal Variances
Mieste Kaime
Vidurkis 503,575 356,122222
Dispersija 84252,45805 23045,8163
Observations 26 6
Pooled Variance 74051,35109
Hypothesized Mean Difference 0
df 30
t Stat 1,196392757
P(T<=t) one-tail 0,120456678
t Critical one-tail 1,697260851
P(T<=t) two-tail 0,240913355
t Critical two-tail 2,042272449
Išvados: , todėl hipotezę apie vidurkius galima priimti, nors išlaidų vidurkis mieste yra didesnis beveik 150 litų (147,45278 Lt).4. Patikrinimas: ar namų ūkio santaupos didėja
Norint patikrinti, ar namų ūkio santaupos didėja, pirmiausia reikia apskaičiuoti visų stebimų namų ūkių santaupas iš kiekvieno namų ūkio disponuojamų pajamų (litais) atitinkamai atėmus namų ūkio vartojimo išlaidas (litais) (žr. į žžemiau esančią lentelę).
Namų ūkio disponuojamos pajamos (Lt) Namų ūkio vartojimo išlaidos (Lt) Namų ūkio santaupos (Lt)
175 1060 -885
2348 2873 -525
1058 2030 -972
1171 1237 -66
1944 1564 380
1092 867 225
611 868 -257
748 804 -56
1295 1131 164
955 1131 -176
810 410 400
1580 495 1085
744 485 259
700 829 -129
534 1834 -1300
2229 1447 782
1970 1812 158
994 1040 -46
1234 1030 204
331 321 10
1427 1773 -346
647 1487 -840
1555 1769 -214
274 234 40
114 830 -716
1247 1413 -166
3990 6101 -2111
270 468 -198
1333 1347 -14
1168 1622 -454
1229 1020 209
2270 2249 21
Pirmiausiai tikrinu tokią hipotezę (žr. žemiau).
t-Test: Paired Two Sample for Means
Namų ūkio disponuojamos pajamos
(Lt) Namų ūkio vartojimo išlaidos (Lt)
Mean 1188,96875 1361,90625
Variance 630822,5474 1108469,443
Observations 32 32
Pearson Correlation 0,821580454
Hypothesized Mean Difference 0
df 31
t Stat -1,618678858
P(T<=t) one-tail 0,057823647
t Critical one-tail 1,695518742
P(T<=t) two-tail 0,115647294
t Critical two-tail 2,039513438
Išvados: , todėl H0 yra teisinga. Namų ūkio santaupos nedidėja. Todėl kitų hipotezių tikrinti nereikia.5. Skurdo rodiklių įvertinimas
Skurdo riba – tai kriterijus, kurio pagalba politikai ar kiti asmenys suskirsto gyventojus, ššeimas ar namų ūkius į skurstančius ir neskurstančius.
Norint apskaičiuoti skurdo rodiklius, reikalingi šie duomenys: namų ūkio dydis, disponuojamos pajamos ir disponuojamos pajamos vienam ūkio nariui.
Duomenys:
Namų ūkio eilės nr. Namų ūkio dydis Namų ūkio disponuojamos pajamos (Lt) Vieno namų ūkio nario disponuojamos pajamos (Lt)
1 3 175 58,3333
2 5 2348 469,6
3 4 1058 264,5
4 4 1171 292,75
5 4 1944 486
6 2 1092 546
7 4 611 152,75
8 2 748 374
9 1 1295 1295
10 2 955 477,5
11 2 810 405
12 5 1580 316
13 2 744 372
14 4 700 175
15 4 534 133,5
16 5 2229 445,8
17 2 1970 985
18 3 994 331,3333
19 1 1234 1234
20 1 331 331
21 3 1427 475,6667
22 3 647 215,6667
23 3 1555 518,3333
24 3 274 91,3333
25 2 114 57
26 2 1247 623,5
27 5 3990 798
28 1 270 270
29 3 1333 444,3333
30 5 1168 233,6
31 3 1229 409,6667
32 4 2270 567,5
Suma: 97 38047 13849,6667
Randu vidutines pajamas vienam namų ūkio nariui, kur: vidutinės pajamos vienam namų ūkio nariui = suma disponuojamų pajamų / suma namų ūkio dydžių.
Gauta reikšmė: 392,2371 (Lt).
Įvertinsiu šiuos skurdo rodiklius:
• skurdo ribą,
• skurdo lygį,
• skurdo gylį,
• žemų pajamų indeksą.
Skurdo riba:
Skurdo riba pasirenkama su 50 % nuo vidutinių pajamų vienam namų ūkio nariui.
r =0.5* vidutinės pajamos vienam namų ūkio nariui.
Skurdo riba: 196,1186 (Lt).
Skurdo lygis:
Skurstančių gyventojų lygis šalyje parodo šalies gyventojų dalį, kurių pajamos žemiau skurdo ribos.
Skurdo lygiui įvertinti naudojama formulė:
L
Čia:
L – skurdo lygis,
q – skurstančių gyventojų skaičius,
n – visų gyventojų skaičius.
Nustatant skurstančių gyventojų skaičių atrenku tuos namų ūkius, kur vienam nariui tenka žemesnės pajamos už skurdo ribą.
Pagal nagrinėjamus duomenis yra 6 namų ūkiai, kuriuose pajamos žemiau skurdo ribos. Šiuos ūkius iš viso sudaro 20 gyventojų (tiek yra skurstančių gyventojų).
L=q/n=20/97= 0,206185567
Vadinasi , 20,62 proc. visų stebimų gyventojų pajamos yra žemiau skurdo ribos.
Skurdo gylis (žemų pajamų nuokrypis):
Žemų pajamų nuokrypis – tai rodiklis, kuris parodo, kiek vidutiniškai skurstančiųjų pajamos nukrypsta nuo skurdo ribos. Šis rodiklis parodo sskurdo gilumą.
Jis randamas:
Kur:
xi – i-tojo skurstančiojo pajamos
r – skurdo riba
ki – namų ūkio dydis
N=1/20*(((196,1186-58,333)/196,1186)*3+((196,1186-152,75)/196,1186)*4+((196,1186-175)/196,1186)*4+((196,1186-133,5)/196,1186)*4+((196,1186-91,3333)/196,1186)*3+((196,1186-57)/196,1186)*2)= 0,386086047, apytiksliai N=0,3861
Vadinasi, vidutiniškai 38,61 proc. skurstančiųjų pajamos nukrypsta nuo skurdo ribos.
Žemų pajamų indeksas:
Žemų pajamų indeksas parodo kiek reikia lėšų, norint eliminuoti skurdą šalyje.
Apskaičiuojamas pagal tokią formulę:
I = L * N
Kur:
L – skurdo lygis,
N – skurdo gylis.
I= 0,07960537
Reikia 7,96 proc. lėšų, norint eliminuoti skurdą šalyje.6. Namų ūkių nelygybės išanalizavimas: Lorenco kreivė, Gini koeficientas
6.1. Lorenco kreivė
Lorenco kreivė rodo, kurią pajamų dalį gauna tam tikra visuomenės dalis. Ši kreivė padeda įvertinti, kaip lygiai pasiskirsto pajamų grafinis vaizdas. Įstriža linija rodo idealiai lygų pajamų pasiskirstymą. Kuo toliau Lorenco kreivė yra nukrypusi nuo įstrižos linijos, tuo netolygesnis pajamų pasiskirstymas. Plotas, esantis tarp Lorenco kreivės ir absoliučios lygybės tiesės vadinamas koncentracijos plotu. Jis parodo skirtumus tarp siekiamos ir realios padėties pajamų pasiskirstymo atžvilgiu.
Sudarau lentelę, kurios apskaičiuotas duomenimis bus braižoma Lorenco kreivė:
Vieno šeimos nario pajamos (Lt) (didėjimo tvarka) Numeracija
Sukauptos vieno namų ūkio nario pajamos (Lt) (3)
0 0
57 1 57 0,03 0,004116
58,33 2 115,33 0,06 0,00832728
91,33 3 206,66 0,09 0,014921666
133,5 4 340,16 0,13 0,024560892
152,75 5 492,91 0,16 0,035590043
175 6 667,91 0,19 0,048225733
215,67 7 883,58 0,22 0,063797956
233,6 8 1117,18 0,25 0,080664796
264,5 9 1381,68 0,28 0,099762738
270 10 1651,68 0,31 0,119257801
292,75 11 1944,43 0,34 0,140395504
316 12 2260,43 0,38 0,163211949
331 13 2591,43 0,41 0,187111453
331,33 14 2922,76 0,44 0,211034784
372 15 3294,76 0,47 0,237894649
374 16 3668,76 0,50 0,264898922
405 17 4073,76 0,53 0,294141517
409,67 18 4483,43 0,56 0,323721304
444,33 19 4927,76 0,59 0,35580368
445,8 20 5373,56 0,63 0,387992196
469,6 21 5843,16 0,66 0,421899166
475,67 22 6318,83 0,69 0,456244413
477,5 23 6796,33 0,72 0,490721794
486 24 7282,33 0,75 0,525812908
518,33 25 7800,66 0,78 0,563238376
546 26 8346,66 0,81 0,602661726
567,5 27 8914,16 0,84 0,643637461
623,5 28 9537,66 0,88 0,688656617
798 29 10335,66 0,91 0,74627536
985 30 11320,66 0,94 0,817396239
1234 31 12554,66 0,97 0,9064959
1295 32 13849,66 1,00 1
13849,66
Pasitelkusi šiuos duomenis, t.y. 4 ir 5 stulpelių duomenimis braižau Lorenco kreivę:
Akivaizdu iš pateiktos Lorenco kreivės, jog tiriamų 32 namų ūkių pajamų pasiskirstymas nėra idealus, t.y. galima teigti, kad pajamų pasiskirstymas yra gana netolygus.6.2. Gini koeficientas
Gini koeficientas dažniausiai naudojamas kaip pajamų pasiskirstymo, netolygumo mmatas.
Kuo šis koeficientas yra didesnis, tuo pajamų pasiskirstymas yra netolygesnis. Esant absoliučiai pajamų pasiskirstymo lygybei, Gini koeficientas yra lygus nuliui. Jei visos pajamos tektų vienam namų ūkio nariui, tai Gini koeficientas būtų lygus vienam. Kai reikšmė mažesnė už 0,25, tai gyventojų pajamų diferenciacijos lygis yra labai mažas; tarp 0,25 – 0,30 – nedidelis; gautas koeficientas didesnis nei 0,30 rodo gyventojų pajamų diferenciacijos netolygumą.
Gini koeficientas skaičiuojamas pagal šią formulę:
;
Kur:
n – namų ūkių skaičius;
– vieno namų ūkio nario disponuojamų pajamų stulpelio vidurkis.
Sudarau tokią lentelę:
N (1) Vieno šeimos nario pajamos (Lt)(didėjimo tvarka) (2) (1)x(2)
32 57 1824
31 58,33 1808,23
30 91,33 2739,9
29 133,5 3871,5
28 152,75 4277
27 175 4725
26 215,67 5607,42
25 233,6 5840
24 264,5 6348
23 270 6210
22 292,75 6440,5
21 316 6636
20 331 6620
19 331,33 6295,27
18 372 6696
17 374 6358
16 405 6480
15 409,67 6145,05
14 444,33 6220,62
13 445,8 5795,4
12 469,6 5635,2
11 475,67 5232,37
10 477,5 4775
9 486 4374
8 518,33 4146,64
7 546 3822
6 567,5 3405
5 623,5 3117,5
4 798 3192
3 985 2955
2 1234 2468
1 1295 1295
432,801875 151355,6
= 432,801875 (Lt);
= 151355,6 (Lt);
n=32.
G(y)= 0,348220597.
Išvados: kadangi gautoji Gini koeficiento reikšmė yra daugiau nei 0,30, tai gyventojų pajamų pasiskirstymas, t.y. diferenciacija yra netolygi. 7. Regresinė analizė: išlaidų priklausomybės nuo kitų įvairių faktorių tyrimas
Regresinė analizė – tai vieno kintamojo priklausomybės tyrimas nuo kitų kintamųjų. Regresinės analizės kintamieji skirstomi į:
• priklausomus kintamuosius, kurie charakterizuoja rezultatą. Jų reikšmė formuojasi nagrinėjamo reiškinio viduje priklausomai nuo daugelio kitų kintamųjų reikšmių;
• nepriklausomus kintamuosius, kurie aprašo nagrinėjamo reiškinio funkcionavimą, savybes, apsprendžia rezultatą.
Regresijos lygtis:
kur:
Y – priklausomas kintamasis;
– nepriklausomieji kintamieji;
– nežinomieji kintamieji;
– atsitiktinis dydis, parodantis nukrypimus nuo taško iki tiesės.
Šioje kursinio darbo dalyje ištirsiu vienam namų ūkio nariui
tenkančių išlaidų priklausomybę nuo įvairių faktorių. Regresinėje analizėje Y – vieno namų ūkio nario išlaidos, jas įtakojančių veiksnių priklausomybei ištirti pasirenku šiuos faktorius (represorius):
1. X1 – namų ūkio disponuojamos pajamos vienam gyventojui (Lt);
2. X2 – namų ūkio galvos lytis (1 – vyras; 0 – moteris);
3. X3 – namų ūkio galvos išsimokslinimas (1 – aukštasis; 0 – kita, t.y. neturi pradinio, pradinis; pagrindinis; bendrasis vidurinis; aukštesnysis);
4. X4 – grupuotas namų ūkio galvos amžius (1 – 60 metų ir daugiau; 0 – mažiau nei 60 mmetų, t.y. amžius iki 60 metų);
5. X5 – namų ūkio galvos socialinė – ekonominė grupė (1 – pensininkai, 0 – kita, t.y. ūkininkai, samdomi darbuotojai, verslininkai).
Sudarau lentelę:
Y X1 X2 X3 X4 X5
Namų ūkio vartojimo išlaidos vienam gyventojui (Lt) Namų ūkio disponuojamos pajamos vienam gyventojui (Lt) Namų ūkio galvos lytis Namų ūkio galvos išsimokslinimas Namų ūkio galvos amžius (grupuotas) Namų ūkio galvos socialinė-ekonominė grupė
353,3333 58,3333 1 0 0 0
574,6 469,6 1 0 0 0
507,5 264,5 1 0 1 1
309,25 292,75 1 0 0 0
391 486 0 0 0 0
433,5 546 0 1 0 0
217 152,75 0 0 1 1
402 374 0 1 0 0
1131 1295 0 0 0 0
565,5 477,5 1 0 0 0
205 405 0 0 0 0
99 316 1 0 1 0
242,5 372 1 0 1 1
207,25 175 1 0 0 0
458,5 133,5 1 0 0 0
289,4 445,8 1 0 0 0
906 985 1 0 0 0
346,6667 331,3333 1 0 0 0
1030 1234 0 0 0 0
321 331 0 0 1 1
591 475,6667 0 0 0 0
495,6667 215,6667 0 0 0 0
589,6667 518,3333 1 1 0 0
78 91,3333 0 0 0 1
415 57 1 0 1 1
706,5 623,5 1 0 1 0
1220,2 798 1 1 0 0
468 270 0 0 1 1
449 444,3333 1 1 0 0
324,4 233,6 1 0 0 0
340 409,6667 0 0 0 0
562,25 567,5 1 0 0 0
Pirmiausia patikrinu, ar regresoriai tarpusavyje nėra koreliuoti (t.y. jie turi būti nepriklausomi). Šiam tikslui tikrinu koreliaciją:
X1 X2 X3 X4 X5 X6
X1 1
X2 0,824316441 1
X3 0,019792469 -0,143357898 1 <
X4 0,228087373 0,151875326 0,005476267 1
X5 -0,22234941 -0,265142603 0,036735918 -0,248451997 1
X6 -0,30341224 -0,38496402 -0,177964846 -0,227710017 0,741940827 1
Kadangi nėra reikšmės, viršijančios 0,85, tai reiškia, jog pasirinkti regresoriai nėra koreliuoti (jie nepriklausomi). Vadinasi, šie faktoriai (regresoriai) yra tinkamai parinkti.
Tikrinu regresiją:
SUMMARY OUTPUT
Regression Statistics
Multiple R 0,846597234
R Square 0,716726877
Adjusted R Square 0,662251277
Standard Error 159,2443604
Observations 32
ANOVA
df SS MS F Significance F
Regression 5 1668206,427 333641,2853 13,15684214 1,9358E-06
Residual 26 659327,9243 25358,76632
Total 31 2327534,351
Coefficients Standard Error t SStat P-value Lower 95% Upper 95% Lower 95,0% Upper 95,0%
Intercept 53,20841 80,182717 0,663589 0,512795 -111,609526 218,026342 -111,609526 218,026342
X1 0,798718 0,107980 7,396893 7,446E-08 0,576761 1,020674 0,576761 1,020674
X2 94,47842 62,238010 1,518018 0,141077 -33,453640 222,410481 -33,453640 222,410481
X3 80,75861 80,460233 1,003708 0,324770 -84,629762 246,146990 -84,629762 246,146990
X4 -49,02829 101,572884 -0,482691 0,633355 -257,814339 159,757762 -257,814339 159,757762
X5 94,05452 114,142740 0,824008 0,417430 -140,569239 328,678282 -140,569239 328,678282
Significant F<α (1,9358E-06<0,05), vadinasi bent vienas regresorius yra reikšmingas. Kadangi X4 (grupuotas .namų ūkio galvos amžius) P – value reikšmė yra didžiausia iš visų tiriamų regresorių reikšmių (P-value=0,633355) ir yra didesnė už reikšmingumo lygmenį α=0,05, šį regresorių, kaip nereikšmingą, išmetu iš tyrimo.
Sudarau naują lentelę (be X4) ir pakartoju operacijas iš naujo:
SUMMARY OUTPUT
Regression Statistics
Multiple R 0,845097
R Square 0,714188
Adjusted R Square 0,671846
Standard Error 156,9662
Observations 32
ANOVA
df SS MS F Significance F
Regression 4 1662298,1 415574,5 16,866958 4,8315E-07
Residual 27 665236,27 24638,38
Total 31 2327534,4
Coefficients Standard Error t Stat P-value Lower 95% Upper 95% Lower 95,0% Upper 95,0%
Intercept 56,28262 78,78589 0,714374 0,4811268 -105,37267 217,937908 -105,37267 217,937908
X1 0,793132 0,1058224 7,494936 4,614E-08 0,57600233 1,01026146 0,57600233 1,01026146
X2 86,34413 59,055982 1,462073 0,1552642 -34,828734 207,516994 -34,828734 207,516994
X3 85,55979 78,700797 1,087153 0,2865796 -75,920903 247,040485 -75,920903 247,040485
X5 53,66997 76,533593 0,70126 0,4891411 -103,36399 210,703928 -103,36399 210,703928
Significant F<α (4,8315E-07<0,05), vadinasi bent vienas regresorius yra reikšmingas. Kadangi X5 (namų ūkio galvos socialinė – ekonominė grupė) P – value reikšmė yra didžiausia iš visų tiriamų regresorių reikšmių (P-value=0,4891411) ir yra didesnė už reikšmingumo lygmenį α=0,05, šį regresorių, kaip nereikšmingą, išmetu iš tyrimo.
Sudarau naują llentelę (be X5) ir pakartoju operacijas vėl iš naujo:
SUMMARY OUTPUT
Regression Statistics
Multiple R 0,842011
R Square 0,708983
Adjusted R Square 0,677802
Standard Error 155,5351
Observations 32
ANOVA
df SS MS F Significance F
Regression 3 1650181,8 550060,6 22,738079 1,1558E-07
Residual 28 677352,59 24191,16
Total 31 2327534,4
Coefficients Standard Error t Stat P-value Lower 95% Upper 95% Lower 95,0% Upper 95,0%
Intercept 88,76827 63,146848 1,405743 0,1708004 -40,582183 218,118724 -40,582183 218,118724
X1 0,763343 0,0960383 7,948315 1,174E-08 0,56661716 0,96006825 0,56661716 0,96006825
X2 75,79992 56,589083 1,33948 0,1911864 -40,117563 191,717397 -40,117563 191,717397
X3 75,37164 76,642995 0,983412 0,3338265 -81,624413 232,367699 -81,624413 232,367699
Significant F<α (1,1558E-07<0,05), vadinasi bent vienas regresorius yra reikšmingas. Kadangi X3 (namų ūko galvos išsimokslinimas) P – value reikšmė yra didžiausia iš visų tiriamų regresorių reikšmių (P-value=0,3338265) ir yra didesnė už reikšmingumo lygmenį α=0,05, šį regresorių, kaip nereikšmingą, išmetu iš tyrimo.
Sudarau naują lentelę (be X3) ir pakartoju operacijas vėl iš naujo:
SUMMARY OUTPUT
Regression SStatistics
Multiple R 0,836021
R Square 0,698931
Adjusted R Square 0,678168
Standard Error 155,4468
Observations 32
ANOVA
df SS MS F Significance F
Regression 2 1626786,5 813393,3 33,661758 2,7584E-08
Residual 29 700747,84 24163,72
Total 31 2327534,4
Coefficients Standard Error t Stat P-value Lower 95% Upper 95% Lower 95,0% Upper 95,0%
Intercept 93,31927 62,941311 1,482639 0,1489569 -35,410167 222,048701 -35,410167 222,048701
X1 0,777911 0,094835 8,202791 4,809E-09 0,58395216 0,97187074 0,58395216 0,97187074
X2 77,35013 56,535026 1,368181 0,1817636 -38,276976 192,977241 -38,276976 192,977241
Significant F<α (2,7584E-08<0,05), vadinasi bent vienas regresorius yra reikšmingas. Kadangi X2 (namų ūkio galvos lytis) P – value reikšmė yra didžiausia iš visų tiriamų regresorių reikšmių (P-value=0,1817636) ir yra didesnė už reikšmingumo lygmenį α=0,05, šį regresorių, kaip nereikšmingą, išmetu iš tyrimo.
Sudarau naują lentelę (be X2) ir pakartoju operacijas vėl iš naujo:
SUMMARY OUTPUT
Regression Statistics
Multiple R 0,824316
R Square 0,679498
Adjusted R Square 0,668814
Standard Error 157,6896
Observations 32
ANOVA
df SS MS F Significance F
Regression 1 1581554 1581554 63,603042 6,6825E-09
Residual 30 745980,36 24866,01
Total 31 2327534,4
Coe.fficients Standard Error t Stat P-value Lower 95% Upper 95% Lower 95,0% Upper 95,0%
Intercept 147,2964 49,750082 2,960727 0,0059481 45,6931881 248,899633 45,6931881 248,899633
X1 0,759311 0,0952095 7,975152 6,683E-09 0,56486673 0,9537544 0,56486673 0,9537544
Significance F<α (6,6825E-09<0,05), vadinasi likęs regresorius X1 (namų ūkio disponuojamos pajamos vienam gyventojui) yra reikšmingas. Tai reiškia, kad vieno namų ūkio nario vartojimo išlaidos priklauso tik nuo jo disponuojamų pajamų. Šią priklausomybę aprašo lygtis:
Y = 147,2964 + 0,759311*X1
Y – vieno namų ūkio nario išlaidos, Lt;
X1 – vieno namų ūkio nario disponuojamos pajamos, Lt.
Didžiausios išlaidos, tenkančios vienam namų ūkio nariui, bus tada, kai jis gaus didžiausias pajamas:
Y = 147,2964 + 0,759311*X1 = 147,2964 + 0,759311*1295 = 1130,6
Mažiausios išlaidos, tenkančios vienam namų ūkio nariui, bus tada, kai jis gaus mažiausias pajamas:
Y = 147,2964 + 0,759311*X1 = 147,2964 + 0,759311*57 = 190,577
Išvados: remiantis gautais rezultatais, galima padaryti išvadą, jog vieno namų ūkio nario vartojamos iišlaidos nepriklauso nuo namų ūkio galvos lyties, išsimokslinimo, amžiaus bei socialinės – ekonominės grupės.
Determinacijos koeficiento įvertis.
Determinacijos koeficientas parodo, ar pasirinktas modelis gerai aprašo duomenis. Determinacijos koeficientas gali įgyti reikšmes iš intervalo:
08. Nustatymas: ar vieno namų ūkio nario vidutinės pajamos tiesiškai nusako namų ūkio vieno nario vidutines išlaidas
Duomenys:
X Y
Vieno namų ūkio nario pajamos (Lt) (didėjimo tvarka) Vieno namų ūkio nario išlaidos (Lt)
57 415
58,3333 353,3333
91,3333 78
133,5 458,5
152,75 217
175 207,25
215,6667 495,6667
233,6 324,4
264,5 507,5
270 468
292,75 309,25
316 99
331 321
331,3333 346,6667
372 242,5
374 402
405 205
409,6667 340
444,3333 449
445,8 289,4
469,6 574,6
475,6667 591
477,5 565,5
486 391
518,3333 589,6667
546 433,5
567,5 562,25
623,5 706,5
798 1220,2
985 906
1234 1030
1295 1131
Norint nustatyti, ar vieno namų ūkio nario vidutinės pajamos tiesiškai nusako vieno namų ūkio nario vidutines išlaidas, reikia apskaičiuoti koreliacijos koeficientą bei patikrinti, ar gautas koreliacijos koeficientas yra reikšmingas ar ne. Taip pat tuo pačiu tikslu sudarysiu regresijos lygtį ir rasiu determinacijos koeficientą.
Koreliacijos koeficientas:
Vieno namų ūkio nario pajamos (Lt) Vieno namų ūkio nario išlaidos (Lt)
Vieno namų ūkio nario pajamos (Lt) 1
Vieno namų ūkio nario išlaidos (Lt) 0,824316444 1
Išvada: gautas koreliacijos koeficientas yra arti vieneto, todėl priklausomybė tarp vieno namų ūkio nario pajamų (Lt) ir vieno namų ūkio nario išlaidų (Lt) yra labai stipri.
Beje, gautas koreliacijos koeficientas yra teigiamas, todėl tarp atsitiktinių dydžių vyrauja tiesinė priklausomybė, t.y. didėjant X, Y taip pat didėja, o mažėjant X, Y – irgi mažėja.
Vadinasi, didėjant vieno namų ūkio nario pajamoms (Lt), vieno namų ūkio nario išlaidos (Lt) taip pat didėja, ir atvirkščiai: mažėjant vieno namų ūkio nario pajamoms ((Lt), vieno namų ūkio nario išlaidos (Lt) taip pat mažėja.
Koreliacijos koeficiento reikšmingumo įvertinimas
Tikrinu hipotezę:
;
.
Koreliacijos koeficientas reikšmingas tuomet, kai . ( 0,01).
.
7,971412448.
.
.
Išvados: priklauso kritinei sričiai (KS), todėl palieku, t.y. gaunu, jog . Tai reiškia, kad koreliacijos koeficientas yra reikšmingas.
Regresijos lygtis
Duomenys:
SUMMARY OUTPUT
Regression Statistics
Multiple R 0,824316
R Square 0,679498
Adjusted R Square 0,668814
Standard Error 157,6896
Observations 32
ANOVA
df SS MS F Significance F
Regression 1 1581554 1581554 63,603042 6,6825E-09
Residual 30 745980,36 24866,01
Total 31 2327534,4
Coefficients Standard Error t Stat P-value Lower 95% Upper 95% Lower 95,0% Upper 95,0%
Intercept 147,2964 49,750082 2,960727 0,0059481 45,6931881 248,899633 45,6931881 248,899633
Vieno namų ūkio nario pajamos (Lt) 0,759311 0,0952095 7,975152 6,683E-09 0,56486673 0,9537544 0,56486673 0,9537544
Y = 147,2964 + 0,759311*X1
Y – vieno namų ūkio nario išlaidos, Lt;
X1 – vieno namų ūkio nario disponuojamos pajamos, Lt.
Didžiausios išlaidos, tenkančios vienam namų ūkio nariui, bus tada, kai jis gaus didžiausias pajamas:
Y = 147,2964 + 0,759311*X2 = 147,2964 + 0,759311*1295 = 1130,6
Mažiausios išlaidos, tenkančios vienam namų ūkio nariui, bus tada, kai jis gaus mažiausias pajamas:
Y = 147,2964 + 0,759311*X2 = 147,2964 + 0,759311*57 = 190,577
Išvada: kaip matyti iš pateiktos regresijos lygties, kuri nusako vieno namų ūkio nario išlaidų priklausomybę nuo jo gautų (disponuojamų) pajamų, parametro reikšmė: vieno namų ūkio nario pajamoms padidėjus bent vienu litu, jo išlaidos padidės 0,759311 (Lt).
Determinacijos koeficiento įvertis.
Determinacijos koeficientas – tai daugiamačio koreliacijos koeficiento kvadratas (R2).
Kaip jau minėjau 7 – oje šio kursinio darbo dalyje, determinacijos koeficientas turi patekti į intervalą: . Jis atspindi
parinkto modelio tikslumą, t.y. kuo artimesnis 1, tuo parinktas modelis geriau aprašo duomenis. Gaunu tokią determinacijos koeficiento reikšmę:
D= R2 = 0,8243162 = 0,679497198.
Išvada: modelyje aprašytas vieno namų ūkio nario pajamų vidurkis aprašo beveik 68 proc. vieno namų ūkio nario išlaidų vidurkį. Tai reiškia, kad vartojimo išlaidos (jų vidurkis) beveik 68 procentais priklauso nuo disponuojamų pajamų, o likusieji 32 procentai pri.klauso nuo kitų faktorių (neįvertintų reikšmių).
Regresijos tiesė (grafiškai)
Duomenys:
Vieno namų ūkio nario pajamos (Lt) (didėjimo tvarka) Vieno namų ūkio nario išlaidos (Lt) Predicted vieno nnamų ūkio nario vartojimo išlaidos (Lt)
57 415 190,5771165
58,3333 353,3333 191,5895053
91,3333 78 216,6467539
133,5 458,5 248,6643746
152,75 217 263,2811029
175 207,25 280,1757629
215,6667 495,6667 311,0544178
233,6 324,4 324,6713619
264,5 507,5 348,1340583
270 468 352,3102664
292,75 309,25 369,5845817
316 99 387,2385522
331 321 398,6282107
331,3333 346,6667 398,8812889
372 242,5 429,7599437
374 402 431,2785649
405 205 454,8171923
409,6667 340 458,3606669
444,3333 449 484,6833824
445,8 289,4 485,7970632
469,6 574,6 503,8686546
475,6667 591 508,475164
477,5 565,5 509,8672081
486 391 516,3213479
518,3333 589,6667 540,8723641
546 433,5 561,8799816
567,5 562,25 578,2051587
623,5 706,5 620,7265502
798 1220,2 753,2262434
985 906 895,2173186
1234 1030 1084,285649
1295 1131 1130,603593
Galutinės šios kursinio dalies išvados: Taigi, apskaičiavusi koreliacijos koeficientą, įvertinusi jo reikšmingumą, sudariusi regresijos lygtį bei apskaičiavusi determinacijos koeficientą, galiu drąsiai teigti, jog vieno namų ūkio nario vidutinės pajamos tiesiškai nusako vieno namų ūkio nario išlaidas. Beje, visa tai iliustruoja ir pateiktas grafikas.9. Pajamų, išlaidų, namų ūkio dydžio koreliacijos ir reikšmingumo įvertinimas
Duomenys:
Namų ūkio disponuojamos pajamos (Lt) Namų ūkio vartojimo išlaidos (Lt) Namų ūkio dydis
175 1060 3
2348 2873 5
1058 2030 4
1171 1237 4
1944 1564 4
1092 867 2
611 868 4
748 804 2
1295 1131 1
955 1131 2
810 410 2
1580 495 5
744 485 2
700 829 4
534 1834 4
2229 1447 5
1970 1812 2
994 1040 3
1234 1030 1
331 321 1
1427 1773 3
647 1487 3
1555 1769 3
274 234 3
114 830 2
1247 1413 2
3990 6101 5
270 468 1
1333 1347 3
1168 1622 5
1229 1020 3
2270 2249 4
Koreliacijos įvertinimas
Namų ūkio disponuojamos pajamos (Lt) Namų ūkio vartojimo išlaidos (Lt) Namų ūkio dydis
Namų ūkio ddisponuojamos pajamos (Lt) 1
Namų ūkio vartojimo išlaidos (Lt) 0,821580454 1
Namų ūkio dydis 0,500114034 0,493981601 1
Išvados:
1. gauta koreliacija tarp namų ūkio disponuojamų pajamų (Lt) ir namų ūkio vartojimo išlaidų (Lt) yra 0,821580454, t.y. arti vieneto, todėl priklausomybė tarp namų ūkio disponuojamų pajamų (Lt) ir nnamų ūkio vartojimo išlaidų (Lt) yra labai stipri.
Beje, gautas koreliacijos koeficientas yra teigiamas, todėl tarp atsitiktinių dydžių vyrauja tiesinė priklausomybė, t.y. didėjant X, Y taip pat didėja, o mažėjant X, Y – irgi mažėja.
Vadinasi, didėjant namų ūkio pajamoms (Lt), namų ūkio išlaidos (Lt) taip pat didėja, ir atvirkščiai: mažėjant namų ūkio pajamoms (Lt), namų ūkio išlaidos (Lt) taip pat mažėja.
2. gauta koreliacija tarp namų ūkio dydžio ir namų ūkio disponuojamų pajamų (Lt) yra 0,500114034, t.y. šiek tiek arčiau vieneto nei nulio, todėl galima teigti, jog priklausomybė tarp namų ūkio dydžio ir namų ūkio disponuojamų pajamų (Lt) yra nei stipri, nei silpna, t.y. vidutinė.
Beje, gautas koreliacijos koeficientas yra teigiamas, todėl tarp atsitiktinių dydžių vyrauja tiesinė priklausomybė, t.y. didėjant X, Y taip ppat didėja, o mažėjant X, Y – irgi mažėja.
Vadinasi, didėjant namų ūkio dydžiui, namų ūkio disponuojamos pajamos (Lt) taip pat didėja, ir atvirkščiai: mažėjant namų ūkio dydžiui, namų ūkio disponuojamos pajamos (Lt) taip pat mažėja.
3. gauta koreliacija tarp namų ūkio dydžio ir namų ūkio vartojimo išlaidų (Lt) yra 0,493981601, t.y. šiek tiek arčiau nulio nei vieneto, todėl galima teigti, jog priklausomybė yra nei stipri, nei silpna, t.y. vidutinė.
Beje, gautas koreliacijos koeficientas yra teigiamas, todėl tarp atsitiktinių dydžių vyrauja tiesinė priklausomybė, tt.y. didėjant X, Y taip pat didėja, o mažėjant X, Y – irgi mažėja.
Vadinasi, didėjant namų ūkio dydžiui, namų ūkio vartojimo išlaidos (Lt) taip pat didėja, ir atvirkščiai: mažėjant namų ūkio dydžiui, namų ūkio vartojimo išlaidos (Lt) taip pat mažėja.
Koreliacijos reikšmingumo įvertinimas
Tikrinu tris tokias hipotezes:
;
.
Koreliacijos koeficientas reikšmingas tuomet, kai . ( 0,01).
.
1. kai r = 0,821580454, tai:
7,971412448.
2. kai r = 0,500114034, tai:
3,163239389.
3. kai r = 0,493981601, tai:
3,111828273.
.
.
Išvados: visos gautosios trys priklauso kritinei sričiai (KS), todėl palieku, t.y. gaunu, jog . Tai reiškia, kad koreliacijos koeficientas tarp:
• namų ūkio disponuojamų pajamų (Lt) ir namų ūkio vartojimo išlaidų (Lt);
• namų ūkio dydžio ir namų ūkio disponuojamų pajamų (Lt);
• namų ūkio dydžio ir namų ūkio vartojimų išlaidų (Lt)
yra reikšmingas.Išvados
Bendra charakteristika. Kokybinių duomenų apibendrinimas. Buvo stebimi 32 namų ūkiai, iš kurių:
• daugiausiai gyvena 5 -iuose didžiuosiuose miestuose (net 17 namų ūkių iš 32);
• daugiausiai yra šeimų, susidedančių iš dviejų ir trijų asmenų (25 proc.);
• arti pusės tiriamų namų ūkių vartojimo išlaidos viršija disponuojamas pajamas;
• daugiausiai, t.y. net 22 tiriamų namų ūkių galvos socialinė – ekonominė grupė – samdomi darbuotojai.
Kiekybinių duomenų apibendrinimas. Stebėjimų sekoje:
• vidutinis namų ūkio dydis yra 3,03125 (apytiksliai po tris asmenis);
• vidutinės disponuojamos pajamos – 1188, 96875 (Lt);
• vidutinės vvartojimo išlaidos – 1361,90625 (Lt).
Vieno šeimos nario išlaidų kaime ir mieste palyginimas. Kad galėčiau nustatyti, ar skiriasi vieno šeimos nario išlaidos kaime ir mieste patikrinau šias hipotezes:
• Hipotezė apie dviejų dispersijų lygybę.
Išvada: , todėl hipotezė priimama. Tai reiškia, jog dispersijos yra lygios.
• Hipotezė apie dviejų vidurkių lygybę.
Išvada: , todėl hipotezę apie vidurkius galima priimti, nors išlaidų vidurkis mieste yra didesnis beveik 150 litų (147,45278 Lt).
Patikrinimas: ar namų ūkio santaupos didėja. Patikrinime: ar namų ūkių santaupos didėja gavau tokias išvadas: , todėl H0 yra teisinga. Namų ūkio santaupos nedidėja.
Skurdo rodiklių įvertinimas. Apskaičiavusi skurdo rodiklius, gavau, kad:
skurdo riba yra lygi 196,1186 (Lt);
20,62 proc. visų stebimų gyventojų pajamos yra žemiau skurdo ribos;
vidutiniškai 38,61 proc. skurstančiųjų pajamos nukrypsta nuo skurdo ribos;
reikia 7,96 proc. lėšų, norint eliminuoti skurdą šalyje.
Namų ūkių nelygybės išanalizavimas: Lorenco kreivė, Gini koeficientas. Išanalizavusi namų ūkio nelygybę, t.y. nubrėžus Lorenco kreivę bei apskaičiavus Gini koeficientą, priėjau tokią išvadą: stebimų 32 namų ūkių pajamų pasiskirstymas (diferenciacija) yra netolygus.
Regresinė analizė: išlaidų priklausomybės nuo kitų įvairių faktorių tyrimas. Atlikusi regresinę analizę, priėjau išvadą, jog vieno namų ūkio nario vartojimo išlaidos priklauso tik nuo jo disponuojamų pajamų, t.y. remiantis gautais rezultatais, galima padaryti išvadą, jog vieno namų ūkio nario vartojamos išlaidos nepriklauso nuo namų ūkio galvos lyties, iišsimokslinimo, amžiaus bei socialinės – ekonominės grupės. Gavau šią priklausomybę aprašančią lygtį:
Y = 147,2964 + 0,759311*X1
Determinacijos koeficientas. Gavau, kad R2 = 0,8243162 = 0,679497198. Tai reiškia, kad vartojimo išlaidos beveik 68 procentais priklauso nuo disponuojamų pajamų, o likusieji 32 procentai priklauso nuo kitų faktorių (neįvertintų reikšmių).
Nustatymas: ar vieno namų ūkio nario vidutinės pajamos tiesiškai nusako namų ūkio vieno nario vidutines išlaidas. Nustatyme ar vieno namų ūkio nario vidutinės pajamos tiesiškai nusako namų ūkio vieno nario vidutines išlaidas, t.y. apskaičiavusi koreliacijos koeficientą, įvertinusi jo reikšmingumą, sudariusi regresijos lygtį bei apskaičiavusi determinacijos koeficientą, priėjau tokią išvadą, jog vieno namų ūkio nario vidutinės pajamos tiesiškai nusako vieno namų ūkio nario išlaidas.
Pajamų, išlaidų, namų ūkio dydžio koreliacijos ir reikšmingumo įvertinimas. Galutinės šio kursinio darbo paskutinės dalies išvados: visos gautosios trys priklauso kritinei sričiai (KS), todėl palieku, t.y. gaunu, jog . Tai reiškia, kad koreliacijos koeficientas tarp:
• namų ūkio disponuojamų pajamų (Lt) ir namų ūkio vartojimo išlaidų (Lt);
• namų ūkio dydžio ir namų ūkio disponuojamų pajamų (Lt);
• namų ūkio dydžio ir namų ūkio vartojimų išlaidų (Lt)
yra reikšmingas.