Ūkio statistikos ir ekonometrijos darbas
TURINYS
ĮVADAS
1. BENDRA NAMŲ ŪKIO CHARAKTERISTIKA – APRAŠOMOJI STATISTIKA
1. Namų ūkio dydis
2. Namų ūkio disponuojamos pajamos
3. Namų ūkio vartojimo išlaidos
2. SKURDO RODIKLIŲ ĮVERTINIMAS
3. IŠLAIDŲ PRIKLAUSOMYBĖS NUO ĮVAIRIŲ FAKTORIŲ TYRIMAS (REGRESINĖ ANALIZĖ)
4. DETERMINACIJOS KOEFICIENTO ĮVERTIS
5. REGRESIJOS KOEFICIENTO REIKŠMINGUMO PATIKRINIMAS
IŠVADOS
ĮVADAS
Šio kursinio darbo tikslai yra:
1) Aprašyti naudojamus duomenis: namų ūkio dydį, disponuojamas pajamas
vienam namų ūkio nariui ir namų ūkio vartojimo išlaidas;
2) Įvertinti skurdo ir nelygybės rodiklius;
3) Atlikti regresinę analizę, ištirti nuo kokių veiksnių priklauso namų
ūkių išlaidos, t.y. iišsiaiškinti kaip namų ūkio vartojimo išlaidos
priklauso nuo pasirinktų veiksnių: gyvenamosios vietos, vaikų iki 18
metų skaičiaus, namų ūkio galvos išsimokslinimo, namų ūkio galvos
lyties, namų ūkio socialinės-ekonominės grupės.
4) Nustatyti determinacijos koeficientą;
5) Patikrinti regresijos koeficiento reikšmingumą.
SĄVOKOS, NAUDOJAMOS DARBE
Namų ūkis – tai atskirai gyvenantis vienas asmuo, arba asmenų grupė,
kuri gyvena viename name arba bute, turi bendrą biudžetą ir kartu
maitinasi. Jei bent vienos iš šių nurodytų sąlygų trūksta, toks asmuo
nepriskiriamas prie namų ūkio. Namų ūkiu gali būti:
✓ ššeima, susidedanti iš sutuoktinių su vaikais, ar be vaikų; arba
vienas iš tėvų su vaikais;
✓ kartu gyvenantys ir bendrą biudžetą turintys giminės;
✓ kartu gyvenantys ir bendrą biudžetą turintys asmenys, kurių nesieja
giminystės ryšys.
✓ vieniši asmenys gyvenantys iš ssavo pajamų;
✓ šeimos, susidedančios iš kelių kartu gyvenančių sutuoktinių porų,
turinčių bendrą biudžetą.
Namų ūkio galva – tai asmuo, gaunantis didžiausias pajamas. Kadangi
šeimos ūkio narių pajamos gali svyruoti, namų ūkio galva laikomas asmuo,
per metus gaunantis didžiausias pajamas. Jei didžiausias pajamas gaunančio
asmens išskirti negalima, namų ūkio galva laikomas asmuo, kurį nurodo
šeima.
Disponuojamos pajamos – tai visos piniginės ir natūrinės pajamos,
kurios gautos už darbą, iš ūkininkavimo, verslo, amatų, laisvos profesinės
veiklos, o taip pat pensijos, įvairios pašalpos, stipendijos, pajamos iš
turto, renta ir kt.
Vartojimo išlaidos – tai piniginės ir natūrinės išlaidos, skirtos namų
ūkio poreikiams patenkinti: tai išlaidos maistui, drabužiams, avalynei,
būstui, sveikatos priežiūrai, kultūros, poilsio reikmėms ir t.t.
Statistinė hipotezė – bet koks tvirtinimas apie atsitiktinio dydžio
pasiskirstymo formą ar apie pasiskirstymo parametrų reikšmes. Išskiriamos
parametrinės ar neparametrinės hipotezės.
Skurdo riba – kriterijus, kurio pagalba politikai arba tyrinėtojai
suskirsto individus, šeimas arba namų ūkius į skurstančius ir ne.
Pagrindiniai skurdo rodikliai – skurstančiųjų lygis šalyje, žemų
pajamų nuokrypis, žemų pajamų indeksas, kvadratinis skurdo nuokrypis.
Determinacijos koeficientas – parodo regresinės lygties adekvatumą,
kuris tikrinamas pagal Fišerio kriterijų, reikšmingumas vertinamas pagal
Stjudento kriterijų.
Gyvenimo lygio sąvoka – asmenų ar grupės asmenų gyvenimo lygio sąvoka
yra siejama su daugybe įvairių faktorių. Kai kuriuos iš jų lengva
išmatuoti, kai kuriuos – ne.
Skurdo sąvoka – daugiaprasmė, ji kinta vystantis visuomenei. Ji
skirtingai suprantama atskirose šalyse.
Skurdo riba – kriterijus, kurio pagalba politikai ar tyrinėtojai
suskirsto individus, šeimas ir namų ūkius į skurstančius ir neskurstančius.
3 skurdo ribų tipai:
1) Absoliuti. Absoliuti skurdo riba – tai minimalus pajamų ar išlaidų dydis
būtinoms vartojimo reikmėms patenkinti.
2) Santykinė . Skurdo riba vadinama santykine, jei skurdo “slenkstis” yra
apibrėžiamas siejant su tam tikrais, dažniausiai su pajamų arba išlaidų,
šalies vidutiniais rodikliais ir priklauso nuo jų. Iš anksto apibrėžiamas
procentas namų ūkių, kuriuos mes norime klasifikuoti kaip skurdžius.
Atitinkamas procentinis pajamų pasiskirstyme ir bus skurdo riba.
3) Subjektyvi (priklauso nuo žmonių nuomonės).
Skaičiuojant namų ūkio rodiklius namų ūkio dydis gali būti vertinamas pagal
paprastą ir ekvivalentinę (ODEC) skales.
Ekvivalentinė skalė apibrėžiama taip:
Pirmas suaugęs namų ūkyje – 1,0
Kiekvienas kitas suaugęs namų ūkyje – 0.7
Kiekvienas vaikas (iki 14 metų) – 0.5
Skurstančiųjų gyventojų lygis šalyje – tai rodiklis, parodantis šalies
gyventojų dalį, kurių pajamos yra žemiau skurdo ribos. q – skurstančiųjų
gyventojų skaičius. L = q / n
Žemų pajamų nuokrypis – rodiklis, kuris parodo, kiek vidutiniškai
skurstančiųjų pajamos nukrypsta nuo skurdo ribos. Šis rodiklis parodo
skurdo gilumą. N = 1 / q * ( ((z – yi) / z)
Žemų pajamų indeksas – jis parodo, kiek reikia lėšų norint eliminuoti
skurdą šalyje. I = L * N
Kvadratinis skurdo nuokrypis – atspindi pajamų pasiskirstymą tarp
skurstančiųjų. Kuo daugiau šalyje yra ypatingai skurstančių žmonių, tuo
didesnis bus tas rodiklis.
Duomenys, kurie buvo panaudoti kursiniame projekte:
➢ Gyvenamoji vieta: 1 – 5 didieji miestai (Vilnius, Kaunas,
Klaipėda, Šiauliai, Panevėžys), 2 – kiti mestai, 3 – kaimas.
Miestas-kaimas: 1 – miestas, 2 – kaimas.
➢ Namų ūkiai su skirtingu skaičiumi vaikų: 1 – namų ūkis su 1 vaiku
iki 18 metų, 2 – namų ūkis su 2 vaikais iki 18 metų, 3 – namų ūkis
be vaikų.
➢ Namų ūkio galvos išsimokslinimas: 1 – neturi pradinio, 2 –
pradinis, 3 – pagrindinis, 4 – bendras vidurinis, 5 – aukštesnysis,
6 – aukštasis.
➢ Namų ūkio galvos socialinė – ekonominė grupė: 1 – ūkininkai, 2 –
samdomieji darbuotojai, 3 – verslininkai, 4 – pensininkai, 5 –
kita.
➢ Namų ūkio galvos lytis: 1 – vyras, 2 – moteris.
1. BENDRA NAMŲ ŪKIO CHARAKTERISTIKA – APRAŠOMOJI STATISTIKA
|Namų ūkio |Namų ūkio |Namų ūkio |Namų ūkio |
|eilės Nr. |dydis |disponuojamos |vartojimo išlaidos|
| | |pajamos | |
|1476 |1 |700 |675,76 |
|1477 |3 |768,25 |731,87 |
|1478 |1 |407,74 |458,77 |
|1479 |3 |265,14 |436,23 |
|1480 |2 |868,91 |875,04 |
|1481 |3 |1406,92 |1050,97 |
|1482 |1 |433,1 |458,51 |
|1483 |1 |2798,4 |2185,27 |
|1484 |3 |1126,3 |592,49 |
|1485 |6 |1780 |908,91 |
|1486 |2 |700 |701,4 |
|1487 |1 |553,44 |615,22 |
|1488 |3 |1070,66 |805,9 |
|1489 |1 |397,37 |680,15 |
|1490 |2 |1052 |1274,51 |
|1491 |2 |867,44 |1429,84 |
|1492 |3 |770,99 |379,18 |
|1493 |3 |1019,21 |2089,66 |
|1494 |2 |1052,26 |837,24 |
|1495 |3 |715,42 |823,48 |
|1496 |2 |3952,02 |774,62 |
|1497 |5 |766,85 |988,92 |
|1498 |1 |439,01 |468,78 |
|1499 |3 |1588,63 |812,57 |
|1500 |3 |1902,79 |1425,47 |
|iš viso |60 |27402,85 |22480,76 |
Kiekybinės namų ūkio charakteristikos: namų ūkio dydis, namų ūkio
disponuojamos pajamos ir vartojimo išlaidos. Duomenys išdėstyti trim
stulpeliais.
Tam, kad atlikti duomenų aprašomąją charakteristiką, reikia naudoti MS
Excel programoje esantį posistemį Tools – Data Analysis ir pasirenkame
Descriptive statistics – aprašomoji statistika, atsidariusiame lange
pažymime summary statistic – “statistikos suvestinė”. Gauname lentelę su
šių trijų dydžių pagrindinėmis statistinėmis charakteristikomis:
| |Namų ūkio |Namų ūkio |Namų ūkio |
| |dydis |disponuojamos|vartojimo |
| | |pajamos |išlaidos |
|Vidurkis |2,64 |968,554 |970,0936 |
|Standartinė paklaida |0,190438 |136,3377902 |104,18779 |
|Mediana |3 |837,21 |965,73 |
|Moda |3 |negalima |negalima |
|Vidutinis kvadratinis |0,95219 |681,6889508 |520,93893 |
|nuokrypis | | | |
|Dispersija |0,906667 |464699,8256 |271377,37 |
|Eksceso koeficientas |-0,79102 |7,999375094 |0,0446104 |
|Asimetrijos |-0,12238 |2,474248948 |0,6927811 |
|koeficientas | | | |
|Duomenų plotis |3 |3262,44 |1955,62 |
|Minimali reikšmė |1 |277,34 |296,24 |
|Maksimali reikšmė |4 |3539,78 |2251,86 |
|Suma
|66 |24213,85 |24252,34 |
|Duomenų skaičius |25 |25 |25 |
Labiausiai statistikoje vartojamos šios charakteristikos:
• Vidurkis – tai visų skaitinių duomenų suma, padalinta iš duomenų
skaičiaus.
• Dispersija – tai išsibarstymo apie vidurkį matas. Tai skirtumų tarp
stebėtų duomenų reikšmių ir vidurkio kvadratų vidurkis.
• Vidutinis kvadratinis nuokrypis – tai kvadratinė šaknis iš
dispersijos.
• Mediana – tai vidurinis duomuo stebėjimų sekoje, išdėstytoje didėjimo
tvarka. Medianos numeris skaičiuojamas pagal formulę: (n+1)/2, kur n –
duomenų skaičius. Jeigu turime lyginį stebėjimų skaičių, medianos
numeris bus trupmeninis, t.y. viduriniai duomenys yra du, todėl
mediana tokiu atveju randama kaip dviejų vidurinių duomenų vidurkis.
• Moda – tai reikšmė, kuri pasikartoja dažniausiai. Jeigu visi duomenys
pasikartoja po vieną kartą, tai modos rasti yra negalima.
• Eksceso koeficientas – tai lėkštumo matas. Kai jis didesnis už 0,
duomenų sklaida apie tą vidurkį yra didesnė, nei normaliosios kreivės.
Kai mažesnis už 0, duomenų sklaida apie tą vidurkį yra mažesnė, nei
normaliosios kreivės, ir kai lygi 0, sklaida apie vidurkį yra
normaliosios kreivės.
• Asimetrijos koeficientas – tai simetrijos matas. Kai jis mažesnis už
0, asimetrija neigiama – kairioji. Kai lygus 0 – simetriška, ir kai
daugiau už 0 – asimetrija teigiama (dešinioji).
• Duomenų plotis –– maksimalios ir minimalios reikšmių skirtumas.
• Maksimali reikšmė – didžiausia reikšmė imtyje.
• Minimali reikšmė – mažiausia reikšmė imtyje.
• Suma – visų imties narių suma.
Namų ūkio dydis
Šioje statistikos lentelėje vidutinis namų ūkio dydis yra 2,64 žmogaus.
Mediana lygi 3, vadinasi, vidurinis duomuo lygus 3. Moda – 3, tai reiškia,
kad dažniausiai pasikartoja skaičius 3. Dispersija yra 0,91, o vidutinis
kvadratinis nuokrypis 0,95. pasiskirstymas – asimetrinis (asimetrija
neigiama, kairioji). Skirtumas tarp maksimumo ir minimumo, t.y. duomenų
plotis yra 3. Minimali stebėta reikšmė – 1, maksimali – 4. Duomenų suma yra
66. Iš viso buvo 25 stebėjimai.
Iš pateiktos statistikos matome, kad nagrinėjama 25 namų ūkiai.
Mieste 17 ūkių
Kaime 8 ūkiai.
Didžioji dalis nagrinėjamų namų ūkių yra miestuose – 68%.
[pic]
Nagrinėdami namų ūkius pagal socialinę – eekonominę grupę:
Ūkininkai – 1
Samdomieji darbuotojai – 16
Verslininkai – 2
Pensininkai – 4
Kiti – 2
Daugiausiai pagal socialinę – ekonominę grupę sudaro samdomieji darbininkai
– 44%.
[pic]
Didžiausias namų ūkis yra 6 asmenų. Viso tokių ūkių yra 1, gyvenantis kaime
Mažiausias namų ūkis statistikoje yra 1 namų ūkio nario. Tokių ūkių yra 7,
iš jų 6 jų yra mieste, ir 1 gyvena mieste. Didžiausią procentą namų ūkių
sudaro 3 asmenų namų ūkiai – 40%, kurių 7 gyvena mieste, 3 – kaime.
Pagal namų ūkių galvos aamžių statistiką galime paskirstyti tokiu būdu:
Iki 30 metų 4
30-39 metai 4
40-49 metai 7
50-59 metai 6
60 metų ir daugiau 4
Didžiausią dalį – 36% visų namų ūkių šeimos galva yra 60 ir daugiau metų.
[pic]
Pagal statistinius duomenis ūkiai gauna pajamas tik iš šių sektorių:
➢ Darbas asmeniniame žemės ūkyje 1
➢ Pensija
4
➢ Samdomas darbas ne ž.ū. visuomeniniame sektoriuje 5
➢ Samdomas darbas ne ž.ū. privačiame sektoriuje 11
➢ Stipendija
1
➢ Pajamos iš verslo, amatų
2
➢ Kitas pajamų šaltinis
1
Didžiausią dalį (44%) pajamų ūkiai uždirba iš samdomo darbo ne ž.ū.
privačiame sektoriuje. Statistikos ūkiai negauna pajamų iš samdomo darbo
ž.ū. visuomeniniame ir privačiame sektoriuje, bedarbio pašalpos, laisvos
profesinės veiklos, socialinių pašalpų, nėra išlaikytinių.
[pic]
Namų ūkio disponuojamos pajamos
Vidutinės namų ūkio disponuojamos pajamos stebėjimuose yra 968,55Lt.
Mediana lygi 837,21, t.y. vidurinis duomuo lygus 837,21. Modos nėra, tai
reiškia, kad visi stebėjimai pasikartoja po vieną kartą. Dispersija lygi
464699,83, o vidurinis kvadratinis nuokrypis 681,69. Pasiskirstymas –
asimetrinis, (asimetrija teigiama, dešinioji). Duomenų plotis, t.y.
skirtumas tarp maksimumo ir minimumo, yra 3262,44. Minimali stebėta reikšmė
yra 277,34, maksimali – 3539,78. Duomenų suma yra 24213,85, iš viso – 25
stebėjimai.
Namų ūkio vartojimo išlaidos
Vidutinės namų ūkių vartojimo išlaidos statistikoje yra 970,0936 Lt.
Mediana (vidurinis duomuo) lygi 965,73. Modos nėra, tai reiškia, kad visi
stebėjimai pasikartoja po vieną kartą. Dispersija yra 271377,37, o
vidutinis kvadratinis nuokrypis – 520,94. pasiskirstymas – asimetrinis.
Skirtumas tarp maksimumo ir minimumo, t.y. duomenų plotis yra 1955,62.
Minimali reikšmė – 296,24, maksimali – 2251,86. Duomenų suma yra 24252,34,
iš viso turime 25 stebėjimai.
2. SKURDO RODIKLIŲ ĮVERTINIMAS
Apskaičiuosiu 3 skurdo rodiklius:
1. Skurstančiųjų gyventojų lygį šalyje;
2. Žemų pajamų nuokrypį (skurdo gylį);
3. Žemų pajamų indeksą;
4. Kvadratinis skurdo nuokrypis.
Tam, kad galėčiau apskaičiuoti šiuos rodiklius, reikia apskaičiuoti
pajamas vienam namų ūkio nariui, kurios gaunamos namų ūkio disponuojamas
pajamas padalinus iš namų ūkio dydžio. Sudėjus visas namų ūkio
disponuojamas pajamas, ir padalinus jas iš namų ūkio dydžio sumos, gausiu
vidutines pajamas vienam namų ūkio nariui. Pajamos vienam namų ūkio nariui
skaičiuojamos darant prielaidą, kad namų ūkio narių svoriai lygūs. Skurdo
ribą pasirenku 55( nuo vidutinių pajamų vienam namų ūkio nariui.
|Namų ūkio |Namų ūkio |Pajamos vienam namų ūkio |
|dydis |disponuojamos |nariui |
| |pajamos | |
|1 |700,00 Lt |700,00 Lt |
|3 |768,25 Lt |256,08 Lt |
|1 |407,74 Lt |407,74 Lt |
|3 |265,14 Lt |88,38 Lt |
|2 |868,91 Lt |434,46 Lt |
|3 |1.406,92 Lt |468,97 Lt |
|1 |433,10 Lt |433,10 Lt |
|1 |2.798,40 Lt |2.798,40 Lt |
|3 |1.126,30 Lt |375,43 Lt |
|6 |1.780,00 Lt |296,67 Lt |
|2 |700,00 Lt |350,00 Lt |
|1 |553,44 Lt |553,44 Lt |
|3 |1.070,66 Lt |356,89 Lt |
|1 |397,37 Lt |397,37 Lt |
|2 |1.052,00 Lt |526,00 Lt |
|2 |867,44 Lt |433,72 Lt |
|3 |770,99 Lt |257,00 Lt |
|3 |1.019,21 Lt |339,74 Lt |
|2 |1.052,26 Lt |526,13 Lt |
|3 |715,42 Lt |238,47 Lt |
|2 |3.952,02 Lt |1.976,01 Lt |
|5 |766,85 Lt |153,37 Lt |
|1 |439,01 Lt |439,01 Lt |
|3 |1.588,63 Lt |529,54 Lt |
|3 |1.902,79 Lt |634,26 Lt |
|60 |27.402,85 Lt |13.970,18 Lt |
Skurdo riba yra: 27.402,85/60*0,55(251.19 Lt.
1. Skurstančiųjų gyventojų lygis šalyje:
q – skurstančiųjų gyventojų skaičius;
n – visų gyventojų skaičius
11 žmonių yra žemiau skurdo ribos, jų pajamos mažesnės, nei 251.19 Lt.
L(q/n ( 11/60 = 0,18333
Išvada: yra 18,33% gyventojų, kurių pajamos žemiau skurdo ribos.
2. Žemų pajamų nuokrypis (skurdo lygis)
Yi – i-tojo skurstančiojo pajamos;
Z – skurdo riba.
[pic]
N = 0,367592
3. Žemų pajamų indeksas
I = L* N
I = 0,18333*0,367592 = 0,0673918
4. Kvadratinis skurdo nuokrypis
[pic]
yi – i-ojo skurstančiojo pajamos
z – skurdo riba
k – asmenų suma namų ūkyje
n – ištirtas žmonių skaičius
Q = 0,033771185
3. IŠLAIDŲ PRIKLAUSOMYBĖS NUO ĮVAIRIŲ FAKTORIŲ TYRIMAS (regresinė analizė)
Regresinės analizės tikslas – ištirti, kaip namų ūkio vartojimo išlaidos
priklauso nuo pasirinktų veiksnių. Pasirinkti veiksniai: vaikų
skaičius iki
18 metų, namų ūkio galvos išsimokslinimas, namų ūkio galvos lytis,
socialinė-ekonominė grupė ir namų ūkio gyvenamoji vieta (miestas-kaimas).
| |Y |X1 |X2 |X3 |X4 |X5 | |Namų ūkio dydis |Namų ūkio vartojimo
išlaidos |Namų ūkio vartojimo išlaidos 1gyv. |Vaikų iki 18 metų skaičius
|Namų ūkio galvos soc-ek.grupė (1-samdomi darbininkai; 0-kita) |Namų ūkio
galvos išsimokslinimas (1-bendras vidurinis; 0-kitas) |Gyvenamoji vieta (1-
miestas; 0- kaimas) |Pagal galvos lytį (1-vyras; 0-moteris) | |1 |675,76 Lt
|675,76 Lt |0 |0 |0 |1 |0 || |3 |731,87 Lt |243,96 Lt |0 |0 |0 |1 |1 | |1
|458,77 Lt |458,77 Lt |0 |1 |0 |1 |1 | |3 |436,23 Lt |145,41 Lt |1 |0 |1 |1
|0 | |2 |875,04 Lt |437,52 Lt |0 |1 |0 |1 |0 | |3 |1.050,97 Lt |350,32 Lt
|1 |1 |0 |1 |1 | |1 |458,51 Lt |458,51 Lt |0 |1 |1 |1 |0 | |1 |2.185,27 Lt
|2.185,27 Lt |0 |1 |0 |1 |0 | |3 |592,49 LLt |197,50 Lt |1 |1 |0 |0 |0 | |6
|908,91 Lt |151,49 Lt |1 |1 |1 |0 |1 | |2 |701,40 Lt |350,70 Lt |1 |1 |0 |1
|0 | |1 |615,22 Lt |615,22 Lt |0 |0 |0 |0 ||0 | |3 |805,90 Lt |268,63 Lt |0
|1 |0 |1 |1 | |1 |680,15 Lt |680,15 Lt |0 |0 |1 |1 |0 | |2 |1.274,51 Lt
|637,26 Lt |0 |1 |1 |1 |1 | |2 |1.429,84 Lt |714,92 Lt |0 |1 |0 |1 |1 | |3
|379,18 Lt |126,39 Lt |0 |1 |0 |1 |0 | |3 |2.089,66 Lt |696,55 Lt |1 |1 |1
|1 |1 | |2 |837,24 Lt |418,62 Lt |0 |1 |1 |0 |1 | |3 |823,48 Lt |274,49 Lt
|1 |0 |1 |0 |0 | |2 |774,62 Lt |387,31 Lt |0 |0 |0 |0 |1 | |5 |988,92 Lt
|197,78 Lt |1 |0 |0 |0 |1 | |1 |468,78 Lt |468,78 Lt |0 |0 |0 ||1 |0 | |3
|812,57 Lt |270,86 Lt |0 |1 |0 |1 |1 | |3 |1.425,47 Lt |475,16 Lt |0 |1 |0
|0 |1 | |
Tikslas – ištirti priklausomybę Y nuo X1,.X5 ir atrinkti reikšmingus Xi
(i = 1,2,3,4,5). Pasirinkau tokį modelį, nes manau, kad šie regresoriai
labiausiai įtakoja išlaidas. Norint nustatyti kuris iš pasirinktų veiksnių
yra reikšmingiausias, t.y. labiausiai įtakoja namų ūkio vartojimo išlaidas,
EXCEL programoje reikia atlikti šiuos veiksmus: Tools – Data Analysis –
Regression.
Gaunami tokie rezultatai:
SUMMARY OUTPUT | | | | | | || | | | | | | | | | | | |Regression Statistics
| | | | | | | | | |Multiple R |0,57934 | | | | | | | | |R Square |0,335635
| | | | | | | | |Adjusted R Square |0,160802 | | | | | | | | |Standard
Error |217,3284 | | | | | | | | |Observations |25 | | | | | | | | | | | | |
| | | | | |ANOVA | | | | | | | | | | |df |SS |MS |F |Significance F | | |
| |Regression |5 |453363 |90672,61 |1,919744 |0,138239 | | | | |Residual
|19 |897400,8 |47231,62 | | | | | | |Total |24 |1350764 | | | | | | |
| | | | | | | | | | | |Coefficients |Standard Error |t Stat |P-value
|Lower 95% |Upper 95% |Lower 95,0% |Upper 95,0% | |Intercept |463,817
|130,4778 |3,554757 |0,002115 |190,7237 |736,9103 |190,7237 |736,9103 |
|X1vaikų sk. |-212,674 |71,4593 |-2,97615 |0,007761 |-362,24 |-63,1078 |-
362,24 |-63,1078 | |X2soc.ekon.grupė |157,7732 |111,3146 |1,417364
|0,172567 |-75,2109 |390,7573 |-75,2109 |390,7573 | |X3išsilavinimas |-
63,5748 |127,2557 |-0,49958 |0,623104 |-329,924 |202,7744 ||-329,924
|202,7744 | |X4gyv.vieta |-43,9292 |95,92468 |-0,45796 |0,652179 |-244,702
|156,8435 |-244,702 |156,8435 | |X5galvos lytis |48,9799 |103,286 |0,474216
|0,64075 |-167,2 |265,16 |-167,2 |265,16 | |
Tiriamųjų veiksnių P-value reikšmė turi būti mažesnė už mano pasirinktą
reikšmingumo lygmenį α = 0,05. Taigi atliekame tyrimą, kol nebelieka
koeficiento, kurio P-value reikšmė didesnė už α.
Y (vartojimo išlaidos) = 463,817-212,674X1 + 157,7732X2 -63,5748X3-
43,9292X4 + 48,9799X5
X4 (gyvenamoji vieta) P-value 0,652179> 0,05
Pagal gautus lentelių duomenis tyrimo ketvirčio (X4) P-value reikšmė
lygi 0,652179 yra didžiausia, vadinasi jis nereikšmingas ir nuo jo
nepriklauso namų ūkio vartojimo išlaidos. Toliau tyrimas vyksta be galvos
lyties stulpelio lentelėje.
Significance F<α (0,138239<0,05), vadinasi bent vienas regresorius yra
reikšmingas.
Sudarome naują lentelę (tik be X4) ir pakartojame operacijas iš naujo
Excel→Tools→Data Analyses→Regresion. Gauname:
SUMMARY OUTPUT | | | | | | | | | | | | | | | | | | |Regression Statistics
| | | | | | | | | |Multiple R |0,572976 | | | | | | | | |R Square
|0,328301 | | | | | | | | |Adjusted R Square |0,193962 | | | | | | | |
|Standard Error |212,9914 | | | | | | | | |Observations |25 | | || | | | | |
| | | | | | | | | | |ANOVA | | | | | | | | | | |df |SS |MS |F
|Significance F | | | | |Regression |4 |443457,5 |110864,4 |2,443813
|0,080075 | | | | |Residual |20 |907306,4 |45365,32 | | | | | | |Total
|24 |1350764 | | | | | | | | | | | | | | | | | | |Coefficients
|Standard Error |t Stat |P-value |Lower 95% |Upper 95% |Lower 95,0% |Upper
95,0% | |Intercept |426,7357 |100,2719 |4,255785 |0,000387 |217,5723
|635,8992 |217,5723 |635,8992 | |X1vaikų sk. |-214,674 |69,90237 |-3,07105
|0,006027 |-360,487 |-68,86 |-360,487 |-68,86 | |X2soc.ekon.grupė |176,7797
|101,2269 |1,746371 |0,096089 |-34,3758 |387,9352 |-34,3758 |387,9352 |
|X3išsilavinimas |-52,3313 |122,373 |-0,42764 |0,673484 |-307,597 |202,9342
|-307,597 |202,9342 | |X5galvos lytis |53,21243 |100,8187 |0,527803
|0,603443 |-157,092 |263,5165 |-157,092 |263,5165 | |
Y (vartojimo išlaidos) = 426,7357-214,674X1 +176,7797X2-52,3313X3+
53,21243X5
X3 (išsilavinimas) P-value 0,673484> 0,05
Pagal gautus iš lentelių rezultatus, gyvenamosios vietos (X4) P-value
reikšmė lygi 0,673484. Ji yra didžiausia iš visų P-value reikšmių, todėl
toliau tyrimas atliekamas be šio veiksnio ir jis laikomas nereikšmingu.
Significance F<α (0,080075<0,05), vadinasi bent vienas regresorius yra
reikšmingas.
Toliau pasinaudojant tomis pačiomis EXCEL
operacijomis, gaunami tokie
rezultatai:
SUMMARY OUTPUT | | | | | | | | | | | | | | | | | | |Regression Statistics
| | | | | | | | | |Multiple R |0,567591 | | | | | | | | |R Square
|0,322159 | | | | | | | | |Adjusted R Square |0,225325 | | | | | | | |
|Standard Error |208,8064 | | | | | | | | |Observations |25 || | | | | | | |
| | | | | | | | | | |ANOVA | | | | | | | | | | |df |SS |MS |F
|Significance F | | | | |Regression |3 |435161,3 |145053,8 |3,326912
|0,039304 | | | | |Residual |21 |915602,5 |43600,12 | | | | | | |Total
|24 |1350764 | | | | | | | | | | | | | | | | | | ||Coefficients
|Standard Error |t Stat |P-value |Lower 95% |Upper 95% |Lower 95,0% |Upper
95,0% | |Intercept |397,1477 |71,1501 |5,58183 |1,54E-05 |249,183 |545,1125
|249,183 |545,1125 | |X1vaikų sk. |-206,88 |66,15905 |-3,12702 |0,005095 |-
344,466 |-69,2951 |-344,466 |-69,2951 | |X2soc.ekon.grupė |180,3941
|98,89142 |1,824164 ||0,082391 |-25,2619 |386,0501 |-25,2619 |386,0501 |
|X5galvos lytis |71,6689 |89,32347 |0,802352 |0,431336 |-114,089 |257,4273
|-114,089 |257,4273 | |
Y (vartojimo išlaidos)= 397,1477 -206,88X1 + 180,3941X2 +71,6689X5
X5 (galvos lytis) P-value 0,431336> 0,05
Pagal gautus iš lentelių rezultatus, išsilavinimas (X5) P-value reikšmė
lygi 0,431336. Ji yra didžiausia iš visų P-value reikšmių, todėl toliau
tyrimas atliekamas be šio veiksnio ir jis laikomas nereikšmingu.
Significance F<α(0,039304<0,05), vadinasi bent vienas regresorius yra
reikšmingas. Toliau pasinaudojant tomis pačiomis EXCEL operacijomis,
gaunami tokie rezultatai:
SUMMARY OUTPUT | | | | | | | | | | | | | | | | | | |Regression Statistics
| | | | | | | | | |Multiple R |0,548981 | | | | | | | | |R Square ||0,30138
| | | | | | | | |Adjusted R Square |0,237869 | | | | | | | | |Standard
Error |207,109 | | | | | | | | |Observations |25 | | | | | | | | | | | | |
| | | | | |ANOVA | | | | | | | | | | |df |SS |MS |F |Significance F | | |
| |Regression |2 |407092,9 |203546,5 |4,745322 |0,019349 | | | | |Residual
|22 ||943671 |42894,13 | | | | | | |Total |24 |1350764 | | | | | | | |
| | | | | | | | | | |Coefficients |Standard Error |t Stat |P-value |Lower
95% |Upper 95% |Lower 95,0% |Upper 95,0% | |Intercept |430,758 |57,04417
|7,551305 |1,52E-07 |312,4555 |549,0605 |312,4555 |549,0605 | |X1vaikų sk.
|-196,501 |64,35451 |-3,05341 |0,005825 |-329,964 |-63,0376 |-329,964 |-
63,0376 | |X2soc.ekon.grupė |188,5271 |97,57088 |1,932206 |0,066313 |-
13,8228 |390,8769 |-13,8228 |390,8769 | |
Y (vartojimo išlaidos)= 430,758 -196,501X1 + 188,5271X2
X2 (socialinė-ekonominė grupė) P-value 0,066313>0,05
Pagal gautus iš lentelių rezultatus, išsilavinimas (X2) P-value reikšmė
lygi 0,066313. Ji yra didžiausia iš visų P-value reikšmių, todėl toliau
tyrimas atliekamas be šio veiksnio ir jis laikomas nereikšmingu.
Significance F<α(0,019349<0,05), vadinasi bent vienas regresorius yra
reikšmingas. Toliau pasinaudojant tomis pačiomis EXCEL operacijomis,
gaunami tokie rezultatai:
SUMMARY OUTPUT | | | | | | | | | | | | | | | | | | |Regression Statistics
| | | | | | | | | |Multiple R |0,427578 | | | | | | | | |R Square
|0,182823 | | | | | | | | |Adjusted R Square |0,147294 | | | | | | | |
|Standard Error |219,0705 | || | | | | | | |Observations |25 | | | | | | | |
| | | | | | | | | | |ANOVA | | | | | | | | | | |df |SS |MS |F
|Significance F | | | | |Regression |1 |246951 |246951 |5,145686 |0,033004
| | | | |Residual |23 |1103813 |47991,86 | | | | | | |Total |24 |1350764
| | | | | | | | | | | | | | | | | | |Coefficients |Standard Error |t
Stat |P-value |Lower 95% |Upper 95% |Lower 95,0% |Upper 95,0% | |Intercept
|477,6235 |54,61268 |8,745651 |8,99E-09 |364,6487 |590,5982 |364,6487
|590,5982 | |X1vaikų sk. |-132,061 |58,21732 |-2,26841 |0,033004 |-252,492
|-11,6292 |-252,492 |-11,6292 | |
Y (vartojimo išlaidos)= 477,6235-132,061X1
X1 (vaikų skaičius) P-value 0,033004<0,05
Pagal gautus iš lentelių rezultatus, vaikų skaičius (X1) P-value reikšmė
lygi 0,033004 ir ji mažesnė už 0,05, daugiau tyrimas neatliekamas.
Vartojimo išlaidų priklausomybę nuo namų ūkių vaikų skaičiaus aprašo
lygtis:
Y = 477,6235-132,061X1
Y – išlaidos vienam namų ūkio nariui, Lt;
X1 – vaikų skaičius iki 18 metų;
Didžiausios išlaidos, tenkančios vienam namų ūkio nariui bus tada, kai
vaikų skaičius iki 18 metų bus mažiausias:
Y= 477,6235-132,061*0 =477,6235Lt.
Mažiausios iišlaidos, tenkančios vienam namų ūkio nariui bus tada, kai
namų ūkį sudarys daugiausiai asmenų:
Y = 477,6235-132,061* 2=213.5015 Lt.
Remiantis gautais rezultatais, galima padaryti išvadą, kad namų ūkio
vartojimo išlaidos nepriklauso nuo gyvenamosios vietos, namų ūkio galvos
išsimokslinimo, namų ūkio galvos lyties ir socialinės-ekonominės grupės.
4. DETERMINACIJOS KOEFICIENTO ĮVERTIS
Determinacijos koeficientas parodo, kaip gerai mano pasirinktas
modelis aprašo duomenis. Determinacijos koeficientas gali priimti tokias
reikšmes: 0 ≤ R² ≤ 1. Kuo R² yra arčiau 1, tuo mano pasirinktas modelis
geriau aprašo duomenis.
Gaunu, kad R² = 0,182823. Tai reiškia, kad vartojimo išlaidos 18,28%
priklauso nuo disponuojamų pajamų, ir 81,77% nuo kitų, neįvertintų
reikšmių.
5. REGRESIJOS KOEFICIENTO REIKŠMINGUMO PATIKRINIMAS
Regresijos koeficiento reikšmingumas tikrinamas pagal Fišerio
kriterijų (F). Jis gaunamas iš EXCEL programos panaudojant operacijas Tools
– Data Analysis – Regression. Jis nurodytas lentelėse Significance F.
Toliau lyginamas su reikšmingumo lygmeniu (α = 0,05) ir, kuo šis kriterijus
mažesnis, jis neturi viršyti 0,05, tuo regresijos lygtis adekvatesnė
realiai padėčiai. Jeigu reikšmingumo lygmuo ά = 0,05 ir Significance
F<0,05, galima padaryti išvadą, kad bent vienas iš Xi yra reikšmingas namų
ūkio vartojimo išlaidoms. Pagal gautus regresinės analizės rezultatus
reikšmingas faktorius yra vaikų iki 18 metų skaičius, o nereikšmingi: namų
ūkio socialinės-ekonominės grupė, gyvenamoji vieta, namų ūkio galvos
išsilavinimas, namų ūkio galvos lytis.
IŠVADOS
Atlikus tyrimus, buvo nustatyta, kad reikšmingiausi faktoriai,
turintys įtaką išlaidoms,
yra vaikų iki 18 metų skaičius ir ekonominė-
socialinė grupė.
Įvertinus skurdo rodiklius buvo gauti tokie rezultatai:
L = 0,18333;
N = 0,367592;
I = 0,0673918;
Q = 0,033771185
4. Atlikus regresinę analizę buvo gauta regresijos lygtis:
Y (vartojimo išlaidos) = 477,6235-132,061X1
5. Išlaidos vienam namų ūkio nariui priklauso nuo vaikų skaičiaus iki 18
metų. Vartojimo išlaidoms vienam namų ūkio nariui visiškai neturi šie
faktoriai: gyvenamoji vieta, socialinės-ekonominės grupės, namų ūkio
galvos išsilavinimas bei namų ūkio galvos lyties.