Duomenų bazių apžvalga

Turinys:

1. Įvadas 3

2. Duomenų bazė 4

3. Duomenų bazės samprata 4

4. Informacijos objektai 6

5. Duomenų bazių valdymo sistema (DBVS) 7

6. Duomenų bazių modeliai 8

7. Literatūra 9

Įvadas

Su paprasčiausiais duomenų bazių technologijos elementais susipažįstama jau dirbant su tekstų procesoriais ir skaičiuoklėmis, tačiau ten vartojamos priemonės yra gana kuklios. Jas tiks-liau būtų vadinti sąrašų tvarkymo priemonėmis. Be to, duomenų bazių valdymo sistemos siūlo ne tik duomenų tvarkymo priemones, bet ir ištisą taikomų uždavinių parengimo kompiuteriniam sprendimui technologiją. Prieš projektuojant duomenų bazę, turi būti atliekama išsami dalykinės srities analizė: apibrėžiami sprendžiami uždaviniai, rengiamų ataskaitų sandara, numatomi anali-zuojamų objektų aprašymo llaikymo ir tvarkymo būdai, jų sąryšiai. Panaudojant tokios analizės re-zultatus ir DBVS įrangą, sukuriamos įvairias informacines paslaugas teikiančios kompiuterizuotos informacijos sistemos.

Akivaizdu, kad, parengiant didesnių įmonių ir kitas sudėtingos sandaros informacijos sistemas, reikia turėti išsamias kompiuterio modeliavimo, informacijos sistemų ir DBVS projekta-vimo ir kitų sričių žinias. Dažniausiai tokį darbą atlieka specializuotos projektavimo įstaigos. Ta-čiau naudotis tokių sistemų paslaugomis, parengti joms duomenis, formuoti užklausas privalo mo-kėti kiekvienas kompiuterių vartotojas. Taip pat naudinga mokėti patiems susikurti bei naudoti ne-sudėtingas, pritaikytas konkrečios darbo vietos dduomenų tvarkymui bazes.

Duomenų bazė. Duomenų bazė (DB) – pagal kokį nors požymį susijusių duomenų, apdorojamų kompiuteriu, visuma. Tai dideli kompiuterio atminties įrenginiuose saugomų logiškai tarpusavyje susietų duomenų masyvų rinkiniai, iš kurių lengvai ir greitai iškviečiami bei pateikiami norimu pavidalu vvaldomi duomenys, panaudojant programinę įrangą – duomenų bazės valdymo sistemą, DBVS. Terminas „duomenų bazė“ – tai tiesioginis vertimas iš anglų kalbos Data base. Šis terminas atsirado XX amžiaus 6-ojo dešimtmečio pabaigoje. Juo įvardijami du skirtingi objektai. Pirmą reikšmę mes apibrėžiame – tai kompiuteryje laikome pagal tam tikrus požymius susiję duo-menys. Kita duomenų bazės reikšmė yra tokia: kompiuterinė programa, skirta šiems duomenims tvarkyti. Pagrindinės duomenų bazių funkcijos yra šios:

 aprašyti duomenų struktūrą,

 įvesti, tikrinti, rūšiuoti, saugoti duomenis,

 susisteminti duomenis,

 atlikti duomenų paiešką pagal pateiktus kriterijus,

 atlikti nesudėtingus skaičiavimus kuriant ataskaitas,

 paruošti suvestines ataskaitas,

 išspausdinti norimas ataskaitas.

Duomenų bazėse dažniausiai kaupiama informacija apie objektus, reiškinius bei pro-cesus. Objektai, apie kuriuos pateikiama informacija, paprastai esti susiję. Tai turi atspindėti ir ku-riamoje duomenų bazėje, t.y. reikia nurodyti ryšius tarp įrašų. Vadinasi, prieš kkuriant duomenų bazę reikia apgalvoti ryšius tarp kaupiamų duomenų elementų bei duomenų tvarkymo principą.

Duomenų bazės samprata. Iš kelių DB sampratų pagrindinės yra trys:

1.Ši samprata tapatina DB su saugomais duomenimis. Duomenų pavyzdžiai: bibliote-kos kartoteka, telefonų abonentų knyga, pirkėjų užsakymų registracijos žurnalas ir kt. DB – tai kar-tu saugomų ir tarpusavyje susijusių duomenų rinkinys. Taip centralizuotai saugomi duomenys ati-tinka realaus pasaulio tam tikros – skirtos automatizuoti – dalies (taikymo srities) modelį. Saugo-mus duomenis dažniausiai naudoja ne vienas, o keli vartotojai. DB vartotojo ssamprata platesnė – apima ne tik asmenį, bet ir taikomąją programą.

Pažymėtina, kad duomenų aprašymai ir jų santykiai būna dviejų tipų: loginiai ir fizi-niai. Fizinis duomenų aprašymas nurodo fizinius duomenų saugojimo būdus išorinėje atmintinėje. Jiems aprašyti dažniausiai vartojami šie terminai: fizinis įrašas, duomenų rinkinys (failas), fizinė duomenų bazė. Loginis duomenų aprašymas skirtas DB vartotojams. Jiems aprašyti dažniausiai var-tojami šie terminai: duomenų elementas (laukas), duomenų agregatas (grupė), įrašas, failas, duome-nų bazė. Duomenų struktūros ir jų ryšiai fiziniame loginiame aprašyme gali būti skirtingi.

Saugomiems DB duomenims būdingos šios pagrindinės savybės:

vientisumas (integralumas);

pertekliškumas;

neprieštaringumas;

saugumas;

nepriklausomumas.

DB vadinama vientisa, jei ji atitinka tam tikras duomenų saugojimo sąlygas tvarkant duomenis. Vartotojui turi būti uždrausta keisti DB taip, kad po pakeitimo kuri nors sąlyga būtų ne-vykdoma. Antroji savybė nusako tai, jog duomenys saugomi vengiant jų dubliavimo. Kuriant DB, siekiama minimizuoti duomenų pertekliškumą. Kai yra pertekliškumas, t.y. kelios duomenų kopi-jos, joms veltui eikvojama atmintis, o modifikuojant duomenis tenka kelis kartus naudoti tas pačias atnaujinimo operacijas. Be to, kai duomenų kopijos atitinka skirtingas atnaujinimo stadijas, gali būti pateikta prieštaringa informacija. Todėl duomenų neprieštaringumas taip pat labai svarbi DB savy-bė. Duomenys, esantys DB, turi būti apsaugoti nuo tyčinio ar netyčinio jų pakeitimo ar sunaikini-mo. DB saugumo savybė apima ir apsaugą nnuo neleistinos duomenų peržiūros. Kiekvienam DB vartotojui turi būti apibrėžtos teisės į duomenų vartojimą. Duomenų nepriklausomumas reiškia, kad duomenų tvarkymo taikomosios programos nesikeičia, modifikuojant duomenų saugojimo ir orga-nizavimo būdą. Pažymėtina, kad gali būti keičiamas ir fizinis, ir loginis duomenų organizavimas.

2. Antroji DB samprata tapatina ją su programų, kurios atlieka duomenų apdorojimo operacijas, rinkiniu. Tokia programinė įranga vadinama duomenų bazių valdymo sistema (DBVS). DBVS turi programines priemones duomenų struktūrai aprašyti, įdiegti, vartoti ir palaikyti. Galima sakyti, kad DBVS atlieka vartotojo sąsajos su saugomais duomenimis vaidmenį.

3. Pagal trečiąją traktuotę DB sąvoka apibrėžiama plačiausiai: Ji apima sisteminius bei technologinius aspektus. DB – tai informacinių, matematinių, kalbinių, programinių, techninių ir organizacinių priemonių, įvertinant saugomus duomenis ir technologiniame procese užimtą perso-nalą sistema centralizuotam duomenų kaupimui, siekiant gauti tuo metu reikalingą informaci-ją. TAIKO-MOSIOS PROGRAMOS VARTOTOJAI

1 pav. DBS struktūra

DB traktuojama kaip saugomų ir DBVS visuma, kuri kartais vadinama duomenų ba-zės sistema (DBS). Prie DBS dažniausiai ir jų vartotojai, t.y. asmenys, tiesiogiai naudojantys DB, ir taikomosios programos, atliekančios operacijas su DB. Tokios sistemos struktūra pavaizduota 1pav.

Informacijos objektai. Informacijos objektas arba esybė yra aprašomos aplinkos elementas, apie kurį pageidaujama laikyti informaciją. Išskiriant atskirus objektus, vadovaujamasi tiek natūraliomis dalykinės srities savybėmis, tiek duomenų apdorojimo poreikiais. Pvz., įstaigos dirbančiųjų aprašymo objektas darbuotojas yra nnatūralus kiekvienos įstaigos informacijos modelio elementas, tačiau kartais jį naudinga skaidyti į smulkesnius objektus. Tada sakysime, kad pagrindi-nis objektas darbuotojas turi jam pavaldžius pagalbinės informacijos objektus apie jų kvalifikaciją ir adresus.

Dažniausiai objektų tipai sudaromi registruoti duomenims apie tokius aprašomų ap-linkų elementus:

 žmones, pavyzdžiui, įstaigos darbuotojus, mokesčių mokėtojus ir t.t.;

 daiktus, pavyzdžiui, apie pagamintą produkciją, turimas prekes, išteklius;

 reiškinius ir procesus, pavyzdžiui, lėktuvų skrydžius, prekių gavimą ir t.t.

Duomenų įrašu vadinamas atskiro objekto (ar subjekto) aprašų rinkinys, lauku – tam tikros objekto (ar subjekto) savybės aprašas. Vienoje kortelėje esantys duomenys sudaro duomenų bazės įrašą. Kiekvienos kortelės struktūra ta pati – jos turi tuos pačius laukus (vardas, pavardė, gi-mimo metai, mėnuo, diena) .

Jei duomenų bazėje saugomos tiktai vieno objekto reikšmės, jos sandara būna labai paprasta. Ją apibūdina objekto reikšmių registravimui skirtų įrašų laukų pavadinimai ir parametrai. Pvz., duomenims apie prekybos įmonėje saugomas prekes registruoti galima naudoti įrašus, kurių sandarą aprašo 1 lentelė.

Objekto savybė Registravimo lauko tipas

Prekės pavadinimas

Prekės kodas

Tiekėjas

Kaina

Kiekis Tekstinis (24 simboliai)

Sveikasis skaičius

Tekstinis (24 simboliai)

Realusis skaičius

Realusis skaičius

1 lent. Elementarios duomenų bazės sandaros aprašymas

1 lent. parašytai duomenų bazei tvarkyti pakanka skaičiuoklės. Tada jos reikšmių laikymui ir tvar-kymui patogu naudoti lentelę (2 lent.), kurios stulpeliuose registruojami prekių savybės, o eilutėse – išsamūs atskirų prekių aprašymai (įrašai).

Prekės pava-

dinimas Kodas Tiekėjas Kaina Kiekis

Žiem. striukė 45 Telšių

Mastis 450,00 200

Vasar. striukė 22 Kauno Urmas 120,00 400

Paltas 12 Vilniaus Mada 800,00 200

2 lent. Prekes aprašančių įrašų lentelė

3

Duomenų bazių valdymo sistema (DBVS). DBVS – sudėtinga programinė

įranga, kuri leidžia kurti, valdyti, atnaujinti duomenų bazes, siekiant gauti naują valdymo informa-ciją. DBVS turi atlikti keletą pagrindinių funkcijų:

1. Duomenų kaupimas. Sistemoje turi būti aiškiai apibrėžta duomenų įvedimo procedūra, jų kaupimo struktūra, turi būti galimybė apžvelgti, papildyti duomenis.

2. Duomenų paieška. Sistemoje turi būti vartotojui patogios galimybės rasti ir atrinkti reikalin-gus duomenis (pagal pateiktus požymius) .

3. Duomenų apdorojimas. Sistemoje turi būti priemonės duomenims redaguoti, keisti jų išdės-tymo ttvarką, aprašyti naujas savybes ir pašalinti nereikalingas.

4. Ataskaitų kūrimas. Ataskaita – tai rezultatų, išvadų pateikimas apie turimą informaciją. Ku-riant didžiules duomenų bazes ataskaitos sudaro galimybę apžvelgti jose esamą informaciją.

DBVS užtikrina vartotojo, kompiuterio operacinės sistemos ir duomenų bazės bendravimą:

2 pav. DBVS programinės įrangos bendravimo struktūra

DBVS programinė įranga suprojektuota vykdyti didelį skaičių tarpusavyje susietų duomenų failų. Vartotojas, aprašęs norimų saigoti duomenų tipą ir naudodamasis DBVS, sukuria duomenų bazės failus. Lengvai valdomas nesudėtingas mechanizmas padeda duomenų bazių val-dymo sistemai saugoti, iškviesti, laikyti duomenis ir jjais manipuliuoti. Naudodamiesi duomenų ba-zių valdymo sistemomis vartotojai iškviečia saugomus duomenis.

DBVS šalia duomenų bazės failų nuolat naudojami du failai (3 pav.):

 duomenų žodynas,

 pasikeitimų žurnalas.

Užklausa

Atsakymai į

užklausas

3 pav. Duomenų žodyno ir pasikeitimo žurnalo naudojimas šalia duomenų bazės

Duomenų žodynas yra tarsi mmaža duomenų bazė, kurioje saugoma informacija apie duomenis ir duomenų strūktūrą, jų vietą duomenų bazėje. Pasikeitimų žurnale saugomas išsamus visos duomenų bazės valdymo sistemos veiklos aprašas: naujų duomenų įvestis, esamų atnaujini-mas, rezultatų gavikas ir saugojimas, jų panaudojimas tiesiogiai ar per ryšių linijas ir kompiuterių tinklus.

Pasaulyje sukurta ir vartojama daugybė specialių duomenų bazių valdymo sistemų. Viena populiariausių ir paprasčiausių tokių sistemų yra kartu su paketu MS Office pateikiama DBVS MS Access.

Mini ir universaliųjų

kompiuterių Asmeninių

kompiuterių

DB2

Oracle

Ingres

Net Ware SQL

SQO base

SY BASE

INFORMIX

R:dbase

WATCOM dBase

PARADOX

Access

Approach

Alpha Four

Fifth Dimension (Mac)

3 lent. Populiariausios DBVS

Duomenų bazių modeliai.

Pagrindiniai duomenų bazių modeliai yra tokie:

 hierarchinis,

 tinklinis,

 sąryšinis (reliacinis).

Hierarchiniame modelyje duomenys suskirstomi į giminingas grupes ir sudaromas kiekvienos iš jų šeimos medis. Modelio šeimos medyje sukuriami trijų tipų įrašai: šaknies, tėvo ir vaiko. Tėvo įrašo struktūra yra aukštesnio llygmens negu vaiko. Kiekvienas vaiko įrašas šeimos medyje virš savęs gali turėti tik vieną tėvo įrašą. Kai vaiko įrašas tampa tėvo įrašu, tai jis žemiau savęs gali turėti daug naujų vaiko įrašų. Aukščiausiame lygmenyje esantis įrašas vadinamas šaknies įrašu. Jis yra modelio raktas, jungiantis šeimos medžio šakas. Kai šiame modelyje norima saugoti ar iškviesti įrašą, duomenų bazių valdymo sistema pradeda judėti nuo šaknies įrašo žemyn per visus įrašus, kol randa reikiamą. Šiame modelyje nėra loginių ryšių tarp suprojektuotų duomenų gimi-ningų ggrupių ir atskirų šeimos medžio šakų – įrašų. Svarbiausia teigiama hierarchinio modelio savy-bė yra ta, kad duomenys gali būti patogiai saugomi ir iškviečiami šeimos medžiu judant žemyn, kai prireikia kurti ataskaitą.

Tinklinis modelis paprastesnis už hierarchinį, bet kiekvienas vaiko įrašas gali turėti daugiau kaip vieną tėvo įrašą. Kuriant šį modelį pavyko nustatyti loginius ryšius tarp skirtingų gi-miningų grupių. Bet koks įrašas gali būti susietas su bet kuriuo kitu duomenų elementu. Teigiama modelio savybė yra ta, kad tarp įrašų galima sukurti sudėtingus loginius ryšius. Tačiau, kaip ir hie-rarchinio modelio atveju, yra ribojamos vartotojo galimybės iškviečiant duomenis, esančius skirtin-gų giminingų grupių įrašuose.

Reliacinis duomenų bazės modelis kuriamas iš lentelių rinkinio. Šis modelis yra po-puliariausias, kuriame naudojamos gana paprastos ir nesunkiai įsisavinamomis duomenų tvarkymo operacijomis. Lentelių tvarkymui taikomos lengvai suprantamos aibių teorijos operacijos: sąjunga, sankirta, skirtumas. Vartotojai tokią bazę gali įsivaizduoto kaip lentelių sistemą ir iš jose laikomų duomenų paprastomis operacijomis formuoti naujus darinius ir įvairias ataskaitas. Lentelių rinkiny-je visos lentelės yra susietos loginiais ryšiais ir turi turėti bendrą duomenų elementą arba lauko raktą. Lauko rakto užduotis – identifikuoti kiekvieną įrašą, todėl bet kuris duomuo, saugomas vie-noje lentelėje. Reliacinio modelio esmę sudaro tai, kad sudėtingi loginiai ryšiai tarp įrašų išreiškia-mi paprastu būdu. Suryšinės duomenų bazės yyra labai naudingos: iš jų galima automatiškai iškviesti duomenis, nes jie yra susieti tarp savęs loginiais ryšiais – sąryšiais.

Reliacinės DBVS irgi labai įvairios nuo paprastų, skirtų vienam vartotojui ar nedide-liai grupei, pvz., dBase, Foxpro, Clarion iki galingų duomenų bazių serverių, galinčių tvarkytis su didelių organizacijų ar net valstybinio masto duomenimis, Oracle, Informix, Sybase.

Iš sąryšinių duomenų bazių populiariausios yra taikomųjų programų paketuose Micro-soft Office XP naudojamos duomenų bazių valdymo sistemos Microsoft Access 2002, pasižyminčios nesudėtinga, bet vaizdžia ir patogia sandara.

Literatūra:

1. D. Janickienė. Informatika. Vadovėlis, Vytauto Didžiojo Universitetas, Kaunas, 2003

2. V.Sekliuckis, S. Gudas, G. Garšva. INFORMACIJOS SISTEMOS IR DUOMENŲ BAZĖS, Vadovėlis. Kaunas: Technologija, 2003

3. V. Dagys ir kt. Duomenų bazės. ECDL atstovybės Lietuvoje sertifikuota mokomoji medžia-ga, L-kla „Žara“, Vilnius, 2000