LIETUVIŠKIEJI INTERNETO PUSLAPIAI

Šiame straipsnyje kalbama apie internetinio tekstyno kurimą bei kilusias problemas renkant ir siunčiant

tekstus iš interneto. Taip pat pateikiamas lietuviškuju interneto svetainiu skirtymas i tipus pagal tekstu

pobudi, i kokias zmoniu grupes jos orientuotos.

1 Ivadas

Populiarejant informacinems technologijoms gana svarbią vietą visuomeneje uzeme internetas, kaip

informacijos šaltinis ir bendravimo priemone. Nekontroliuojamai plaukiančios informacijos gausa bei ivairus jos

pobudis atskleidzia gana plačią, beveik neaprepiamą interneto tematiką. Pamazu vis labiau susidomima

lietuviškaisiais interneto puslapiais. Atsiranda ivairiausiu tyrinejimu ir darbu šia tema.

Vytauto Didziojo universitete Kompiuterines lingvistikos centre parengus bei ddar toliau pildant

bendrojo pobudzio Dabartines lietuviu kalbos tekstyną (šiuo metu apimanti 60 milijonu zodziu) taip pat paruošus

kelis specialaus pobudzio tekstynus, iškilo butinybe parengti internetini tekstyną, kuris butu pagrindinis šaltinis

interneto tekstu tyrinejimui. Šiuo metu kaupiama internetiniu tekstu duomenu baze pasieke apytiksliai 18,6

milijono zodziu skaičiu ir dar toliau pildoma. Prognozuojama, jog internetinis tekstynas turetu apimti apie 20

milijonu zodziu. Kadangi jis yra specialaus pobudzio, tai tokia apimtis yra pakankama. Tekstynas turetu buti

pakankamai reprezentatyvus, kad “tekstyne lyg veidrodyje atsispindetu kalba” [36]. Tai yra viena iiš tekstynu

kurimo sąlygu. Todel tekstu atranka šiam tekstynui nera oportunistine, o paremta subalansuotu atrankos

principu, [36] t. y. tekstai atrenkami taip, kad atspindetu interneto tekstu tipiškumą.

Šis darbas atliekamas keliais etapais. Visu pirma, reikia susirasti nemazą kieki internetiniu svetainiu

adresu. Lietuvoje kol kas nnera parengto didelio adresu zinyno, kuriame butu suregistruoti bent jau dauguma

adresu, ir to, matyt, neimanoma padaryti. Galima butu pamineti Lietuviškojo interneto katalogą [1] bei interneto

svetainę www.online.lt, kur pateikiama nemazai adresu, suskirstytu pagal veiklos sritis.

Kitas darbo etapas – iš interneto svetainiu išrinkti tekstus, kurie butu bent jau puses puslapio dydzio.

Tekstai imami kuo ivairiausiu sričiu, kad kuo labiau atspindetu konkrečios srities leksiką bei sintaksinę sandarą,

internetiniu tekstu pobudi bei zanrinę ivairovę. I ši etapą ieina tu tekstu parsiuntimas, neretai sukeliantis ivairiu

problemu bei parsiustu failu tvarkymas. Ši darbą atlikus, tekstai jungiami skirstant juos pagal veiklos sritis ir

pobudi.

Perzvelgus daugeli lietuviškojo interneto puslapiu ir ziurint i juos kaip i visumą, galima daryti nemazai

apibendrinimu ir iškelti klausimu: kokią informaciją teikia adresas, kokio tipo vyrauja svetaines, kiek

informatyvus tekstai, kkodel apskritai domimasi tekstais ir ar jie internete tokie svarbus.

2 Internetiniu adresu informatyvumas

Vienas pagrindiniu uzdaviniu – kaip iš gausybes adresu išrinkti, kurios svetaines galetu buti

tinkamiausios kuriant tekstyną. Juk adresą dazniausiai sudaro firmos, istaigos išsamus pavadinimas, pvz.:

http://www.ambergallery.lt – Gintaro muziejus-galerija; http://muziejai.mch.mii.lt – Lietuvos muziejai arba tik

zodziu pirmuju raidziu santrumpos, pvz.: http://www.lnm.lt/ – Lietuvos nacionalinis muziejus. Todel, jei dar iš

išsamiai nurodyto pavadinimo galima pasakyti kieno tie puslapiai, tai iš santrumpu gana sunku spręsti apie ką ta

svetaine.

Nemazai adresu netgi nera susiję su puslapiu kkureju ar istaiga, pvz.: http://www.elnet.lt/inema/ –

periodinis leidinys “Iš pirmo zvilgsnio”; http://www.iti.lt/~piketas/landyne/ – elektroninis “Šluotos” variantas;

http://freehosting2.at.webjump.com/ – Vidmanto Karoso puslapis; http://mp3.ku.lt/bilas/ – anekdotai apie Bilą

Klintoną; http://www.muza.lt/index.html – Kulturos ministerija; http://www.is.lt/karma/ – Antandrijos veislynas.

Tai apsunkina vartotoją, nes adresai nera informatyvus ir daug sunkiau nezinant adreso surasti reikiamą

informaciją. Lietuviškojo interneto kataloge šiek tiek padeda skirstymas pagal veiklos sritis.

6-toji magistrantu ir doktorantu konferencija

3 Internetiniu s vetainiu tipai

3.1 Svetainiu tipai pagal informacijos pobudi

Kadangi objektas yra tekstai, pagal tai internetines svetaines galima skirstyti i du tipus: tekstines ir

netekstines. Tekstiniu svetainiu pagrindas – informacijos pateikimas tekstu: aprašomos naujienos, ivykiai,

supazindinama su firmos veikla ar pan. Neretai iliustruojama nuotraukomis. Tokios svetaines dazniausiai

pasizymi nedidele nuorodu gausa, aiškia struktura, informacija pateikiama gana išsamiai.

Netekstinese svetainese paprastai teksto nedaug, dominuoja vaizdine medziaga: nuotraukos, piešiniai,

zemelapiai, diagramos, ivairios schemos bei lenteles. Jos pasizymi nuorodu gausa, taip pat pernelyg didele

dizaino spalvu gama. Tokios svetaines patraukia interneto naršytoju demesi, bet jos labai painios, neturi aiškios

strukturos ir, zinoma, tokią svetainę perziureti uzima gana daug laiko.

Teksto svarba internete gana nemaza. Kad ir kaip populiaretu grafinis vaizdas, vis tik interneto

puslapyje informacija dazniausiai perduodama tekstu, todel didzioji dauguma svetainiu yra tekstinio pobudzio.

Tekstas vis dar išlieka kaip pats patogiausias informacijos perdavimo budas.

Perziurejus daugybę svetainiu išryškeja bendros ju tendencijos, panašumai ir skirtumai. Labai sskiriasi

svetainiu pobudis, todel pagal pateiktą informaciją galima išskirti kelis svetainiu tipus (zr.1 pav):

1 pav. Svetainiu tipai.

1. Bene didziausią dali internete uzima firmu, imoniu prisistatymai, pvz.: saldainiu fabrikas “Ruta”

[32], “Narbutas ir Ko”[26] , prekybos namai “Piramide”[21] ir kt.

Perzvelgus tokias svetaines matyti, kad jos neišsiskiria originalumu. Ryškeja bendra šiu interneto

svetainiu struktura. Puslapyje galima pastebeti mazdaug septynias nuorodas, pasikartojančias beveik visose

svetainese: apie mus, naujienos, veikla, produktai, paslaugos, kontaktai, nuorodos. Pirmosios keturios nuorodos

beveik be išimčiu pasizymi tekstine medziaga, kuri šiuo atveju labiausiai ir reikalinga.

• Apie mus skyrelyje pristatoma firma, papasakojama jos ikurimo ir gyvavimo istorija;

• Naujienose aptariamos kai kurios firmos naujoves, ivykiai, nauji produktai;

• Veikla – veiklos apibudinimas, teisinis veiklos pagrindas, kur pateikiami istatymai, nutarimai ar ju

nuorodos ir kt.

Enciklopediniu duomenu

puslapiai

SVETAINIU

TIPAI

Moksliniu, vyriausybiniu,

religiniu organizaciju

puslapiai

Firmu, imoniu

prisistatymai

Kulturiniai puslapiai Pramoginiai puslapiai

Asmeniniai puslapiai

Periodika

Moksliniu darbu,

referatu

puslapiai

Projektu pristatymai

Gozines literaturos

skaitiniai

Pokalbiai,

konferencijos

Informaciniai puslapiai

Informacine visuomene ir universitetines studijos Kaunas, 2001 balandzio 26 d.

• Produktai – firmos gaminamos ar parduodamos prekes, neretai pateikiamos ištisos kolekcijos ar

parodos su aprašymais nuotraukomis. Šis nuorodu skyrius dazniausiai buna bene išsamiausias ir

reprezentatyviausias.

• Paslaugos – dazniausiai papunkčiui išvardijamos firmoje teikiamos paslaugos, klientu aptarnavimas.

• Kontaktai – nurodomos panašios veiklos kryptys ir firmos.

• Nuorodu skyrelyje pateikiamos kitu svetainiu nuorodos panašia tema, dazniausiai uzsienio svetainiu.

2. Moksliniu istaigu, institutu, draugiju, religiniu bendruomeniu, vyriausybes puslapiu (pvz.: “Lietuvos

Raudonasis kryzius”[31], Vegetaru ddraugija [5], Etiniu farmacijos kompaniju atstovybiu asociacija [11],

Vilniaus krašto totoriu bendruomene[13]) struktura panaši i firmu puslapiu, tik neretai pridedami ivairus

projektai, agitaciniai straipsniai, ilgi veiklos aprašymai, periodiniai leidiniai.

3. Kulturiniai puslapiai, pvz.: Po Kamanu rezervatą [15], Kuršiu Nerijos nacionalinis parkas [27]. Šie

puslapiai išsiskiria tuo, kad yra daugiausia pazintinio pobudzio. Jie nustebino informacijos gausa, plačiais

aprašymais, moksliniais tyrinejamojo pobudzio tekstais. Bene daugiausia puslapiu gamtos, geografijos,

zoologijos tema, nemazai parodu, istoriniu ekspoziciju pristatymu. Gana daug informacijos apie ivairiuose

miestuose vykstančius kulturinius renginius.

4. Pramoginiai puslapiai, pavyzdziui, anekdotai, laisvalaikio pasiskaitymai, hobi skirti laisvalaikiui ir

yra dazniausiai humoristinio pobudzio. Prie šio tipo puslapiu galima priskirti taip pat dauguma asmeniniu

puslapiu, kurie skiriami vien tik pramogai ar hobi aprašymui. Tekstu kalba pasizymi šnekamosios kalbos

atspalviu, neretai iškraipomas lietuviškasis alfabetas. Nemazai šia tema yra periodiniu leidiniu, tokiu, kaip

elektroninis “Šluotos” variantas [16], zurnalai “Šuns pasaulis”[6], “Ore”[17]. Atskiros svetaines anekdotu,

horoskopu, virtuves receptu, televizijos laidu.

5. Moksliniu darbu, referatu puslapiai dazniausiai skirti atskiru profesiju specialistams. Prie šio tipo

svetainiu galima priskirti ir asmenines, kuriose taip pat neretai publikuojami pačiu parašyti moksliniai darbai.

Galima butu pamineti svetainę Mokslo centras [24], kur publikuojami pagal temines sritis suskirstyti ivairus

referatai ir moksliniai darbai.

6. Enciklopediniai duomenys svetainese taip pat nereti. Pateikiami ivairus zinynai, pvz.: ginklu,

astronomijos, fizikos, vaistu, Lietuvos bei kitu šaliu ir miestu enciklopediniai duomenys.

7. Projektu

pristatymai, pvz.: projektas “Aš galiu”, “Sniego gniuzte”, bankininkystes studentu

projektai, nusikalstamumo prevencija Lietuvoje.

8. Informaciniai puslapiai (kas kur kada), pvz.: Lithuania Online, Lietuvos – Vokietijos informacine

sistema [10], Lietuvos nacionalinis informacijos centras “Eurika” [12], kino filmai, Lietuvos avialinijos [18] ir

dar daug kitu. Šie puslapiai dazniausiai skirti informacijos paieškai.

9. Periodiką internete galima skirstyti i pramoginę (zurnalai “Moteris” [25], ,,Panele” [29],

“Bombonešis” [8]), bendrąją (“Kauno diena” [3], “Lietuvos rytas” [22], “Verslo zinios” [34]) ir specialiąją

(“Mokslo Lietuva” [2], “Geras skonis” [23], “Baznyčios zinios” [19], “Keturi ratai” [30], ““Septynios meno

dienos” [9]). Dauguma šiu zurnalu išleidziami ne tik elektronine forma. Ju elektroninis variantas šiek tiek skiriasi

nuo popierinio varianto.

10. Grozines literaturos skaitiniai, pvz.: Klasikine lietuviu literatura-antologija [1]. Čia ieitu ne tik

literaturos kuriniai, bet ir pačiu skaitytoju pasakojimai bei kuryba, pvz.: Polar page [20]– poliarines keliones,

Vilniaus autostopo klubas [7], puslapis apie NSO [28].

11. Asmeniniai puslapiai (hobi, savęs pristatymai). Tai individualus puslapiai, neretai ir garsiu zmoniu,

kuriu tikslas papasakoti apie save, pristatyti savo pomegius, hobi, kurybą ir noras uzmegzti kontaktą su panašiu

pomegiu zmonemis. ŠŠiuose puslapiuose dominuoja nuotraukos, paveiksleliai, teksto gana nedaug, dominuoja

šnekamosios kalbos frazes.

12. Pokalbiai, konferencijos, seimo posedziai, pvz.: interviu su ivairiais zmonemis, elektroniniu

konferenciju svetaines. Šioms svetainems budingas dialogiškumas [37], klausimo-atsakymo forma.

3.2 Svetainiu tipai pagal adresatą

Beveik kiekviena interneto svetaine orientuota i tam tikrą zzmoniu grupę, besiskiriančią savo amziumi,

išsilavinimu, su skirtingais tikslais, turinčią savu pomegiu, interesu. Internetas yra toks platus informacijos

šaltinis, kad jame smalsumą gali patenkinti ivairiausiu poreikiu turintys individai. Taigi pagal tai, i kokią zmoniu

grupę orientuota svetaine, puslapius galima skirstyti i kelias grupes:

1. Puslapiai smalsiam interneto naršytojui, megstančiam sensacijas (pvz.: raganu klubas, skaičiu

magija, burtai);

6-toji magistrantu ir doktorantu konferencija

2. Eiliniam interneto vartotojui (firmu reklaminiai puslapiai, naujienos);

3. Specialaus pobudzio puslapiai specialiam zmoniu ratui (ivairiu profesiju, religiju, organizaciju,

bendruomeniu atstovams);

4. Specialaus pobudzio puslapiai plačiajai visuomenei (ivairiu ligu gydymas, grozine literatura,

kulturiniai puslapiai);

5. Puslapiai vaikams.

Apskritai internetinis tekstas skiriasi nuo knyginio teksto. Del elektronines formos ir nuorodu

naudojimo tekstui budingas fragmentiškumas, informacijos paskirstymas dalimis. Suskaidytą i daug daliu tekstą

zymiai lengviau skaityti, matoma aiški struktura. Nors, kita vertus, daugybe nuorodu klaidina. Viena ppagrindiniu

internetinio teksto funkciju – sudominti ir patraukti vartotoją savo informacijos turiniu. Todel tekstas kai kuriais

aspektais primena reklamini, ir neretai taip yra del komerciniu paskatu. Del tokio pobudzio, tekstams

charakterizuoti nebetinka iprastiniai funkciniai stiliai ir ju zanrai, kadangi internetinis tekstas balansuoja tarp

rašytines ir sakytines kalbos. Vienas iš tokiu bruozu – griztamasis ryšys, arba dialogiškumas, kada svetaineje

paliekamas atskiras skyrelis nuomonems ir komentarams.

Taigi toks internetiniu puslapiu skirstymas atsizvelgiant i puslapiuose pateikiamą tekstinę informaciją,

leidzia geriau suvokti bendrą svetainiu vaizdą ir, zinoma, yra svarbus internetinio tekstyno ssudarymui. Tokiu ar

panašiu skirstymu bus paremtas internetiniu tekstu grupavimas bei ju jungimas. Tačiau prieš tai minetinas dar

vienas internetinio tekstyno kurimo etapas – tekstu parsiuntimas bei ju tvarkymas.

4 Tekstu siuntimas ir ju tvarkymo problematika

Kadangi tekstu analizei bei internetinio tekstyno kurimui reikalinga tekstu visuma, tai tekstai turi buti

parsiusti ir sugrupuoti pasirenkant tam tikrus kriterijus. Tai daroma pasitelkiant Vido Daudaravičiaus

(Kompiuterines lingvistikos centras) parengtą programą “Kolektoriu”, kuri skirta tekstu parsiuntimui, ju

apdorojimui ir kt. Be šios programos dar dirbama su “Webzip”, kuri papildomai naudojama tik tekstu

parsiuntimui.

Pagrindine problema, su kuria susiduriama parsisiuntus tekstus – tai didele disproporcija tarp interneto

puslapyje matomu tekstu ir parsiustu failu. Paprastai atsiunčiama daugiau tekstu nei matoma svetaineje. Taip

atsitinka del to, kad svetainese yra beveik nepastebimu nuorodu, kurios daznai lokalizuotos puslapio pakraštyje

ir išryškeja tik bakstelejus pele. Tai apsunkina darbą kuriant tekstyną, nes be jau perziuretu tekstu tenka

papildomai tikrinti ar parsiustieji tekstai atitinka nusistatytus kriterijus, t. y. ar parsiustame faile pakankamai

teksto ir kokio jis pobudzio.

Parsiusti failai su tekstais yra perziurimi, nustatomas teksto tipas ir zanras. Tekstai nera išskaidomi ir

sumaišomi. Jie lieka konkrečios interneto svetaines kontekste ir tuo budu atspindi svetaines tipą ir pobudi.

5 Išvados

Aptarus internetinio tekstyno kurimo etapus ir apibudinus tekstyno kurimo problematiką galima teigti,

jog gana nemazai problemu kelia internetiniu svetainiu adresai, kurie yra nneinformatyvus ir apsunkina vartotoją,

taip pat tekstu siuntimas.

Atlikta gana subjektyvi interneto svetainiu klasifikacija teksto aspektu leidzia suvokti bendrą

lietuviškojo interneto svetainiu tekstu vaizdą, tematiką, išskirti kai kuriuos tekstu zanrus ir svetainiu pobudi bei

tipus. Ši klasifikacija taip pat atspindi internetinio tekstyno tekstu visumą bei zanrinę ivairovę.

Kadangi iškilo butinybe tyrineti internetą, tai internetinis tekstynas turetu pasitarnauti kaip pagalbine

priemone interneto analizei.

Literaturos sąrašas

[1] http://anthology.lms.lt/lindex.html

[2] http://ic.lms.lt/ml.html

[3] http://kaunodiena.lt

[4] http://receptai.w3.lt/

[5] http://sveikata.elnet.lt/vegetarai/

[6] http://www.5ci.net/dogs/

[7] http://www.autostop.lt/pirmas.html

[8] http://www.coolzone.lt/music/bomboneshis.htm

Informacine visuomene ir universitetines studijos Kaunas, 2001 balandzio 26 d.

52

[9] http://www.culture.lt/7menodienos

[10] http://www.deutschland.lt/lt/default.htm

[11] http://www.efa.lt/

[12] http://www.eureka-cost.lt/

[13] http://www.gaumina.lt/totoriai/

[14] http://www.humoras.lt/

[15] http://www.is.lt/venta/mokiniu/kamanai/

[16] http://www.iti.lt/~piketas/landyne/

[17] http://www.laisvalaikis.lt/ore.htm

[18] http://www.lal.lt/

[19] http://www.lcn.lt/bzinios/

[20] http://www.lgt.lt/polar/

[21] http://www.lithill.lt/piramide/

[22] http://www.lrytas.lt

[23] http://www.meniu.lt/

[24] http://www.mokslo.centras.lt/main.php3

[25] http://www.moteris.lt/