LIETUVIŠKIEJI INTERNETO PUSLAPIAI
Šiame straipsnyje kalbama apie internetinio tekstyno kurimą bei kilusias problemas renkant ir siunčiant
tekstus iš interneto. Taip pat pateikiamas lietuviškuju interneto svetainiu skirtymas i tipus pagal tekstu
pobudi, i kokias zmoniu grupes jos orientuotos.
1 Ivadas
Populiarejant informacinems technologijoms gana svarbią vietą visuomeneje uzeme internetas, kaip
informacijos šaltinis ir bendravimo priemone. Nekontroliuojamai plaukiančios informacijos gausa bei ivairus jos
pobudis atskleidzia gana plačią, beveik neaprepiamą interneto tematiką. Pamazu vis labiau susidomima
lietuviškaisiais interneto puslapiais. Atsiranda ivairiausiu tyrinejimu ir darbu šia tema.
Vytauto Didziojo universitete Kompiuterines lingvistikos centre parengus bei ddar toliau pildant
bendrojo pobudzio Dabartines lietuviu kalbos tekstyną (šiuo metu apimanti 60 milijonu zodziu) taip pat paruošus
kelis specialaus pobudzio tekstynus, iškilo butinybe parengti internetini tekstyną, kuris butu pagrindinis šaltinis
interneto tekstu tyrinejimui. Šiuo metu kaupiama internetiniu tekstu duomenu baze pasieke apytiksliai 18,6
milijono zodziu skaičiu ir dar toliau pildoma. Prognozuojama, jog internetinis tekstynas turetu apimti apie 20
milijonu zodziu. Kadangi jis yra specialaus pobudzio, tai tokia apimtis yra pakankama. Tekstynas turetu buti
pakankamai reprezentatyvus, kad “tekstyne lyg veidrodyje atsispindetu kalba” [36]. Tai yra viena iiš tekstynu
kurimo sąlygu. Todel tekstu atranka šiam tekstynui nera oportunistine, o paremta subalansuotu atrankos
principu, [36] t. y. tekstai atrenkami taip, kad atspindetu interneto tekstu tipiškumą.
Šis darbas atliekamas keliais etapais. Visu pirma, reikia susirasti nemazą kieki internetiniu svetainiu
adresu. Lietuvoje kol kas nnera parengto didelio adresu zinyno, kuriame butu suregistruoti bent jau dauguma
adresu, ir to, matyt, neimanoma padaryti. Galima butu pamineti Lietuviškojo interneto katalogą [1] bei interneto
svetainę www.online.lt, kur pateikiama nemazai adresu, suskirstytu pagal veiklos sritis.
Kitas darbo etapas – iš interneto svetainiu išrinkti tekstus, kurie butu bent jau puses puslapio dydzio.
Tekstai imami kuo ivairiausiu sričiu, kad kuo labiau atspindetu konkrečios srities leksiką bei sintaksinę sandarą,
internetiniu tekstu pobudi bei zanrinę ivairovę. I ši etapą ieina tu tekstu parsiuntimas, neretai sukeliantis ivairiu
problemu bei parsiustu failu tvarkymas. Ši darbą atlikus, tekstai jungiami skirstant juos pagal veiklos sritis ir
pobudi.
Perzvelgus daugeli lietuviškojo interneto puslapiu ir ziurint i juos kaip i visumą, galima daryti nemazai
apibendrinimu ir iškelti klausimu: kokią informaciją teikia adresas, kokio tipo vyrauja svetaines, kiek
informatyvus tekstai, kkodel apskritai domimasi tekstais ir ar jie internete tokie svarbus.
2 Internetiniu adresu informatyvumas
Vienas pagrindiniu uzdaviniu – kaip iš gausybes adresu išrinkti, kurios svetaines galetu buti
tinkamiausios kuriant tekstyną. Juk adresą dazniausiai sudaro firmos, istaigos išsamus pavadinimas, pvz.:
http://www.ambergallery.lt – Gintaro muziejus-galerija; http://muziejai.mch.mii.lt – Lietuvos muziejai arba tik
zodziu pirmuju raidziu santrumpos, pvz.: http://www.lnm.lt/ – Lietuvos nacionalinis muziejus. Todel, jei dar iš
išsamiai nurodyto pavadinimo galima pasakyti kieno tie puslapiai, tai iš santrumpu gana sunku spręsti apie ką ta
svetaine.
Nemazai adresu netgi nera susiję su puslapiu kkureju ar istaiga, pvz.: http://www.elnet.lt/inema/ –
periodinis leidinys “Iš pirmo zvilgsnio”; http://www.iti.lt/~piketas/landyne/ – elektroninis “Šluotos” variantas;
http://freehosting2.at.webjump.com/ – Vidmanto Karoso puslapis; http://mp3.ku.lt/bilas/ – anekdotai apie Bilą
Klintoną; http://www.muza.lt/index.html – Kulturos ministerija; http://www.is.lt/karma/ – Antandrijos veislynas.
Tai apsunkina vartotoją, nes adresai nera informatyvus ir daug sunkiau nezinant adreso surasti reikiamą
informaciją. Lietuviškojo interneto kataloge šiek tiek padeda skirstymas pagal veiklos sritis.
6-toji magistrantu ir doktorantu konferencija
3 Internetiniu s vetainiu tipai
3.1 Svetainiu tipai pagal informacijos pobudi
Kadangi objektas yra tekstai, pagal tai internetines svetaines galima skirstyti i du tipus: tekstines ir
netekstines. Tekstiniu svetainiu pagrindas – informacijos pateikimas tekstu: aprašomos naujienos, ivykiai,
supazindinama su firmos veikla ar pan. Neretai iliustruojama nuotraukomis. Tokios svetaines dazniausiai
pasizymi nedidele nuorodu gausa, aiškia struktura, informacija pateikiama gana išsamiai.
Netekstinese svetainese paprastai teksto nedaug, dominuoja vaizdine medziaga: nuotraukos, piešiniai,
zemelapiai, diagramos, ivairios schemos bei lenteles. Jos pasizymi nuorodu gausa, taip pat pernelyg didele
dizaino spalvu gama. Tokios svetaines patraukia interneto naršytoju demesi, bet jos labai painios, neturi aiškios
strukturos ir, zinoma, tokią svetainę perziureti uzima gana daug laiko.
Teksto svarba internete gana nemaza. Kad ir kaip populiaretu grafinis vaizdas, vis tik interneto
puslapyje informacija dazniausiai perduodama tekstu, todel didzioji dauguma svetainiu yra tekstinio pobudzio.
Tekstas vis dar išlieka kaip pats patogiausias informacijos perdavimo budas.
Perziurejus daugybę svetainiu išryškeja bendros ju tendencijos, panašumai ir skirtumai. Labai sskiriasi
svetainiu pobudis, todel pagal pateiktą informaciją galima išskirti kelis svetainiu tipus (zr.1 pav):
1 pav. Svetainiu tipai.
1. Bene didziausią dali internete uzima firmu, imoniu prisistatymai, pvz.: saldainiu fabrikas “Ruta”
[32], “Narbutas ir Ko”[26] , prekybos namai “Piramide”[21] ir kt.
Perzvelgus tokias svetaines matyti, kad jos neišsiskiria originalumu. Ryškeja bendra šiu interneto
svetainiu struktura. Puslapyje galima pastebeti mazdaug septynias nuorodas, pasikartojančias beveik visose
svetainese: apie mus, naujienos, veikla, produktai, paslaugos, kontaktai, nuorodos. Pirmosios keturios nuorodos
beveik be išimčiu pasizymi tekstine medziaga, kuri šiuo atveju labiausiai ir reikalinga.
• Apie mus skyrelyje pristatoma firma, papasakojama jos ikurimo ir gyvavimo istorija;
• Naujienose aptariamos kai kurios firmos naujoves, ivykiai, nauji produktai;
• Veikla – veiklos apibudinimas, teisinis veiklos pagrindas, kur pateikiami istatymai, nutarimai ar ju
nuorodos ir kt.
Enciklopediniu duomenu
puslapiai
SVETAINIU
TIPAI
Moksliniu, vyriausybiniu,
religiniu organizaciju
puslapiai
Firmu, imoniu
prisistatymai
Kulturiniai puslapiai Pramoginiai puslapiai
Asmeniniai puslapiai
Periodika
Moksliniu darbu,
referatu
puslapiai
Projektu pristatymai
Gozines literaturos
skaitiniai
Pokalbiai,
konferencijos
Informaciniai puslapiai
Informacine visuomene ir universitetines studijos Kaunas, 2001 balandzio 26 d.
• Produktai – firmos gaminamos ar parduodamos prekes, neretai pateikiamos ištisos kolekcijos ar
parodos su aprašymais nuotraukomis. Šis nuorodu skyrius dazniausiai buna bene išsamiausias ir
reprezentatyviausias.
• Paslaugos – dazniausiai papunkčiui išvardijamos firmoje teikiamos paslaugos, klientu aptarnavimas.
• Kontaktai – nurodomos panašios veiklos kryptys ir firmos.
• Nuorodu skyrelyje pateikiamos kitu svetainiu nuorodos panašia tema, dazniausiai uzsienio svetainiu.
2. Moksliniu istaigu, institutu, draugiju, religiniu bendruomeniu, vyriausybes puslapiu (pvz.: “Lietuvos
Raudonasis kryzius”[31], Vegetaru ddraugija [5], Etiniu farmacijos kompaniju atstovybiu asociacija [11],
Vilniaus krašto totoriu bendruomene[13]) struktura panaši i firmu puslapiu, tik neretai pridedami ivairus
projektai, agitaciniai straipsniai, ilgi veiklos aprašymai, periodiniai leidiniai.
3. Kulturiniai puslapiai, pvz.: Po Kamanu rezervatą [15], Kuršiu Nerijos nacionalinis parkas [27]. Šie
puslapiai išsiskiria tuo, kad yra daugiausia pazintinio pobudzio. Jie nustebino informacijos gausa, plačiais
aprašymais, moksliniais tyrinejamojo pobudzio tekstais. Bene daugiausia puslapiu gamtos, geografijos,
zoologijos tema, nemazai parodu, istoriniu ekspoziciju pristatymu. Gana daug informacijos apie ivairiuose
miestuose vykstančius kulturinius renginius.
4. Pramoginiai puslapiai, pavyzdziui, anekdotai, laisvalaikio pasiskaitymai, hobi skirti laisvalaikiui ir
yra dazniausiai humoristinio pobudzio. Prie šio tipo puslapiu galima priskirti taip pat dauguma asmeniniu
puslapiu, kurie skiriami vien tik pramogai ar hobi aprašymui. Tekstu kalba pasizymi šnekamosios kalbos
atspalviu, neretai iškraipomas lietuviškasis alfabetas. Nemazai šia tema yra periodiniu leidiniu, tokiu, kaip
elektroninis “Šluotos” variantas [16], zurnalai “Šuns pasaulis”[6], “Ore”[17]. Atskiros svetaines anekdotu,
horoskopu, virtuves receptu, televizijos laidu.
5. Moksliniu darbu, referatu puslapiai dazniausiai skirti atskiru profesiju specialistams. Prie šio tipo
svetainiu galima priskirti ir asmenines, kuriose taip pat neretai publikuojami pačiu parašyti moksliniai darbai.
Galima butu pamineti svetainę Mokslo centras [24], kur publikuojami pagal temines sritis suskirstyti ivairus
referatai ir moksliniai darbai.
6. Enciklopediniai duomenys svetainese taip pat nereti. Pateikiami ivairus zinynai, pvz.: ginklu,
astronomijos, fizikos, vaistu, Lietuvos bei kitu šaliu ir miestu enciklopediniai duomenys.
7. Projektu
pristatymai, pvz.: projektas “Aš galiu”, “Sniego gniuzte”, bankininkystes studentu
projektai, nusikalstamumo prevencija Lietuvoje.
8. Informaciniai puslapiai (kas kur kada), pvz.: Lithuania Online, Lietuvos – Vokietijos informacine
sistema [10], Lietuvos nacionalinis informacijos centras “Eurika” [12], kino filmai, Lietuvos avialinijos [18] ir
dar daug kitu. Šie puslapiai dazniausiai skirti informacijos paieškai.
9. Periodiką internete galima skirstyti i pramoginę (zurnalai “Moteris” [25], ,,Panele” [29],
“Bombonešis” [8]), bendrąją (“Kauno diena” [3], “Lietuvos rytas” [22], “Verslo zinios” [34]) ir specialiąją
(“Mokslo Lietuva” [2], “Geras skonis” [23], “Baznyčios zinios” [19], “Keturi ratai” [30], ““Septynios meno
dienos” [9]). Dauguma šiu zurnalu išleidziami ne tik elektronine forma. Ju elektroninis variantas šiek tiek skiriasi
nuo popierinio varianto.
10. Grozines literaturos skaitiniai, pvz.: Klasikine lietuviu literatura-antologija [1]. Čia ieitu ne tik
literaturos kuriniai, bet ir pačiu skaitytoju pasakojimai bei kuryba, pvz.: Polar page [20]– poliarines keliones,
Vilniaus autostopo klubas [7], puslapis apie NSO [28].
11. Asmeniniai puslapiai (hobi, savęs pristatymai). Tai individualus puslapiai, neretai ir garsiu zmoniu,
kuriu tikslas papasakoti apie save, pristatyti savo pomegius, hobi, kurybą ir noras uzmegzti kontaktą su panašiu
pomegiu zmonemis. ŠŠiuose puslapiuose dominuoja nuotraukos, paveiksleliai, teksto gana nedaug, dominuoja
šnekamosios kalbos frazes.
12. Pokalbiai, konferencijos, seimo posedziai, pvz.: interviu su ivairiais zmonemis, elektroniniu
konferenciju svetaines. Šioms svetainems budingas dialogiškumas [37], klausimo-atsakymo forma.
3.2 Svetainiu tipai pagal adresatą
Beveik kiekviena interneto svetaine orientuota i tam tikrą zzmoniu grupę, besiskiriančią savo amziumi,
išsilavinimu, su skirtingais tikslais, turinčią savu pomegiu, interesu. Internetas yra toks platus informacijos
šaltinis, kad jame smalsumą gali patenkinti ivairiausiu poreikiu turintys individai. Taigi pagal tai, i kokią zmoniu
grupę orientuota svetaine, puslapius galima skirstyti i kelias grupes:
1. Puslapiai smalsiam interneto naršytojui, megstančiam sensacijas (pvz.: raganu klubas, skaičiu
magija, burtai);
6-toji magistrantu ir doktorantu konferencija
2. Eiliniam interneto vartotojui (firmu reklaminiai puslapiai, naujienos);
3. Specialaus pobudzio puslapiai specialiam zmoniu ratui (ivairiu profesiju, religiju, organizaciju,
bendruomeniu atstovams);
4. Specialaus pobudzio puslapiai plačiajai visuomenei (ivairiu ligu gydymas, grozine literatura,
kulturiniai puslapiai);
5. Puslapiai vaikams.
Apskritai internetinis tekstas skiriasi nuo knyginio teksto. Del elektronines formos ir nuorodu
naudojimo tekstui budingas fragmentiškumas, informacijos paskirstymas dalimis. Suskaidytą i daug daliu tekstą
zymiai lengviau skaityti, matoma aiški struktura. Nors, kita vertus, daugybe nuorodu klaidina. Viena ppagrindiniu
internetinio teksto funkciju – sudominti ir patraukti vartotoją savo informacijos turiniu. Todel tekstas kai kuriais
aspektais primena reklamini, ir neretai taip yra del komerciniu paskatu. Del tokio pobudzio, tekstams
charakterizuoti nebetinka iprastiniai funkciniai stiliai ir ju zanrai, kadangi internetinis tekstas balansuoja tarp
rašytines ir sakytines kalbos. Vienas iš tokiu bruozu – griztamasis ryšys, arba dialogiškumas, kada svetaineje
paliekamas atskiras skyrelis nuomonems ir komentarams.
Taigi toks internetiniu puslapiu skirstymas atsizvelgiant i puslapiuose pateikiamą tekstinę informaciją,
leidzia geriau suvokti bendrą svetainiu vaizdą ir, zinoma, yra svarbus internetinio tekstyno ssudarymui. Tokiu ar
panašiu skirstymu bus paremtas internetiniu tekstu grupavimas bei ju jungimas. Tačiau prieš tai minetinas dar
vienas internetinio tekstyno kurimo etapas – tekstu parsiuntimas bei ju tvarkymas.
4 Tekstu siuntimas ir ju tvarkymo problematika
Kadangi tekstu analizei bei internetinio tekstyno kurimui reikalinga tekstu visuma, tai tekstai turi buti
parsiusti ir sugrupuoti pasirenkant tam tikrus kriterijus. Tai daroma pasitelkiant Vido Daudaravičiaus
(Kompiuterines lingvistikos centras) parengtą programą “Kolektoriu”, kuri skirta tekstu parsiuntimui, ju
apdorojimui ir kt. Be šios programos dar dirbama su “Webzip”, kuri papildomai naudojama tik tekstu
parsiuntimui.
Pagrindine problema, su kuria susiduriama parsisiuntus tekstus – tai didele disproporcija tarp interneto
puslapyje matomu tekstu ir parsiustu failu. Paprastai atsiunčiama daugiau tekstu nei matoma svetaineje. Taip
atsitinka del to, kad svetainese yra beveik nepastebimu nuorodu, kurios daznai lokalizuotos puslapio pakraštyje
ir išryškeja tik bakstelejus pele. Tai apsunkina darbą kuriant tekstyną, nes be jau perziuretu tekstu tenka
papildomai tikrinti ar parsiustieji tekstai atitinka nusistatytus kriterijus, t. y. ar parsiustame faile pakankamai
teksto ir kokio jis pobudzio.
Parsiusti failai su tekstais yra perziurimi, nustatomas teksto tipas ir zanras. Tekstai nera išskaidomi ir
sumaišomi. Jie lieka konkrečios interneto svetaines kontekste ir tuo budu atspindi svetaines tipą ir pobudi.
5 Išvados
Aptarus internetinio tekstyno kurimo etapus ir apibudinus tekstyno kurimo problematiką galima teigti,
jog gana nemazai problemu kelia internetiniu svetainiu adresai, kurie yra nneinformatyvus ir apsunkina vartotoją,
taip pat tekstu siuntimas.
Atlikta gana subjektyvi interneto svetainiu klasifikacija teksto aspektu leidzia suvokti bendrą
lietuviškojo interneto svetainiu tekstu vaizdą, tematiką, išskirti kai kuriuos tekstu zanrus ir svetainiu pobudi bei
tipus. Ši klasifikacija taip pat atspindi internetinio tekstyno tekstu visumą bei zanrinę ivairovę.
Kadangi iškilo butinybe tyrineti internetą, tai internetinis tekstynas turetu pasitarnauti kaip pagalbine
priemone interneto analizei.
Literaturos sąrašas
[1] http://anthology.lms.lt/lindex.html
[2] http://ic.lms.lt/ml.html
[3] http://kaunodiena.lt
[4] http://receptai.w3.lt/
[5] http://sveikata.elnet.lt/vegetarai/
[6] http://www.5ci.net/dogs/
[7] http://www.autostop.lt/pirmas.html
[8] http://www.coolzone.lt/music/bomboneshis.htm
Informacine visuomene ir universitetines studijos Kaunas, 2001 balandzio 26 d.
52
[9] http://www.culture.lt/7menodienos
[10] http://www.deutschland.lt/lt/default.htm
[11] http://www.efa.lt/
[12] http://www.eureka-cost.lt/
[13] http://www.gaumina.lt/totoriai/
[14] http://www.humoras.lt/
[15] http://www.is.lt/venta/mokiniu/kamanai/
[16] http://www.iti.lt/~piketas/landyne/
[17] http://www.laisvalaikis.lt/ore.htm
[18] http://www.lal.lt/
[19] http://www.lcn.lt/bzinios/
[20] http://www.lgt.lt/polar/
[21] http://www.lithill.lt/piramide/
[22] http://www.lrytas.lt
[23] http://www.meniu.lt/
[24] http://www.mokslo.centras.lt/main.php3
[25] http://www.moteris.lt/