Paieška Apie tekstyną Kaip naudotis Kaip cituoti Publikacijos Kontaktai

Apie tekstyną

Šiuo metu (2018 m.) interneto vartotojams pateikiamą laisvai prieinamą Sakytinės lietuvių kalbos tekstyną sudaro daugiau nei 320 000 žodžių.

Tekstyno pradžia siejama su 2006 m. ir 2007–2008 m. LVMSF finansuotais projektais (C-48/2006, L-12/2008), skirtais buitinės šnekamosios kalbos įrašams kaupti ir transkribuoti. Šių projektų metu buvo sukurtas tekstyno pagrindas ‒ morfologiškai anotuotas 225 000 žodžių apimties Sakytinės lietuvių kalbos tekstynas, prie kurio prisidėjo įvairių Lietuvos mokslo institucijų darbuotojai, kaupę sakytinės kalbos duomenis įvairiuose Lietuvos regionuose (I. Dabašinskienė, L. Kamandulytė-Merfeldienė, I. Balčiūnienė, S. Dereškevičiūtė, I. Prameneckienė, L. Vaicekauskienė, J. Girčienė, G. Tamaševičius, M. Ramonienė, N. Linkevičienė, E. Petrašiūnienė, D. Pagojienė, S. Sirvydienė, V. Drukteinytė, G. Kačiuškienė, R. Gedrimas). Vėliau tekstynas gausintas ir plėstas vykdant Lietuvos mokslo tarybos projektus pagal Nacionalinę lituanistikos plėtros 2009–2015 m. programą: Sintaksinės sakytinės lietuvių kalbos ypatybės: tekstyno analizė (LIT-9-11) ir pagal Valstybinę lituanistinių tyrimų ir sklaidos 2016–2024 m. programą: Šiuolaikinė sakytinė lietuvių kalba: leksikos ir gramatikos tyrimas tekstynų lingvistikos metodu (LIP-085/2016).

Iš viso tekstyną sudarančių pokalbių kaupime ir paruošime dalyvavo daugiau nei 50 tyrėjų ir jų prižiūrimų asmenų. Pokalbių įrašų trukmė labai įvairi ‒ nuo 1 minutės (dažniausiai tai pokalbiai, vykstantys aptarnavimo srityje) iki 0,5 ar net 1 valandos. Tekstyną sudarantys pokalbių įrašai yra transkribuoti ir morfologiškai koduoti naudojant lietuvių kalbai adaptuotą programą CHILDES (https://childes.talkbank.org/) adaptavo A. Utka, I. Dabašinskienė, L. Kamandulytė-Merfeldienė).

Sakytinės lietuvių kalbos tekstynas yra subalansuotas ir apima pokalbius, kauptus atsižvelgiant į sakytinės kalbos pobūdį (spontaninė / parengta kalba; privati / vieša komunikacija) ir struktūrą (monologai / dialogai / polilogai), komunikacijos vietą, socialinius pašnekovų santykius ir demografinius rodiklius. Didžiąją tekstyno dalį sudaro spontaninė kalba, kurios pokalbius galima suskirstyti į spontaninius privačius pokalbius ir spontaninius institucinius pokalbius. Spontaniniai privatūs pokalbiai dažniausiai vyksta namuose, svečiuose ar panašioje aplinkoje tarp gerai pažįstamų, artimų kalbėtojų. Spontaninei institucinei komunikacijai priskiriami aptarnavimo srities pokalbiai, vykstantys maitinimo įstaigose (restorane, kavinėje ir pan.), prekybos vietose (parduotuvėje, turguje, kioske, knygyne, vaistinėje, teatro / kino / autobusų bilietų kasoje ir pan.), paslaugas teikiančiose įstaigose (kirpykloje, grožio salone, siuvykloje, banke, automobilių servise, draudimo įmonėje ir pan.), darbo vietoje ar biure. Mažesnę tekstyno dalį sudaro parengta kalba, daugiausiai apimanti akademinę komunikaciją (paskaitos universitetuose, kolegijose, pranešimai konferencijose, posėdžiai, pokalbiai tarp akademinės bendruomenės narių) ir komunikaciją žiniasklaidoje (TV, radijo laidų įrašai). Tekstyne taip pat yra pokalbių, įrašytų kitose vietose: gatvėje, kieme, bažnyčioje, mokykloje, vaikų darželyje ir kt.

Sakytinės lietuvių kalbos tekstyne sukaupti pokalbiai apima 1086 informantų, kurių amžius nuo 3 iki 81 metų, kalbą (2018 m.). Tarp visų kalbėtojų vyriškosios lyties informantai sudaro 39,3 %, moteriškosios lyties ‒ 60,7 %. Pagal ryšį tarp kalbėtojų tekstyno pokalbiai yra skirstomi į tiesioginius pokalbius ir netiesioginius pokalbius, vykstančius telefonu, Skype ir kt. nuotolinio bendravimo priemonėmis.

Šiuo metu internetinės tekstyno versijos vartotojai gali atlikti paiešką pagal žodį arba žodžio formą bei gauti duomenis apie pasirinktos formos dažnumą visame tekstyne arbo jo dalyje, taip pat matyti gramatinę informaciją, filtruoti rezultatus pagal lytį, amžiaus grupę, pokalbio vietą. Artimiausiu metu planuojama įdiegti anglišką tekstyno versiją, kuria bus patogu naudotis užsienio mokslininkams ar užsieniečiams, besimokantiems lietuvių kalbos.

Už bendradarbiavimą kuriant naująją tekstyno versiją dėkojame prof. Inetai Dabašinskienei, dr. Laurai Kamandulytei-Merfeldienei, dr. Ingridai Balčiūnienei, dr. Andriui Utkai, Viktorijai Kavaliauskaitei, Ievai Prameneckienei, Eugenijui Railai.