Lietuvių kalbos tekstynas

Paieška tekstyne

    Vytauto Didžiojo universiteto Humanitarinių mokslų fakulteto Kompiuterinės lingvistikos centre parengtas 100 milijonų žodžių apimties lietuvių kalbos tekstynas. Tai elektroninį pavidalą turinčių ir specialia programine įranga aprūpintų tekstų visuma, kurie skirti filologinei, statistinei, sociologinei ar kitokiai kalbos vienetų vartosenos analizei. Tekstyno rengimą 1997 metais parėmė Lietuvos valstybinis mokslo ir studijų fondas, tolesnę jo plėtrą ir tobulinimą remia Valstybinė lietuvių kalbos komisija prie Lietuvos Respublikos Seimo.

    Tekstyną sudaro nepriklausomybės laikotarpio leidiniai, parinkti taip, kad kuo geriau atspindėtų dabartinę rašytinę lietuvių kalbą: bendroji periodika - respublikinių ir vietinių laikraščių tekstai, ir specialioji periodika, skirta ir bet kokio išsilavinimo skaitytojui, ir specialistui. Likusią tekstyno dalį sudaro grožinė ir kitokia literatūra (mokslinė, populiaroji) bei įvairūs dalykinį pobūdį turintys dokumentai ir leidiniai.

Tekstyno sandara (2002.10.15 - 102 mln. žodžių)

    Šis tekstynas yra daugiau bendro pobūdžio nei specialus, parengtas pagal skaitomumo tendencijas, tęstinis, ištisų tekstų rinkinys, sudaromas pagal kai kurių kitų Europos kalbų (anglų, vokiečių, danų, čekų, etc.) tekstynų sandaros principus.

Tekstyno paieškos sistema, paruošta Vido Daudaravičiaus, leidžia:

    1. Atlikti žodžio paiešką:
        1.1.vienoje ar keliose tekstyno dalyse;
        1.2. visame tekstyne.
    2. Sužinoti pasirinkto žodžio statistinę informaciją visame ir atskirose tekstyno dalyse.
    3. Ieškoti pasirinkto žodžio konkrečia gramatine forma, pvz., nepriklausomybės arba naudojant simbolį *, kuris leistų ieškoti visų žodžio gramatinių formų, pvz., nepriklausomybė, nepriklausomybės, nepriklausomybei.

Pasinaudoti kitomis galimybėmis, t. y. atlikti statistinę kalbos vienetų vartosenos analizę bei sužinoti tikslesnius tekstų šaltinius galima Kompiuterinės lingvistikos centre, Donelaičio g. 52-206.



© 1998 - 2002 VDU Kompiuterinės lingvistikos centras