Saturday, February 22, 2014

ქართული ენის ტექნოლოგიზება: პირველი რიგის გადაუდებელი ამოცანები



პროფ. ტარიელ ფუტკარაძე

ქართული ენის ტექნოლოგიზება:
პირველი რიგის გადაუდებელი ამოცანები

შესავალი.

ქართული ენა სახელმწიფო ენად გამოცხადდა 23 საუკუნის წინ...
რუსეთის საბჭოთა იმპერიაში იძულებით ყოფნის დროს, 1978 წლის 14 აპრილს, საქართველოს მოსახლეობის ღირსეულმა შვილებმა, ქართველებმაც და სხვა ეთნიკური ჯგუფების წარმომადგენლებმაც, დაიცვეს საქართველოს სახელმწიფო ენის სტატუსი, შესაბამისად, 14 აპრილი ოფიციალურად უნდა აღინიშნებოდეს  საქართველოს სახელმწიფო ენის დაცვის დღე და არა - მხოლოდ ქართველთა დედაენის დღე.
შდრ.:
14 აპრილი დღემდე ოფიციალურად კვალიფიცირდება, როგორც ქართველთა დედაენის დღე; ასეთი სახელდება ნაკლებად იძლევა საშუალებას, 14 აპრილი იზეიმონ საქართველოს მოქალაქე ეთნიკურმა სომხებმა, აზერბაიჯანლებმა, რუსებმა, ოსებმა, აფხაზებმა და .. დედაენად მიჩნევის შემთხვევაში ამ დღეს რა უნდა იზეიმონ, მაგალითად, საქართველოს მოქალაქე სომხებმა? თუკი 14 აპრილი ხელისუფლების მიერ ოფიციალურად გამოცხადდება საქართველოს სახელმწიფო ენის დღედ, დარწმუნებული ვარ, საქართველოს მოქალაქენი ამ დღეს პატივისცემით აღნიშნავენ არა მხოლოდ თბილისში, ბათუმში, ზუგდიდსა თუ თელავში, არამედ, ახალქალაქშიც, მარნეულშიც, წალკაშიც... მოვა დრო, ცხინვალშიც, გალშიც, სოხუმშიც და ..
ვფიქრობ, 14 აპრილის სახელდება მხოლოდ ქართველთა დედაენის დღედ აკნინებს 35 წლის წინანდელი მოვლენის ზოგადსახელმწიფოებრივ მნიშვნელობას და ხელს არ უწყობს  ჩვენი ეთნიკური უმცირესობების ინტეგრაციას ქართულენოვან სახელმწიფოში.
აქვე აღვნიშნავ:
 მრავალი საუკუნეა, ქართველები დედაენის დღეს ვუწოდებთ ლაზარეს შაბათს.

ბოლო პერიოდში ხელისუფლების მიერ არაადეკვატურად ნაკლები ყურადღება ეთმობა საქართველოს სახელმწიფო ენას; არადა, დედა ენა არის ნაციის არსებობის საფუძველი, ხოლო სახელმწიფო ენა ქვეყნის ღირსების საზომია; შესაბამისად, ყველა ნორმალური ხელისუფლება განსაკუთრებულ ყურადღებას აქცევს სახელმწიფოს მთავარ ენას, პარალელურად, უცხო ენებსა თუ უმცირესობების ენებს; სამწუხაროდ, დღეს საქართველოში ბევრს ლაპარაკობენ რეგიონული თუ უცხო ენების შესახებ; მაგალითად, საქართველოს უსაფრთხოების ოფიციალურ კონცეფციაში გათვალისწინებულია ინგლისური ენის სწავლების აუცილებლობა, მაგრამ გააზრებული არ არის საქართველოს სახელმწიფო ენის სტატუსის პერსპექტივა; კერძოდ, ქართული ენა, როგორც სახელმწიფო ენა დე ფაქტო არ ფუნქციონირებს საქართველოს ტერიტორიის მესამედზე, დანარჩენ ტერიტორიაზე კი მისი დაცულობის ხარისხი კრიტიკას ვერ უძლებს; უსაფრთხოების კონცეფციაში არაფერია ნათქვამი ამ მიმართულებით.

ქართული ენის ტექნოლოგიზება - ახალი არსებითი გამოწვევა.

თანამედროვე ტექნოლოგიები რადიკალურად შეცვლის მსოფლიოს ენათა მომავალს. საქართველოში ჯერჯერობით არ არსებობს ქართული ენის სრულმასშტაბიან ტექნოლოგიზებაზე ორიენტირებული არც ერთი ინსტიტუტი; შედეგად, ცივილიზებულ ხალხებს შორის ქართველი ერი და საქართველოს სახელმწიფო ყველაზე ნაკლებადაა მომზადებული ამ დიდი გამოწვევისთვის.
თანამედროვე თუ მომავალი ტექნოლოგიური ნახტომების პირობებში ქართული სალიტერატურო ენა კულტურულ ენათა რიგში რომ დარჩეს, საამისოდ აუცილებელია, დროულად განხორციელდეს ჯერ ნაწერი, შემდეგ კი, უახლოეს მომავალში,  ზეპირი ტექსტის ავტომატური თარგმანი; ეს შესაძლებელს გახდის, რომ საქართველოს მოქალაქემ თავის სახელმწიფო ენაზე მიიღოს გლობალურ ქსელში არსებული ინფორმაციები.
თანამედროვე სახელმწიფოს ღირსების ერთ-ერთი უმთავრესი საზომია სახელმწიფო ენის ტექნოლოგიზების დონე; გარდა ამისა, მხოლოდ ქართული ენის თანამედროვე ტექნოლოგიების ენად ქცევის შემთხვევაში შეინარჩუნებს ქართველი ერი თავისი კულტურის განმსაზღვრელ უმთავრეს ფენომენს - დედაენას; შესაბამისად, ავტომატური თარგმანის პარალელურად, აუცილებელია მომზადდეს კომპიუტერული პროგრამები, რომლებიც უზრუნველყოფს ქართული ენის სრულმასშტაბიან ტექნოლოგიზებას.
თავის დროზე მსოფლიოს მრავალი ენა დაიკარგა იმიტომ, რომ მისმა მფლობელმა ხალხმა დროულად ვერ შექმნა დამწერლობა თავისი დედაენისათვის; თანამედროვე პირობებში ბევრი მრავალსაუკუნოვანი სამწიგნობრო ტრადიციის ენა და სახელმწიფო ენა გაქრება, თუკი  მოცემული ენა დროულად ვერ გახდება ინტერნეტსივრცის, ავტომატური თარგმანების, ულტრათანამედროვე ტექნიკის ზეპირი ბრძანებით მართვის ენა; კერძოდ, ვფიქრობ, აუცილებელია, სახელმწიფოს პროგრამული დაფინანსებით (და არა, მოკლევადიანი საგრანტო წესით) დროულად განხორციელდეს მრავალპროფილიანი გრძელვადიანი პროექტი, რომლის პროდუქცია იქნება კომპიუტერული პროგრამები, რომლებიც:
) ქართულ ზეპირ მეტყველებას გადააქცევს ნაბეჭდ ტექსტად,
) ავტომატურად აამეტყველებს ქართულ ნაბეჭდ ელექტრონულ ტექსტს,
) გააციფრებს ნაბეჭდ პროდუქციასა და ხელნაწერებს,
) განახორციელებს სრულყოფილ ავტომატურ ქართულენოვან მართლწერას,
) განახორციელებს ავტომატურ თარგმანს ქართულიდან სხვა ენებზე და პირიქით...

წარმოდგენილი ამოცანების განსახორციელებლად ასევე პროგრამული დაფინანსებით სასწრაფოდაა შესაქმნელი:
1. ქართული ენის დიდი ელექტრონული განმარტებითი  ლექსიკონი /სადაც შევა როგორც სალიტერატური ენის, ასევე, ქართველთა დიალექტების ლექსიკაც/;
2. ელექტრონული მრავალდარგოვანი ტერმინოლოგიური ლექსიკონი;
3. სამწიგნობრო ენის ნორმების ინტერაქტიული ვებპორტალი;
4. საკუთარი სახელების ნორმატიული ელექტრონული ლექსიკონი;
5. ქართული ენის ტექსტების ეროვნული კორპუსი, სადაც შევა ქართული სალიტერატურო ენის მასალაც და ქართველთა დიალექტური მონაცემებიც /მეგრულ-ლაზური და სვანური იდიომების ჩათვლით/ და სხვ.
შედარებით ვრცლად შევეხებით ქართული ტექსტების ეროვნული კორპუსის საკითხს:
ქართული ტექსტების ეროვნული კორპუსი (სალიტერატურო ქართულისა და ქართველური დიალექტების მონაცემები) ქართულ ენას შეუნარჩუნებს ისტორიულ ეროვნულ (გამაერთიანებლურ) და კულტურულ ფუნქციას. დღეს არის მცდელობა, ქართული ტექსტების კორპუსის პარალელურად დაიგეგმოს /და შეიქმნას/ მეგრული, სვანური და ლაზური ტექსტების დამოუკიდებელი კორპუსებიც. უახლოეს პერიოდში ენობრივი კორპუსი იქცევა ერის /ეთნიკური ჯგუფების/ იდენტობის უმთავრეს განმსაზღვრელ ფაქტორად, შესაბამისად, ქართული ტექსტების ეროვნული კორპუსის ნაცვლად ოთხი დამოუკიდებელი "ენის" კორპუსის (ქართულის, მეგრულის, ლაზურის, სვანურის) შექმნის მცდელობა მოემსახურება მავანთა ინტერესს, ენობრივ-ეთნიკურ-კულტურულად დაანაწევროს მრავალსაუკუნოვანი ქართველი ერი. ასევე, პრობლემურია არნ. ჩიქობავას ენათმეცნიერების ინსტიტუტის პროექტიც: "საქართველოს ლინგვისტური პორტრეტი", რომლის მიხედვითაც ქართული ენის პარალელურად დამოუკიდებელ ენებად ითვლება მეგრულ-ლაზური და სვანური; აქ სხვა წინააღმდეგობაცაა: საქართველოს მოსახლეობის "ლინგვისტური პორტრეტი" ვერ შეიქმნება მხოლოდ ქართველური მასალით. 
ვფიქრობ, ლოგიკურია, მეგრულ-სვანური-ლაზური დიალექტური მასალა, სხვა ქართველურ დიალექტურ (ხევსურულ, იმერულ, ტაოურ, ჰერულ, კახურ, მესხურ...) მონაცემებთან ერთად შევიდეს ქართული ენის ერთიან ეროვნული კორპუსში დიალექტების სტატუსით; კერძოდ: სხვა მრავალი ენის მსგავსად, ქართველურ ენობრივ სამყაროშიც ენა-კილოების სტატუსი ჩვენ მიერ სოციოლინგვისტური კრიტერიუმებით ფასდება, შესაბამისად, ჩვენი პროექტის მიხედვით, ქართული ტექსტების ეროვნულ კორპუსს აქვს ქართული სტანდარტული ენისა და ქართველური დიალექტური მასალის განყოფილებები, რომელთა ლექსიკური ფონდები ქართველთა სამწიგნობრო ენის ერთიან პერსპექტიულ სალექსიკონო ბაზადაა გააზრებული.

ქართული ეროვნული კორპუსის ამგვარი ორგანიზება ლოგიკური გაგრძელება იქნება ჩვენი წინაპრების მრავალსაუკუნოვანი მაგისტრარული ხაზისა, რომლის მიხედვითაც საქართველოს ყველა კუთხის ქართველობა მრავალი საუკუნის მანძილზე ერთიან სამწიგნობრო კულტურას ქმნის.

დღეს პრობლემურია ქართული ენის სკოლაში სწავლებაც:
არსებული ეროვნული სასწავლო გეგმა სერიოზულ ცვლილებებს მოითხოვს. საჭიროა შეიქმნას ქართული სალიტერატურო ენის სწავლების ერთიანი კონცეფცია სწავლების ყველა საფეხურისათვის; ამასთან, საგანგებო ღონისძიებებია გასატარებელი მასწავლებელთა მაღალ დონეზე მომზადებისათვის და არა მხოლოდ - გადამზადებისათვის.
ასევე, აუცილებელია, შემუშავდეს სახელმწიფოს პრაგმატული მიდგომა ქართველთა ზეპირი საშინაო მეტყველებების გადასარჩენად, რომელთაც ნამდვილად ემუქრებათ საფრთხე; კერძოდ, განსაკუთრებით დიდი საფრთხის წინაშე არის: სვანური, ტაოური, ლივანური, იმერხეული, რაჭული, ხევსურული, თუშური, მოხეური... ქართველთა ეს კილოები ჩვენს თვალწინ ქრებიან! შესაბამისად, აუცილებლად მიგვაჩნია, სასკოლო საგნად შემოვიღოთ: "ქართველთა ენობრივი სამყარო", რომლის პირველ ნაწილში წარმოდგენილი იქნება ყველა ქართველური დიალექტის გავრცელების არეალი და მეტყველების ნიმუშები, ხოლო მეორე ნაწილში შევა სპეციალური კითხვარი და ინსტრუქცია, რომ მოცემული ქართველური კილოს მფლობელს საშუალება ჰქონდეს, შეისწავლოს და წარმოაჩინოს მისი კუთხური მეტყველების ლექსიკა.
აუცილებელია, ხელისუფლების მიერ შემუშავდეს სტრატეგია, რომელიც უზრუნველყოფს:
1. თანამედროვე პირობებში ქართული ენის კულტურული ფუნქციისა და საქართველოს მოქალაქეების მაკონსოლიდირებელის როლის შენარჩუნებას,
2. ქართული ენის, როგორც სახელმწიფო ენის უფლებების დაცვას, სწავლებასა და კვლევას,
3. ქართველთა სამწიგნობრო ენის მასაზრდოებელი ნაკადულების - ქართველთა დიალექტების - გადარჩენასა და კვლევას.
კონკრეტული ამოცანები ასე შეიძლება ჩამოყალიბდეს:
1. ქართული ელექტრონული ნაბეჭდი ტექსტის ამეტყველება:
1.1. სინტეზატორი ალოფონური ბაზის საფუძველზე;
1.2. სინტეზატორი მარცვლოვანი ბაზის საფუძველზე;
1.3. სინტეზატორი დიფონური ბაზის საფუძველზე და სხვ.
2. ქართული მეტყველების ნაბეჭ ტექსტად ქცევა:
2.1. კარნახით ტექსტის ჩაწერა
2.2. ტექნიკის ხმით მართვა და სხვ.
3. უკვე დაბეჭდილი წიგნების/თუ გაზეთების/ ტექსტებისა და ხელნაწერების  ელექტრონულ ნაწერ ტექსტად ქცევა (გაციფრება);
4. ქართული ენის მორფოლოგიურ და სინტაქსურ პროცესორებზე დაფუძნებული მართლმწერის მომზადება;
5. ქართულ-ინგლისური ორენოვანი თრანსფერ ტიპის თარგმანის განხორციელება /ნაწერი ტექსტისა/;
5.1. კონკრეტულ ლოგიკურ გრამატიკულ მოდელზე ორიენტირებული ქართული ენის მორფოლოგიური პროცესორის აგება;
5.2. კონკრეტულ გრამატიკულ მოდელზე არაორიენტირებული ქართული ენის მორფოლოგიური პროცესორის აგება;
5.3. ქართული ენის სინტაქსური პროცესორის აგება;
6. ქართულ-ინგლისური ორენოვანი თარგმანის განხორციელება .. ლოგიკურ-მათემატიკური მეტა-ენის შუამავლობით;
7. ქართული ენის ლექსიკურ მონაცემთა ელექტრონული ბაზის შექმნა:
7.1. ქართული ენის განმარტებითი ლექსიკონი, ქართული ენის კომბინირებული განმარტებითი ლექსიკონი.../
7.2. ქართულ-ინგლისური  და სხვა ორენოვანი ელექტრონული ლექსიკონების მოპოვება /შექმნა/
7.3. უცხოური ტერმინების თარგმნის მუდმივი ცენტრის ამოქმედება
8. ქართული ენის რეპრეზენტაციული (მომცველობითი) და დაბალანსებული (პრესა, ბელეტრისტიკა, საქმიანი დოკუმენტაცია, გვარსახელები, რეესტრის სხვა მონაცემები და სხვ.) ტექსტების კორპუსის შექმნა:
8.1. მორფოლოგიურ და სინტაქსურ პროცესორებზე ორიენტირებული ტექსტების კორპუსი /პროცესორი - საძიებო სისტემა, რომელიც მოძებნის ნებისმიერ მორფოლოგიურ ფორმანტს/კატეგორიას და სინტაქსურ სტრუქტურას/, დაადგენს სიტყვის სიხშირეს: უფრო რომელ ლექსიკურ ერთეულებთან (ცოლოცატიონ) თუ მეტყველების ნაწილებთან გვხდება (ცოლლიგატიონ); გააკეთებს რეზიუმირებას;
8.2. ტექსტების მორფოსინტაქსურად ანოტირებული /ან ნახევრად ანოტირებული/კორპუსი: ნახევრად ავტომატური ანალიზატორის მეშვეობით კორპუსის ანოტირება და  ანოტატორთა მიერ ხელით ჩასწორება (/შემოწმება რამდენად სწორად არის ანოტირებული ამ ანალიზტორის მიერ)/...
წარმოდგენილი ამოცანები სქემატურად ასე შეიძლება გამოვსახოთ:



დასკვნის ნაცვლად:
საქართველოს ხელისუფლების მიერ შემუშავებულ "ეროვნული უსაფრთხოების კონცეფციის" დოკუმენტში (რომელიც დევს საქართველოს საგარეო საქმეთა სამინისტროს ვებგვერდზე [1], არ ჩანს, ჩემი აზრით, ხუთი არსებითი მიმართულება:
ა) ქართველთა ენობრივ-ეთნიკური ერთიანობის შენარჩუნებისათვის ზრუნვა;
ბ)    ქართული ენის, როგორც სახელმწიფო ენის, ფუნქციონირების აღდგენის სტრატეგიის შემუშავება და უმცირესობებისათვის საქართველოს სახელმწიფო ენის სწავლებით ინტეგრაციის  რეალური პირობების შექმნა;
გ)    ქართული ენის ტექნოლოგიზება; ამ კუთხით საქართველოს განათლების სისტემის დაგეგმვა საქართველოს სახელმწიფო ინტერესების გათვალისწინებით;
დ)   საქართველოს სახელმწიფოობრიობის ისტორიისთვის ქართულენოვანი მართლმადიდებლობისა და საქართველოს ეკლესიის განსაკუთრებული როლის აღიარება;
ე)    სამხრეთ კავკასიაში (ტაო-კლარჯეთი, ლაზეთი) მცხოვრები ავტოქთონი ქართველების ეთნიკური იდენტობისა და ქართველური კულტურული მემკვიდრეობისათვის ზრუნვა.

...ენების ტექნოლოგიზებით დღეს მსოფლიოში დიდი კულტურული ნახტომი ხორციელდება; მხოლოდ ინტერნეტსივრცის ენად ქცევა გადაარჩენს ქართულს, როგორც კულტურულ ენას (შესაბამისად, ქართველ ერს).

იმედია, უახლოეს მომავალში ხელისუფლების მიერ გააზრებულად დაიგეგმება ქართული ენის ტექნოლოგიზება და ამ მიმართულებით სპეციალისტთა კონსოლიდაცია.



[1] http://www.mfa.gov.ge/index.php?lang_id=GEO&sec_id=12 (2013 წლის მონაცემებით).