იურიდიული ტექსტების კორპუსლინგვისტური დამუშავების ძირითადი პრინციპები

  • Tinatin Tenterashvili ფილოლოგიის სადოქტორო პროგრამის დოქტორანტი, ივანე ჯავახიშვილის სახელობის თბილისის სახელმწიფო უნივერსიტეტი, ქ. თბილისი, ილია ჭავჭავაძის გამზ. 1, 0179, საქართველო http://orcid.org/0009-0002-8113-7115

Resumen

 ჰუმანიტარული მეცნიერებების განვითარების თანამედროვე ეტაპზე ერთ-ერთი მნიშვნელოვანი ნაბიჯია დიდ მონაცემთა ბაზების (big data) შექმნა და კვლევის თანამედროვე მეთოდების შემუშავება. ციფრული კორპუსების არსებობა ეფიციენტური კვლევების განხორციელების შესაძლებლობას იძლევა, რაც ხელს უწყობს როგორც ცალკეული ლინგვისტური საკითხის გადაწყვეტას, ისე კომპლექსური ენათმეცნიერული კვლევების განხორციელებას. ქართულისათვის ერთ-ერთ ასეთ რესურსს წარმოადგენს ქართული ენის ეროვნული კორპუსი, რომელიც 202 მლნ. ტოკენს მოიცავს და სხვადასხვა ჟანრის ტექსტთან ერთად განვრცობილია ორი თემატური კორპუსით: პოლიტიკური და იურიდიული ტექსტების კორპუსით, თუმცა არც ერთი მათგანი არ არის ბოლომდე შევსებული. კერძოდ, იურიდიული ტექსტების ქვეკორპუსი მოიცავს მხოლოდ ისტორიულ იურიდიულ დოკუმენტებს. ამ თვალსაზრისით ქართული ენის ეროვნული კორპუსის ჟანრობრივი დაბალანსება მნიშვნელოვანი გამოწვევაა, რომლის დაძლევა აუცილებელია მისი საბოლოო სრულყოფისა და სრულფასოვანი ფუნქციონირებისათვის. აღნიშნული პრობლემის გადაჭრის ერთ-ერთ გზად გვესახება საკანონმდებლო ტექსტების ციფრული დამუშავების ტექნოლოგიური ჩარჩოს შექმნა კვლევის თანამედროვე მეთოდების გამოყენებით.

ამა თუ იმ ტექსტის ციფრული დამუშავებისათვის აუცილებელია, რომ ისინი ელექტრონულ ფორმატში იყოს ხელმისაწვდომი. დღეისათვის საკანონმდებლო ტექსტები უკვე გაციფრებულია. მათი ელექტრონული ვერსიები თავმოყრილია ვებ-გვერდზე matsne.gov.ge, თუმცა ისინი არ არის ლინგვისტურად დამუშავებული და, შესაბამისად, მოკლებულია ამგვარი კვლევის შესაძლებლობასაც. ამ საკითხის გადაჭრის ერთ-ერთი გზაა მოცემული ქვემოთ წარმოდგენილ სტატიაში, რომელშიც აღწერილია იურიდიული ტექსტების კორპუსლინგვისტური დამუშავების ძირითადი პრინციპები კონკრეტული სამართლებრივი ტექსტების მაგალითზე. მიღებული რესურსი იყო ემპირიული ბაზა ლინგვისტური კვლევისათვის, რომელზე დაყრდნობითაც გაანალიზდა იურიდიული სემანტიკის მქონე ენობრივი საშუალებები.

სამართლებრივ ტექსტებში დარგობრივი ლექსიკის შესწავლის თვალსაზრისით საყურადღებოა ისეთი შემთხვევები, როდესაც დარგობრივი შინაარსის გადმომცემი ლექსიკა ერთზე მეტი კომპონენტისგან შედგება და მხოლოდ ამ ფორმით იძენს დარგისათვის სპეციფიკურ მნიშვნელობას. თუ მათ ერთმანეთისგან დამოუკიდებლად განვიხილავთ, ხშირ შემთხვევაში, ისინი დაკავშირებული არ იქნება იურიდიულ სფეროსთან. ამ თვალსაზრისით მნიშვნელოვანია ორკომპონენტიანი ზმნები, რომლებიც ძირითადი ზმნისა და მასთან მყარად დაკავშირებული არსებითი სახელის ან საწყისის კომბინაციით არის გადმოცემული, მაგ., თავისუფლების აღკვეთა, გადაწყვეტილების გამოტანა და ა.შ. ამგვარი კომბინაციები იურიდიულ ტექსტებში ხშირად გვხვდება სამართლებრივი პროცესების აღსაწერად. 

იურიდიული ტექსტებისათვის ნიშანდობლივი ამ მახასიათებლების გამოვლენა და გათვალისწინება მნიშვნელოვანია, ერთი მხრივ, იურიდიული ტექსტების კორპუსლინგვისტური დამუშავებისათვის, მეორე მხრივ კი, იურიდიულ ტერმინთა ბანკის შესავსებადაც, ვინაიდან ორკომპონენტიანი ზმნები კორპუსლინგვისტურად უნდა დამუშავდეს არა ცალკეული ლექსიკური ერთეულების დონეზე, არამედ იმ ფორმით, რომლითაც დაკავშირებულია სამართლის სფეროსთან.

 

საკვანძო სიტყვები: ქეეკ, კორპუსლინგვისტური, საკანონმდებლო ტერმინი, ორკომპონენტიანი.

Publicado
2025-06-23
Sección
სამეცნიერო სტატიები - ენათმეცნიერების სექცია