Корпустың құрылымдық сипаты және қызметі
Қаралымдар: 23 / PDF жүктеулері: 2
DOI:
https://doi.org/10.32523/2616-678X-2025-150-1-172-185Кілт сөздер:
компьютерлік лингвистика, корпус, корпустың құрамы, ұлттық корпус, корпус құрастыру, лексикографиялық зерттеулерАңдатпа
Тілді модельдеудің бір бағыты – компьютерлік аударма ісі бойынша зерттеулер жүргізу қазір аса маңызды және уақыт талабы болып отыр. Зерттеудің мақсаты – корпус, параллель корпус, олардың мақсаты мен қызметі, құрылым ерекшеліктері жайында мәлімет беру, корпустардың машиналық аударма ісіндегі қызметін талдау. Негізгі бағыттары – корпус түзудің негізгі талаптарына, жалпы құрылымына ақпараттық шолу жасау. Негізгі идеясы – машиналық аударма ісінде компьютерлік лингвистика әлеуетін ұтымды пайдалану жолдарын ұсыну. Корпус құрылымы, жұмыс істеу алгоритмі, қызметі бойынша берілген мәліметтер машиналық аударма саласында жүргізілетін әртүрлі көлемдегі зерттеулерге сай теориялық әрі тәжірибелік негіз бола алады. Зерттеу әдістемелері: теориялық талдау, жинақтау, сауалнама. Зерттеудің негізгі нәтижелері, талдаулары, қорытындылары: сауалнама нәтижесінен бақылағанымыз: Қазақ тілінің ұлттық корпусының сан алуан мүмкіндіктеріне сұраныс көп. Корпустың міндеттері мен мүмкіндіктері әлдеқайда күшті екені белгілі. Дәлірек айтқанда, машиналық аударма ісінде негізгі құрал болуы керек екенін айрықша атаған орынды деп есептейміз. Өйткені бүгінде Қазақ тілінің ұлттық корпусында тек мәтінді өңдеудің бірнеше түрі ғана іс жүзінде қолданылады. Осының өзінде техникалық әрі базалық ақау аз емес. Ал машиналық аударманы жетілдіру үшін корпустың ішінде параллель корпустар құрылуы қажет.
Жүзеге асырылған зерттеудің мәні Қазақ тілінің ұлттық корпусының дамуына үлес қосады. Жұмыс нәтижесінің практикалық мәні: Корпус қызметі, жұмыс істеу алгоритмі, құрылымы бойынша алынған нәтижелер кейінгі зерттеушілерге тәжірибелік жұмыстар жүргізу кезінде жетекші нұсқаулық қызметін атқара алады.