Корпусқа енгізілетін мәтіндердегі сөздерге морфологиялық белгіленім қою және оларды компьютерлік бағдарламаға енгізу мәселелері
Қаралымдар: 135 / PDF жүктеулері: 252
DOI:
https://doi.org/10.32523/2616-678X-2022-140-3-103-113Кілт сөздер:
корпус, корпустық лингвистика, мәтін, морфология, шартты белгі, белгіленім, компьютерлік программаАңдатпа
Мақалада тіл біліміндегі корпус жасау ісінің тарихына қысқаша шолу жасалып, корпустық лингвистика ғылымына сипаттама беріледі, морфологиялық белгіленімге қойылатын теориялық және практикалық міндеттер мен талаптар көрсетіледі.
Корпусқа енгізілетін мәтіндердегі сөздерге морфологиялық белгіленім қою алғашында қолмен жасалды. Мысал ретінде алынған сөйлемдегі жеке сөздерге жасалған морфологиялық талдаудың негізгі принциптеріне, қойылған белгіленімдерге түсініктеме берілді. Морфологиялық талдау, негізінен, мәнмәтінге байланыссыз жасалатыны белгілі. Мақалада сөз таптарының морфологиялық құрылымдарын талдау мен оларға белгіленімдер қоюда кездескен негізгі ерекшеліктер жеке-жеке көрсетіледі.
Сөздердің морфологиялық құрамын автоматты түрде ажырату компьютер жадына бірнеше сатылы шарттардың орындалуы арқылы іске асады. Олар: 1) сөздердің морфологиялық құрылымын ажырату (түбір сөз, қосымшалар); 2) компьютер жадына алдын ала дайындалған қосымшалардың тізімі мен шартты белгілерін енгізу; 3) компьютер жадына тілдің әртүрлі стилін қамтитын, морфологиялық белгіленім қойылған электронды пішіндегі мәтіндерді енгізу. Бұдан кейін компьютерлік бағдарлама арқылы мынадай жұмыстар орындалады: а) сөз табы қойылмаған кейбір сөздерге белгіленімдер қою; ә) реестр сөздерді тізімдеу, өңдеу барысында оларға сөз таптарын қоюда кеткен кейбір қателерді қолмен жөндеу; б) реестр сөздер тізіміндегі бір сөз табына қатысты омоним сөздердің бірін ғана қалдыру; в) сөзжасамдық жұрнақтар мен форма тудырушы жұрнақтардың аражігін ажырату.
Мәтіндер корпусын құрастыруға арналған компьютерлік бағдарламаны жасаудың мынадай инженерлік-линвистикалық және техникалық проблемаларын атауға болады:
- корпусқа енгізілген мәтіндерді морфологиялық талдау принциптері жаңадан жасалып отырғандықтан, әрі қарай жетілдіруді талап етеді;
- морфологиялық белгіленім қоюда тілдің ішкі заңдылықтарына байланысты шартты түрде алынған белгілер қолданылатындықтан, компьютерлік бағдарлама жасау барысында олар да өзгерістер мен толықтырулар енгізуді қажет етеді.