Корпусқа енгізілетін мәтіндердегі сөздерге морфологиялық белгіленім қою және оларды компьютерлік бағдарламаға енгізу мәселелері


Қаралымдар: 135 / PDF жүктеулері: 252

Авторлар

  • С.Қ. Құлманов А. Байтұрсынұлы атындағы Тіл білімі институты
  • А.Ә. Жаңабекова А. Байтұрсынұлы атындағы Тіл білімі институты
  • Н.М. Әшімбаева
  • А.З. Бисенғали А.Байтұрсынұлы атындағы Тіл білімі институты
  • Н. Қ. Шүленбаев А.Байтұрсынұлы атындағы Тіл білімі институты
  • Б.Қ. Қордабай А. Байтұрсынұлы атындағы Тіл білімі институты

DOI:

https://doi.org/10.32523/2616-678X-2022-140-3-103-113

Кілт сөздер:

корпус, корпустық лингвистика, мәтін, морфология, шартты белгі, белгіленім, компьютерлік программа

Аңдатпа

Мақалада тіл біліміндегі корпус жасау ісінің тарихына қысқаша шолу жасалып, корпустық лингвистика ғылымына сипаттама беріледі, морфологиялық белгіленімге қойылатын теориялық және практикалық міндеттер мен талаптар көрсетіледі.

Корпусқа енгізілетін мәтіндердегі сөздерге морфологиялық белгіленім қою алғашында қолмен жасалды. Мысал ретінде алынған сөйлемдегі жеке сөздерге жасалған морфологиялық талдаудың негізгі принциптеріне, қойылған белгіленімдерге түсініктеме берілді. Морфологиялық талдау, негізінен, мәнмәтінге байланыссыз жасалатыны белгілі. Мақалада сөз таптарының морфологиялық құрылымдарын талдау мен оларға белгіленімдер қоюда кездескен негізгі ерекшеліктер жеке-жеке көрсетіледі.

Сөздердің морфологиялық құрамын автоматты түрде ажырату компьютер жадына бірнеше сатылы шарттардың орындалуы арқылы іске асады. Олар: 1) сөздердің морфологиялық құрылымын ажырату (түбір сөз, қосымшалар); 2) компьютер жадына алдын ала дайындалған қосымшалардың тізімі мен шартты белгілерін енгізу; 3) компьютер жадына тілдің әртүрлі стилін қамтитын, морфологиялық белгіленім қойылған электронды пішіндегі мәтіндерді енгізу. Бұдан кейін компьютерлік бағдарлама арқылы мынадай жұмыстар орындалады: а) сөз табы қойылмаған кейбір сөздерге белгіленімдер қою; ә) реестр сөздерді тізімдеу, өңдеу барысында оларға сөз таптарын қоюда кеткен кейбір қателерді қолмен жөндеу;  б) реестр сөздер тізіміндегі бір сөз табына қатысты омоним сөздердің бірін ғана қалдыру; в)  сөзжасамдық жұрнақтар мен форма тудырушы жұрнақтардың аражігін ажырату.

Мәтіндер корпусын құрастыруға арналған компьютерлік бағдарламаны жасаудың мынадай инженерлік-линвистикалық және техникалық проблемаларын атауға болады:

- корпусқа енгізілген мәтіндерді морфологиялық талдау принциптері жаңадан жасалып отырғандықтан, әрі қарай жетілдіруді талап етеді;

- морфологиялық белгіленім қоюда тілдің ішкі заңдылықтарына байланысты шартты түрде алынған белгілер қолданылатындықтан, компьютерлік бағдарлама жасау барысында олар да өзгерістер мен толықтырулар енгізуді қажет етеді.

Автор өмірбаяндары

С.Қ. Құлманов, А. Байтұрсынұлы атындағы Тіл білімі институты

филология ғылымдарының кандидаты, доцент

А.Ә. Жаңабекова, А. Байтұрсынұлы атындағы Тіл білімі институты

филология ғылымдарының докторы, профессор

Н.М. Әшімбаева

филология ғылымдарының кандидаты

А.З. Бисенғали, А.Байтұрсынұлы атындағы Тіл білімі институты

– философия докторы (PhD)

Н. Қ. Шүленбаев , А.Байтұрсынұлы атындағы Тіл білімі институты

гуманитарлық ғылымдар магистрі

Б.Қ. Қордабай , А. Байтұрсынұлы атындағы Тіл білімі институты

гуманитарлық ғылымдар магистрі

Жүктеулер

Жарияланды

2022-12-17

Дәйексөзді қалай келтіруге болады

Құлманов, С. ., Жаңабекова, А. ., Әшімбаева, Н. ., Бисенғали, А. ., Шүленбаев , Н. Қ. ., & Қордабай , Б. (2022). Корпусқа енгізілетін мәтіндердегі сөздерге морфологиялық белгіленім қою және оларды компьютерлік бағдарламаға енгізу мәселелері. Л.Н. Гумилев атындағы Еуразия ұлттық университетінің Хабаршысы. ФИЛОЛОГИЯ сериясы, 140(3), 103–113. https://doi.org/10.32523/2616-678X-2022-140-3-103-113

Журналдың саны

Бөлім

Лингвистика