Проблемы морфологической разметки слов в текстах корпуса и их включения в компьютерную программу


Просмотры: 122 / Загрузок PDF: 211

Авторы

  • С.К. Кулманов, Институт языкознания имени Байтурсынулы
  • A. A. Жанабекова Институт языкознания имени А.Байтурсынулы
  • Н.М. Ашимбаева
  • А.З.-Ғ. Бисенғали Институт языкознания имени А.Байтурсынулы
  • Н.К. Шуленбаев Институт языкознания имени А.Байтурсынулы
  • Б.К. Кордабай Институт языкознания имени А.Байтурсынулы

DOI:

https://doi.org/10.32523/2616-678X-2022-140-3-103-113

Ключевые слова:

корпус, корпусная лингвистика, текст, морфология, условная пометка, разметка, компьютерная программа.

Аннотация

В статье даются краткий обзор истории создания корпуса в языкознании, характеристика корпусной лингвистики, указываются теоретические и практические задачи и требования морфологической разметки.

Морфологическая разметка слов в текстах корпуса изначально создавалась вручную. Даны разъяснения по основным принципам морфологического анализа отдельных слов и разметок. Известно, что морфологический анализ проводится в основном без привязки к контексту. В статье отдельно выделяются различные особенности, встречающиеся при анализе морфологических структур частей речи и размещении морфологических разметок слов.

Автоматическая разборка морфологической системы языка осуществляется за счет выполнения нескольких ступенчатых условий в памяти компьютера. Это: 1) выявление морфологической структуры слов (однокоренное слово, аффиксы); 2) внесение в память компьютера списка и заранее подготовленных условных обозначений аффиксов; 3) внесение в память компьютера текстов электронного формата различных стилей языка,  содержащих морфологические разметки. Затем с помощью компьютерной программы выполняются следующие работы: а) проставление разметок частей речи на некоторых словах, где они не указаны; б) в процессе обработки реестревых слов вручную исправляются единичные ошибки в указании их части речи; б) оставляется только одно из слов-омонимов относительно одной из частей речи в списке реестревых слов; в) выявляются различия словообразовательных суффиксов и формообразующих аффиксов.

Биографии авторов

С.К. Кулманов,, Институт языкознания имени Байтурсынулы

  кандидат филологических наук, доцент

A. A. Жанабекова, Институт языкознания имени А.Байтурсынулы

доктор филологических наук, профессор

Н.М. Ашимбаева

кандидат филологических наук

А.З.-Ғ. Бисенғали , Институт языкознания имени А.Байтурсынулы

– доктор философии (PhD)

Н.К. Шуленбаев, Институт языкознания имени А.Байтурсынулы

магистр гуманитарных наук

Б.К. Кордабай , Институт языкознания имени А.Байтурсынулы

магистр гуманитарных наук

Загрузки

Опубликован

2022-12-17

Как цитировать

Кулманов, С. ., Жанабекова, А. ., Ашимбаева, Н. ., Бисенғали , А. ., Шуленбаев, Н. Қ. ., & Кордабай , Б. (2022). Проблемы морфологической разметки слов в текстах корпуса и их включения в компьютерную программу. Вестник Евразийского национального университета имени Л.Н. Гумилева. Серия Филология, 140(3), 103–113. https://doi.org/10.32523/2616-678X-2022-140-3-103-113

Выпуск

Раздел

Лингвистика