Предпосылки создания синтаксической и семантической разметки
Просмотры: 175 / Загрузок PDF: 138
DOI:
https://doi.org/10.32523/2616-678X-2023-144-3-8-21Ключевые слова:
политика оцифровки, языковой корпус, лейпцигское правило, глоссирование, морфологический тег, условные знаки, синтаксически-семантическая разметка, современные лингвистические исследованияАннотация
Аннотация. В статье рассматривается дальнейшее совершенствование корпуса казахского языка, которое развивается в связи с политикой цифровизации страны, его использования в лингвистических исследованиях, учебном процессе и т.д. Необходимо создать и официально утвердить перечень условных признаков морфологического глоссирования на основе международного Лейпцигского правила. Проведен анализ использования метатегов, используемых в корпусах казахского языка и в сфере отечественной компьютерной лингвистики. Также освещены работы родственных и других языков в этом направлении, показаны их специфика и основные характеристики условных знаков и обозначений. Условные знаки, используемые при морфологическом глоссировании, могут стать основой для создания корпуса казахского языка, оснащенного синтаксически-семантическими разметками. Такие условные знаки дают возможности нашему родному языку сравнивать или сопоставлять его с другими языками, продемонстрировать языковые материалы в кратком и наглядном варианте, описать грамматические признаки, обрабатывать текстовые данные на компьютере; они открывают новые возможности для современных лингвистических исследований с использованием IT-технологий и разработанных корпусов.