Опыт обучения систем искусственного интеллекта сложным глагольным конструкциям казахского языка: подходы к тегированию и морфологическому моделированию
DOI:
https://doi.org/10.59102/kufil/2025/iss3pp94-108Аннотация
В статье изложен опыт реализации этапов аннотирования и тегирования для построения генеративных моделей ИИ посредством автоматического распознавания сложных глаголов в казахском языке и проведения работ по разметке корпуса. Рассматриваются трудности и научные проблемы при тегировании сложнокомпонентых глаголов, составных глаголов и аналитических глагольных форм, пути их решения, а также особенности разметочных процедур. Несомненно, в основе архитектуры больших языковых моделей лежит грамматика соответствующего языка,и его грамматические модели. Направление развития современной лингвистики также связано с разработкой и совершенствованием таких моделей. Поэтому моделирование одного из сложных грамматических компонентов казахского языка — сложно-составных глагольных конструкций — и предложение их морфологической схемы разметки является одной из наиболее актуальных задач автоматизации казахского языка. Настоящая статья написана с целью поделиться опытом, накопленным в этом направлении.
Ключевые слова:
глагол, сложные глаголы, аналитический формант, составные глаголы, правильные сложные глаголы, искусственный интеллект, автоматизация, разметкаБиблиографические ссылки
Toporkov O., Agerri R. On the Role of Morphological Information for Contextual Lemmatization // Computational Linguistics. – 2024. – №50 (1): 157–191 pp. https://doi.org/10.1162/coli_a_00497
Оxford Phrasal Verbs Dictionary for learners of English. Oxford University Press, 2006. – 436 p.
Slyambekov Q.B., Sadyk A.M. The National corpus of the Kazakh language: the semantic markup оf verbs // Tiltanym, 2024. – №1. – 189-196 pp. https://doi.org/10.55491/2411-6076-2024-1-189-196
Toluspayeva, G. The System of Grammatical Categories of the Verb in Kazakh, Russian, and English // World Journal of English Language, 2023. – №13(2). – 120-126 pp. https://doi.org/10.5430/wjel.v13n2p120
Ысқақов А. Қазіргі қазақ тілі. Морфология. – Алматы: Ана тілі, 1991. – 381 б.
Қазақ грамматикасы. Фонетика, сөзжасам, морфология, синтаксис. – Астана, 2002. – 784 б.
Шәкенов Ж. Қазақ тіліндегі күрделі сөздер мен күрделі тұлғалар. – Алматы: Ана тілі, 1991. – 120 б.
Момынова Б. Қазақ тілінің морфологиясы: оқу құралы. – Алматы: Қазақ ун-ті, 2014. – 278 б.
Жолшаева М. Қазақ тіліндегі құранды етістіктердің лексика-грамматикалық ерекшеліктері// Tiltanym. 2022. – №1 (185). – 44-54 pp. https://doi.org/10.55491/2411-6076-2022-1-43-52
Маманов Ы. Қазіргі қазақ тілі: Етістік. – Алматы: Мектеп, 1966. – 156 б.
Ысқақов А. Қазіргі қазақ тілі. Морфология. – Алматы: Мектеп, 1974. – 407 б.
Оралбаева Н. Қазіргі қазақ тіліндегі етістіктердің аналитикалық форманттары. – Алматы: Мектеп, 1975. – 136 б.
Исаев С. Қазіргі қазақ тілі. Морфология. – Алматы: Өнер, 2007. – 336 б.
Опубликован
Как цитировать
Выпуск
Раздел
Лицензия
Copyright (c) 2025 Bulletin of Shokan Ualikhanov Kokshetau University Philological Series

Это произведение доступно по лицензии Creative Commons «Attribution-NonCommercial» («Атрибуция — Некоммерческое использование») 4.0 Всемирная.