Опыт обучения систем искусственного интеллекта сложным глагольным конструкциям казахского языка: подходы к тегированию и морфологическому моделированию

Авторы

  • Қ. Слямбеков Институт языкознания им. А. Байтурсынова, Алматы, 050040, Казахстан https://orcid.org/0000-0002-9731-0448
  • А. Солтанбекова Институт языкознания им. А. Байтурсынова, Алматы, 050040, Казахстан https://orcid.org/0000-0002-3513-4012
  • Б. Шалабай Кокшетауский университет имени Ш. Уалиханова, Кокшетау, 020000, Республика Казахстан https://orcid.org/0000-0002-5289-4507
  • Т. Калибекулы Казахский университет международных отношений и мировых языков имени Абылай хана, 050022, Алматы, Казахстан https://orcid.org/0000-0003-0188-4488

DOI:

https://doi.org/10.59102/kufil/2025/iss3pp94-108

Аннотация

В статье изложен опыт реализации этапов аннотирования и тегирования для построения генеративных моделей ИИ посредством автоматического распознавания сложных глаголов в казахском языке и проведения работ по разметке корпуса. Рассматриваются трудности и научные проблемы при тегировании сложнокомпонентых глаголов, составных глаголов и аналитических глагольных форм, пути их решения, а также особенности разметочных процедур. Несомненно, в основе архитектуры больших языковых моделей лежит грамматика соответствующего языка,и его грамматические модели. Направление развития современной лингвистики также связано с разработкой и совершенствованием таких моделей. Поэтому моделирование одного из сложных грамматических компонентов казахского языка — сложно-составных глагольных конструкций — и предложение их морфологической схемы разметки является одной из наиболее актуальных задач автоматизации казахского языка. Настоящая статья написана с целью поделиться опытом, накопленным в этом направлении.

Ключевые слова:

глагол, сложные глаголы, аналитический формант, составные глаголы, правильные сложные глаголы, искусственный интеллект, автоматизация, разметка
Поддерживающие организации
Мақала «Қазақ тілі ұлттық корпусын Smart-мәтіндер мегажобасы және қазақтілді жасанды интеллект негізі ретінде жетілдіру, ішкорпустарын әзірлеу» (BR24993244) бағдарламалық-нысаналы қаржыландыру жобасы аясында жазылды.

Биография автора

Қ. Слямбеков, Институт языкознания им. А. Байтурсынова, Алматы, 050040, Казахстан

К.Б. Слямбеков – магистр филологических наук, младший научный сотрудник, Институт языкознания им. А.Байтурсынулы, Алматы, 050040, Казахстан. E-mail: zaqpost@gmail.com, https://orcid.org/0000-0002-9731-0448.

Библиографические ссылки

Toporkov O., Agerri R. On the Role of Morphological Information for Contextual Lemmatization // Computational Linguistics. – 2024. – №50 (1): 157–191 pp. https://doi.org/10.1162/coli_a_00497

Оxford Phrasal Verbs Dictionary for learners of English. Oxford University Press, 2006. – 436 p.

Slyambekov Q.B., Sadyk A.M. The National corpus of the Kazakh language: the semantic markup оf verbs // Tiltanym, 2024. – №1. – 189-196 pp. https://doi.org/10.55491/2411-6076-2024-1-189-196

Toluspayeva, G. The System of Grammatical Categories of the Verb in Kazakh, Russian, and English // World Journal of English Language, 2023. – №13(2). – 120-126 pp. https://doi.org/10.5430/wjel.v13n2p120

Ысқақов А. Қазіргі қазақ тілі. Морфология. – Алматы: Ана тілі, 1991. – 381 б.

Қазақ грамматикасы. Фонетика, сөзжасам, морфология, синтаксис. – Астана, 2002. – 784 б.

Шәкенов Ж. Қазақ тіліндегі күрделі сөздер мен күрделі тұлғалар. – Алматы: Ана тілі, 1991. – 120 б.

Момынова Б. Қазақ тілінің морфологиясы: оқу құралы. – Алматы: Қазақ ун-ті, 2014. – 278 б.

Жолшаева М. Қазақ тіліндегі құранды етістіктердің лексика-грамматикалық ерекшеліктері// Tiltanym. 2022. – №1 (185). – 44-54 pp. https://doi.org/10.55491/2411-6076-2022-1-43-52

Маманов Ы. Қазіргі қазақ тілі: Етістік. – Алматы: Мектеп, 1966. – 156 б.

Ысқақов А. Қазіргі қазақ тілі. Морфология. – Алматы: Мектеп, 1974. – 407 б.

Оралбаева Н. Қазіргі қазақ тіліндегі етістіктердің аналитикалық форманттары. – Алматы: Мектеп, 1975. – 136 б.

Исаев С. Қазіргі қазақ тілі. Морфология. – Алматы: Өнер, 2007. – 336 б.

Загрузки


Просмотров аннотации: 0 | Загрузок PDF: 0

Опубликован

29.09.2025

Как цитировать

Слямбеков, Қ., Солтанбекова, А., Шалабай, Б., & Калибекулы, Т. (2025). Опыт обучения систем искусственного интеллекта сложным глагольным конструкциям казахского языка: подходы к тегированию и морфологическому моделированию . Bulletin of Shokan Ualikhanov Kokshetau University Philological Series, (3), 94–108. https://doi.org/10.59102/kufil/2025/iss3pp94-108