Том 1 № 1 (2025): КОМПЬЮТЕРНАЯ ЛИНГВИСТИКА: ПРОБЛЕМЫ, РЕШЕНИЯ, ПЕРСПЕКТИВЫ
Статьи

O‘ZBEK TILI KORPUSINI ANNOTATSIYALASH VA TEGLASH (UMUMIY QOIDA VA TIZIMLAR)

Madina Samatboyeva
Alisher Navoiy nomidagi Toshkent davlat o‘zbek tili va adabiyoti universiteti

Опубликован 2025-05-02

Ключевые слова

  • korpus, annotatsiya, teg(lash), NLP, razmetka, POS-tagging.

Аннотация

Ushbu maqolada O‘zbek tili korpuslarini tuzish jarayonida amalga oshiriladigan annotatsiyalash va teglash ishlari, ularning umumiy qoidalari hamda qo‘llanilayotgan tizimlar haqida so‘z boradi. Maqolada avvalo korpuslar uchun zarur bo‘lgan morfologik, sintaktik va semantik darajadagi teglash turlari bayon etiladi. O‘zbek tilining agglutinativ xususiyati, morfologik murakkabligi va erkin so‘z tartibi kabi xususiyatlari tufayli annotatsiyalash jarayonida yuzaga keladigan muammolar va ularni hal etish yo‘llari muhokama qilinadi.