Vol. 1 No. 1 (2025): COMPUTER LINGUISTICS: PROBLEMS, SOLUTIONS, PROSPECTS
Articles

O‘ZBEK TILI KORPUSINI ANNOTATSIYALASH VA TEGLASH (UMUMIY QOIDA VA TIZIMLAR)

Madina Samatboyeva
Alisher Navoiy nomidagi Toshkent davlat o‘zbek tili va adabiyoti universiteti

Published 2025-05-02

Keywords

  • korpus, annotatsiya, teg(lash), NLP, razmetka, POS-tagging.

Abstract

Ushbu maqolada O‘zbek tili korpuslarini tuzish jarayonida amalga oshiriladigan annotatsiyalash va teglash ishlari, ularning umumiy qoidalari hamda qo‘llanilayotgan tizimlar haqida so‘z boradi. Maqolada avvalo korpuslar uchun zarur bo‘lgan morfologik, sintaktik va semantik darajadagi teglash turlari bayon etiladi. O‘zbek tilining agglutinativ xususiyati, morfologik murakkabligi va erkin so‘z tartibi kabi xususiyatlari tufayli annotatsiyalash jarayonida yuzaga keladigan muammolar va ularni hal etish yo‘llari muhokama qilinadi.