Vol. 1 No. 1 (2025): COMPUTER LINGUISTICS: PROBLEMS, SOLUTIONS, PROSPECTS
Articles

O‘ZBEK TILI KORPUSI UCHUN TEGLASH TIZIMINI ISHLAB CHIQISH MASALASI

Oqila Abdullayeva
Alisher Navoiy nomidagi Toshkent davlat o‘zbek tili va adabiyoti universiteti
Bio

Published 2025-05-02 — Updated on 2025-05-02

Versions

Keywords

  • teg, POS teg, sintaktik parsing, parser dasturlar, treebank.

Abstract

Tabiiy tilni qayta ishlash (NLP)da matnlarni morfologik va sintaktik teglash va teglangan korpuslarni yaratish eng muhim vazifalardan biri hisoblanadi. Bugungi kunda universal POS teglar tizimidan ko‘plab tillarda tegsetlar tizimining asosi sifatida foydalanishib, keyinchalik har bir tilga xos xususiyatlarni ifodalovchi qo‘shimcha teglar bilan kengaytirilgan. Ushbu universal POS teglar tizimidan ko‘p tilli teglangan NLP ma’lumot platformalaridan biri hisoblangan Universal Dependencies (UD) loyihasi ham ishlab chiqildi. Ammo barcha tillar o‘z sintaksisi, morfologiyasi va fonetikasi bilan bir-biridan farqlanadi, bu esa POS teg
va sintaktik teglar tizimini ishlab chiqish zaruriyatini keltirib chiqaradi. Mazkur maqolada tegsetlar tizimining, teglash modellarining yaratilishi bilan bog‘liq masalalar muhokama qilingan.