Published 2025-05-02 — Updated on 2025-05-02
Versions
- 2025-05-02 (2)
- 2025-05-02 (1)
Keywords
- teg, POS teg, sintaktik parsing, parser dasturlar, treebank.
Abstract
Tabiiy tilni qayta ishlash (NLP)da matnlarni morfologik va sintaktik teglash va teglangan korpuslarni yaratish eng muhim vazifalardan biri hisoblanadi. Bugungi kunda universal POS teglar tizimidan ko‘plab tillarda tegsetlar tizimining asosi sifatida foydalanishib, keyinchalik har bir tilga xos xususiyatlarni ifodalovchi qo‘shimcha teglar bilan kengaytirilgan. Ushbu universal POS teglar tizimidan ko‘p tilli teglangan NLP ma’lumot platformalaridan biri hisoblangan Universal Dependencies (UD) loyihasi ham ishlab chiqildi. Ammo barcha tillar o‘z sintaksisi, morfologiyasi va fonetikasi bilan bir-biridan farqlanadi, bu esa POS teg
va sintaktik teglar tizimini ishlab chiqish zaruriyatini keltirib chiqaradi. Mazkur maqolada tegsetlar tizimining, teglash modellarining yaratilishi bilan bog‘liq masalalar muhokama qilingan.