Vol. 1 No. 1 (2024): COMPUTER LINGUISTICS: PROBLEMS, SOLUTIONS, PROSPECTS
Articles

O‘ZBEK TILI KORPUSI MATNLARINI POS TEGLASH USULLARI

Botir Elov
Tashkent State University named after Alisher Navoi University of Uzbek language and literature
Bio

Published 2024-05-22

Keywords

  • Teg, razmetka, annotatsiya, tegset, NLP, korpus, PoS teglash.

Abstract

Til korpusi qurilishida lingvistik ta’minot masalasi muhim va murakkab hisoblanadi. Korpuslarda matnlardagi nutq bo‘laklariga mos identifikatorini belgilash jarayoni muammolidir, sababi tilni modellashtirish teglash qoidasi va tilda mavjud qonuniyat bilan bog‘liq. Teglash, xususan, grammatik teglash yoki PoS tegging o‘zbek korpus lingvistikasi uchun ham dolzarb masaladir. Ushbu maqolada jahonda keng qo‘llanib kelinayotgan tegsetlardan foydalanib o‘zbek tili korpusi matnlarini POS teglash usullari ko‘rib chiqiladi.