Vol. 1 No. 1 (2026): COMPUTER LINGUISTICS: PROBLEMS, SOLUTIONS, PROSPECTS
Articles

O‘ZBEK TILIDA SEMANTIK O‘XSHASHLIKLARNI ANIQLASH: MUAMMO VA YECHIMLAR

Muslimbek Soliyev
Tashkent State University named after Alisher Navoi University of Uzbek language and literature
Bio

Published 2026-05-31

Keywords

  • semantik o‘xshashlik muammolari, o‘zbek NLP, agglyutinatsiya, korpus tanqisligi, subword tokenizatsiya, transliteratsiya, dialekt farqlari, gibrid model

Abstract

Mazkur ilmiy tadqiqot o‘zbek tilida semantik o‘xshashlik aniqlash sohasida to‘plangan murakkabliklarni tizimlashtirib, har biriga nisbatan ilmiy asoslangan yechim takliflarini ilgari suradi. Tadqiqot sakkiz asosiy muammo doirasini qamrab oladi: morfologik boylik va leksemalar ko‘pligi, parallel korpus tanqisligi, orfografik xilma-xillik, polisemiya va metafora qatlamlari, dialektlararo tafovut, transliteratsiya tartibsizligi, sentiment interferensiyasi hamda past resurslilik muammosi. Har bir muammo uchun real matn namunalari keltiriladi, tegishli miqdoriy ko‘rsatkichlar taqdim etiladi va til texnologiyalari hamda tilshunoslik asosidagi yechim yo‘llari muhokama qilinadi. Subword tokenizatsiya, ko‘p vazifalik o‘qitish va gibrid arxitekturalarga asoslangan amaliy tavsiyalar takliflar qatorida ilgari suriladi.