Published 2026-05-31
Keywords
- semantik o‘xshashlik muammolari, o‘zbek NLP, agglyutinatsiya, korpus tanqisligi, subword tokenizatsiya, transliteratsiya, dialekt farqlari, gibrid model
Abstract
Mazkur ilmiy tadqiqot o‘zbek tilida semantik o‘xshashlik aniqlash sohasida to‘plangan murakkabliklarni tizimlashtirib, har biriga nisbatan ilmiy asoslangan yechim takliflarini ilgari suradi. Tadqiqot sakkiz asosiy muammo doirasini qamrab oladi: morfologik boylik va leksemalar ko‘pligi, parallel korpus tanqisligi, orfografik xilma-xillik, polisemiya va metafora qatlamlari, dialektlararo tafovut, transliteratsiya tartibsizligi, sentiment interferensiyasi hamda past resurslilik muammosi. Har bir muammo uchun real matn namunalari keltiriladi, tegishli miqdoriy ko‘rsatkichlar taqdim etiladi va til texnologiyalari hamda tilshunoslik asosidagi yechim yo‘llari muhokama qilinadi. Subword tokenizatsiya, ko‘p vazifalik o‘qitish va gibrid arxitekturalarga asoslangan amaliy tavsiyalar takliflar qatorida ilgari suriladi.