Vol. 1 No. 1 (2026): COMPUTER LINGUISTICS: PROBLEMS, SOLUTIONS, PROSPECTS
Articles

O‘ZBEK TILIDA SENTIMENT TAHLILI UCHUN AVTOMATLASHTIRILGAN LEKSIK RESURS YARATISH

Published 2026-05-31

Keywords

  • o‘zbek tili, sentiment tahlili, NLP, avtomatlashtirilgan leksik resurslar, PMI metodi, Word2Vec, korpus lingvistikasi, lemmatizatsiya.

Abstract

Ushbu maqolada o‘zbek tili agglyutinativ tabiatini hisobga olgan holda sentiment tahlili uchun avtomatlashtirilgan lug‘at yaratish metodologiyasi ishlab chiqilgan. Tadqiqotda 10 000 ta gapdan iborat uch qatlamli (axborot, ijtimoiy va rasmiy matnlar) korpusini shakllantirish, mBERT va GPT modellarini qo‘llash hamda Word2Vec va PMI statistik metodlari orqali leksik birliklarning hissiy koeffitsiyentini [-1; +1] oralig‘ida hisoblash bosqichlari ko‘rsatib o‘tilgan. Taklif etilayotgan avtomatlashtirilgan tizim an’anaviy qo‘lda shakllantiriladigan lug‘at yaratish jarayoniga nisbatan vaqt unumdorligini 1000 baravardan ortiqroqqa oshirishi va tahlil aniqligini 85% gacha yetkazishi asoslab berilgan.