Опубликован 2026-05-30
Ключевые слова
- nutqni aniqlash, o‘zbek tili, ASR, ochiq kodli modellar, Whisper, avtomatik subtitr, Word Error Rate, WER, Character Error Rate, CER, etalon matn, qiyosiy tahlil.
Аннотация
Mazkur maqolada o‘zbek tilidagi video kontentlar uchun avtomatik subtitrlar yaratishda ochiq kodli nutqni aniqlash (Automatic Speech Recognition – ASR) modellarining samaradorligi qiyosiy tahlil qilinadi. Tadqiqotning ilmiy aniqligini ta’minlash maqsadida o‘zbek tilining barcha uslublarini qamrab olgan 10 ta video material tanlab olindi va ularning mutaxassis tomonidan qayta tinglanib, qo‘lda yozilgan transkripsiyalari etalon sifatida shakllantirildi. Tajribalar doirasida 13 ta ochiq kodli modelning natijalari ushbu inson tomonidan tayyorlangan matnlarga nisbatan Word Error Rate (WER) va Character Error Rate (CER) metrikalari, shuningdek, ishlov berish tezligi bo‘yicha o‘zaro qiyoslandi. Natijalar shuni ko‘rsatdiki, lokal korpuslarda o‘qitilgan modellar inson nutq idrokiga yaqinroq natija ko‘rsatsa-da, tilning agglyutinativ tabiati va punktuatsiya masalalarida muayyan cheklovlar saqlanib qolmoqda. Maqola yakunida o‘zbek tili uchun eng yuqori aniqlik va tezlik muvozanatini ta’minlovchi modellar bo‘yicha amaliy tavsiyalar berilgan.