Published 2026-05-31
Keywords
- metama’lumotlarni avtomatik ekstraksiya qilish, akademik maqolalar, qoidalarga asoslangan tizimlar, mashinaviy o‘rganish, SVM, chuqur o‘rganish, CNN, LSTM, GROBID, CERMINE, Science Parse, Anystyle, bibliografik havolalar, skanerlangan hujjatlar, kontekstual tahlil, neyron tarmoqlar, OCR, ko‘p tilli hujjatlar
Abstract
Ushbu maqolada akademik maqolalardan metama’lumotlarni avtomatik ekstraksiya qilish sohasidagi mavjud yechimlar evolyutsion rivojlanish nuqtai nazaridan tahlil qilinadi. Qoidalarga asoslangan tizimlar, an’anaviy mashinaviy o‘rganish modellari (SVM, HMM, Random Forest) va chuqur o‘rganish asosidagi yechimlar (CNN, RNN, LSTM, transformer arxitekturalari) o‘rtasida qiyosiy tahlil o‘tkaziladi. GROBID, CERMINE, Science Parse, Anystyle va ParsCit kabi ochiq kodli tizimlarning imkoniyatlari va cheklovlari batafsil yoritiladi. Tadqiqot natijalariga ko‘ra, qoidalarga asoslangan tizimlar ma’lum formatlarda yuqori aniqlik ko‘rsatsa-da, moslashuvchanligi pastligi bilan ajralib turadi. An’anaviy mashinaviy o‘rganish modellari nisbatan moslashuvchan bo‘lsa-da, sifatli o‘quv ma’lumotlariga bog‘liq. Chuqur o‘rganish asosidagi tizimlar kontekstual va semantik xususiyatlarni o‘rganish qobiliyati tufayli murakkab hollarda barqaror natijalar beradi (masalan, psevdo-kodlarni ajratishda 94.23% aniqlik). Biroq, barcha mavjud tizimlar turli formatlar, skanerlangan hujjatlar va ko‘p tilli maqolalarda universal va barqaror natijalar bera olmaydi.