Vol. 1 No. 1 (2023): COMPUTER LINGUISTICS: PROBLEMS, SOLUTIONS, PROSPECTS
Articles

ЎЗБЕК ТИЛИ МАТНЛАРИНИНГ РАЗМЕТКАЛАНГАН КОРПУСИНИ МОДЕЛЛАШТИРИШ

Abduvali Qarshiyev
Tashkent University of Information Technologies named after Muhammad al-Khwarizmi
Bio

Published 2023-04-29

Keywords

  • корпус, модел, маълумотлар базаси, матн, разметка, тег, JSON, сўз.

Abstract

Ушбу ишда, Ўзбек тили миллий корпусини қурилишида пайдо бўлган назарий ва амалий масалалар келтирилган. Корпусни қуриш вақтни ва меҳнатни талаб қилувчи жараёндир. Мавжуд корпусларни таҳлил қилиш натижасида кўриш мумкинки, корпусларни қуришда барча тиллар учун ягона бўлган методология мавжуд эмас. Ушбу мақолада корпусга қўйиладиган талаблар, корпус қуриш модели ва босқичлари таҳлил қилинган.