КОМПЬЮТЕРНАЯ ЛИНГВИСТИКА
ВЫЧИСЛИТЕЛЬНАЯ ЯЗЫКОВКА: ШАГ К РАЗВИТИЮ
Существование узбекского компьютерного языка, адаптированного для искусственного интеллекта, является залогом его национального развития и выживания.
Сегодня повышение культуры грамотности в нашей стране, укрепление статуса нашего государственного языка, развитие престижа узбекского языка в мировом сообществе стало одним из приоритетов государственной политики.
В этой связи обнародование Указа Президента Республики Узбекистан от 21 октября 2019 года ПФ-5850 «О мерах по кардинальному повышению престижа и статуса узбекского языка как государственного» ускорило движение. Как отмечается в указе, узбекский язык активно используется в политической, правовой, социально-экономической, духовной и образовательной сферах, широко слышен на международных форумах. Интерес к нашему языку и его изучению в зарубежных странах растет.
Поэтому поставленные в Указе вопросы, в том числе кардинальное повышение престижа узбекского языка в общественной жизни нашего народа, на международном уровне и повышение роли и престижа государственного языка, обеспечение достойного места узбекского языка в информационной и коммуникационные технологии, в частности Интернет. Такие задачи, как создание, особенно примечательны своей чрезвычайной срочностью. Сегодня активное потребление естественного языка определяется его отражением в цифровых технологиях и созданием его формального облика.
Компьютерная лингвистика в Ташкентском государственном университете узбекского языка и литературы имени Алишера Навои
В процессе стратегического образования, направленного на выполнение этих задач, в Ташкентском государственном университете узбекского языка и литературы имени Алишера Навои в 2020 году открыта магистратура 5А120106 - «Компьютерная лингвистика», на которую принято 13 магистров.
Компьютерная лингвистика - это область образования, направленная на решение языковых задач с помощью компьютерных программ, основной упор делается на создание формальной грамматики узбекского языка, создание лингвистической базы всех связанных с языком явлений. В этом случае языковые правила приобретают формальный вид. Поэтому роль компьютерного лингвиста в переводе естественного языка на машинный неоценима.
Узбекская компьютерная лингвистика сформировалась в конце двадцатого века, первоначально в результате научных исследований и создания ряда частотных словарей с помощью программного обеспечения, которое определяет частоту слов, наиболее часто используемых в периодических изданиях и ряде художественной литературы. К 20-м годам XXI века проведение исследований с практическими результатами, создание различных лингвистических программ (автоматическое редактирование и анализ, транслитерация, мобильные приложения) и получение степени магистра компьютерной лингвистики в вузах республики (Ташкентский государственный университет ) с открытием сцены начался собственный путь развития.10-е годы XXI века
20-е годы XXI века
В нашем университете такие дисциплины, как «Компьютерная лингвистика», «Машинный перевод», «Обработка естественного языка / NLP», «Язык программирования Python», «База данных» преподаются на основе двух модулей: лингвистические знания и программная инженерия. Эта интеграция информационных технологий и лингвистики приносит свои плоды: студенты приобретают навыки и компетенции для формирования лингвистической базы данных, адаптированной к целям этих дисциплин.
Известно, что в сервисах переводчиков Google, Yandex (Online) есть узбекский язык, но поскольку узбекский язык не полностью отражен в памяти этих систем перевода, во многих случаях перевод не имеет ясности и языкового выражения оригинала. Чтобы устранить причину приговора, нужно приложить немало усилий. Поэтому следующие вопросы в области компьютерной лингвистики являются приоритетными в нашем университете:
формирование цифровой лингвистики;
- создание корпуса национального языка;
- создание системы обучения языкам;
- электронные словари нового поколения;
- литература для электронного обучения;
- Отличные программы-переводчики;
- Программа текстового редактора Word предназначена для создания возможности редактирования и анализа узбекских текстов.
По реализации этих задач ведутся как научные, так и практические исследования, и усилия приносят свои плоды. В частности, была создана программа для редактирования и анализа текста на операционной системе Ubuntu Linux. В настоящее время ведутся исследования по включению его лингвистической базы данных в Microsoft Office.
Приоритеты определены в соответствии с Постановлением Президента Республики Узбекистан от 17 февраля 2021 года «О мерах по созданию условий для ускоренного внедрения технологий искусственного интеллекта» и Стратегией «Цифровой Узбекистан - 2030» по ускорению создания искусственного интеллекта. интеллект в социальной сфере Ряд практических проектов
в стадии реализации.
Наши достижения
В результате практического проекта «Разработка узбекского речевого программного обеспечения и синтезатора голоса для слабовидящих с использованием компьютерных технологий, чтения и написания текстов» был создан узбекский синтезатор речи (Text to Speech / TTS). .
Этот синтезатор речи позволяет автоматически озвучивать написанные тексты. Следует отметить, что создание этого синтезатора речи - первый эксперимент в узбекской компьютерной лингвистике. Теперь будут решены проблемы, связанные с процессом самостоятельной работы слепых с электронными текстами на узбекском языке, и их трудоустройство будет обеспечено.
Как известно, сегодня эффективное использование богатого выразительного потенциала узбекского языка стало одним из приоритетов государственной политики. Один из главных признаков речевой культуры - правильное произношение. Проблемы в этой области отражаются в произношении слов, изученных на языках со свободным акцентом. Слова, ассимилированные в определенном языке, имеют тенденцию восстанавливаться в соответствии с природой и законами этого языка, что заставляет усвоенные слова оседать из лексического слоя языка.
Например: моносемия (по-русски) - моносемия (по-узбекски), мускул (по-русски) - мускул (по-узбекски). Сохранение акцента в языке или исходном языке, к которому принадлежит приобретенное слово, может помешать усвоению международного слова. Учитывая схожие аспекты, университет подготовил к изданию в 2-х томах «Акцентный словарь узбекских слов», который включает 11 000 слов, широко используемых компьютерными лингвистами в различных сферах и социальных сетях.
Этот словарь играет особую роль в устранении речевых ошибок, вызванных ударением слов в узбекском языке, служит ценным лексикографическим источником при разработке речевых корпусов и лингвистических моделей для узбекского синтезатора речи и программного обеспечения распознавания речи, автоматического анализа и программы автоматического перевода. Теле- и радиоканалы будут играть важную роль в курсах переподготовки, организованных с целью повышения речевой культуры спикеров.
Еще один такой проект реализуется на основе задач, поставленных научным сообществом университета по грантовому проекту «Создание образовательного корпуса узбекского языка» на 2020-2022 годы. В результате этого проекта будет создан учебный корпус, который будет служить общеобразовательным инструментом III эпохи Возрождения. Основное внимание уделяется созданию современного электронного учебника, 10 видов филологических словарей и непереведенных лексических единиц узбекского языка - толковых словарей национальных и культурных слов, лексикографических мобильных приложений и мультимедийных продуктов, направленных на развитие навыков правильного произношения на узбекском языке.
Известно, что обучение языку требует большой работы. В настоящее время актуальной проблемой стало создание инновационных образовательных технологий, основанных на потребностях и запросах современного студента. В качестве решения этих проблем ведется активная работа над практическим проектом «Создание лингводидактической электронной платформы тюркских языков», направленным на обучение турок, казахов, киргизов, азербайджанцев и татар узбекскому языку на их родных языках.
Основная цель - продемонстрировать природу узбекского языка на этих тюркских языках с помощью компьютерных технологий и выразить текстовые и звуковые разговоры узбекского языка в творческих графических проектах, обеспечить мультимедийную интерпретацию фольклора на других тюркских языках. на единой платформе. Он учитывает преподавание языков и популяризацию нашего духовного наследия через электронную платформу.
Благодаря целевой онлайн-пропаганде профессоров и преподавателей вузов, сегодня наши студенты создают и запускают мобильные приложения по «Навоийской газели», «Творчеству Бобура» и ряду учебных предметов и художественной литературы.
Мобильное приложение «Навои Газели»
Мобильное приложение Bobur Ijodi
Также прилежными мастерами компьютерной лингвистики был создан специальный сайт (http://alisher.navoiy-uni.uz/), отражающий личность и творчество Алишера Навои.
Специалисты в области компьютерной лингвистики как специалисты-новаторы, которые создают и работают над филологическими программами:
Преподаватели и исследователи высших учебных заведений республики;
Специалисты по информационным технологиям в туристических информационных центрах;
Специалисты, преподающие информатику и родной язык в образовательных учреждениях на основе интеграции;
Специалисты по созданию электронных словарей в государственных и негосударственных издательствах республики;
Специалист по международным отношениям / редактор-переводчик;
Они смогут работать над созданием информационно-поисковых систем в электронном правительстве.
Перед университетом стоит высокая цель - объединить узбекский язык и современные информационные технологии, укрепить позиции
наш национальный язык в мировом сообществе и дальнейшее повышение престижа нашего духовного наследия в развитии компьютерной лингвистики и цифровых публикаций.
Елов Ботир Болтаевич - заведующий кафедрой информационных технологий Ташкентского государственного университета узбекского языка и литературы имени Алишера Навои, доктор философии (PhD) технических наук
Абджалова Манзура Абдурашетовна - доктор философских наук, и.о. доцента кафедры «Информационные технологии» Ташкентского государственного университета узбекского языка и литературы имени Алишера Навои.