Сохранить национальные языки помогут технологии искусственного интеллекта. Нейросетевая модель GigaChat начнёт обучаться удмуртскому языку. Соглашение о сотрудничестве в этой сфере заключили Сбер и Министерство национальной политики Удмуртской Республики в лице министра Эдуарда Петрова. Документ подписан в День удмуртского языка, который отмечается 27 ноября.
Для обучения модели регион предоставит разработчикам тексты на удмуртском языке с переводом на русский. Это будут книги, статьи, научно-образовательные публикации, посты из соцсетей и другие материалы. Чтобы искусственный интеллект «заговорил» на удмуртском, стороны будут работать с носителями языка и дополнят данные актуальной информацией и диалогами. Затем тексты пройдут проверку на ошибки и станут основой для машинного обучения.
Дарья Сунцова, Постоянный представитель Главы Удмуртской Республики при Президенте Российской Федерации – заместитель Председателя Правительства Удмуртской Республики:
«Сохранение и развитие языков народов Российской Федерации – основной вопрос Стратегии государственной национальной политики нашей страны. В Удмуртской Республике для сохранения национального языка приняты региональные нормативные правовые акты. В том числе Госпрограмма, которая утверждена постановлением Правительства Удмуртской Республики от 20.11.2023 № 748. В её рамках оказывается поддержка и развитие национальных СМИ, издаётся художественная, учебная и научная литература на национальном языке. Также ведётся активная работа по оцифровке удмуртского языка. Создание и обработка корпусов текстов, на которых впоследствии можно обучить модели искусственного интеллекта, важный и нужный процесс. Он поможет в дальнейшем не только переводить, но и генерировать тексты на удмуртском языке. Что особенно важно в эпоху цифровизации».
Максим Ерёменко, вице-президент, директор Департамента развития искусственного интеллекта и машинного обучения Сбербанка:
«Важно сохранить национальные языки народов России и передать их следующим поколениям. У Сбера для этого есть проверенные решения, которыми мы готовы делиться с нашими региональными партнёрами. Примеров, когда AI-технологии помогли воссоздать утраченное и сохранить культурное наследие, много. С помощью искусственного интеллекта мы занимались распознаванием рукописей Петра I и расшифровкой древних египетских манускриптов. Теперь GigaChat займётся изучением разных языков нашей большой страны. Подписанное соглашение с руководством Удмуртской Республики поможет обучить модель удмуртскому. У этого уникального национального языка начинается новый, цифровой этап эволюции».
Министр национальной политики Удмуртской Республики Эдуард Петров:
«Министерство национальной политики ведёт большую работу по цифровизации удмуртского языка. Для популяризации удмуртского языка и активной представленности в визуальном пространстве, детской и молодежной аудитории, с применением инструментов искусственного интеллекта, при поддержке регионального Правительства в Удмуртии разработаны IT-продукты и мобильные приложения. Также создана электронная поисковая система «Национальный корпус удмуртского языка», которая содержит помимо массива текстов материалы русско-удмуртского словаря и удмуртско-русского словаря. Национальная библиотека Удмуртской Республики с 2009 года ведет работу по оцифровке изданий на удмуртском языке. Электронная библиотека ежемесячно пополняется на 400-500 книг, газет и журналов. Пользоваться данным ресурсом можно из любой точки мира. Соглашение со Сбером даст новый виток этой большой и важной работе».
По материалам сайта Главы и Правительства УР