Шрифт
А А А
Фон
Ц Ц Ц Ц Ц
Изображения
Озвучка выделенного текста
Настройки
Обычная версия
Междубуквенный интервал
Одинарный Полуторный Двойной
Гарнитура
Без засечек С засечками
Встроенные элементы
(видео, карты и т.д.)
Вернуть настройки по умолчанию
Настройки Обычная версия
Шрифт
А А А
Фон
Ц Ц Ц Ц Ц
Изображения
Междубуквенный интервал
Одинарный Полуторный Двойной
Гарнитура
Без засечек С засечками
Встроенные элементы (видео, карты и т.д.)
Вернуть настройки по умолчанию

Али Кужугет: «Национальные языки России поможет сохранить искусственный интеллект»

28 июня 2024
52

Программист, лауреат Национальной бизнес-премии в области искусственного интеллекта, рассказал, как разработчики помогут сохранить языковое разнообразие и культуры народов России.

В Москве наградили победителей 6-й Национальной бизнес-премии. В этом году заявки на конкурс подали более тысячи участников со всей страны. Из них жюри выбрало два десятка лучших предпринимателей и специалистов, чьи достижения стали примером эффективного управления и стратегического мышления. Всероссийский конкурс ежегодно проводится при поддержке Торгово-промышленной палаты РФ, Минпромторга РФ и Союза пиарщиков России. В связи с глобальной автоматизацией в этом году особое внимание организаторы уделили проектам, разработанным на основе искусственного интеллекта. Инженером года в области искусственного интеллекта стал 36-летний программист из Тувы Али Кужугет за создание первого русского-тувинского переводчика на основе искусственного разума. Мы попросили его рассказать о том, как цифровизация исчезающих языков поможет их сохранить.

— Али, организаторы Национальной бизнес-премии в последние годы уделяют всё больше внимания сфере цифровых технологий: растёт количество номинаций для айтишников, при этом критерии отбора становятся строже. С чем Вы это связываете?

— На мой взгляд, это связано со стремительным технологическим процессом. Сегодня мы наблюдаем цифровизацию и объединение различных сфер бизнеса, общества и политики. Для этого необходимы первоклассные специалисты IT, которые предложат уникальные идеи и стратегии, смогут эффективно интегрировать новейшие технологические и инновационные решения. Сегодня много талантливых и увлечённых профессионалов, которые вносят большой вклад в развитие отрасли информационных технологий, а выявить лучших, топовых специалистов помогают как раз такие конкурсы.

— Свою премию Вы получили за разработку первого русско-тувинского переводчика на базе искусственного интеллекта. Язык находится в статусе уязвимого — его носителей, по официальным данным, осталось не больше 250 тысяч. Как появилась идея создания программы?

— Идея зрела еще со времён студенчества, когда я с друзьями работал над созданием Тувинского раздела Википедии. Тогда пришло понимание, что мой родной тувинский язык на пути вымирания, ведь он совершенно не оснащен технически: нет словарей, клавиатуры, онлайн-переводчиков. По мере сил старался это исправить. Сервис ИИ-переводчика я запустил в прошлом году вместе с коллегами - инженерами машинного обучения Давидом Дале и Айрой Монгуш. Я спроектировал и разработал приложение для iOS, Android, веб и серверную части. Сегодня мы предлагаем пользователям русско-тувинский двунаправленный переводчик, базу параллельных переводов и приём корпуса свободных переводов.

— В 2012 году Вы создали Тувинскую Википедию, перевели интерфейс ВКонтакте на родной язык, именно эта огромная работа помогла качественно и быстро обучить переводчик?

— Да, совершенно, верно. Все тексты и переводы я использовал для обучения искусственного интеллекта. Он обучается только на том материале, который ты ему предлагаешь. Если качество текстов будет низким, или их будет недостаточно, пострадает качество обучения. К этому вопросу подошел очень серьезно – качество всех статей с лингвистами перепроверяли по нескольку раз, поэтому обучение прошло успешно.

— Вы работаете над проектом с 2016 года. За это время Вам удалось не просто цифровизировать тувинский язык, предотвратив его вымирание, но и сделать популярным - переводчиком, которым широко пользуются в разных странах. Как проект будет развиваться дальше?

— Сначала я сделал тувинско-русский, а затем русско-тувинский словари. На следующем этапе появился переводчик, который с 2023 года работает на базе искусственного интеллекта. За время работы собрано более 350 тысяч различных переводов. Сейчас их проверяют профессиональные филологи. Как только они закончат, программа будет обновлена, переводчик станет ещё более мощным. Мы работаем с новейшими открытыми технологиями

искусственного интеллекта. Запрограммировали специальный уникальный код, который создает модель ИИ-переводчика, позволяющую переводить оперативно и, главное, правильно. Параллельно работаем с лингвистами, писателями, журналистами. Как только наберём миллион параллельных переводов, а это будет очень скоро, ещё улучшим код и получим современную эффективную технологию на основе искусственного интеллекта, которая поможет сохранить тувинский язык и другие малоресурсные языки народов России.

— По сути, Ваш онлайн-переводчик — это хорошо обученный искусственный интеллект. И что немаловажно, он обучается на основе Ваших же энциклопедических статей. Насколько сложно работать с искусственным разумом и что помогает в такой работе?

— Как и абсолютное большинство моих коллег, я убеждён, что вся дальнейшая работа IT-специалистов будет неразрывно связана с искусственным интеллектом. Об этом известно уже давно, все успешные, топовые программисты учитывали этот факт при разработке приложений, изучали ИИ и его возможности, стремились внедрить его в свои наработки. И я - не исключение. К тому же у меня к тому времени уже богатый опыт и серьезные наработки, например, в создании электронной энциклопедии, а их статьи легли в основу этапа обучения ИИ.

— Вы проделали огромную работу по обучению искусственного интеллекта. Сегодня только благодаря вашим разработкам мобильные приложения и веб-версия первого русского-тувинского переводчика доступны из любой точки мира. И у приложений на платформах для скачивания самая высокая оценка. Кто пользуется сервисами чаще всего?

— Да, за последний год количество посетителей увеличилось почти на 17%. Чаще других заходят жители России, Казахстана, Монголии, Франции, Германии, США, Южной Кореи. Сервис особенно популярен у студентов, учителей, учёных, журналистов. Также им пользуются деятели культуры и политики. В основном заходят на сайт с мобильных устройств. Я думаю, что людей привлекает не только то, что ресурс, действительно, рабочий и удобный, но и то, что он постоянно развивается. Сейчас на сайте есть сервис приема параллельных переводов, с которым работают более 100 волонтёров-переводчиков и профессиональные лингвисты. Они работают над корпусом параллельных переводов, следят за их качеством. С 2023 года наши переводчики активно изучают и переводят различные датасеты, включая наборы данных Яндекса.

— Помимо прочего у Вас очень много успешных коммерческих проектов. В качестве старшего разработчика компании Customertimes Вы создали приложения для известных брендов. Над какими работать было особенно интересно?

— Мне важны и интересны абсолютно все мои проекты. Например, в компании Customertimes внедрил новую технологию и на 50% улучшил скорость доставки проектов. Это позволило программистам работать быстрее. Таким образом, мы значительно сократили время на разработку и улучшили более 20 мобильных приложений для крупных корпораций Bayer, Abbott, L'Oréal и других. Очень интересный был опыт. Еще могу отметить работу над выпуском приложений DJ Mix Pads 2, Pro Microphone в компании Академ Медиа. Они очень популярны – миллионы установок на мобильные устройства.

— Правительство Республики Тыва высоко оценило Ваш вклад в развитие IT в госсекторе: работа по созданию сайтов и обучению чиновников не раз отмечалась почетными грамотами и благодарностями. А как программист попал на госслужбу?

— Сейчас программисты нужны везде, например, органы власти ведут сайты, общаются с населением в соцсетях. Для них это было новым направлением работы, поэтому были нужны специалисты. Меня пригласили на должность начальника Департамента по информационной политике регионального Правительства. Я разработал более 10 сайтов, создал регламенты по работе чиновников с сайтами и соцсетями. Организовал работу представителей власти через социальные сети. С моей помощью сайт Правительства занял лидирующие позиции в федеральном рейтинге.

— Вы также разработали мобильное приложение для московской Мэрии, которое сразу заинтересовало другие регионы. В чем его особенность?

— В сотрудничестве с компанией “Мегаполис ИТ”

создал мобильное приложение по управлению городскими камерами и контролю дорожных происшествий. Удобная программа, которая в реальном времени мониторит транспортную ситуацию, состояние транспорта и инфраструктуры. Такие приложения очень актуальны, особенно в крупных городах, где многочасовые пробки часто парализуют движение. Поэтому вскоре у программы появились другие заказчики.

— Сегодня Вы - успешный востребованный программист, Ваши разработки в области искусственного интеллекта помогли сохранить и распространить тувинский язык и подтолкнули специалистов к цифровизации других исчезающих языков. К чему стремитесь теперь?

— У меня есть несколько задумок, связанных с искусственным разумом, но пока держу их в тайне. Продолжу развивать все свои социальные проекты, буду реализовывать свою давнюю мечту – хочу, чтобы все языки нашей многонациональной страны сохранились и развивались, сделаю для этого всё возможное. Отрадно, что есть единомышленники и последователи – программисты и лингвисты из других регионов работают над сохранением языков малых народностей России. Проектов много, но хочу особо отметить Финно-угорскую лабораторию и "Языки разные - код один", где собрались программисты, специалисты по машинному обучению и данным, лингвисты и студенты. Ребята из Татарстана, Башкортостана, Марий Эл, Удмуртии, Коми делятся своими наработками, алгоритмами и вычислительными ресурсами. Я верю, что совсем скоро виртуальные голосовые помощники заговорят и на тувинском языке: будут рассказывать детям сказки, показывать любимые мультфильмы на тувинском, татарском, башкирском, удмуртском, алтайском и других языках, будут обучать желающих разным языкам в игровой форме. Совсем скоро такие технологии станут доступнее и дешевле во внедрении. И я горжусь тем, что участвую в этом.

По данным Комсомольской правды

Фото из открытых источников

Аналитика и мнения