• A
  • A
  • A
  • АБВ
  • АБВ
  • АБВ
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта

«Сегодня сделать большую языковую модель — это гигантский труд»

«Сегодня сделать большую языковую модель — это гигантский труд»

Фото: wtcmoscow.ru

С 22 по 24 ноября проходит международная онлайн-конференция в сфере технологий искусственного интеллекта AI Journey 2023. В ее работе приняли участие эксперты НИУ ВШЭ. В фокусе обсуждения — языковые модели и методы, которые применяются сегодня для обучения искусственного интеллекта.

Научный сотрудник Международной лаборатории интеллектуальных систем и структурного анализа факультета компьютерных наук НИУ ВШЭ Елизавета Гончарова выступила с докладом «Языковые модели. Что можно выучить, генерируя текст?». Она рассказала об истории развития процесса обработки естественного языка и больших языковых моделей как виртуальных ассистентов. По ее словам, начало этому направлению было положено еще в середине прошлого столетия, но применяемые тогда подходы главным образом были основаны на правилах, связанных с формальной грамматикой и регулярными выражениями. «Однако впоследствии нейросетевые подходы по обработке естественного языка и трансформерные модели взяли верх, и все большие и наиболее успешные примеры работ моделей по обработке естественного языка теперь связаны именно с архитектурой трансформеров», — отметила исследовательница.

Елизавета Гончарова

Елизавета Гончарова считает, что большие языковые модели очень мощные, поэтому, будучи предобученными на простой задаче языкового моделирования, они способны решать гораздо более сложные прикладные задачи даже без дальнейшего обучения. «Если заглянуть внутрь модели, то мы увидим, что каждая часть модели отвечает за кодирование и своей информации, и той информации, на которую мы посягаем как люди: лингвистической структуры текста, фактологии, понятий времени и пространства и даже визуальных концептов, в целом закодированных внутри модели, которую мы рассматриваем, — объяснила она. — Добавление на дообучение модели данных других модальностей позволяет лучше улавливать понятия, связанные с этими модальностями, как в случае цветов, так и в случае форм. Это намекает нам на то, что текстов недостаточно, чтобы модель получила все знания о мире. Возможно, расширение модальности позволит нам открыть новые формы моделей и перейти к более сложным и более умным моделям, которые мы будем использовать в будущем».

Об алгоритмах, которые применяются для создания языковых моделей, используемых искусственным интеллектом, рассказал Евгений Соколов, руководитель департамента больших данных и информационного поиска, доцент факультета компьютерных наук, научный руководитель Центра непрерывного образования НИУ ВШЭ. Тема его доклада — «Tехнологии и алгоритмы внутри больших языковых моделей, или Что сегодня понимают под ИИ?». Евгений Соколов отметил, что сегодня уже много информации об успехах ИИ, генеративных моделей, больших языковых моделей. Он предложил разобраться, как они работают, что находится внутри, какие алгоритмы делают возможными все эти результаты и за счет чего происходит рост качества в методах ИИ.

Евгений Соколов

«Сегодня сделать большую языковую модель — это гигантский труд. Да, математика, которая лежит в основе, очень простая: производные, градиенты, градиентный спуск. А дальше начинается много интересного, нужно придумать методы для извлечения информации из данных, — говорит Евгений Соколов. — Сейчас есть трансформеры, но, кто знает, может, завтра придумают что-то новое? Очень важны сегодня обучающие данные. Классическая парадигма — это когда мы берем обучающие данные и подкручиваем параметры какой-то модели, какого-то алгоритма, чтобы получилось получше. Но сейчас этого мало, недостаточно. Нам нужно как-то внедрить требования качества в эту модель. Для этого мы берем асессоров, собираем большую выборку, строим отдельную оценивающую модель, что требует тоже очень много времени, и на основе этого докручиваем параметры нашей большой языковой модели. Получается сложная схема, какой мы видим ее сегодня. И это то, как сейчас обучаются большие языковые модели».

Эксперт отметил, что в этой работе главную роль играет не решение задачи, чтобы модель как-то «догадалась», что разработчики в нее заложили какие-то глубокие понимания — например, понимание того, как устроен язык. В этой работе важны два момента — собрать качественные данные и взять модель побольше. По его мнению, последние годы исследований показали, что основной рост качества языковых моделей достигается за счет определения большего количества параметров, по которым в дальнейшем будет вестись разработка большой языковой модели.

Свои доклады на конференции также представили и другие исследователи из Вышки. Так, младший научный сотрудник Института искусственного интеллекта и цифровых наук Айбек Аланов выступил с докладом «Редактирование изображений с помощью диффузионных моделей». Сотрудник Института искусственного интеллекта и цифровых наук и Научно-учебной лаборатории методов анализа больших данных НИУ ВШЭ Виталий Поздняков представил доклад на тему «Генерация стрессовых данных для проверки устойчивости моделей». Доцент факультета компьютерных наук, сотрудник Международной лаборатории интеллектуальных систем и структурного анализа НИУ ВШЭ Дмитрий Ильвовский сделал сообщение на тему «Интерпретируемые подходы к дискурсивным, логическим и аргументативным структурам в тексте». А профессор НИУ ВШЭ в Нижнем Новгороде Андрей Савченко представил исследование «Эффективные методы распознавания выражений лиц на видео».

В форсайт-сессии «ИИ для человека будущего» выступил Александр Чулок, директор Центра научно-технологического прогнозирования ИСИЭЗ НИУ ВШЭ.

Вам также может быть интересно:

Интеллект искусственный и дополненный: связь бизнеса, образования и науки

Сегодня фраза «приручить искусственный интеллект» уже не звучит как суперспособность будущего. Эти технологии революционно меняют жизнь, от голосовых помощников и систем «умный дом» до создания цифровых двойников и секвенирования генома. О связи науки, бизнеса и образования в развитии искусственного интеллекта рассказала декан факультета информатики, математики и компьютерных наук НИУ ВШЭ – Нижний Новгород Наталья Асеева.

НИУ ВШЭ, Яндекс и ИТМО запустили аспирантуру в области ИИ и гранты для молодых ученых

НИУ ВШЭ в партнерстве с Яндекс создает первую аспирантуру по искусственному интеллекту с уклоном в практику (еще одну такую аспирантуру компания откроет в ИТМО). Цель — предложить лучшие условия и инфраструктуру для развития молодых ученых в стране. Каждый год обучения аспиранты будут получать гранты по 800 тысяч рублей, чтобы создавать новые технологии в области ИИ и быстро внедрять свои разработки на практике, в индустрии.

Вышка — в лидерах рейтинга вузов Альянса в сфере ИИ

Альянс в сфере искусственного интеллекта опубликовал новый рейтинг вузов России по качеству подготовки специалистов в области ИИ. Высшая школа экономики как и в прошлом году вошла в группу лидеров А+ вместе с МФТИ и ИТМО. Всего участниками рейтинга стали 207 университетов из 69 регионов страны. В 2024 году на профильные программы в области искусственного интеллекта этих вузов были приняты более 35 тыс. студентов.

В Вышке разрабатывают технологию идентификации текстов, сгенерированных ИИ любого типа

Ученые НИУ ВШЭ работают над созданием приложения, которое позволяет установить, написан текст человеком или сгенерирован искусственным интеллектом. Подход, на который опирается приложение, носит универсальный характер и позволяет «ловить» самых разных ботов, построенных на разной архитектуре. В ближайшее время запланировано тестирование прототипа в широком диапазоне текстов. Предполагается, что платформа будет доступна пользователям в 2025 году.

В питерской Вышке завершилась школа-конференция по ИИ

В НИУ ВШЭ — Санкт-Петербург прошла международная школа-конференция по искусственному интеллекту — ISSCAI 2024. Ее организовали Школа физико-математических и компьютерных наук совместно с Лабораторией социальной и когнитивной информатики при поддержке VK и других партнеров. В недельном интенсиве приняли участие талантливые студенты, аспиранты и разработчики со всей страны — от Москвы до Екатеринбурга, а также из Казахстана и Египта. Ведущие эксперты из России, ОАЭ и Индии прочли курсы по ключевым трендам в области ИИ: от компьютерного зрения до обработки музыкальных сигналов.

Искусственный интеллект как драйвер развития отечественной экономики

Для развития отечественной экономики и роста производительности труда сегодня необходимо активное внедрение технологий искусственного интеллекта (ИИ). Эту задачу можно решить только благодаря тесному сотрудничеству между бизнесом, наукой и образованием. Об этом шла речь на стратегической сессии НИУ ВШЭ по развитию ИИ.

В нижегородской Вышке запустили бакалавриат по искусственному и дополненному интеллекту

Студенты первой сетевой программы высшего образования по искусственному и дополненному интеллекту НИУ ВШЭ в Нижнем Новгороде будут изучать передовые технологии с участием экспертов BigTech-компаний. Меморандум о партнерстве в рамках реализации программы «Технологии искусственного и дополненного интеллекта» подписан между нижегородским кампусом Высшей школы экономики, АНО «НЕЙМАРК», Альфа-Банком и VK.

«Выпускники онлайн-магистратуры ВШЭ и “Яндекса” будут востребованы на горизонте многих лет»

Вышка открывает набор на совместную с “Яндексом” онлайн-магистратуру «Искусственный интеллект в маркетинге и управлении продуктом». Студенты будут изучать автоматизацию маркетинга, машинное обучение и ИИ, управление проектами и другие предметы. Академический руководитель онлайн-магистратуры, доцент департамента больших данных и информационного поиска факультета компьютерных наук ВШЭ Александр Тараканов, и академический руководитель со стороны “Яндекса”, эксперт в сфере маркетинговых образовательных технологий Дмитрий Еременко, рассказали, какие задачи ИИ помогает решать бизнесу и какие специалисты потребуются рынку в будущем.

НИУ ВШЭ первым из российских университетов разработал и утвердил Декларацию этических принципов использования ИИ

Высшая школа экономики стала первым университетом в России, утвердившим Декларацию этических принципов создания и использования систем искусственного интеллекта. Документ станет важным ориентиром для всех участников образовательного процесса, задавая высокие стандарты и способствуя формированию ответственного подхода к использованию искусственного интеллекта. Декларация была утверждена Ученым советом 26 июня.

В НИУ ВШЭ изучили, как в России готовят высококвалифицированные кадры в области ИИ

Институт статистических исследований и экономики знаний НИУ ВШЭ представил новую серию регулярных информационно-аналитических материалов на основе специализированных обследований по изучению трендов, направлений и факторов развития и распространения технологий искусственного интеллекта в России и мире. Первый выпуск основан на результатах сплошного обследования 1100 вузов и их филиалов, проведенного в 2023 году. Его целью стало выявление масштабов и условий обучения технологиям ИИ в рамках образовательных программ высшего образования и дополнительных профессиональных программ в вузовском секторе.