ноя

2023

«Сегодня сделать большую языковую модель — это гигантский труд»

Фото: wtcmoscow.ru

С 22 по 24 ноября проходит международная онлайн-конференция в сфере технологий искусственного интеллекта AI Journey 2023. В ее работе приняли участие эксперты НИУ ВШЭ. В фокусе обсуждения — языковые модели и методы, которые применяются сегодня для обучения искусственного интеллекта.

Научный сотрудник Международной лаборатории интеллектуальных систем и структурного анализа факультета компьютерных наук НИУ ВШЭ Елизавета Гончарова выступила с докладом «Языковые модели. Что можно выучить, генерируя текст?». Она рассказала об истории развития процесса обработки естественного языка и больших языковых моделей как виртуальных ассистентов. По ее словам, начало этому направлению было положено еще в середине прошлого столетия, но применяемые тогда подходы главным образом были основаны на правилах, связанных с формальной грамматикой и регулярными выражениями. «Однако впоследствии нейросетевые подходы по обработке естественного языка и трансформерные модели взяли верх, и все большие и наиболее успешные примеры работ моделей по обработке естественного языка теперь связаны именно с архитектурой трансформеров», — отметила исследовательница.

Елизавета Гончарова

Елизавета Гончарова считает, что большие языковые модели очень мощные, поэтому, будучи предобученными на простой задаче языкового моделирования, они способны решать гораздо более сложные прикладные задачи даже без дальнейшего обучения. «Если заглянуть внутрь модели, то мы увидим, что каждая часть модели отвечает за кодирование и своей информации, и той информации, на которую мы посягаем как люди: лингвистической структуры текста, фактологии, понятий времени и пространства и даже визуальных концептов, в целом закодированных внутри модели, которую мы рассматриваем, — объяснила она. — Добавление на дообучение модели данных других модальностей позволяет лучше улавливать понятия, связанные с этими модальностями, как в случае цветов, так и в случае форм. Это намекает нам на то, что текстов недостаточно, чтобы модель получила все знания о мире. Возможно, расширение модальности позволит нам открыть новые формы моделей и перейти к более сложным и более умным моделям, которые мы будем использовать в будущем».

Об алгоритмах, которые применяются для создания языковых моделей, используемых искусственным интеллектом, рассказал Евгений Соколов, руководитель департамента больших данных и информационного поиска, доцент факультета компьютерных наук, научный руководитель Центра непрерывного образования НИУ ВШЭ. Тема его доклада — «Tехнологии и алгоритмы внутри больших языковых моделей, или Что сегодня понимают под ИИ?». Евгений Соколов отметил, что сегодня уже много информации об успехах ИИ, генеративных моделей, больших языковых моделей. Он предложил разобраться, как они работают, что находится внутри, какие алгоритмы делают возможными все эти результаты и за счет чего происходит рост качества в методах ИИ.

Евгений Соколов

«Сегодня сделать большую языковую модель — это гигантский труд. Да, математика, которая лежит в основе, очень простая: производные, градиенты, градиентный спуск. А дальше начинается много интересного, нужно придумать методы для извлечения информации из данных, — говорит Евгений Соколов. — Сейчас есть трансформеры, но, кто знает, может, завтра придумают что-то новое? Очень важны сегодня обучающие данные. Классическая парадигма — это когда мы берем обучающие данные и подкручиваем параметры какой-то модели, какого-то алгоритма, чтобы получилось получше. Но сейчас этого мало, недостаточно. Нам нужно как-то внедрить требования качества в эту модель. Для этого мы берем асессоров, собираем большую выборку, строим отдельную оценивающую модель, что требует тоже очень много времени, и на основе этого докручиваем параметры нашей большой языковой модели. Получается сложная схема, какой мы видим ее сегодня. И это то, как сейчас обучаются большие языковые модели».

Эксперт отметил, что в этой работе главную роль играет не решение задачи, чтобы модель как-то «догадалась», что разработчики в нее заложили какие-то глубокие понимания — например, понимание того, как устроен язык. В этой работе важны два момента — собрать качественные данные и взять модель побольше. По его мнению, последние годы исследований показали, что основной рост качества языковых моделей достигается за счет определения большего количества параметров, по которым в дальнейшем будет вестись разработка большой языковой модели.

Свои доклады на конференции также представили и другие исследователи из Вышки. Так, младший научный сотрудник Института искусственного интеллекта и цифровых наук Айбек Аланов выступил с докладом «Редактирование изображений с помощью диффузионных моделей». Сотрудник Института искусственного интеллекта и цифровых наук и Научно-учебной лаборатории методов анализа больших данных НИУ ВШЭ Виталий Поздняков представил доклад на тему «Генерация стрессовых данных для проверки устойчивости моделей». Доцент факультета компьютерных наук, сотрудник Международной лаборатории интеллектуальных систем и структурного анализа НИУ ВШЭ Дмитрий Ильвовский сделал сообщение на тему «Интерпретируемые подходы к дискурсивным, логическим и аргументативным структурам в тексте». А профессор НИУ ВШЭ в Нижнем Новгороде Андрей Савченко представил исследование «Эффективные методы распознавания выражений лиц на видео».

В форсайт-сессии «ИИ для человека будущего» выступил Александр Чулок, директор Центра научно-технологического прогнозирования ИСИЭЗ НИУ ВШЭ.

Дата

24 ноября 2023

Рубрики

Экспертиза

Темы

дискуссии репортаж о событии искусственный интеллект

В статье упомянуты

Департамент анализа данных и искусственного интеллекта, Департамент больших данных и информационного поиска, Международная лаборатория интеллектуальных систем и структурного анализа, Научно-учебная лаборатория методов анализа больших данных, Факультет компьютерных наук, Центр непрерывного образования

Персоны

Аланов Айбек

Гончарова Елизавета Федоровна

Ильвовский Дмитрий Алексеевич

Поздняков Виталий Витальевич

Савченко Андрей Владимирович

Соколов Евгений Андреевич

Вам также может быть интересно:

мая

2025

«ИИ и машинное обучение — мощные технологии, но не везде научились их применять»

Рост доходов мировой индустрии образования может составить до 4% в ближайшие годы благодаря внедрению технологий искусственного интеллекта. Кроме того, ИИ сокращает время работы преподавателей в 4–5 раз. Эксперты Вышки рассказали, как преподаватели и административный персонал вузов осваивают нейросети, боты и другие инструменты и почему не стоит бояться, что их заменит ИИ.

30 мая

мая

2025

Онлайн-кампус НИУ ВШЭ стал лауреатом премии «AI Олимп»

«AI Олимп» оценивает разработки в области искусственного интеллекта и является продолжением проекта Digital Leaders, который более 10 лет освещает лучшие достижения в области цифровизации, онлайн-сервисов и диджитал-решений.Онлайн-кампус НИУ ВШЭ стал победителем номинации «Платформа года» в категории «Персонализированные обучающие платформы». Среди лауреатов премии — Сбер, «Гемотэк», RuStore, «Норникель», «Авито» и другие крупные компании.

28 мая

мая

2025

Меньше половины пиарщиков сообщают клиентам, что пользуются ИИ

Центр медиапрактик Высшей школы экономики совместно с АКОС подготовил исследование о том, как российские пиарщики пользуются искусственным интеллектом. Большинство респондентов оценивают работу с нейросетями как эффективную и считают, что использование ИИ улучшило качество их работы.

21 мая

мая

2025

В НИУ ВШЭ будет создан Центр подготовки кадров для ИТ-отрасли

Минцифры России совместно с Аналитическим центром при Правительстве России подвели итоги конкурсного отбора вузов для получения грантов на запуск углубленного ИТ-образования. Заявки на конкурс подали 50 вузов, определены 26 победителей из 13 регионов, в том числе Высшая школа экономики.

13 мая

мая

2025

Сервисы должны быть гибкими: как использовать искусственный интеллект государству

Международная лаборатория цифровой трансформации в государственном управлении НИУ ВШЭ провела круглый стол «Искусственный интеллект в государственном управлении: современные тенденции». Какие сервисы улучшит ИИ и что важно учитывать, применяя новые технологии, рассказали российские и зарубежные ученые.

7 мая

апр

2025

«Когда мир стремительно меняется, важно искать инструменты управления изменениями»

В начале апреля в Высшей школе экономики в Москве состоялась XIX Всероссийская научная конференция с международным участием «Параллельные вычислительные технологии» (ПаВТ). Конференция ПаВТ — ежегодное научное мероприятие, которое проводится в крупных научных центрах России. Форум в НИУ ВШЭ объединил более 200 ученых из пяти стран. Участники конференции представляли 55 организаций из 28 городов, в том числе 15 институтов РАН и НИИ, 30 университетов, 8 предприятий ИТ-индустрии и 2 промышленных предприятия.

30 апреля

апр

2025

ВШЭ — лидер конкурсного отбора Минцифры России по подготовке кадров в области ИИ

Министерство цифрового развития, связи и массовых коммуникаций Российской Федерации и Аналитический центр при Правительстве РФ завершили конкурсный отбор вузов, которые в 2025–2030 годах займутся подготовкой специалистов в сфере искусственного интеллекта. По итогам конкурсного отбора по программам высшего уровня «ТОП ДС» первое место заняла Высшая школа экономики.

30 апреля

апр

2025

Искусственный интеллект помогает точнее прогнозировать риски сложных заболеваний

Разработанные в Центре искусственного интеллекта НИУ ВШЭ нейросетевые модели значительно улучшают прогнозирование риска ожирения, диабета первого типа, псориаза и других многофакторных заболеваний. Совместное исследование с компанией Genotek показало, что алгоритмы глубокого обучения эффективнее традиционных методов, особенно при сложных взаимодействиях генов (эпистазах). Результаты опубликованы в журнале Frontiers in Medicine.

30 апреля

апр

2025

Искусственный интеллект может стать катализатором устойчивого развития

Искусственный интеллект трансформирует все сферы жизни, расширяя наши возможности и границы. В то же время технологии бросают человечеству новые вызовы, связанные с безопасностью, этикой и защитой окружающей среды. На сегодняшний день каждая нейросеть оставляет за собой большой углеродный след. Однако при грамотном управлении ИИ может принести пользу планете и стать залогом устойчивой экономики будущего. Об этом рассказал научный руководитель Лаборатории алгоритмов и технологий анализа сетевых структур НИУ ВШЭ в Нижнем Новгороде Панос Пардалос в рамках XXV Ясинской (Апрельской) международной научной конференции по проблемам развития экономики и общества.

29 апреля

апр

2025

В Вышке создали собственную MLOps-платформу

Ученые НИУ ВШЭ создали MLOps-платформу SmartMLOps. Она предназначена для исследователей в области искусственного интеллекта, которые хотели бы превратить свое изобретение в полноценный сервис. В будущем на платформе могут быть развернуты ИИ-помощники для упрощения образовательного процесса, оказания медицинской помощи, консультирования и решения многих других задач. Создатели ИИ-технологий смогут получить готовый к работе сервис в течение считанных часов. На суперкомпьютере Вышки этот сервис может быть запущен в несколько кликов.

23 апреля