От генерации картинок к проектированию автомобилей: чего ожидать от функционала нейросетей
Иван Оселедец — о том, как будет развиваться генеративный ИИ в ближайшие годы
Генеративный искусственный интеллект стремительно внедряется в различные отрасли, предлагая новые возможности и создавая вокруг них настоящий ажиотаж. Сегодня продукты на базе генеративного ИИ активно применяются в финансовом секторе, ритейле, IT и дизайне. Рассмотрим, что может ждать технологию в среднесрочной перспективе и какой из известных сценариев следует считать наиболее вероятным.
Это форма искусственного интеллекта, которая позволяет создавать (генерировать) сущности по входному запросу пользователя. Он может писать тексты, рисовать изображения, монтировать видео, писать музыку, составлять проектную документацию и многое другое.
Сценарий 1: хайп утихнет, инвестпривлекательность спадет
Если бизнес не решит вопрос монетизации технологических продуктов, со временем они могут превратиться в дорогую игрушку. Так, например, компания — создатель популярного генератора изображений Stable Diffusion Stability AI столкнулась с финансовыми трудностями и рассматривает возможность продажи бизнеса. Совсем недавно, в 2022 году, Stability AI привлекла $100 млн инвестиций при оценке в $1 млрд, а теперь терпит крах. В первом квартале 2024 года доход компании составил менее $5 млн, а убытки — $30 млн. Исследователи покидают компанию, что усугубляет ее положение.
Свою роль в подобном развитии событий играет не только отсутствие коммерчески устойчивой бизнес-модели, но и перспективы зарегулированности отрасли. Развитые технологии могут использоваться мошенниками, поэтому правительства стран и разных регионов по всему миру активно работают над созданием соответствующих правовых норм. Чтобы быть эффективным, этот процесс должен вестись при участии профильных экспертов. Например, сейчас в Калифорнии активно обсуждают введение нормативов, которые возлагают на разработчиков ответственность за применение их решений в неправомерных целях. Подобный вектор развития регулирования вызывает опасения сообщества, свидетельствует о непонимании фундаментальных принципов работы моделей ИИ и в случае его реализации блокирует дальнейшее развитие, в том числе, и open-source разработки в регионе.
Ключевой блокатор этого сценария заключается в том, что работа с рисками ведется уже сейчас. Исследователи разрабатывают алгоритмы доверенного искусственного интеллекта и решения для кибербезопасности ИИ. Например, способы маркировки ИИ-моделей и контента. Это способствует работе против неправомерного использования генеративных технологий. Вопрос окупаемости решений в первую очередь затрагивает прорывные генеративные LLM (large language models — большие языковые модели) крупных компаний, в то время как на рынке есть намного менее изученные и перспективные сферы применения генеративных технологий.
Сценарий 2: ключевой трек развития сузится до креативного сектора
Этот сценарий связан с тем, что уровень адаптации генеративных моделей в креативных профессиях довольно высок прямо сейчас. Компании используют GPT-4, DALL-E 3, Midjourney, Kandinsky и другие модели для генерации маркетинговых кампаний и контента. Например, "Императорский Фарфоровый завод" выпускает фарфор с ИИ-дизайном. Нейросети используются и для создания рекламных объявлений на маркетплейсах. Год назад опросы показывали, что 45% дизайнеров в России уже применяли ИИ в работе.
Естественно, появление новых инструментов порождает опасения о рабочих местах и вызывает серьезные дебаты о необходимости регулирования использования нейросетей в творческом секторе. В 2024 году Голливуд уже столкнулся с забастовками сценаристов и актеров, которые требуют защиты своих прав и ограничений на использование технологий для создания контента без их участия.
Инструменты искусственного интеллекта действительно могут воспроизвести полноценный творческий контент с минимальным участием человека. Но удовлетворит ли подобный контент нужды бизнеса без участия экспертов — большой вопрос. Для применения результатов генерации необходимы верификация и отбор контента, навыки по грамотному формированию запросов для нейросетей (промпт-инжиниринг) и, в зависимости от масштаба проекта, ресурсы на вычислительные мощности.
Сценарий 3: спадет повсеместный ажиотаж, но область применения расширится
Сценарий, который кажется наиболее вероятным, — развитие технологии согласно кривой Гартнера. Напомню: после пика завышенных ожиданий нас ждет фаза ослабления всеобщего интереса, затем коррекция и переход технологии в категорию зрелой. Градус информационного хайпа снизится, но инвестиционная привлекательность продуктов на основе ИИ сохранится на высоком уровне за счет постепенного привыкания общества к взаимодействию с такими решениями.
Аргументом в пользу этого сценария выступает рост интереса к мультимодальным нейросетям — растет популярность синтеза изображений и видеоконтента с помощью генеративных сетей.
Главный тренд — внедрение в промышленность и медицину
Останется ли генеративный ИИ инструментом для сферы развлечений, покажет время, однако можно с уверенностью сказать, что потенциал применения технологии в реальном секторе экономики совершенно точно еще не раскрыт. Новый виток развития технологических продуктов будет связан именно с этим сектором. Это будет не просто генеративный ИИ, а обусловленный генеративный ИИ, который позволит на основе заданных ограничений создавать физически объяснимые конструкции: вещи, детали, молекулы. Отношение к генеративному ИИ станет более серьезным.
Несмотря на сложности, на рынке уже есть интересные кейсы. Генеративный ИИ используют в проектировании автомобилей. Первичные эскизы "загружаются" в системы на основе ИИ для обработки и предложения новых вариантов внешнего вида авто с учетом инженерных ограничений. General Electric использует ИИ для разработки новых конструкций генераторов и трансформаторов с улучшенными характеристиками и повышенной надежностью. Так компания экономит на производстве и эксплуатации оборудования.
Поддержка существующих ИИ-решений на предприятиях также станет драйвером применения генеративных технологий. Системы детекции брака, предсказательной аналитики и программ для автономного управления строительной техникой нуждаются как в регулярной доработке, так и в тонкой "настройке" для внедрения в работу конкретного предприятия. Созданные с помощью генеративного искусственного интеллекта синтетические датасеты помогут справиться с нехваткой качественно размеченных данных для обучения и дообучения моделей.
Чтобы значительно расширить область применения генеративного ИИ в промышленности и перейти на новый уровень зрелости технологии, необходимо решить две задачи. Первая — наладить регулярное взаимодействие междисциплинарных научных команд и отраслевых специалистов, понимающих физику процессов, для которых создаются ИИ-решения. Вторая — направить ресурсы в поиск новых нейросетевых архитектур для более оптимального расхода вычислительных ресурсов и увеличения контролируемости процесса генерации.
Технология развивается не только на пользу промышленности. Все идет к тому, что в ближайшие пять лет появятся готовые решения в области здравоохранения. Уже сейчас диалоговые ассистенты на основе больших языковых моделей помогают врачам и пациентам в постановке диагнозов и выборе лечения. "СберМедИИ" и правительство Москвы разработали инструмент на базе ИИ, который помогает терапевтам в проставлении диагноза на основании данных электронной медицинской карты пациента. Первые лекарства, созданные на основе сгенерированных нейросетью молекул, проходят клинические испытания, что ускоряет процесс вывода новых препаратов на рынок. Например, стартап Insilico Medicine разработал препарат для лечения идиопатического легочного фиброза, который проходит клинические испытания на людях. А значит, можно ожидать яркие кейсы и в этом направлении.