Раскрыты сильные ограничения в креативности генеративных систем ИИ

Это говорит о сильной ограниченности их креативных способностей, отметили математики
Редакция сайта ТАСС
16:02

МОСКВА, 19 декабря. /ТАСС/. Европейские и американские математики обнаружили, что существующие системы генеративного искусственного интеллекта без человеческого надзора начинают вырабатывать очень однообразные и "попсовые" изображения с минимальным выбором тем и стилистики. Это говорит о сильной ограниченности их креативных способностей, пишут ученые в статье, опубликованной в журнале Patterns.

"Проведенные нами опыты показывают, что креативные способности ныне существующих генеративных систем ИИ очень ограничены. Выработанные ими изображения были очень общими, однообразными и "попсовыми", что в целом является полной противоположностью тому, что человек обычно считает креативным. Они не смогут стать Пикассо и нарисовать "Гернику", - заявил профессор Университета Даларна (Швеция) Аренд Хинтце, чьи слова приводит пресс-служба журнала.

Исследователи пришли к такому выводу в рамках эксперимента, в ходе которого ученые попытались создать своеобразную творческую мастерскую на базе двух генеративных систем искусственного интеллекта - одной из популярных моделей Stable Diffusion, формирующих изображения на базе пользовательских запросов, и большой языковой модели LLaVA, способной генерировать текстовые описания изображений.

В качестве "задания" для этой мастерской ученые подготовили сто описаний очень непохожих друг на друга изображений, которые были найдены в глобальной сети при помощи еще одного алгоритма. Эти описания были переданы в генератор изображений, который подготовил изображения на базе этого запроса и направил их модели LLaVA. Она, в свою очередь, выработала текстовые описания сгенерированных картинок и передала их назад алгоритму Stable Diffusion, что запустило новый цикл генерации изображений.

Культурное однообразие ИИ

"Мы ожидали, что изображения через несколько подобных циклов стабилизируются и будут в целом соответствовать тем запросам, которые мы подготовили. В реальности всего через сто циклов системы ИИ начали генерировать одни и те же изображения с очень узким набором популярных тем вне зависимости от текста первоначального запроса. При этом ИИ периодически резко переключались между этими тематиками в последующие тысячи циклов работы, причины чего не ясны", - добавил профессор Хинтце.

Как отмечают исследователи, схожее поведение было характерно не только для изученной ими пары генеративных систем ИИ, но и для любых комбинаций из еще шести аналогичных алгоритмов. При длительной циклической работе все они начинали игнорировать тематики изначальных запросов и вырабатывать изображения на 12 узких тематик, связанных со спортом, городскими сценами, пейзажами, дворцами и некоторыми другими "нейтральными" и популярными темами.

"С точки зрения культурной политики, повсеместное внедрение подобных ИИ-систем может привести к гомогенизации визуальной культуры, если творчество нейросетей всегда будет сводиться к очень небольшому набору эстетических принципов и визуальных идей. Это говорит о том, что для защиты креативного разнообразия необходим человеческий надзор над ИИ или механизм, который будет мешать ИИ стремиться в сторону этой культурной сингулярности", - подытожили ученые.