Робот вместо Кобейна: зачем искусственный интеллект учат писать стихи
Сотрудники "Яндекса" научили нейросеть сочинять стихи в стиле Курта Кобейна. Авторы проекта рассказали ТАСС, что это значит и зачем это нужно
Алексей Тихонов и Иван Ямщиков учат нейросеть писать стихи в стиле культовых музыкантов, после чего кладут их на музыку и выпускают альбомы. Таким образом разработчики "Яндекса" пытаются определить возможности и творческий потенциал искусственного интеллекта. Впоследствии эти знания используются в разработке новых сервисов и продуктов.
Летом 2016 года Тихонов и Ямщиков выпустили альбом "404", созданный на основе написанных искусственным интеллектом песен в стиле Егора Летова.
Следующим этапом стало создание стихов на английском языке. Выбор пал на лидера группы Nirvana Курта Кобейна. Нейросеть сгенерировала стихи в его стиле, Иван Ямщиков написал к ним музыку, а исполнил песни американский вокалист Роб Кэролл.
Некоторые поклонники Nirvana отметили, что композиции получились очень похожи на оригинал. И в шутку попросили разработчиков научить нейросеть генерировать стихи других музыкантов, например, тех, кто давно не выпускал новый альбом.
Мы попросили Ивана Ямщикова, постдока Института научной математики Общества Макса Планка в Лейпциге (Германия) и консультанта "Яндекса", простым языком рассказать о том, что такое нейросеть, зачем она нужна и как заставить ее писать стихи.
Что такое нейросеть?
Нейросети бывают естественные и искусственные. Естественные — это группы химически и физически связанных между собой нейронов. Мозг человека — это очень мощная и сложная естественная нейронная сеть.
Искусственные же нейронные сети — это тип математических моделей, он был придуман для того, чтобы смоделировать процессы, протекающие в мозге. Это математическая абстракция или, если угодно, алгоритм, который может обучаться на примерах.
Сначала нейросеть не умеет ничего, но чем больше вы показываете ей примеров, тем лучше она начинается справляться с задачей, которой вы ее обучаете.
Применений у таких алгоритмов много: в "Яндексе" искусственные нейросети используются для поиска картинок по описанию того, что на них изображено, для синтеза и распознавания речи, например в "Яндекс. Навигаторе", и в целом для лучшего понимания смысла поисковых запросов.
Как она работает?
Если коротко, то мы берем много достаточно простых элементов, которые собираем в "слои". Информация поступает на входные элементы (нейроны), а потом идет от слоя к слою. Каждый элемент связан с другими, получает информацию от одних нейронов, как-то ее преобразует и отдает дальше.
Связи между нейронами в процессе обучения могут становиться сильнее или слабее. Мы показываем входным нейронам достаточно много "примеров", а сеть, обучаясь на них, усиливает одни внутренние связи и ослабляет другие. В итоге она начинает достаточно хорошо справляться с поставленной задачей.
Как научить нейросеть писать стихи?
Все задачи такого рода решаются похожим образом. Сначала надо собрать большой набор данных (дата-сет), после чего проверить его качество. Если дата-сет плохой, то ничему хорошему нейросеть не научится.
После подготовки данных надо переходить к обучению. После генерации стихов надо писать музыку, искать вокалиста и сводить все вместе.
Вокалиста нам было найти особенно сложно для последнего проекта. Nirvana — это легенда, и сделать что-то похожее трудно. Мы ориентировались на раннее творчество группы, нам показалось, что тексты к нему больше отсылают.
Мы работали с четырьмя разными вокалистами, все отлично пели, но нам не нравилось. В какой-то момент я отчаялся и вбил в поиск YouTube запрос "singing like Kurt Cobain", стал слушать вокал на видео и пытаться связаться с каждым, чей вокал мне нравился. Так я вышел на Роба Кэролла. Ему идея понравилась, я отправил минуса и дело пошло.
На каких стихах она училась?
Человек не может написать хорошие стихи, если он читал только одного поэта. Так и искусственная нейросеть должна обучаться на разных авторах. Больше примеров позволяет сети лучше разобраться в структуре языка, и итоговый алгоритм получается более интересным с точки зрения широты применения. Мы можем сгенерировать не только нейро-Курта, но и нейро-По и нейро-Марли, к примеру.
Есть два правила: чем более "плодовитым" был автор, тем выше шанс, что нейросеть правильно уловит его стиль. Второе — не надо ждать от финальных стихов стройного нарратива. Если автор пишет экспрессивно, оперирует образами, как Кобейн или Летов, то стилизация будет интереснее, чем если автор пишет сюжетные стихотворения. Связанные сюжетные стихотворения нейронная сеть генерировать пока не умеет.
Может ли нейросеть создать кардинально новые стихи?
Да, но это другая задача. Для ее решения нам нужна какая-то метрика качества творческого произведения. Причем она должна хорошо описываться в математических терминах. Утверждения "я так вижу" здесь недостаточно.
Проблема в том, что за долгие годы существования цивилизации мы не смогли создать какую-либо метрику в отношении искусства. Более того, возможно, что ее отсутствие в области творчества станет онтологическим свойством творческой деятельности. Это глубокий вопрос, с которым нужно разбираться философам и искусствоведам.
Сможет ли машина заменить поэта?
Может ли трактор заменить человека? Да — пахаря, но не тракториста. Может ли водопровод заменить человека? Да — водовоза, но не банщика. Машинный интеллект вообще и нейросети в частности уже сейчас справляются с рядом задач лучше, чем люди. Но это фундаментальное свойство любой технологии: вас же не удивляет, что лопатой копать удобнее, чем ладонью.
Я регулярно слышу, что принципиальная разница в том, что лопата или трактор усиливали человека физически, а тут речь идет о выполнении интеллектуальных задач. Дескать, искусственный интеллект отличается от всех других технологий. Это неправда.
Калькулятор, да даже простейшие счеты, — это тоже технологические решения, которые повышали производительность людей при решении интеллектуальных задач. Это фундаментальное свойство технологии. Она не заменяет человека, а расширяет его возможности, позволяет не тратить время и силы на простые, понятные задачи, а заниматься чем-то новым и непонятным. В этом прелесть и сила технологий. Они позволяют нам интереснее жить.
Виктория Сальникова