Нейронные сети — обучаемые алгоритмы, имитирующие работу человеческого мозга. Они уже помогают ставить диагнозы и сажать самолеты, а на что способны машинное обучение и большие данные в культуре? В этой статье мы не будем разбираться, может ли робот написать симфонию, но постараемся понять, насколько хорошо он создает художественную литературу.
Фикшн, сгенерированный при помощи нейросетей, выходит уже давно. Так, с 2013 года в рамках ежегодного челленджа NaNoGenMo — National Novel Generation Month (Национальный месяц генерирования романов) — программисты со всего мира выложили на github уже несколько сотен законченных произведений. Среди них: чудной гибрид "Алисы в Стране чудес" и "Моби Дика", сборник заклинаний и поток сознания Молли Блум из "Улисса". У конкурса почти нет правил и нет победителей, каждый участник должен за месяц написать код, который соберет не меньше 50 тысяч слов, и выложить результат на странице мероприятия. Бесполезно искать среди этих текстов привычные внятные нарративы, зато NaNoGenMo дает энтузиастам по всему миру повод реализовать свои самые безумные задумки, например — перевести попиксельно обложку "И восходит солнце" Хемингуэя в текст. Это настоящее поле для экспериментов, чемпионат с атмосферой капустника. Но сгенерированные романы — это не просто баловство для гиков.
В 2020 году калифорнийская компания OpenAI, одним из сооснователей которой является Илон Маск, представила новый алгоритм генерации текста GPT-3. На данный момент это самая мощная нейросеть, имитирующая человеческое письмо, она умеет отвечать на вопросы, решать примеры, программировать, а главное — писать что угодно: от новостных заметок до стихов. Например, нейросеть стала автором эссе для The Guardian о том, почему роботы не представляют угрозы для человечества. GPT-3 обучена на пятистах гигабайтах данных: страницах всей англоязычной Википедии, архивах открытой библиотеки Common Crawl, книгах и миллиардах сайтов. И с ее помощью можно за несколько секунд написать если не роман-эпопею, то приличный постмодернистский рассказ. В октябре "Сбер" выложил русскоязычную версию GPT-3 в открытый доступ, так что каждый может попробовать себя в роли начинающего веб-издателя и собрать на сайте ruGBT отрывок новой книги Виктора Пелевина.
in: Когда-то в России и правда жило беспечальное юное поколение, которое улыбнулось лету, морю и солнцу — и выбрало "Пепси".
out: Когда-то в России и правда жило беспечальное юное поколение, которое улыбнулось лету, морю и солнцу — и выбрало "Пепси". Что, в общем, не очень характерно для российского характера, оно по причине своей всепоглощающей инфантильности всегда шло вторым. Возможно, потому, что к подлинным патриотам не зарастало корнями, любовью к Родине и гордостью за ее дело у него было очень мало. И наконец, третьему поколению тоже никогда не жилось в комфортных условий — и тут, на мой взгляд, совершенно очевидно, какие люди ехали отдыхать на Евро-2008, купив чемоданы "Volkswagen".
Потенциально нейросеть выполняет функции не только автора, но и переводчика. Такая возможность значительно сократила бы расходы издательств, выпускающих техническую или жанровую литературу. Удачные примеры уже есть: осенью издательство "Индивидуум" опубликовало "Будущее без работы" — экономический нон-фикшн Дэниела Сасскинда. Его перевод с английского был полностью выполнен прокачанной версией "Яндекс.Переводчика". Над итоговым текстом, конечно, поработал редактор, тем не менее случившееся — важный прецедент, и стоит ожидать, что в ближайшие годы машинные переводы в книгоиздании станут встречаться чаще.
Пока что сгенерированные романы не похожи на обычные. Сюжет часто поворачивается самым нелогичным образом, регулярно происходят нарушения в устройстве вселенной: под водой начинается пожар, в XIX веке герой вдруг едет на личном автомобиле. Но поразителен сам факт: эти книги уже печатают на бумаге и их можно купить на Amazon. В 2019 году датский художник Андреас Рефсгаард и аналитик Микель Тубо Лус запустили онлайн-магазин научной фантастики booksby.ai, для которого тексты, обложки, имена авторов, аннотации, блербы и даже цены были сгенерированы с помощью машинного обучения. В их издательском портфеле — десять книг с названиями в духе "Обеденная депрессия" и "Несовершенство в катастрофе". Возможно ли их прочитать от начала до конца? Скорее нет. Хочется ли иметь такое в своей библиотеке? Скорее да.
Другой удивительный проект — дневник путешествия 1 the Road. Художник Росс Гудвин, который на личном сайте представляется как "гонзо дата-сайентист", обвесил автомобиль камерой наблюдения, GPS-модулем, микрофоном и часами и отправился из Нью-Йорка в Новый Орлеан — по маршруту Джека Керуака. Созданная им нейросеть ехала рядом, в реальном времени считывала всю поступающую информацию и генерировала текст на рулоне чековой ленты.
Опутанная проводами машина могла показаться случайным прохожим террористической угрозой. Чтобы не тратить время и силы на объяснения с полицией, Гудвин нашел изящное решение — он притворился госслужащим и поехал на дорогом Cadillac. Получившиеся мемуары робота вышли на бумаге в сыром виде, без правок. В книге не найти ни классических сюжетных арок, ни стройного повествования, 1 the Road — чистая поэзия, вдохновленная американской традицией романов о дорожных путешествиях. В самом начале пути машина замечает: "Было без семи минут десять утра, и это было единственное хорошее из всего, что случилось". Хотя отдельные куски получились удачными, такой искусственный интеллект может заменить разве что скучного попутчика, который постоянно говорит о погоде, времени и дорожных знаках. Но настоящего писателя?
Нужно быть очень упорным человеком, чтобы прочитать хотя бы один сгенерированный роман из тех, что уже существуют. Дело не только в том, насколько несовершенное у них устройство, допустим, через несколько лет все нынешние промахи с цельностью пространства и времени будут исправлены. Основная проблема состоит в том, что ни одна из этих книг не написана настоящим искусственным интеллектом, то есть алгоритмом, сопоставимым по вычислительной мощности с разумом человека. Каждую из нейросетей приходится обучать на каком-то массиве контента, в итоге мы получаем скомканную смесь из уже существующих произведений, которая напоминает все сразу и не может существовать без оригинала, произведенного живым автором.
Робот не может создать шедевр, потому что ему пока что нечего сказать, у него нет собственных идей и откровений, из которых мог бы родиться великий роман. Нельзя уследить за мыслью автора, если автора нет и мысли тоже нет. В 2016 году появились десятки новостей о том, что искусственный интеллект чуть не выиграл литературную премию: книга "День, когда компьютер напишет роман" (The Day a Computer Writes a Novel) попала в финал японского конкурса имени Хоси Синъити. Но если копнуть глубже, то становится понятно, что бо́льшую часть работы над книгой выполнили все-таки люди: команда выбирала, какими будут сюжет и герои, а робот только наполнил готовую схему будущего романа текстом. Этот кейс ярче всего иллюстрирует, какое будущее ждет нейросети в мире литературы.
Начинающие авторы сталкиваются с боязнью белого листа, опытные писатели — с творческим кризисом. В такой момент человеку может понадобиться толчок, который поможет ему не забросить рукопись. И с этим справился бы сервис, предлагающий сотни вариантов развития сюжета, концовок, названий глав. На данный момент алгоритмы генерации текста совсем не выглядят как что-то способное уничтожить писательскую профессию. Наоборот, они могут стать помощниками для тех, кто хотел бы писать прозу, могут открыть пространство для креативных коллабораций машин и людей. Так, сиэтловская студия Botnik — сообщество комиков со всего мира, создающих контент с помощью предиктивного ввода текста, — выпустила ИИ-фанфик "Гарри Поттер и портрет чего-то похожего на большую кучу пепла". История, где Рон на первой же странице случайно съедает семью Гермионы, никогда не заменила бы оригинальные приключения мальчика со шрамом, но она даже не претендует на такое достижение. Скорее это произведение, которое никогда не написал бы человек, совсем новая область, где будет процветать новый бизнес и новое искусство.