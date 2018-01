Канадские эксперты по искусственному интеллекту утверждают, что наконец определили язык, на котором написана загадочная 600-летняя рукопись, поставившая в тупик не одно поколение криптографов и лингвистов. Что такое манускрипт Войнича и действительно ли компьютер опять смог сделать то, что не получилось у человека?

О какой книге идет речь?

Манускрипт Войнича — это средневековый документ без обложки, смысл и назначение которого настолько туманны, что отдельные конспирологи заявляют, будто бы он написан инопланетянами. Одна же из основных версий: манускрипт создан с целью розыгрыша и написан на несуществующем языке. 240 страниц рукописного текста в нем проиллюстрированы изображениями растений, в том числе и не похожих на известные науке виды, странных астрономических диаграмм и купающихся женщин. Текст манускрипта написан слева направо с использованием примерно 20-25 “буквами” (еще несколько десятков символов встречаются один-два раза) и без видимых знаков препинания.

По сложившейся традиции манускрипт делят на шесть разделов, посвящённых соответственно травам, астрономии, биологии (здесь как раз содержатся изображения женщин), космологии и фармацевтике — а шестой раздел обычно называют “звездами” из-за рисунков звезд на полях очень плотного текста.

Рукопись получила название, под которым она стала знаменита, по имени польского торговца редкими книгами и мужа писательницы Этель Войнич Вильфреда, который купил ее у иезуитской библиотеки в 1912 году — и стал активно искать специалиста, который мог бы ее расшифровать.

С помощью метода радиоуглеродной датировки, который используется для определения возраста ископаемых останков и древних артефактов, манускрипт отнесли к началу XV века. Сейчас он хранится в библиотеке Бейнеке Йельского университета, которой его в 1969 году подарил другой торговец книгами, Ханс Краус, не сумевший найти для таинственной рукописи следующего покупателя.

В 2016 году испанское издательство Siloe, специализирующееся на создании копий рукописей, купило права на печать 898 точных копий манускрипта Войнича ценой от 7 до 8 тысяч евро за штуку — при этом примерно 300 ещё не готовых копий уже куплены.

Кто пытался раскрыть секрет манускрипта?

Манускрипт Войнича — без преувеличения, одна из главных криптографических загадок человечества. Считается, что расшифровать его безуспешно пытались даже первые его известные владельцы — в зависимости от источника это или пражский алхимик первой половины XVII века по имени Георг Бареш, или придворный аптекарь императора Рудольфа II Якуб Горжчицкий. Манускрипт поставил в тупик, например, криптографов из британского Блетчли-Парка, взломавших шифры немецкой “Энигмы” во Вторую мировую войну. Популярную и очень обстоятельную книгу о нем, “Манускрипт Войнича: изящная загадка” Мэри д'Империо, написанную в 1978 году, сейчас можно найти в открытом доступе на сайте американского Агентства национальной безопасности (NSA).

Разобраться в “войничском”, как стали называть таинственный язык рукописи, пытались многие ученые. Одно из первых задокументированных предположений о том, чем может быть манускрипт Войнича, в 1921 году сделал профессор философии Уильям Ньюболд, который разглядел в начертаниях букв крошечные линии, выдававшие, по его мнению, скоропись древнегреческого. Ньюболд объявил, что манускрипт в XIV веке составил ученый и философ Роджер Бэкон, и посвящен он на самом деле научным открытиям вроде изобретения микроскопа. Однако просуществовала эта версия недолго: критики Ньюболда быстро показали, что найденые им микроскопические линии — просто трещины в чернилах.

Некоторые специалисты считают, что это текст на каком-то европейском или другом языке, зашифрованный с помощью некоторого алгоритма (а кое-кто указывает, что этих языков может быть два — так, например, думают в Институте прикладной математики имени М.В. Келдыша РАН). В качестве языков-кандидатов рассматривались не только относительно банальная латынь, но и тибетский диалект и даже украинский язык, из которого убрали гласные. Последнюю идею в 1978 году высказал филолог-любитель и канадец украинского происхождения Джон Стойко, но его версия перевода, с предложениями вроде “пустота — это то, за что борется око бога-младенца” оказалась крайне малоосмысленной. По другим версиям, манускрипт Войнича может быть написан с помощью книжного кода, то есть значение для каждого слова в нем нужно искать в специальном словаре — писать и читать такие тексты крайне трудоемко, но теоретически это возможно.

Кроме того, манускрипт может быть написан в технике стенографии или стеганографии, когда для передачи смысла используются неочевидные детали (скажем, только количество букв в каждой строке). Не менее интересны гипотезы о том, что манускрипт может быть написан на малоизвестном естественном или искусственном языке — последней версии какое-то время придерживался знаменитый криптограф Уильям Фридман, "отец американской криптологии", хотя самые ранние известные нам упоминания идеи искусственно сконструированного языка встречаются на два столетия позже предполагаемого времени создания манускрипта.

Наконец, рукопись Войнича может быть намеренной бессмыслицей. Например, Гордон Рагг из Килского университета в Англии в 2004 году написал заметку в Scientific American, в которой предположил, что для создания заведомо бессмысленного текста, лишь внешне напоминающего шифр, автор мог использовать решетку Кардано — метод, придуманный в 1550 году итальянским математиком Джероламо Кардано. Решетка Кардано — это карточка с прорезанными в ней отверстиями, накладывая которую на специально подготовленный и на вид безобидный текст, в отверстиях можно прочитать скрытое сообщение. С правильно сделанной карточкой Раггу, по его словам, удавалось получать текст, по своим свойствам очень похожий на текст манускрипта Войнича.

Противники этой гипотезы указывают на тот факт, что текст рукописи подчиняется так называемому закону Ципфа: этот закон описывает, с какой частотой в достаточно длинном тексте на естественном языке встречаются те или иные слова, то есть полной белибердой манускрипт всё-таки быть не может. Правда, Рагг в ответ на это в 2016 году написал статью, в которой показал, что с помощью решетки Кардано можно убедительно сымитировать и “текст", не уступающий осмысленному с точки зрения закона Ципфа.

А журналисты Джерри Кеннеди и Роб Черчилль в своей книге 2004 года и вовсе допускают, что манускрипт — это пример глоссолалии (речи, состоящей из бессмысленных слов, но имеющей некоторые признаки осмысленной речи): по их предположению, его автор мог "просто" записать поток сознания, который надиктовали ему голоса в голове.

Самая свежая громкая история с “расшифровкой” манускрипта случилась в сентябре 2017 года, когда британский историк и телесценарист Николас Гиббс объявил, что, по его данным, рукопись — это учебник-инструкция по лечению гинекологических заболеваний для состоятельной дамы, написанная авторскими латинскими лигатурами (лигатура — это соединение двух букв для удобства и скорости письма, например, знак амперсанд, &, образован от лигатуры et).

Гиббса тут же раскритиковали многочисленные специалисты по медиевистике и латыни, обвинившие его в присвоении чужих идей о медицинской природе рукописи и необоснованных тезисах. Директор Американской академии исследований средневековья Лиза Фэгин-Дэвис тогда сказала изданию The Atlantic, что если бы Гиббс показал свои выводы хотя бы библиотекарям Йеля, где хранится манускрипт, те бы мгновенно их опровергли.

Что же произошло на этот раз?

На прошлой неделе канадские СМИ вдруг обнаружили исследование профессора Грега Кондрака из лаборатории искусственного интеллекта университета Альберты и его аспирант Брэдли Хауэра, опубликованное еще в 2016 году. Эти ученые обучили программу верно определять язык текста в 97% случаев, используя в качестве материала для “тренировки” перевод Всеобщей декларации прав человека на 380 языков. Ранее лаборатория Кондрака и Хауэра представила компьютерную программу Cepheus, способную обыграть профессиональных игроков в разновидность техасского холдема, одного из самых сложных видов покера.

Применив свой алгоритм к манускрипту Войнича, канадцы пришли к выводу, что манускрипт Войнича написан на древнем иврите с альфаграммами — анаграммами, в которых буквы отсортированы по алфавиту. Предположение об альфаграммах высказывали и другие ученые, и Кондрак и Брэдли, используя алгоритмы для их расшифровки, “опознали" в 80% слов манускрипта слова иврита. После уточнений в орфографии первое предложение манускрипта Google Translate перевел так: “Она дала рекомендации священнику, хозяину дома, мне и другим людям”. Канадцы считают, что рукопись — это фармакопея, свод правил изготовления, хранения и назначения лекарств.

Работа ученых опубликована в журнале Transactions of the Association of Computational Linguistics. Первые профессиональные реакции на эту тему появились, по-видимому, ещё задолго до того, как журналисты стали ссылаться на работу, так что пока к гипотезе относятся весьма настороженно. Канадской прессе сам Кондрак заявил, что эксперты по манускрипту Войнича восприняли его работу прохладно, и отметил, что, по его мнению, эти эксперты “недружелюбно настроены по отношению к таким исследованиям, возможно, они боятся, что компьютеры их заменят”. При этом он согласен, что без человека здесь не обойтись: разобраться в синтаксисе и смысле слов пока сможет только живой ученый.

Ольга Добровидова