Стоит ли бояться прорывной инновации в нейросетях: что дает миру ChatGPT
Антон Якимов — о том, что из себя представляет чат-бот с искусственным интеллектом и какие риски и преимущества несет для человечества
В интернете в последнее время не стихает обсуждение чат-бота с искусственным интеллектом (ИИ) от компании OpenAI — ChatGPT. Сервис побил все рекорды популярности: через пять дней после старта число пользователей достигло 1 млн человек (для сравнения: Instagram (запрещена в РФ) потребовалось на это два месяца), а на момент написания этого текста чат-бот испытали уже более 100 млн человек по всему миру. Самый популярный сценарий — поиск ответов на вопросы. По сути, ChatGPT — замена традиционных поисковиков.
При этом с разницей в день ИТ-гиганты Google и Microsoft объявили о запуске своих поисковых сервисов нового поколения, где ответы формируются искусственным интеллектом. Стараясь опередить конкурента, Google в проморолике чат-бота Bard случайно показала, что нейросеть может ошибаться: отвечая на вопрос, о каких новых открытиях телескопа "Джеймс Уэбб" можно рассказать девятилетнему ребенку, алгоритм указал достижение телескопа-предшественника. Microsoft же интегрировал в свой поисковик Bing алгоритм ChatGPT и справился с презентацией на отлично. Нейросеть, например, подготовила план семейного путешествия на пять дней в Мехико, а потом написала короткое письмо об этом для отправки родным по электронной почте.
Все вместе это запустило вирусную реакцию на рынке и жаркие споры экспертов о плюсах и минусах этой технологии.
Что у машины на уме?
История нейросети ChatGPT не случайно вышла столь громкой. Стартап OpenAI был создан в 2015 году в Сан-Франциско, у его истоков стояли Илон Маск и Сэм Альтман. Целью предприятия объявили некоммерческие разработки в области искусственного интеллекта, и одним из основных направлений стало создание больших языковых моделей, с помощью которых чат-бот может генерировать ответы на основе текстовых подсказок, подобно человеку. Для обучения таких моделей использовался суперкомпьютер Azure AI.
Бесспорно, ChatGPT — это новый этап во внедрении технологии искусственного интеллекта в повседневную жизнь, им уже сегодня при желании могут пользоваться все обладатели смартфонов. Эксперты сравнивают эту разработку с появлением самих мобильных телефонов, а возможно, и интернета. Новым генеративным нейросетям прочат большое будущее, в том числе в области синтеза изображений, видео, речи с интонацией. Их планируют дальше интегрировать в носимые устройства и сервисы дополненной и виртуальной реальности.
Но это в будущем, а пока основное внимание приковано к возможности нейросети осмысленно отвечать на поисковые запросы пользователя. Конечно, алгоритмам еще далеко до естественного интеллекта: машина не мыслит как человек, но использует большой объем данных и огромные вычислительные мощности, чтобы спрогнозировать, как лучше всего ответить на запрос. Сегодня искусственный интеллект научился понимать слова по отдельности и в контексте и воссоздавать речевые паттерны. Команда OpenAI за счет применения ИИ смогла добиться самого большого скачка релевантности ответов за всю историю поисковых сервисов.
Представьте, что нейросеть сможет учитывать не только сам вопрос, но и то, у кого, когда и при каких обстоятельствах он возник! Это сразу повышает ее статус до интеллектуального собеседника.
Например, во время пробежки пользователь, у которого в кармане смартфон, а на руке фитнес-трекер, может поинтересоваться: "Где поблизости продается хороший кофе?" Нейросеть, имеющая доступ к показателям физического состояния человека, учитывающая эмоциональный тон вопроса и множество других характеристик, может либо указать адрес ближайшего кофе-пойнта, либо посоветовать выпить минеральной воды или чая, которые продаются за углом. И все это будет подано через вежливого виртуального помощника, которых не зря называют человеческими именами: Алиса, Сири, Олег, а не, к примеру, "алгоритм 345".
Независимо от того, нравится человеку идея тотальной роботизации или нет, он вряд ли будет против персонального совета. Иллюзия присутствия заинтересованного и компетентного собеседника, который доступен в любой бытовой и рабочей ситуации, будет формировать все большую степень доверия к технологии.
Укрепляет имидж нейросетей и способность дать простой ответ на сложный вопрос. Например, доступно объяснить суть теории относительности. Люди склонны доверять тем, кто умеет объяснить на пальцах.
Так начинается непрерывный диалог человека с ИИ. При этом любое действие пользователя и изменение его состояния — это контекст для текущих и будущих запросов. Накапливая информацию о людях, алгоритм сможет предвосхищать их намерения и желания. А на следующем этапе, возможно, и влиять на них — так же, как в ситуации с человеческим авторитетом. В этом и огромный плюс, и риски, которые важно учесть на старте развития технологии.
Разыскиваются учителя для искусственного интеллекта
Главный вопрос, который волнует сегодня исследователей и рядовых пользователей, — достоверность результатов, которые выдает нейросеть. Одного лишь факта, что ChatGPT в качестве эксперимента сдал экзамен на степень MBA в Уортонском колледже (не блестяще, но сдал), недостаточно для того, чтобы поверить в его абсолютные знания.
Качество ответов напрямую зависит от количества и разнообразия данных, на которых обучалась нейросеть. Как отбиралась информация, прошла ли квалифицированную проверку на правильность и безопасность — решающие факторы для того, чтобы пользователь получил по-настоящему полезные сведения.
Большие языковые модели (у ChatGPT — "модель Прометея") обучались на значительных выборках данных, можно сказать, что они "прочитали весь интернет". В этом им помогали эксперты — как люди, так и алгоритмы, опирающиеся на заранее систематизированную информацию. При этом, так как для подготовки нейросети использовались только общедоступные тексты, ее знания находятся на уровне "люди и машины в Сети говорят", что не позволяет достоверно оценить все искажения, которые были усвоены в процессе обучения.
Повышение качества ответов требует дополнительного обучения на более достоверных знаниях — энциклопедиях, профессиональной рецензируемой литературе, учебниках. Однако и это лишь частично решает проблему, так как пользователь может задать вопрос, на который нет явного, конкретного ответа. В этом случае, следуя своей генеративной природе, ChatGPT и похожие алгоритмы будут "придумывать" ответ — обычный пользователь (без специальных знаний) не всегда сможет заметить ошибку и в итоге просто доверится выводу машины. Если в одних ситуациях один неправильный ответ на десять запросов будет приемлемым, то в других даже единственная ошибка на тысячу запросов способна привести к негативным последствиям.
Также ценным источником данных для обучения моделей станет ежедневное сопровождение жизни людей, но выявлять подлинные мотивы ответов при этом станет все сложнее. Так, возникает обеспокоенность, что в процессе обучения различные компании будут в коммерческих интересах продвигать свои рекомендации. В примере с вопросом про кофе алгоритм мог порекомендовать минеральную воду или чай из-за того, что предвзято обучен и его создатель заинтересован в продажах именно этих продуктов. Само определение критериев достоверности и непредвзятости становится сложнее, ведь, по сути, ничего плохого в минеральной воде и чае нет, а отказ от кофе вряд ли навредит.
А что, если, пробежав еще 500 м, пользователь получит другой ответ на аналогичный запрос? Возникнут сомнения в достоверности полученных сведений в целом, особенно если виртуальный помощник не сможет логически объяснить, почему изменил свое "мнение". Впрочем, живые люди тоже полны предвзятости и это не останавливает большинство из нас от общения. Можно предположить, что и робот-собеседник не утратит доверия, даже если не все его ответы будут прозрачны и обоснованны.
Главное, чтобы при этом не произошло смещения акцентов. ИИ нужен для быстрого получения достоверного и непредвзятого знания. Это значит, что инструменты поиска с использованием больших моделей должны работать максимально открыто и предоставлять заключение о достоверности собственных результатов. Впрочем, робоэволюция не исключает требования к человеку критически мыслить и принимать собственные решения.
Нейросеть подрывает устои
Уровень инновационности технологии определяется ее влиянием на существующие рынки. Так, новая камера в смартфоне может претендовать только на звание инкрементальной инновации, потому что немного улучшает уже существующий гаджет на традиционном рынке. В то время как ChatGPT уже смело можно причислять к подрывным инновациям (термин предложен профессором Гарвардской школы бизнеса Клейтоном Кристенсеном в середине 1990-х) — они отличаются тем, что полностью изменяют цепочку доставки ценности на рынке, делают существующие решения и методы неконкурентоспособными.
Классический пример подрывных технологий — цифровая фотосъемка, которая убила гиганта Kodak. Или совсем недавний кейс — замена посредников цифровой платформой, или уберизация, которая навсегда изменила множество сервисов: от заказа такси до клининга.
Очевидно, что у "подрыва" ChatGPT и других генеративных нейросетей будут жертвы. Первыми занервничали копирайтеры, дизайнеры, маркетологи, разработчики поисковых сетей: уже на сегодняшнем уровне развития нейросеть неплохо справляется с созданием различных текстов, промоматериалов, а также с генерацией изображений на основе описаний. Хотя, думаю, пока еще рано говорить о профессиях, которые на 100% заменит ИИ, но уже предполагается, что это могут быть аналитики по работе с данными, персональные помощники и даже музыканты.
Впрочем, внедрение новых технологий не всегда сопровождается "людскими потерями". В свое время появление цифровых фотокамер не привело к сокращению количества фотографов. Наоборот, сейчас им может стать практически каждый и многие будут претендовать на всемирную известность и миллионы подписчиков в соцсетях. Возможно, нечто подобное произойдет и с ChatGPT — например, инструменты ИИ будут стимулировать спрос на необычный креативный контент.
Главная задача экспертных ИТ-команд — найти те сегменты, где инновации создадут рынки кратно больше и в коммерческом, и в социальном плане. Ведь мы смотрим на появление телефонов не как на трагедию рынка телеграфистов, а как на технологию, которая позволила во много раз ускорить передачу информации, повысила мобильность населения и бизнеса и создала новые профессии. Именно поиск перспективных бизнес-сценариев для ИИ — главная задача сегодняшнего дня.