Михал Козински: не big data побеждает на выборах, а сами кандидаты

До ноябрьских выборов президента США имя доцента кафедры организационного поведения Стэнфордской высшей школы бизнеса Михала Козински было известно разве что специалистам в области big data (больших данных). Группа ученых под руководством выпускника Кембриджского университета установила, что личность человека можно досконально изучить по тому, как он ведет себя в соцсетях.

После победы Дональда Трампа о методе Козински внезапно заговорили. Утверждалось, что именно он лег в основу успешной кампании республиканца, а до этого предопределил судьбу референдума о Brexit. В интервью ТАСС 34-летний уроженец Польши рассказал о своем методе, преимуществах и рисках сбора big data, открестился от участия в политических кампаниях и признал, что даже в век высоких технологий побеждают не они, а сам кандидат.

— Ocean, или Big Five ("Большая пятерка", модель определения личности человека на основании его пяти черт: экстраверсии, доброжелательности, добросовестности, нейротизма и открытости опыту. — Прим. ТАСС), давно существующая модель. Что именно нового вы привнесли в нее при создании своей методологии?

— Мой метод показывает, что вы можете использовать "цифровые следы" для того, чтобы раскрыть психологические особенности человека. Было много сомнений, реалистично ли это, получится ли воспроизвести эффективность тщательно разработанных опросников, возможно ли по поведению человека в Сети, его "цифровым следам" определить его личность, психологические черты.

Люди могут быть неискренними, сами не отдавая себе в этом отчет. "Вы дружелюбный человек?". Ответ: "Да". "Вам нравится оттягиваться дома?" Ответ: "Да". На самом деле людям нравится говорить "да"

Такой подход подвергался критике со стороны психологического сообщества. Адепты классической психологии утверждали, что люди, проходя традиционные тесты, думают о своем поведении и стараются ответить честно. В то время как, находясь в интернете, они совершают случайные действия, проанализировав которые, мы не всегда получим объективную картину.

Мои исследования показали, что это не так. Вы можете взять за основу "цифровые следы", потому что, даже когда люди думают, что все это — бессистемные вещи, это неверно. Поведение в Сети наглядно говорит об их личности.

— Чем вам не подходят традиционные опросники?

— Раньше мы оценивали человека при помощи личностных опросников, например MBTI (Майерс — Бриггс), а также при помощи тестов на интеллект, опросников, измеряющих уровень счастья, депрессии и так далее. Ocean — это еще один подход к типологии личности.

Во-первых, в опросниках есть определенные недостатки — заполняя их, очень просто солгать. Люди обычно хотят казаться лучше. Так, например, интроверту в такой стране, как США, где социальность приветствуется, будет удобнее выдать себя за экстраверта.

Во-вторых, люди могут быть неискренними, сами не отдавая себе в этом отчет. "Вы дружелюбный человек?". Ответ: "Да". "Вам нравится оттягиваться дома?" Ответ: "Да". На самом деле людям нравится говорить "да". Ну а теперь представьте, что это — опросник при устройстве на работу или на сайте знакомств. Ждать искренности от людей тут не приходится, и оказывается, что работу получает тот, кто больше других солгал. Ну и к тому же эти тесты очень дорогие и требуют много времени на обработку.

— И как помогут в этом деле "цифровые следы"?

— Я со своими коллегами пришел к выводу, что вместо того, чтобы задавать людям вопросы, достаточно просто посмотреть на их действия в Сети, чтобы получить ту же самую информацию. Вместо того, чтобы спросить: "Ты часто ходишь на вечеринки?", можно зайти на страничку в Facebook, и "цифровые следы" расскажут обо всем. Ими могут быть фото с вечеринок, приглашения на тусовки. Или, например, вместо того, чтобы спрашивать, нравится ли человеку читать, изучите, прочитывает ли он книги в интернете, покупает ли он их, обсуждает? Таким образом сегодня вы получаете возможность узнать о психологических чертах характера человека даже без его ведома.

— В рамках исследования вы опросили более 6 млн добровольцев, изучили их поведение в Сети. К каким выводам вы пришли?

— Мы пытались понять, как много можем узнать о человеке через призму его "цифровых следов", но более конкретно в рамках этого проекта — понять, можем ли мы таким образом оценить черты его личности, уровень интеллекта, политические пристрастия, сексуальную ориентацию и другие особенности. Конечно, вам не надо быть ученым, чтобы узнать, что человек республиканец, если он заходит на сайты Республиканской партии и ее политиков. Не надо быть гением, чтобы определить ориентацию человека, если он постоянно заходит на гей-сайты и читает соответствующие журналы.

Но при помощи компьютера можно свести воедино все детали — какую музыку слушает человек, какие книги читает, чему и кому он поставил "лайк". Все дело в том, насколько сильными будут получаемые сигналы. Если я скажу, что мне нравится Барак Обама, то можно будет сделать вывод, что я либерал и демократ. Если я скажу, что мне нравится определенная модель велосипеда, то вывод о моих политических пристрастиях не будет столь очевиден. Компьютеры же могут анализировать эту информацию. И внезапно самые малозначительные детали могут привести к очень верным выводам.

— Тут мы непосредственно подходим к понятию big data. Не могли бы вы рассказать о нем поподробнее?

— Для меня это такой объем данных, который человеку сложно обработать без помощи специализированной техники. И что интересно, любой объем информации может быть одновременно и большим, и маленьким. Все зависит от того, как на это посмотреть. Давайте возьмем, к примеру, фото на профиле в Facebook. На первый взгляд, информации более чем достаточно — мы можем понять, что за человек изображен, его пол, цвет кожи. Но, если взять ту же фотографию, но в очень большом разрешении, скажем, в размере 1 гигабайт, она сама по себе может стать big data. Вы сможете как под микроскопом разглядеть все детали кожи, а лицо превратится в карту большого разрешения, которую люди не смогут проанализировать так же, как это сделают машины. Если нужно сосчитать волосы на голове человека, то компьютер сделает это за секунды, а вот человеку придется непросто.

Для того, чтобы понять человека настолько же хорошо, как и его коллеги по работе, достаточно проанализировать 10 "лайков"; а чтобы узнать его так же хорошо, как муж или жена, нужно около 230–240 "лайков". В среднем же "в багаже" у любого пользователя соцсети есть не менее 300 нажатий на кнопку "нравится"

Конечно, мозг человека — в высшей степени специализированный компьютер, одна из функций которого — интерпретировать лица. Но, как свидетельствуют научные разработки, оптический нерв недостаточно широк, чтобы передать информацию обо всем, что мы видим. Таким образом, ваш глаз получает большое количество информации из окружающей среды, после чего она идет через зрительный нерв, но делает это в сжатом виде. Из-за этого много информации теряется. Мозгу предстоит расшифровать эти данные, превратив их в цельную картину.

Один пример того, как работает эта сложная машина, которой является наш мозг, — расшифровка эмоций человека по малейшим деталям: движению губ, глаз. Еще несколько лет назад компьютеры были не в состоянии этого сделать. Им не хватало вычислительных возможностей. За эти годы они прошли эволюцию, на которую человеку понадобились миллионы лет. Сегодня они способны считывать человеческие эмоции с такой же точностью, как и люди.

— Насколько высока точность вашего метода?

— Мой любимый пример — "лайки" в Facebook, потому что все их ставят, ведь у огромного числа людей есть аккаунты в этой социальной сети. Мы строим модели, основанные на языке, на анализе посещаемых интернет-сайтов, истории поисков. Один мой знакомый построил модель, основанную на том, что вы купили при помощи своей кредитной карты. Мы стараемся предсказать широкий спектр результатов: от сексуальной ориентации, политических пристрастий и религии до уровня интеллекта, употребления наркотиков, семейного статуса. Точность очень высока. Так, например, цвет кожи, пол, сексуальную ориентацию можно определить с точностью около 90%.

Для того, чтобы понять человека настолько же хорошо, как и его коллеги по работе, достаточно проанализировать 10 "лайков"; а чтобы узнать его так же хорошо, как муж или жена, нужно около 230–240 "лайков". В среднем же "в багаже" у любого пользователя соцсети есть не менее 300 нажатий на кнопку "нравится".

— А много ли среди опрошенных вами было пользователей из России?

— Из-за того, что мы задавали вопросы на английском языке, нашим исследованием в основном были охвачены англоязычные пользователи. К тому же я не могу свободно говорить по-русски, поэтому изучить российских пользователей мне не так просто. Но если российские ученые хотят изучить данные, относящиеся к пользователям из России, я открыт для сотрудничества. В нашу коллаборацию входят более 200 ученых со всего света. Они работают с собранными нами данными, и было бы здорово, если бы российские ученые также работали с нами.

— Вы разделяете точку зрения, которую иногда можно услышать, что люди сами себе создают монстра в виде социальных сетей? С одной стороны, люди живут в параллельной реальности, а с другой — ими так просто манипулировать, и их каждый шаг, каждый клик мышкой контролируется.

— Я абсолютно не разделяю эту идею. Я думаю, что мир стал намного лучше, он стал более счастливым местом благодаря цифровым средствам коммуникации и социальным сетям. Конечно, как в случае с любыми технологиями, есть связанные с ними риски, но есть и громадные преимущества. Это и возросшая взаимосвязь между людьми, и доступ к информации, и возможность общаться без контроля правительства. Потому что, даже если правительство установит контроль над одним из этих каналов, существуют другие каналы, на которые вы можете переключиться. В целом, я думаю, что преимущества с лихвой превосходят риски.

— Но риски все же есть. Не могли бы вы подробнее остановиться на них?

— Эти технологии исследуют личные привычки или выявляют интимные подробности, например сексуальную ориентацию, для большой группы людей при том, что те даже не отдают себе в этом отчет. Иногда это может представлять для них непосредственную угрозу. Если вы живете в Саудовской Аравии, где за принадлежность к сексуальным меньшинствам вас может ждать смертная казнь, то становится уже совсем не смешно, что вашу сексуальную ориентацию можно определить по вашим "лайкам".

Но эффекты от применения технологии могут быть и менее радикальными. Если я могу оценить вашу личность без вашего ведома, на основании оценки ваших "цифровых следов", то я могу адаптировать мои маркетинговые предложения таким образом, чтобы они были убедительными.

— Кстати, про маркетинговые предложения. Недавно я искал фотоаппарат в интернете, и теперь каждый раз, когда я вхожу в браузер, у меня выскакивает реклама этой самой модели фотоаппарата. Конечно, кто-то может быть счастлив от этого, но есть люди, которые чувствуют, что социальные сети преследуют их.

— Ну, если вы чувствуете, что вас преследуют, тогда вам просто не надо пользоваться ими. На мой взгляд, просто стыдно не использовать социальные сети, потому что вы теряете замечательный инструмент, который позволяет вам быть на связи с людьми. В итоге они потеряют доступ к вам, с вами будет сложнее связаться.

К тому же, если вам не нравится реклама в Facebook, вы можете просто перестать им пользоваться или установить фильтр AdBlock. Я бы не стал употреблять слово "преследовать", потому что, на мой взгляд, это слишком сильное определение.

В конце концов, вы должны отдавать себе отчет в том, что с вас не берут деньги за пользование Facebook, поэтому просмотр время от времени рекламы — это своеобразный способ поддержки развития этой платформы.

— Для того, чтобы быть более эффективными в создании психологического портрета, компании покупают данные пользователя, например, его кредитную историю. И этот рынок баз данных существует очень давно. Но тогда встает вопрос этики. Пользуясь кредитной картой, я хотел бы верить, что моя личная информация защищена.

— Вы когда-нибудь справлялись у компании, которая выдала вам кредитную карту, как она использует вашу информацию? Если бы людей это волновало, они или не пользовались бы кредитными картами, или компании не делали бы этого. Но поскольку людям все равно, то компании продолжают этим заниматься.

— Все из-за того, что никто не читает внимательно контракты?

— Есть кредитные карты для всех типов населения — для тех, кто путешествует, кто совершает покупки, кто любит заниматься дайвингом и так далее. Вы когда-нибудь видели кредитную карту, в рекламе к которой было указано, что выпустившая ее компания никогда ни с кем не поделится информацией о вас? Такого продукта на рынке нет. И лишь по одной причине — людям все равно. В этом вся проблема. Не в том, что это обслуживающие кредитные карты — компании. Вся проблема в пользователях.

— Если мы говорим про таргетирование (целевое прогнозирование) данных, когда в Сети люди получают определенную информацию, исходя из их предпочтений, их профиля, нет ли угрозы, что выдача определенной информации соответствующим группам усилит разделение на эти группы, создаст определенную кастовость в интернете?

— Если вы имеете в виду идею существования "информационных пузырей" (известная также под названием "Пузырь фильтров", Filter bubble. — Прим. ТАСС), то я в нее не верю. Я думаю, что сейчас это модная тема и люди много говорят о ней, однако я не вижу никакого подтверждения этому. Человечество всегда существовало в условиях ограниченного доступа к информации. Всегда. Если бы вы родились сто лет назад в небольшом городке, у вас была одна библиотека, один священник и ваша община. Этим ограничивался бы ваш доступ к информации. У вас не было возможности избежать этого, да к тому же люди особенно и не пытались совершить этот "побег".

Если бы вы родились сто лет назад в небольшом городке, у вас была одна библиотека, один священник и ваша община. Этим ограничивался бы ваш доступ к информации. У вас не было возможности избежать этого, да к тому же люди особенно и не пытались совершить этот "побег". Сегодня в мире от всего объема знаний, собранного человечеством, вас отделяет всего лишь один клик

Сегодня в мире от всего объема знаний, собранного человечеством, вас отделяет всего лишь один клик. Люди говорят: "Я иду в Facebook, а мне показывают новости, отражающие лишь одну политическую точку зрения". Я считаю, что это не Facebook создает вокруг вас этот "пузырь". Если вы заинтересованы всего в одном типе сообщений, Facebook распознает это и начнет готовить информацию, исходя из ваших вкусов.

Так что не стоит обвинять Facebook в том, что он не рассказывает вам о вещах, которые находятся вне вашего "пузыря". Просто, когда вы их сами игнорируете, система распознает это. Поэтому и Facebook, и другие рекомендательные системы будут показывать вам контент, исходя из ваших предпочтений и ожиданий.

— То есть вы считаете, что в конце концов, вне зависимости от того, какие технологии будут существовать в будущем, последнее слово всегда останется за человеком?

— Это сильное преувеличение. Я на самом деле не уверен в этом. Я думаю, что некоторые технологии, бесспорно, будут влиять на нас таким образом, что мы не будем полностью их контролировать. Тут у меня нет сомнений.

Но, я повторюсь, я не верю в "информационные пузыри". У людей сегодня есть восхитительный доступ к информации в таком объеме, который было невозможно ожидать раньше. Если бы вы родились в прошлом, в поселке с консервативными настроениями, вы даже не знали бы о существовании либеральных идей. С другой стороны, если бы вы родились в либеральном обществе, вы вообще никогда не услышали бы о противоположной точке зрения.

В прошлом были огромные "пузыри". Сегодня — и этот феномен очень хорошо известен в психологии — людям нравится получать информацию, которая подтверждает их точку зрения. Они не желают знакомиться с точкой зрения, противоречащей их подходам и взглядам. Почему? Потому что сложно читать то, что бросает вам вызов. Поэтому люди и не идут по этому пути.

Но сегодня вы входите в интернет, в том же Facebook собирается такое количество разных людей, есть газеты левых и правых взглядов, вы получаете легкий доступ к разносторонней информации. Людям, которые говорят, что они находятся в "информационных пузырях", можно сказать: вы всегда были в них, просто сейчас вы обратили на это внимание. От самого факта осознания этого "пузырь" сильно уменьшился, потому что сегодня у людей есть возможность выбраться за его пределы — обратиться в Wikipedia, зайти на сайт газеты или СМИ, отражающий иные точки зрения, и проверить информацию.

— В последнее время появилось несколько публикаций в СМИ о том, что ваше исследование было с успехом использовано для влияния на избирателей некоторыми политическими силами или приверженцами определенной политической идеи, например сторонниками Brexit или Дональда Трампа. Так, сообщалось, что среди фирм, показавших хорошие результаты на организации предвыборных кампаний, была Cambridge Analytica. Насколько, с вашей точки зрения, это возможно?