28 октября 2019, 09:48
Мнение

Личные данные россиян в Сети: почему их необходимо вывести из серой зоны

Наталья Касперская — о том, что мы живем в переходную эпоху, когда цифровые персональные данные о каждом гражданине собираются в беспрецедентных масштабах и используются бесконтрольно

Понятие персональных данных описывается в одноименном федеральном законе 2006 года. Но закон этот уже довольно старый (он принят еще до широкого распространения социальных сетей и видеохостингов) и касается самых общих вещей. Персональными данными там названо практически все, что имеет отношение к персоне ("любая информация, относящаяся к прямо или косвенно определенному или определяемому физическому лицу"). К сожалению, больше никак это понятие там не растолковывается.

Поэтому его правоприменение каждая российская компания, а также регулятор и правоохранители выстраивают в меру своего понимания. Но хуже всего то, что существующий федеральный закон на практике никак не ограничивает использование цифровых персональных данных в интернете.

А общество вообще плохо понимает, о каких данных идет речь и в чем угрозы их бесконтрольного использования. В чем разница, например, между общедоступными персональными и большими пользовательскими данными людей. И почему использование больших пользовательских данных в интернете должно регулироваться государством.

Какие пользовательские данные бывают и как используются

1. Большие пользовательские данные о людях

Это обезличенные/анонимизированные данные о пользователях и гражданах. К ним относятся данные о перемещении людей, которые могут собираться и использоваться государственными службами, муниципальными властями, транспортными компаниями, организаторами масштабных митингов или фестивалей, мобильными операторами, рекламными системами.

Такие данные, например, могут использовать сервисы геоаналитики, показывающие, из какого квадрата в какой и сколько людей перешло, сколько автомобилей едет по какой улице. Геоаналитика не показывает маршрут каждого конкретного человека, но благодаря ей хорошо видно перемещение масс людей — на основе данных мобильных операторов. Благодаря этой информации организаторы крупных городских мероприятий могут точно понять, где поставить оцепление, а где разместить туалеты, в каких районах Москвы установить медицинские пункты — в рамках программы столичного мэра Сергея Собянина "Мой район", нацеленной на развитие города.

Еще один хороший пример обезличенных персональных данных о людях — данные в "Яндекс.Картах". Они собираются с каждого мобильного устройства, на котором установлено приложение "Яндекс.Карты". Устройства пользователей сообщают, с какой скоростью они движутся и по какой дороге. Благодаря таким сообщениям возникает общая картина пробок ("взгляд с высоты птичьего полета"), полезная всем, но при этом движение каждой машины не показывается.

Если собирать и анализировать большие данные, можно рассчитывать оптимальное движение транспорта и человеческих масс. Определять социальную температуру в регионах и заблаговременно предотвращать социальную напряженность. Заранее определять потребности жителей разных регионов в определенных специальностях, в дорогах, медицинских учреждениях, изучать вакансии и потребности людей в конкретной работе. Все это очень полезно для развития государства и общества, это можно и нужно делать, но только если это не нарушает приватности, прав личности на частную жизнь, не приводит к созданию "социальных рейтингов" и построению тоталитарного "цифрового ада".

2. Явно отдаваемые закрытые личные данные

Эти данные пользователь сам отдает конкретной цифровой платформе — при регистрации и при пользовании ею (Google, "Яндекс", iPhone, Android, Mail.ru, Facebook и др.).

Например, вы подписались на сервис публичной электронной почты, ваша переписка никому не видна, кроме ваших корреспондентов и самой почтовой системы. Или, допустим, у вас есть закрытые профили "ВКонтакте" или в Instagram, где вы размещаете фото и посты для друзей или только для себя. Однако в реальности эти данные могут использоваться.

3. Неявно отдаваемые закрытые данные

Есть данные, которые вы отдаете платформам неявно: это почтовые сообщения, просмотр сайтов, финансовые транзакции, местоположение и т. п. Вы предполагаете, что эти данные только ваши, но на самом деле цифровые платформы используют их в своих интересах.

Например, платформа Google показывает вам рекламу на основании текстов ваших писем в Gmail ("Собираюсь в поход, надо бы новый рюкзак присмотреть", — и вы две недели видите везде рекламу магазинов, предлагающих походное снаряжение). Вроде бы эти данные ваши личные, закрытые, но индексный робот Google анализирует содержание и тематику ваших сообщений.

И в результате вам показывается "подходящая реклама" везде — в поисковых результатах Google, на всех его проектах и на всех сайтах третьих сторон, где установлена рекламная система Google AdSense. Часто — реклама ненужная вам и весьма навязчивая.

Если прочесть внимательно пользовательские соглашения большинства цифровых платформ (чего никогда не делает подавляющее большинство пользователей, механически проставляя галочку "Я согласен"), то можно с удивлением обнаружить, что платформа получает от вас право использовать ваши личные данные — как отдаваемые явно, так и неявно. Использовать для своих коммерческих целей, для передачи своим коммерческим партнерам или спецслужбам своего государства.

На самом деле такие соглашения противоречат даже существующим законам РФ и являются юридически ничтожными, но цифровые платформы на это пока не обращают внимания.

4. Общедоступные персональные данные

Это данные, которые видны всем в соцсетях, на видеохостингах (YouTube и др.) и фотохостингах — посты, комментарии, фото, ролики, лайки.

С ними ситуация другая — их пользователь сознательно сделал доступными всем: платформе, "друзьям", внешним наблюдателям, аналитическим сервисам. Так, ваше лицо, снятое уличной или подъездной камерой, — это тоже общедоступные персональные данные: ведь его вы показываете всем. Выходите на улицу, где на вас заведомо будут смотреть люди, подъездные камеры, камеры ГИБДД, мэрии, метро, торговых центров, чьи-то смартфоны. Это данные все равно личные, персональные — но общедоступные.

Но вы не знаете, как и кем эти данные могут быть использованы, в том числе против вас. Поэтому закон об общедоступных персональных данных и их защите государством — необходим. Сейчас он готовится в рамках национальной программы "Цифровая экономика РФ".

Общедоступные персональные данные — чьи они?

Есть две противоположных позиции, касающихся общедоступных персональных данных.

Например, крупные цифровые платформы (Google, Mail.ru, "Яндекс" и др.) считают, что общедоступные персональные данные пользователей — их собственность. На том основании, что платформы создали свою "рамку", куда "набились" люди и сами добровольно занесли им общедоступные персональные данные: свои профили, посты о том, где и как они отдыхают, что покупают, едят, куда ездят по выходным, свои фотографии и видеоролики.

Поэтому крупные интернет-площадки считают, что данные людей, которые пользуются их сервисами (электронной почтой, сервисом вызова такси, доставки еды и другими) тоже принадлежат им. Они якобы имеют право использовать эти данные в своих интересах. А все остальные, например, производители товаров и услуг, предлагающие людям свою рекламу в Сети, должны эти данные у площадок покупать.

На мой взгляд, это неправильная позиция. Потому что это в чистом виде попытка монополизации данных. Платформы рассчитывают "в хвост и в гриву" использовать данные своих пользователей, ограничивая к ним доступ остальных игроков рынка. Это называется "дискриминирующий доступ к данным".

Но есть и другая точка зрения. В любой соцсети или видеохостинге есть галка "Скрыть мои данные". Если человек ее не поставил специально, не закрыл данные, то эти данные могут и должны быть доступны любому: читателям, журналистам, государству, аналитическим программам, агентствам и сервисам, отслеживающим и анализирующим упоминания брендов, продуктов, услуг и ключевых персон. То есть всем, кто профессионально собирает и анализирует открытые источники.

Потому что эти данные — публичные, человек сам их такими сделал. И, как мне кажется, по природе своей открытые данные не могут являться чьей-то собственностью. В том числе и собственностью крупных интернет-платформ.

Обществу нужна прозрачность публичной жизни, нужно понимать, что и кто сказал, заявил, декларировал — как из публичных персон, так и из обычных пользователей. Однако использовать общедоступные данные нужно корректно.

Вычисляемые данные — смещение центра тяжести

В чем основная проблема с анализом личных данных станет понятнее, если ввести еще два понятия: первичных (то есть непосредственно собираемых) и производных (то есть вычисляемых из первичных) данных. Центр тяжести в современном мире смещается именно в сторону производных или вычисляемых данных.

Например, по фотографиям, поисковым запросам, постам и комментариям сейчас уже можно вычислить наличие некоторых болезней у пользователя. И если первичные данные о болезнях (в медицинских картах и базах данных больниц) закон защищает, и получить их коммерсантам, кадровикам, кредитным клеркам практически невозможно, то производные данные можно вычислить. При этом они никак не защищены.

Скажем, сейчас уже возможно вычислить некоторые заболевания по радужке глаз, цвету лица или ногтей, фигуре. Беременность можно вычислить по походке или… по поисковым запросам будущей мамы.

Ваши маршруты по городу и любимые адреса известны вашему смартфону, вашему мобильному оператору, а также ГИБДД и мэрии. Хотя вы их никому в явном виде не отдавали и никому не разрешали использовать.

Эти данные организации, анализирующие данные пользователей, абонентов, пассажиров или пешеходов, получают даром, вычислив факты по косвенным признакам. И таких данных становится все больше. А с их помощью можно вычислить серьезные и чувствительные вещи.

Что делать с вычисляемыми данными

Ограничить их сбор невозможно — ведь они не собираются, а вычисляются. Значит, нужно регулировать использование этих данных на законодательном уровне. Государству и коммерсантам нужно законодательно запретить вычислять данные о несовершеннолетних, инвалидах, пожилых людях, о беременности или психическом здоровье пользователя.

А если даже они вычислены "внутри", их нельзя публиковать, использовать для рекламы, перепродавать, использовать для дискриминации при приеме на работу или выдаче кредитов.

Зачем нужны законы, регулирующие личные данные

В программе "Цифровая экономика РФ" предусмотрена нормативная работа по большим данным, по общедоступным персональным данным. Это значит, что рано или поздно эти вопросы будут решены. Решать их так, как в Европе, принимая крайне жесткий закон наподобие GDPR (правил обработки персональных данных, одобренных ЕС в мае прошлого года) — нельзя.

Это накладывает огромные обременения на цифровой бизнес и приводит к возникновению гигантского количества "хлебных" бюрократических должностей, например, офицеров по данным (DPO), к крайне жесткому регулированию (бояться начинают все).

К нелепым решениям (например, "если в гигантском интернет-сервисе в России или Китае есть хотя бы один пользователь из Европы, весь сервис и его владельцы подпадают под юрисдикцию GDPR"). Все эти перекосы Европа пытается убрать — но пока безуспешно.

В США закон сдвинули на противоположный конец шкалы. Там, наоборот, объявили полную свободу, разрешив операторам использовать все персональные данные пользователей без их ведома. То есть в Европе данные полностью зарегулировали — с огромными штрафами. В Штатах — отпустили на свободу.

А у нас в России — серая зона, пока законы о данных не приняты. Многие предлагают механически скопировать и воспроизвести GDPR у нас, не задумываясь о том, что такое воспроизведение может практически убить развитие индустрии больших данных в стране, не даст развить технологии анализа больших данных о населении, образовании, транспорте, медицине и т. п.

При чем тут государство

Выбор этапа, на котором запрет на чувствительные данные должен вступать в силу; этапа, на котором должны появляться требования анонимизации пользовательских данных, — это дело государства. Именно поэтому я сказала премьер-министру РФ на его сентябрьской "прямой линии" с министерствами: "Надо регулировать — потому что сейчас эти данные собирает кто угодно".

А пока наши данные продаются и перепродаются массово. В том числе очень чувствительные — например, на "Горбушке" в частном порядке можно купить и СМС, и распечатки звонков по любому абоненту. Стоят они пять-десять рублей за строчку. Сами операторы используют данные пользователей тоже как угодно — в коммерческих целях, без ограничений. Мэрии городов начали массово собирать данные лиц и перемещений граждан.

Это нехорошая ситуация, которая может развиться до полного цифрового контроля над личностью. Поэтому все, что касается персональных и больших пользовательских данных в сети Интернет, надо упорядочивать и регулировать на самом высоком уровне.