20 апреля 2018, 09:00

Что нужно знать о Big Data

Руслан Шамуков/ ТАСC
ТАСС — о том, как анализ больших данных помогает создавать умных роботов, повышать продажи и узнавать о беременности покупательниц в супермаркетах

Зачем бизнесу и государству нужны данные о наших покупках, перемещениях по городу и друзьях в соцсетях рассказал ТАСС преподаватель курса "Основы работы с большими данными" в "Нетологии" и гендиректор фирмы "Clever Data" Денис Афанасьев.

Что такое Big Data?

1

Big Data — это концепция сбора, хранения, обработки и использования всевозможных данных, полученных от людей и/или цифровых устройств.

Что подразумевается под данными? Во-первых, любое действие потребителя, которое он совершает с помощью технологий — расплачивается картой за покупки или проходит через турникет в торговом центре, — оставляет "цифровой след". Приложили банковскую карту к терминалу — оставили данные о своих потребительских предпочтениях. И самый популярный источник для получения ваших данных — это социальные сети. Во-вторых, наши гаджеты тоже сообщают данные в электронные системы. Вы пришли в кафе и подключились к Wi-Fi, а в это время система "кладет в копилку" как минимум данные о том, какая у вас модель телефона. В-третьих, компании могут собирать данных не о людях, а о вещах. Например, есть системы, которые так мониторят состояние оборудования на заводах.

Как компании используют эти данные?

2

Самый "бородатый" кейс — это история о том, как магазин понял, что 16-летняя школьница беременна, раньше, чем об этом узнал ее отец.

Американская сеть магазинов Target собирала данные из чеков своих покупателей, чтобы прогнозировать их покупки и предлагать товары, которые, по мнению системы, им вскоре понадобятся. Однажды в магазин пришел разгневанный мужчина и пожаловался на то, что компания присылает его дочери купоны на покупку памперсов и одежду для беременных. Оказалось, система проанализировала последние покупки и заметила, что девочка начала выбирать товары, которые предпочитают беременные женщины. Бот автоматически "поместил" ее в список будущих мам, и компания отправила соответствующие предложения. Конечно, иногда боты ошибаются: девочка могла выбирать такие продукты случайно или потому что прочитала книгу о здоровом питании, но в этом случае сбоя не было. Через несколько дней мужчина извинился перед менеджером сети: его дочь была беременна.

Крупные ретейлеры используют Big Data в разных вариантах. На картах лояльности накапливается история покупок: магазины знают ваши предпочтения. Самое простое, что они могут сделать, — отправить сообщение с предложением купить любимые дорогие товары со скидками. А еще могут проанализировать все чеки и увидеть, какие товары часто берут вместе и поменять выкладку. Так, одна сеть выяснила, что с памперсами часто покупают пиво, поставила рядом с детскими товарами самые дорогие сорта и увеличила продажи.

Технологии, по сути, заменяют маркетологов. Если раньше сеть проводила опросы покупателей или звала эксперта, который говорил, опираясь на теорию: "Ваша целевая аудитория — женщины от 25 до 35 лет", — то теперь бот строит решения на основе статистики. Но маркетинг — это далеко не окончательное и даже не самое полезное применение Big Data.

А где еще полезны большие данные?

3

В обучении чат-ботов, которые внедряются в колл-центрах, отделах продаж, техподдержке. Ведь главная цель работы с Big Data — это не поиск целевой аудитории, а автоматизация и снижение издержек.

Один из масштабных кейсов — это боты-операторы Сбербанка. Компания долго записывала и собирала диалоги клиентов с реальными людьми-операторами. На основе этих диалогов разработчики обучили роботов, а эти роботы впоследствии заменили людей. Для любой компании такая автоматизация — чистая экономия. 

Еще один интересный кейс внедрил железнодорожный оператор в Италии. С помощью датчиков в компании снимают показания, как работают двери в поезде. Сразу выяснилось, что одна дверь открывается в три раза чаще, чем другие: больше людей заходит в этот вагон. И наоборот — есть двери, которые открываются реже. Если стандартно двери в вагонах ремонтируются по плану, то теперь в компании знают, что одну дверь надо обслуживать чаще, другую — реже.

Насколько законно собирать данные о людях?

4

Нет почти никаких законных препятствий для сбора открытых данных. Федеральный закон "О персональных данных" эксперты оценивают как "размытый". Например, получение и использование телефона клиента с помощью технологий трактуется по-разному: в одном суде могут посчитать эту информацию персональной, в другом — нет. 

Однозначно нельзя использовать данные из переписки пользователей, данные из кредитных историй, из медицинских карт. 

Считается, что все, что в социальных сетях можно увидеть своими глазами, — можно использовать, но были и прецеденты по этому вопросу. В прошлом году "ВКонтакте" подала иск в Арбитражный суд на Национальное бюро кредитных историй (НБКИ) и стартап Double Data, которые собирали, анализировали и продавали банкам информацию о пользователях: фамилии, имена, данные о месте работы, учебы, регионе проживания, данные из анкет друзей и родственников. На основе этой информации Double Data создавала сервисы, позволяющие оценить кредитоспособность заемщика, а НБКИ продавала эти технологии банкам. "ВКонтакте" выиграла дело, суд обязал стартап перестать использовать данные пользователей.

Что произойдет с Big Data в будущем?

5

В будущем, которое показано в фильме "Особое мнение", люди видят персонализованную рекламу везде: на улице, в торговых центрах. Герои с интерактивных баннеров обращаются к каждому человеку по имени ("Джон Андерсен, забудьте о своих проблемах!") и предлагают купить автомобиль, выпить пива, взять кредит. В рекламной сфере Big Data развивается именно в этом направлении. 

Что касается автоматизации, то сейчас использование больших данных чаще внедряется в крупном бизнесе. Но вскоре эти системы будут заметно распространяться и в госсекторе. Кстати, сеть автоматизированных парковок в Москве, которая умеет советовать водителям, где поставить машину, основана на работе с большими данными. В дальнейшем алгоритм будет развиваться, например, сможет предсказывать загруженность парковок в определенное время.

Анастасия Степанова