10 июня 2021, 08:00
Интервью

Глава Росстата: органы власти все больше интересуются статистикой

Павел Малков. Министерство экономического развития РФ/ ТАСС
Павел Малков

Пандемия стала серьезным вызовом для системы государственной статистики и ускорила процесс цифровизации ведомства. Для получения наиболее точных данных по инфляции Росстат уже проводит эксперимент по использованию данных контрольно-кассовой техники и внедряет в свою работу искусственный интеллект. Об итогах этого эксперимента, о новых источниках данных о доходах населения и о подготовке к Всероссийской переписи рассказал в интервью ТАСС руководитель Росстата Павел Малков. Глава ведомства также поделился информацией о том, как проходит взаимодействие с Министерством экономического развития, и вспомнил самые необычные запросы правительства.

— Павел Викторович, в этом году главная тема, которая волнует людей, — это инфляция. И Росстат как один из основных источников получения информации о росте цен должен был начать эксперимент по внедрению искусственного интеллекта в расчет индекса потребительских цен и данных с онлайн-касс. Можете рассказать, как проходит этот эксперимент? Стала ли информация об инфляции точнее благодаря этому?

— Мы активно сотрудничаем с Федеральной налоговой службой. В прошлом году Росстат начал проект по разбору и анализу данных из чеков, которые предоставляет нам ФНС. Задача оказалась довольно сложной и нестандартной. На первом этапе мы провели пилотные эксперименты в нескольких регионах. Видим, что динамика при наших расчетах, когда цены фиксируются сотрудниками, и при учете данных в чеках схожа. Следующий шаг — разработка методологии, которая детально распишет применение данных контрольно-кассовой техники для расчета индекса потребительских цен. Будем создавать специальную информационно-аналитическую систему с элементами искусственного интеллекта, чтобы корректно использовать данные из чеков, интернета и других источников.

Пока те данные ККТ, которые мы получаем, использовать для полной замены существующей информации невозможно. Если сейчас просто взять и начать замещать традиционные данные на данные чеков ККТ, мы просто не сможем обеспечить сопоставимость рядов, точность пока недостаточна. Это связано с тем, что не существует единого классификатора наименований товарной продукции, и поэтому информацию по ценам на отдельные товары приходится получать из чеков на основе технологий искусственного интеллекта. Но технологии совершенствуются и улучшаются, и мы видим новые возможности.

Кстати, сегодня ни одна статистическая служба в мире не считает инфляцию на данных ККТ. В нескольких странах пытались, но пока удачных результатов не было. Есть возможность стать лидером

К концу этого — в начале следующего года мы запустим систему (по использованию данных с онлайн-касс для расчета инфляции — прим. ТАСС). И в 2022 году начнем проводить параллельно два расчета: по старому алгоритму сбора данных о ценах и тарифах, публикуя ИПЦ на сайте Росстата, и с использованием новых источников. Будем смотреть, насколько они сопоставимы, и как только поймем, что дошли до точки сопоставимости, сможем использовать. Но это будет не полный переход на ККТ. Есть вещи, которые с помощью ККТ просто нельзя отследить или правильно идентифицировать: например, бытовые услуги называют по-разному. Есть услуги, которые используются в расчете ИПЦ, но пока могут не фиксироваться через ККТ. Например, аренда квартир, услуги по обучению иностранным языкам, сложно найти услуги по ремонту одежды. Таких примеров достаточно много, поэтому еще долгое время Росстат будет частично собирать информацию вручную.

Важный момент — методология расчета инфляции не меняется. Как считали индекс год назад, так и будем считать через год или через два. Это важно для сохранения сопоставимости данных, для временных рядов. Но мы увеличиваем количество источников данных, получаем возможность видеть больше разрезов — по регионам и территориям, по типам товаров и услуг, по форматам торговли. То есть получаем больше возможностей для последующего анализа динамики цен.

— Максим Решетников говорил на одном из заседаний, что нужно расширять источники информации для ИПЦ. Планируется ли расширять число наблюдаемых товаров и магазинов?

— Традиционный сбор данных в магазинах расширять пока не планируется, нет такой необходимости. Выборка отвечает текущим потребностям и задачам, и у Росстата просто нет ресурсов для этого, потому что информация собирается вручную. Максим Геннадьевич как раз имел в виду использование контрольно-кассовой техники, которая позволит существенно расширить выборку и, например, считать по тем муниципальным образованиям, по которым раньше данных не было.

Сейчас, в рамках традиционной методологии, мы как собирали по 282 населенным пунктам по всей стране, так и продолжаем собирать

Что касается увеличения количества наблюдаемых позиций, это происходит постоянно. Список корректируется в соответствии с потребительскими предпочтениями и дополняется новыми позициями. Например, в прошлом году появились лекарства, применяемые при лечении COVID-19, и еще ряд позиций, которые возникают в современном мире в силу экономических и социальных изменений.

Но нельзя расширять список до бесконечности, потому что тем самым сглаживаются колебания инфляции. Бесконтрольное расширение наблюдаемых товаров и услуг перераспределит влияние наиболее весомых товаров на малозначащие товары. Мы считаем индекс цен для каждого товара отдельно, а потом данные усредняются с учетом удельных весов товаров и услуг в общем потреблении их населением.

Нас ругают за средние значения, говорят, что инфляция, например, в 4,5% или в 6% не отражает ситуации, когда отдельные товары дорожают быстрее. Но если мы расширим число отслеживаемых товаров и услуг, сделаем несколько тысяч позиций без учета их реального потребления, то у нас инфляция на графике будет прямой линией, и изменения будут практически незаметны. Слишком сильное усреднение

В некоторых странах инфляция считается на меньшем наборе: в Испании отслеживается порядка 480 товаров и услуг, в США — чуть больше 300, в Финляндии — чуть больше 500. А есть, наоборот, страны, где ведется мониторинг по более чем тысяче позиций. Например, в Израиле или Швейцарии, но это небольшие страны, где процедура отработана на протяжении многих десятков лет. У нас другие масштабы. Да и международный опыт показывает, что наши 556 позиций — это практически золотая середина.

А дальнейшее развитие идет по технологическому пути — использование данных контрольно-кассовой техники, веб-скрейпинга и других источников данных о ценах.

В прошлом году ЦБ предлагал включить цены на недвижимость и аренду в методологию расчета инфляции, вы сказали, что готовы к дискуссии. Когда это станет возможным? Как Росстат будет рассчитывать этот индикатор и каким образом внедрит его в ИПЦ?

— Сейчас ежемесячно в индексе потребительских цен уже учитывается стоимость аренды недвижимости на одно- и двухкомнатные квартиры. Динамику цен на недвижимость включать в индекс потребительских цен пока не планируется. Тем не менее мы отслеживаем стоимость жилья и считаем соответствующий индекс в рамках других наших исследований. Росстат видит интерес к этим данным и планирует совершенствовать методологию, улучшать качество расчетов. Ведем работу с Росреестром и застройщиками. До конца года будет разработана новая система оценки стоимости первичного и вторичного рынка на основе индексов. Другой вопрос — учет при расчете ИПЦ затрат, которые собственники жилья несут на его обслуживание. В следующем году будем изучать эту возможность, проанализируем международный опыт. О том, как практически включать эти услуги в расчет инфляции, можно будет говорить позже.

А какие это услуги?

— Ремонт, страховка, налоги на недвижимость — те затраты, которые несет владелец квартиры или дома при обслуживании своей жилплощади. Но это сложный вопрос. Например, хотя всех и призывают страховать свою недвижимость, но как велика доля тех, кто этим занимается? Здесь многое зависит от происходящих процессов, от того, как растет финансовая грамотность людей.

— Несколько лет назад Росстат оценил долю "теневой" экономики в России в 12% ВВП. Во сколько вы оцениваете сейчас долю ненаблюдаемой экономики России?

— Если говорить сухим профессиональным языком, речь идет об экономических операциях, не наблюдаемых прямыми статистическим методами. За 2019 год доля ненаблюдаемой экономики составляет 11,6% от ВВП. Данные за 2020 год будут к концу этого года, когда Росстат подготовит третью оценку ВВП. Но это не "теневая" или криминальная экономика в том смысле, в котором ее обычно понимают.

Теневыми операциями в легальной экономике мы называем ситуации, когда часть производства намеренно пытаются скрыть от внимания власти, например, для уклонения от уплаты налогов. Доля такой теневой экономики составляет порядка 4% ВВП.

Также мы включаем в теневую экономику производство в неформальном секторе. Например, это владельцы подсобных хозяйств, которые на своем участке что-то выращивают для продажи на рынке. Кроме того, при расчете ВВП Росстат учитывает и то, что все мы производим для собственного потребления дома или на дачах, — от овощей, варенья и грибов до самостоятельного ремонта своего автомобиля или изготовления каких-то механизмов для использования в домашнем хозяйстве.

Что касается криминального производства или услуг, а именно это чаще всего понимается под теневой экономикой, то в мире разный подход к расчетам. Так как эта область находится вне закона, то и каких-либо статистических данных нет. Ряд стран, в основном входящие в ОЭСР (Организация экономического сотрудничества и развития — прим. ТАСС), оценивают их через цифры силовых структур. Разрабатываются различные математические модели расчета. Однако результаты невозможно проверить и верифицировать.

— То есть она не изменилась, получается, за три года? И цифровизация не позволила снизить этот показатель?

— Ненаблюдаемая экономика не может стремиться к нулю. Напомню, что это не то же самое, что криминальная экономика. Например, продукция подсобных хозяйств не должна учитываться в системах налоговой службы. Если посмотреть на цифры, то есть снижение ненаблюдаемой экономики с 12,6% в 2017 году до 11,6% в 2019 году. При этом цифровизация не столько меняет итоговые значения, сколько позволяет видеть это явление с разных сторон значительно подробнее. Оценка ненаблюдаемой экономики для Росстата — не самоцель. Эти расчеты нужны, чтобы полностью оценить все макроэкономические показатели. Как цифровые технологии помогают ФНС выявить те доходы, по которым отсутствуют налоговые платежи, и увеличить поступления в бюджет, корректнее спрашивать коллег. Я знаю, что они проделали огромную работу в этом направлении и вывели ее на принципиально новый уровень.

— В прошлом году было поручение президента пересмотреть потребительскую корзину и приблизить ее к реальности. Но потом отказались от использования потребительской корзины для расчета МРОТ и прожиточного минимума. Зачем тогда она вообще нужна? И будет ли ее Росстат модернизировать и продолжать считать?

— Росстат не отвечает за состав потребительской корзины, это вопрос к Минтруду. Мы всегда помогали коллегам, предоставляли информацию о средних ценах на необходимые товары и услуги, а также о структуре потребления. Кроме того, МРОТ и прожиточный минимум с 2021 года рассчитываются в соответствии с обновленной методологией, в которой потребительская корзина больше не используется.

— В последнее время из-за коронакризиса повысилось ли внимание к статистике со стороны ведомств, Кремля, правительства? Присылают ли вам больше запросов?

— Мы не оценивали количество запросов, которое к нам приходит, но по ощущениям интерес значительно вырос. Росстат начал готовить больше аналитических отчетов, больше разрезов, постоянно приходят нестандартные запросы. Точное количество запросов я не назову, но то, что они становятся сложнее, объемнее и необычнее, — это да, безусловно.

Если говорить про необычные запросы, то самой сложной и интересной задачей было все, что касается статистики коронавируса. Она разрабатывалась в сложное время, с нуля, никто не знал, что такое коронавирус, что такое смертность от коронавируса, и это стало серьезным вызовом для системы статистики

А в целом новые направления появляются постоянно, плюс постоянно дорабатываются старые подходы и методики. Месяц назад провели заседание расширенной коллегии Росстата, и там показали, что за два года у нас усовершенствована методология расчетов по более чем 70 направлениям. По каждому направлению мы существенно актуализировали подходы.

— Некоторые государственные деятели, например глава Счетной палаты Алексей Кудрин, не раз высказывались за независимость Росстата. Актуальна ли эта дискуссия сейчас?

— Эта дискуссия идет постоянно, и наш ответ на нее не изменился. В истории Росстата были разные периоды. Каждый раз это было вызвано какими-то определенными условиями. Некоторое время назад Росстат находился в сложной ситуации. Требовался серьезный технологический и организационный прорыв. Нужна была поддержка, и партнерство с Министерством экономического развития — самый естественный шаг. Сейчас мы вместе с коллегами решаем вопросы, которые накопились за долгое время. Я не исключаю, что ситуация может измениться в будущем, но это точно не вопрос к самому Росстату.

Отмечу другое. Мировой опыт показывает, что вопрос подчинения мало связан с качеством данных и работой статистического ведомства. Даже в Европе мы видим самые различные комбинации, вплоть до подчиненности МВД в Германии. И, кстати, работа вместе с министерством экономики — это довольно частое явление.

— Как проходит взаимодействие с министром экономического развития?

— Мы работаем и полностью нашли общий язык. Росстат развивается в соответствии с приоритетами, установленными министром.

— В связи с переводом сотрудников на удаленный формат работы Росстат перенес публикацию статистики с 16:00 на 19:00. Когда ведомство вернется к традиционному времени публикации?

— Так же как и вопрос подчиненности, это традиционный вопрос, который звучит в каждом интервью. Ответ на него тоже не изменился, пока публикации сохраняются на 19:00.

Но могу сказать, что сейчас в целом меняется публикационная политика. Внесены изменения в Федеральный план статработ, и дальше продолжается его совершенствование. Давно уже говорится о том, что Росстат серьезно уточняет и делает пересчеты по ряду показателей, в том числе по промпроизводству. Это происходит в том числе из-за того, что очень серьезно зажаты сроки сдачи отчетности от предприятий. Много лет идут разговоры о том, что сами предприятия на момент сдачи отчетности еще не владеют всей информацией и дают оценочные цифры. Потом они сами их корректируют, а Росстат вынужден уточнять ранее опубликованные данные. За прошлый год около 80% предприятий подавали те или иные уточнения, которые потом ложились в основу пересчетов.

Сейчас мы приняли решение удлинить сроки подачи отчетности, вышло распоряжение правительства, и уже отчетность за май по ряду форм будет сдаваться на пять-шесть дней позже. Понятно, что теперь достаточно большое количество показателей будет публиковаться позже на те же самые пять-шесть дней. Кстати, обращаю внимание, что Росстат для своих расчетов не добавил ни одного дня, местами мы даже, наоборот, еще ужесточили сроки.

— Публикации по каким показателям будут выходить позже?

— Перенеслась подача информации по шести формам, в том числе малого, среднего и крупного бизнеса. Эти формы затрагивают 31 работу федерального плана статработ, а реальных показателей там не меньше сотни. В том числе, например, позже будет публиковаться промпроизводство.

Что еще это повлекло за собой? Росстат публиковал два ключевых доклада: "Информация о социально-экономическом положении России" и "Социально-экономическое положение России" — мы их еще у себя называем большой и краткий доклад. Сейчас из-за того, что некоторые показатели появляются позже, короткая версия переехала на дату размещения большого доклада. И логично выглядит решение просто объединить эти два доклада в один. Готовить две отдельных публикации нецелесообразно. Нам пришлось сократить время работы над большим докладом, чтобы он, в свою очередь, не уехал куда-то дальше по срокам публикации. В результате сроки выхода полной версии остались неизменными, а краткая вливается в него. Такие достаточно серьезные изменения.

В целом рассчитываем, что решение о переносе сроков подачи отчетности повлечет повышение качества расчетов и снизит масштаб пересчетов.

Можно сказать, что это начало больших перемен в нашей практике публикации данных. Росстат серьезно занялся ревизией федерального плана статистических работ, убираем дубли и невостребованные позиции. Ведем эту работу со всеми министерствами и ведомствами.

Потом сделаем еще один шаг вперед — введем в промышленную эксплуатацию автоматизированную систему ведения плана статработ. В нее можно будет зайти и получить информацию по каждой статистической работе: зачем она нужна, какое ведомство ее ведет, на основе каких данных, в соответствии с какой методологией, какие показатели получаются в итоге. И, что особенно важно, какова нагрузка на респондентов при подготовке отчетности.

— По поводу времени, это же было связано с тем, что часть сотрудников на удаленке. Сейчас у вас какая часть все еще работает удаленно?

— Около 20%, по последним данным. С одной стороны, мы в числе лидеров по вакцинации сотрудников, а с другой стороны, все равно есть люди, у которых в силу медицинских или иных причин нет возможности пройти эту процедуру. Они продолжают работать в дистанционном режиме.

Но надо честно сказать, и мы всегда напоминаем об этом, что некоторые показатели рассчитываются вплоть до последней минуты перед публикацией. У нас очень жесткие сроки

Тем более что некоторые цифры, которые мы получаем, потом используются в других расчетах. Например, промышленное производство — всегда рассчитывается и уточняется до последней секунды перед публикацией. Мы видим какие-то всплески, звоним в территории, территории звонят в предприятия. Это происходит до самого последнего момента, в режиме подвига для сотрудников. Дополнительные два-три часа перед публикацией на самом деле для нас значат очень много.

— Росстат совместно с ФНС сейчас работает над цифровой аналитической платформой (ЦАП) "Население". Вы говорили, что технологически платформа будет готова к октябрю 2021 году. Удастся ли запустить ее в срок?

— ЦАП "Население" создает Росстат. Мы получаем данные по демографии — рождаемость, смертность, браки и разводы, а также ряд других показателей — из информационной системы ЕГР ЗАГС от ФНС. Поэтому можно говорить, что мы, действительно, работаем совместно.

Часть модулей будет запущена к октябрю, так как изначально планировалось, что система будет использоваться в первую очередь для подведения итогов переписи населения. Заработает модуль, связанный с данными о естественном движении населения, — ежемесячный расчет рождаемости и смертности, браков и разводов будет производиться в новой системе полностью в онлайне. Можно будет смотреть, что происходит по любым территориям. На первом этапе данные будут обновляться ежемесячно. В полном объеме ЦАП "Население" будет запущена в следующем году, когда в нее можно будет загрузить все итоги переписи населения.

— Во сколько обойдется создание этой платформы?

— Сейчас сложно сказать, потому что окончательной оценки стоимости всей системы и ТЗ на нее еще нет. Но могу сказать, что первый модуль, который сейчас разрабатывается, стоит 34 млн рублей.

— Сколько всего будет модулей?

— Будет несколько блоков, и это еще одно достоинство системы. Можно расширять ее функционал за счет "прикручивания" новых модулей.

— В этом году началась передача административных данных из ПФР. Какие данные получает Росстат?

— Росстат получает информацию о численности работников и фонде оплаты труда.

Информация агрегированная и обезличенная, то есть мы не можем знать, чья именно это зарплата. Но видим количество тех, кто получает ту или иную зарплату. И ее величину — от самой низкой до самой большой. Благодаря этому можно построить правильное распределение населения по доходам, а также по другим характеристикам: пол, возраст, количество работ, сколько он совмещает, сколько месяцев он работает и тому подобное

Сейчас обсудили несколько экспериментальных методик, в том числе расчет медианы на основе данных ПФР. Сейчас оцениваем стабильность этих данных.

— С помощью этих данных вы будете уточнять информацию о доходах населения?

— Сейчас информацию о доходах получаем на основе большого количества данных из различных ведомств. Используется балансовый метод, когда собираются административные данные по доходам и расходам населения, в том числе с учетом информации о розничном обороте, об объемах сбережений и кредитов. Еще одним источником станет и информация из Пенсионного фонда. У каждого инструмента есть свои достоинства и ограничения. Например, при полевых исследованиях сложно оценить доходы богатых людей. Лишь некоторые из них готовы открыть двери и ответить на наши вопросы. Однако их доходы в деперсонифицированном виде видны через цифры Пенсионного фонда, исходя из их отчислений.

— И сильно расходятся эти данные с вашими?

— Нет, не сильно. На уровне России вообще минимальные расхождения по сумме доходов. Тут весь вопрос в характеристиках дифференциации доходов по разным группам населения. У Росстата есть модель досчета доходов, но характеристики рассчитать раньше было невозможно. А поскольку теперь есть данные по каждому человеку, можно эти характеристики рассчитать более корректно.

— Это поможет подсчитать теневые доходы?

— Теневой доход можно лишь примерно оценить. Пенсионный фонд и ФНС видят легальные доходы. Их работа направлена на то, чтобы корректно рассчитать их и собрать налоги и начислить пенсии.

Единственная возможность увидеть теневой доход — это сравнить доходы и расходы в целом. Но дальше возникает другой вопрос: а что там внутри, действительно ли это теневой доход, из чего он состоит

Это отдельное пространство для работы статистиков. В Росстате есть управление статистики уровня жизни, где работают профессионалы высокого уровня, разрабатывающие методологию таких расчетов. Использование макроэкономических источников, данных ЦБ и других ведомств позволяет нам получать вполне корректные результаты.

— Недавно власти перенесли Всероссийскую перепись населения на октябрь, как изменится бюджет?

Перепись переносится в третий раз, но общий бюджет не меняется. Это 32 с небольшим миллиарда рублей на три года. Изменения касаются только переброски средств с 2020 на 2021 год. Это не дополнительное финансирование. Просто все деньги, которые хотели выплатить переписчикам в 2020 году, перенесли на бюджет 2021 года. Пытаемся уложиться в те суммы, которые уже выделены. Где-то приходится поджиматься, где-то людей сокращать. Смотрим, как можно оптимизировать процессы подготовки к переписи.

— По итогам переписи могут быть еще какие-то непредвиденные расходы?

— Пока сложно говорить, могут возникнуть. Сейчас готовимся и все просчитываем. Не исключаю, что появятся какие-то потребности. Например, уже в прошлом году напечатана часть агитационных плакатов, где написано про перепись с 1 апреля. Их нельзя использовать в октябре. Перепись переносилась уже три раза: сначала был октябрь прошлого года, потом апрель, потом сентябрь, потом октябрь этого года. И, конечно, каждое изменение влияет на все процессы при подготовке к переписи. Пока невозможно дать окончательные оценки. Важно другое. Технологически мы готовы, наша IT-инфраструктура уже несколько раз тестировалась, а электронные планшеты доставлены в регионы и готовы к использованию.

— Как Росстат будет отслеживать ход переписи?

— Будем отслеживать ее в режиме онлайн. Создана система, которая потом будет использована в ЦАП "Население" уже для представления данных. Все, кто задействован в подготовке переписи, вносят туда с определенной периодичностью информацию, и Росстат получает возможность отслеживать ход подготовки к переписи. Пока, конечно, не в онлайн-режиме, такой формат сейчас не нужен. Информация собирается раз в неделю, раз в две недели, в зависимости от необходимости и поставленных задач. А в период переписи информация будет загружаться ежедневно, в том числе с планшетов вообще в автоматическом режиме. И уже в онлайн-режиме можно будет видеть, сколько было опрошено людей на каждом планшете, какова динамика в каждом населенном пункте.

— Эти данные будут доступны только вам?

— В первую очередь Росстату. Разумеется, мы готовы делиться ими с заинтересованными экспертами и журналистами. Предусмотрена выгрузка достаточно подробной информации по России, по каждому субъекту с разрезами до муниципалитетов.