Накануне в СМИ вышло сенсационное расследование: 6 миллионов переболевших в России — крайне заниженные данные! По данным журналистов, в реальности новую коронавирусную инфекцию в стране перенесли уже около 29 миллионов человек.
Выводы сделали на основе сертификатов переболевших, которые массово начали рассылать Госуслуги. У тех, кто перенес коронавирусную инфекцию, например, в декабре, порядковый номер соответствует 11 миллионам, в начале июня было чуть больше 27 миллионов, к июлю цифра подскочила до 29 миллионов.
Действительно, если брать номера сертификатов переболевших, то некая логика прослеживается. Сотрудник портала «Доктор Питер» перенес ковид в январе 2021 года. Номер сертификата — 8471 01хх 14хх хххх. Если судить по данным расследования, 8 — стандартная цифра для шифрования, 47 — код региона (Ленинградская область), 1 — цифра шифрования. Далее дата 01хх — когда был получен отрицательный результат и данные внесли в базу. А за ним следует порядковый номер сертификата 14 ххх ххх. То есть, по мнению авторов расследования, эти цифры соответствуют количеству переболевших
Минздрав на запрос, что же именно обозначают номера сертификата ответил, но довольно расплывчато. Якобы в этих данных для служебного пользования содержатся сведения о всех гражданах, которые имеют подтвержденный диагноз, госпитализированы с признаками пневмонии, прошли вакцинацию. Однако у того же переболевшего сотрудника «Доктор Питер» есть еще один сертификат — «О вакцинации» и порядковый номер в нем 9470 0000 075х хххх. 9 — может быть кодом шифрования услуги, 47 — цифровое обозначение региона, 7 5хх ххх — номер вакцинации. То есть, в апреле, когда сотрудник получил вакцину, вероятно, было привито более 7,5 миллиона человек.
Даже если исходить из того, что в реестре фиксируют всех переболевших, вакцинированных и госпитализированных с признаками пневмонии, то расхождение достаточно большое, или можно сказать, что в больницах лежали миллионы людей с невыявленной новой коронавирусной инфекцией (6 миллионов переболевших на июль 2021, 7,5 миллиона вакцинированных на апрель 2021 против 14 миллионов переболевших на январь). Можно предположить, что официальная статистика отличается от реальных цифр переболевших. Но говорить о 29 миллионах с уверенностью не стоит. Почему? Объяснил независимый аналитик Александр Драган.
аналитик открытых данных, маркетолог
Хотя расследование выглядит впечатляюще, а его выводы отвечают тому, что мы и так давно знаем, на деле я вижу с ним несколько крупных проблем. И главное: в нем слишком много допущений и слишком мало убедительных доказательств. Реальных больных с ковидом, попавших в базу Минздрава, больше, чем в данных опершатаба, но в несколько раз меньше 29 миллионов.
Расследование строилось на нескольких десятках переболевших, выборка совсем небольшая.
У нас нет основания считать, что там сплошная нумерация, то есть, что после записи 100 идет 101, а затем — 102. После номера 100 000 может идти 100 100, а затем 100 200. Логика может быть какой угодно, вплоть до рандомизированного характера нумерации. В базах данных такого рода сплошная нумерация используется редко. Часто встречаются специальные пустоты, квоты, пулы свободных айдишников. Вполне может быть, что после записи в 2 миллиона есть пустой пул до 5 миллионов.
В базе вакцинированных есть только один статус — «привит», поэтому она соответствует тем цифрам, которые транслирует Минздав. В базе переболевших есть разные статусы, вероятно, диагноз не подтвердился, или изменился. Поэтому говорить, что принципы нумерации совпадают — нельзя.
В данных есть скачки, более поздним сертификатам могут соответствовать более ранние даты. Это в расследовании пытаются объяснить переопределением номеров, якобы пациент, у которого диагноз не подтвердился из базы выбывает, а его номер присваивают другому, более позднему больному. Но решение это очень странное и нелогичное, нехарактерное при работе с базами данных. Зачем экономить айдишники?
Можно сделать вывод, что мы не знаем, сколько реально записей в этом реестре. Их может быть 29 миллионов, а может 20 или 12. И 29 миллионов — это может быть объединенная база ковида, пневмонии и ОРВИ, которая ведется с марта 2020 года. Но это не означает, что российская официальная статистика корректна.