Математическая модель, v3
Внимательный читатель указал нам на существенный недостаток в опубликованной мат. модели v2. Для оценки числа погибших и для оценки числа раненых в формуле
T = R / (A / Q)
мы используем одно и то же Q
- общее число заявок от родственников.
Это число можно использовать для оценки общего числа бойцов ВФУ, но не для оценки погибших и раненых, потому что последние два множества являются строго не пересекающимися. Вместо этого для каждой категории i
следует использовать Q_{i}
- число заявок о людях из той или иной категории. И вот почему: человек\, за крайне редкими исключениями (о них - ниже) не может быть одновременно в плену и погибшим\, то есть любые вероятности\, связанные с нахождением в одной из этих категорий\, не будут независимыми.
По каждой же категории i
следует использовать формулу
T_{i} = R_{i} / (A_{i} / Q_{i}
При этом, оценка модели v2 для T_{i}
завышена в Q / Q_{i}
раз (1).
В модели v2 известно только общее число заявок Q = Q_{погиб} + Q_{в плену} + ...
Но непонятно их разбиение по отдельным категориям. Какое оно? Сколько заявок, на самом деле, о погибших, сколько - о пленных, сколько - о других категориях, если мы ничего не знаем об этих людях кроме, собственно, заявок?
В модели v3, которую мы опишем ниже, мы постарались сделать такую оценку ценой ввода дополнительных предположений. Новая версия модели не заменяет предыдущую модель целиком, а исправляет ошибку модели v2.
Примечание: все числа в статье взяты на момент ее написания. Поскольку новые данные появляются каждый день, то и числа будут меняться со временем. Точные оценки публикуются в виде графиков, значения для которых вычисляются автоматически и единомоментно.
Часть 1: Категории людей
Первой проблемой, которую нужно решить, является то, какие категории возможны для тех, о ком подают заявки.
Набор категорий должен обладать следующими свойствами:
- описывать всю совокупность бойцов ВФУ (любой человек должен в любом случае попадать в одну из этих категорий);
- никакие две категории не должны пересекаться (любой человек должен попасть строго в одну из этих категорий);
- категории должны описывать сколько-нибудь значимую часть людей. Дело в том, что на войне бывает всякое: кто-то погибает под обстрелом, будучи уже в плену, на живых приходят похоронки, погибших числят пропавшими и так далее.
Мы рассмотрели несколько вариантов:
- погибшие: такие есть, хотя их и относительно немного (273 человека найдены по заявкам);
- пленные, включая раненых: это подавляющее большинство найденных (1277);
- прочие, оказавшиеся на украинской стороне: раненые бойцы ВФУ, дезертиры, любые другие люди - ноль. За десять месяцев работы нашего проекта мы не встретили ни одного случая, когда бы такой человек нашелся по заявке. Обращаем внимание, что мы собираем информацию в том числе из хакерских групп – таких как Nemez1da.ru или Берегини, которые публикуют те или иные списки, в том числе дезертиров и раненых. Более того, в нашей базе есть, пусть и не очень большое, но ненулевое число дезертиров. Поэтому нам приходится принять, что число заявок о дезертирах, раненых или других категориях составляет менее 0.1% от всех заявок потому, что нам не встретилось ни одного такого случая из более чем тысячи найденных людей;
- пропавшие без вести: при детальном рассмотрении выяснилось, что любой человек из пропавших без вести в любом случае оказывается в одной из вышеупомянутых категорий. Единственное, что его отличает - отсутствие о нем информации. Поэтому эту категорию в принципе нельзя включить в рассматриваемый набор.
Примечание: в реальности все эти категории у нас в базе немного пересекаются. Так, например, есть пленные погибшие в Еленовке; есть и обменянные, позже погибшие. Однако такие пересечения составляют малую долю, менее 1% от интересующих нас категорий, поэтому мы решили ими пренебречь. Делаем вывод: на основе случаев, с которыми мы сталкивались, любой человек, о котором была подана заявка может быть либо в плену, либо погибшим (2). Других исходов в значимых количествах мы не наблюдали.
Часть 2: оценка завышения числа пленных в модели v2
Здесь мы рассмотрим два метода, в корне отличающиеся от использованных в модели v2.
Метод первый - на основе информации об обменянных бойцах. На день сегодняшний в нашей базе содержится более 1200 записей о бойцах ВФУ, которых обменяли.
Информацию об обменах до 21 сентября 2022 года мы отбросили - во-первых она составляет всего лишь десятую долю от всех известных обменянных, во-вторых, к сожалению, в тот промежуток времени мы не структурировали информацию должным образом, поэтому использовать ее для автоматического ежедневного расчета затруднительно.
Из оставшихся 1080 записей мы знаем примерно 730. Таким образом, если судить на основе обменянных, у нас в базе содержится информация примерно о 65.1% пленных.
Всего в нашей базе есть информация о 6555 пленных, что дает оценку числа пленных в 6555 / 0.651 = 10069
(3).
Сопоставляя эту оценку с оценкой модели v2 получаем Q_{в плену} / Q = 10069 / 33959 = 0.297
, другими словами лишь 29,7%
от всех заявок поданы по людям в плену, а остальные 70,3% - по погибшим, пусть даже мы и не знаем, что случилось с конкретным человеком. (4)
Метод второй - на основе заявок, по которым родственники сами что-то нашли. На текущий момент у нас в базе содержится 53 заявки, по которым в плену нашлись 40 человек и еще 7 были обменяны (остальные, к сожалению, погибли).
Аналогично предыдущему методу число пленных получается 6555 / 0.75 = 8740
человек, а Q_{в плену} / Q = 8740 / 33959 = 0.257
. То есть, согласно этому методу лишь 25,7%
из тех, кого ищут, окажутся в плену. Остальные 74,3%
окажутся погибшими.
Мы считаем, что первый метод является более достоверным, поскольку не зависит от морально-эмоционального состояния заявителей, которое может исказить статистику (будете ли вы сообщать какому-то проекту, если у вас погиб близкий человек?). Однако близость результатов оценки второго метода несколько добавляет уверенности в оценках.
Часть 3: оценка завышения числа погибших в модели v2
Исходя из (2) и (4):
Q_{погиб} / Q = 1 - Q_{в плену} / Q = 0.703
Таким образом, оценка модели v2 в плане числа погибших завышена примерно на 29,7%
. Отсюда оценка модели v3 составляет 249 035 * 0.703 = 175071
человек погибших.
Заключение
В модели v2 мы допустили концептуальную ошибку, полагая некоторые состояния (в плену и погиб) независимыми. Благодаря внимательному читателю в новой версии модели, v3, мы предлагаем исправление и дополнение. Исправление строится на ряде новых допущений.
С одной стороны, новая модель по-прежнему, с точностью до пары десятков процентов согласуется с заявлениями различных официальных сторон и экспертов о числе погибших (модель v2 шла с опережением в 15-20%, модель v3 отстает от них на 10%).
С другой стороны, оценка числа пленных стала куда ближе к информации, опубликованной ранее российской стороной.
Для большей наглядности в ближайшее время мы несколько изменим публикацию графиков: На всех графиках будут отображаться оценки модели v2 (блеклым цветом до дня публикации) и модели v3 (насыщенным со дня публикации)
В самой статье с графиками мы оставим только их краткое описание и список основных изменений и событий, например - переход на новую версию модели, единовременное добавление большого массива данных, обмены, заявления официальных лиц, озвучивающих потери и тому подобное.
А пока приводим графики тут:
Если Вы заметили неточную или устаревшую информацию - сообщите нам пожалуйста!