Поиск человека

Возобновляем публикацию оценок по модели v3

Несколько недель назад мы перестали публиковать регулярную инфографику наших оценок численности и потерь ВФУ. После перерыва мы решили возобновить публикацию модели, оставив ее и оценки без изменений.

Почему? Объясняем: основная причина проста. Где-то с начала февраля мы начали плотно работать по новому источнику информации, содержащему большое количество данных - сайтам громад (общин) и районов. Эти сайты содержат много некрологов, часто - с подробностями - имя погибшего, год рождения, звание, должность, иногда - войсковая часть плюс фото погибшего.

К нашему удивлению, и эти данные оказались востребованы: в некоторых случаях найденная информация оказалась новой для родственников, оставивших нам заявку на розыск.

Как внесение данных из этого источника повлияло на наши оценки? Оценки, естественно, стали достаточно быстро расти. В формуле T = R/(A/Q) начался быстрый рост множителя R при незначительном изменении соотношения A/Q. Такие изменения прямо говорят о том, что мы подошли к краю области применимости модели v3. В этой модели мы не делали различия между “качеством” источников - тем, насколько часто информация о человеке из одного или другого источника оказывается полезной (то есть новой) для тех, кто его искал. Внимание: под “качеством” мы имеем в виду строго полезность информации для заявителей, а не ее достоверность. Мы уверены, что практически вся опубликованная на подобных сайтах информация является достоверной.

В результате мы решили взять паузу и попытаться изучить и оценить это самое “качество” источников. Единственный вариант объективной оценки, который мы смогли придумать, состоял в изучении случаев, когда, через некоторое время после подачи заявки, родственники сами сообщали нам о том, что они нашли человека. В таком случае можно было изучить, из каких источников у нас была информация на момент, когда нам сказали, что человек нашелся. И таким образом оценить (потенциальное) распределение по источникам “внутри Q” - во множестве всех заявок.

К сожалению, после обработки данных мы установили, что объем нужных данных у нас гораздо меньше того, что требуется для сколько-нибудь надежных оценок: всего мы смогли установить 20 случаев, в которых родственники сами сообщили нам о гибели человека; из не более 5, в которых мы имели информацию об этих людях до момента сообщения. Для сравнения, по пленным у нас есть 101 случай, когда родственники сами сообщили нам информацию; из них 73 случая, когда у нас была какая-то информация на момент сообщения.

Таким образом мы выяснили, что собранной информации - 5 случаев на более чем 13000 поданных на сегодня заявок - недостаточно для принципиального уточнения модели v3 и построения модели v4, включающей дифференцированную оценку качества источников.

Конечно, мы будем стараться получить больше таких данных. Однако, напоминаем: речь идет о случаях, когда люди достоверно узнали, что их близкий родственник погиб, после этого сняли свою заявку с упоминанием причины, и, при всем при этом, мы знали о случившемся с этим человеке из других источников. Случаи действительно редкие.

В результате мы решили возобновить публикацию оценок на основе модели v3, но при этом настоятельно рекомендуем иметь в виду, что модель построена на известных допущениях, которые, на самом деле, нарушаются. Пока так. Как только у нас появится достаточно данных, или мы узнаем способ уточнить модель другим способом - мы обязательно его опубликуем.

Если Вы заметили неточную или устаревшую информацию - сообщите нам пожалуйста!