Пошук людини

Математична модель втрат ЗСУ

З 25 травня цього року проект WarTears.org допомогає людям знаходити своїх родичів, таких що служили у ЗФУ і перестали виходити на зв'язок з тих чи інших причин. За цей час Проект зібрав базу з понад 125 000 записів, прийняв понад 3000 заявок на розшук і допоміг знайти інформацію більш ніж по 900 військовослужбовцям (і ці числа ростуть щоденно).

Примітка. Тут і далі ми використовуємо скорочення ЗФУ – Збройні формування України. Ми так робимо тому що досить часто незрозуміло, до якої структури належить та чи інша людина. Це можуть бути ЗСУ (Збройні сили Украиїни), НГУ (Національна Гвардія України), ТрО (територіальна оборона), СЗР (Служба зовнішньої розвідки України). Крім того, існують націоналістичні формування, наприклад полк "Азов" (заборонений в РФ) який суттєво, хоча й неповністю перетинається з в/ч А3057, батальйон "Кракен", "Закарпатська Січ"; добровольчі батальйони (добробат "Сонечко"), организації найманців і просто іноземців, що далеко не завжди входять до складу офіційних структур. Ми шукаємо усіх. Саме тому тут і далі ми використовуємо узагальнюючий термін ЗФУ.

Ми вирішили спробувати оцінити втрати і загальну чисельність ЗФУ на основі отриманих даних статистичними методами. Цікаво тут те, що напряму це зробити досить складно через множину причин, які можут суттєво спотворити статистику. Наприклад:

  • частина даних отримана досить великими списками -- так, нами був отриманий список полонених на декілька сотен прізвищ, а також ми проаналізували базу проектів volunteer.su і nemez1da.ru з майже 120 000 неунікальних записів (це означає, що по одній і тій самій людині на цих проектах могли бути створені 2 і більше записів);
  • частина категорій може перетинатися досить примхливим чином: в нашій базі одна й та сама людина може числитися пораненою і загиблою, тому що спочатку вона була поранена (дані по пораненим можуть бути у системі охорони здоров'я ДНР), а потім померла.

Але частину записів, особливо записи про загиблих, полонених і заявки від родичів, ми перевіряємо на унікальність вручну, тому дублікати можуть впливати на оцінку загальної чисельності, але не на оцінку втрат.

Методика

Відразу хочемо зазначити, що оцінка кількості поранених, евакуйованих на території, підконтрольні Києву, а також оцінка кількості дезертирів нами не проводилися через відсутність достатньої кількості даних. Тому математична модель та її оцінки нижче робилися тільки щодо загиблих українців і українців, які потрапили у полон.

Саме ці люди – загиблі або полонені – складають генеральну сукупність моделі в статистико-імовірнісному сенсі.

Ми окремо оцінювали кількість людей в тій чи іншій вузькій категорії, що визначається однозначно. Ми робимо припущення про те, що розподіл людей, яких шукають через проект WarTears.org, і розподіл даних, отриманих проектом з відкритих джерел-незалежні. Інформацію про полонених і загиблих ми здебільшого отримуємо зі списків, що спливли у відкритих джерелах, і з Телеграм-каналів, які викладають будь-яку подібну інформацію, що потрапляє в їх поле зору. Невелика частина інформації приходить зі ЗМІ, проте вона в основному стосується або офіцерів, або націоналістів.

У зв'язку з останнім, офіцерський склад нам довелося рахувати окремо - про це і про інші можливі коригування нижче, в розділі "чисельний результат".

По кожному стану (загиблі, полонені) оцінка вираховувалася за формулою:

T = R /(A / Q)

де:

T – загальна кількість солдатів ЗФУ в цьому стані, R – кількість записів про цей стан у нас в базі, Q – загальна кількість заямовлень на пошук від родичів, A – кількість замовлень, за якими солдат був знайдений і знаходиться в цьому стані.

Іншими словами, ми апріорі припускаємо, що ймовірність того, що у нас в базі є запис про когось, збігається з ймовірністю того, що його знайшли у нашій базі за умови, що шукали.

Крім того ми зробили оцінку загальної чисельності ЗФУ - активних, загиблих і полонених - згідно з тим же методом, вважаючи що всі, хто знаходиться у нашій базі, так чи інакше знаходяться або перебували у ЗФУ. На основі цієї та попередніх двох оцінок ми простим відніманням оцінили активну чисельність ЗФУ. Оскільки ми знаємо, що наша база містить дублікати записів про активних членів ЗФУ, то отримана оцінка є оцінка зверху. У міру роботи дублікати будуть вилучатися з бази, і оцінка буде зменшуватися.

Чисельний результат

Ми встановили, що для деяких категорій ця модель незастосовна. Головна з цих категорій – це офіцери. В нашій базі дуже мало заявок на розшук офіцерів, але з понад 3 500 записів про загиблих більш ніж 1200 – офіцери. Це показує принципово інший розподіл ймовірностей в категорії, тому ми припустили, що нам відомо про всі або майже про всі випадки загибелі офіцерів. В моделі кількість таких записів враховувалась напряму, без якихось коєфіцієнтів.

Також ми звірили свої оцінки з виступом Сергія Шойгу. На 21 вересня 2022 року наша модель давала оцінку на 6 000 більше (67 000 проти 61 000), ніж офіційні дані МО Росії. Ми припускаємо, що це може бути свідоцтвом наявності інших категорій, окрім офіцерів, для яких кількість заявок на розшук може бути аномально низькою.

Такими категоріями може бути ядро української армії, що пройшло британську підготовку, а також представники націоналістичних угруповувань на кшталт "Азову", "Кракена" або "Закарпатської Січі" – всім їм приділяється підвищена увага у ЗМІ. Ми припускаємо, що ці люди в плані статистики знаходяться десь поміж офіцерами та звичайними мобілізованими. Однак при відсутності суворих критеріїв ми не стали вводити ще одну корекцію. Якщо читач вважає її необхідною, то можна зменшити наші оцінки загиблих приблизно на 10%.

Нижче ми наводимо щоденно оновлювані графіки оцінки числа загиблих і полонених військовослужбовців ЗФУ. Щоб подивитись чисельне значення оцінок у визначений день, наведіть на точку відліку за цей день.

Увага! На графіках вказана зміна нашої оцінки, яка включає в себе як зміну реального стану справ, так і зміну нашого розуміння ситуації. Тому не варто дивуватись ні змінам оцінки числа загиблих в меншу сторону, ні раптовим стрибкам – швидше за все, в цей день ми знайшли і обробили черговий список імен, що з'явився в мережі.

Далі, на основі всієї сукупності записів ми ризикнули зробити оцінку загальної чисельності ЗФУ.

Ми вважаємо, що це - оцінка згори, яка може бути скоректована вниз з цілого ряду міркувань, наприклад:

  1. в нашій базі присутня значна кількість дублікатів записів. В поточній версії ми, однак, не враховували цей фактор, який, як вже сказано, може суттєво знизити оцінку загальної чисельності,
  2. із загальних міркувань заявки на розшук будут куди більш ймовірні для тих, хто служить у фронтових частинах, ніж для тих, хто, умовно кажучи, охороняє Львів.

Укладення

Реальні втрати ЗФУ, окрім цих чисел, включають в себе поранених, дезертирів і реально зниклих безвісти. Ми припускаємо, що загальні безповоротні втрати ЗФУ (як вбиті, так і поранені, непридатні до військової служби) можуть бути в два рази вище нашої оцінки. Чисельний же склад, можливо, перебільшений.

Також необхідно пам'ятати, що це – запізніла згладжена оцінка. По-перше, вона враховує те, що родичі звернулися до нашого проекту. Таке може статися і через два тижні, і через п'ять місяців, як було з ударом по розташуванню 137 ОБМП у Миколаєві 18 березня 2022 року. Скоки наших оцінок, наприклад, 5 або 24 Жовтня, безпосередньо пов'язані з тим, що ми натрапили на якийсь досить великий список загиблих і внесли його за один раз.

Оцінку зниклих безвісти і інших категорій ми не робили. У разі зниклих нам достеменно відомо безліч випадків, коли київський режим повідомляв родичам, що люди зникли безвісти, тоді як ця людина загинула при ракетному обстрілі розташування у глибокому тилi.

Оцінку інших категорій поки вважаємо передчасною, тому що кiлькiсть відомих випадків у них недостатньо для отримання статистично значущих значень. Ми так само розуміємо, що оцінка загальної чисельності ЗФУ скорiш за все завищена. Ми плануємо відчистити базу від дублікатів записів і, відповідно, скорегувати оцінку.

Если Вы заметили неточную или устаревшую информацию - сообщите нам пожалуйста!