Чем «толще хвост», тем сильней он «виляет собакой»

4,6K прочитали

Прорывной результат анализа 2,5 тыс. лет эпидемий

Явный и реальный хвост эпидемии. Источник: https://www.nature.com/articles/s41567-020-0921-x
Явный и реальный хвост эпидемии. Источник: https://www.nature.com/articles/s41567-020-0921-x

Нассим Талеб теперь уж точно войдет в историю главным ниспровергателем статистических методов оценки рисков. Первое ниспровержение состоялось в 2016. Тогда в ходе Нобелевского симпозиума Нассим Талеб опроверг теорию о спаде насилия в мире, а заодно математически обосновал страшный вывод —  большой войны с десятками миллионов жертв не миновать .

Новое ниспровержение датируется маем 2020 и связано с пандемией COVID-19. В опубликованной вчера работе «Хвостовой риск инфекционных болезней» Нассим Талеб и Паскуале Сирилло рассказывают о результатах статистического анализа всех больших эпидемий на Земле за 2,5К лет. При анализе они использовали ту же методологию, что была ими использована в 2016 для анализа числа жертв войн за всю историю.

В основе методологии Теория экстремальных значений — Extreme value theory (спецраздел матстатистики для работы с «Черными лебедями», имеющими максимальное отклонение вероятности от среднего значения — ураганы, наводнения, землетрясения и т.д.) и обобщенное распределение Парето — Generalized Pareto distribution (позволяет моделировать только хвост распределения).

Результаты нового анализа вполне могут стать предметом рассмотрения на очередном Нобелевском симпозиуме.

Вот их резюме.

  • Анализ 2.5 тыс. лет эпидемий показал, что статистическое распределение их жертв имеет чрезвычайно «толстый хвост» (Fat-Tailed Distribution). В «толстом хвосте» графика этого распределения зачастую прячутся «Черные лебеди» — редкие, маловероятные, но очень значимые события — что делает бессмысленным вычисление средних значений. По своей «толщине» хвост распределения жертв пандемий не уступает распределению жертв войн.
  • Чем «толще хвост» распределения, тем сильнее он «виляет собакой». Т.е. тем больше статистической информации содержится в крайних точках и тем меньше — в «массовых» событиях высокой частоты, где она становится почти шумом. Поэтому расчеты на основе средних значений по «массовым» событиям могут быть неинформативными и ненадежными. Для распределений с «толстыми хвостами» нужно извлекать ценную информацию из пиковых событий, прячущихся в хвостах. Это делается путем отказа от опоры на средние значения и использования вместо этого Теории экстремальных значений и обобщенного распределения Парето.
  • Такой подход меняет все: от моделей эпидемий до политических решений по борьбе с ними. Он дает совсем иные результаты. Но главное, он меняет мировоззренческие представления о соизмеримости вероятностей, неопределенностей и рисков. Сегодняшние доминирующие представления о вероятностных рисках основаны на сравнении «теплого и длинного». Практически все (обыватели, журналисты, эксперты, политики) сопоставляют число жертв пандемии с числом жертв автомобильных аварий, сердечных приступов, рака, падений с лестниц и т.п. Это в корне ошибочно, поскольку распределение жертв последних имеет тонкие гауссовские хвосты, в которых просто не спрятаться «черным лебедям». А в толстых хвостах пандемий их может быть сколько угодно и без ограничений размера. Не понимая этого: (1) реалистичное управление рисками невозможно, (2) используемые модели (типа SIR) хороши для научных дискуссий, но бессмысленны для принятия практических решений.

В заключение о важном дополнении к работе Талеба и Сириллио.

✔️ Авторы, имхо, абсолютно правы, утверждая, что Теория экстремальных значений — единственно верный статподход современной науки для управления риском и принятия решений в борьбе с пандемией.

✔️ Но от себя добавлю. Этот подход единственный в рамках привычной нам науки. В постнауке (а она уже рядом) есть методы покруче Теории экстремальных значений. Подтверждая выводы последней, «Динамическое причинно-следственное моделирование» Фристона, идет куда дальше. Оно в корне меняет отношение Homo sapiens к неопределенности, являющейся не чем иным, как непомерной ценой, заплаченной за интеллект.

Об этом мой очередной пост, от написания которого снова пришлось отвлечься из-за Талеба.

________________________________

Если понравился пост:
- нажмите на “палец вверх”;
- подпишитесь на обновления канала на платформе Яндекс Дзен ;
- оставьте комментарий.
Еще больше материалов на моем Телеграм канале «Малоизвестное интересное». Подпишитесь