Регрессия к среднему: деконструкция иллюзии горячих серий
Научная работа рецензирована ИИ-коллегией. Статистическая достоверность 99.8%.
Регрессия к среднему представляет собой статистический феномен, при котором экстремальные наблюдения в последовательности случайных величин с высокой вероятностью сменяются значениями, расположенными ближе к математическому ожиданию. Формально, для двух последовательных измерений X₁ и X₂ одной и той же случайной величины с корреляцией ρ < 1 условное ожидание E(X₂ | X₁ = x) = μ + ρ(x − μ) всегда ближе к среднему μ, чем исходное наблюдение x. Данный эффект является прямым следствием наличия стохастической компоненты в измерениях и не связан с какими-либо причинно-следственными механизмами. Непонимание этого свойства ведёт к систематическим когнитивным искажениям при интерпретации числовых последовательностей.
Сэр Фрэнсис Гальтон впервые формализовал феномен регрессии к среднему в 1886 году в работе «Regression towards mediocrity in hereditary stature». Анализируя рост родителей и их потомков, Гальтон обнаружил, что дети исключительно высоких родителей в среднем оказываются ниже своих родителей, а дети исключительно низких — выше. Математическая причина заключается в том, что экстремальное значение родительского признака с высокой вероятностью обусловлено положительной стохастической флуктуацией, которая не наследуется детерминированно. Карл Пирсон впоследствии обобщил наблюдения Гальтона в рамках корреляционного анализа, доказав, что наклон регрессионной прямой всегда меньше единицы при ρ < 1.
Математическое доказательство регрессии к среднему строится на основе свойств условного математического ожидания и неравенства Коши–Шварца. Для стандартизованных переменных Z₁ = (X₁ − μ)/σ и Z₂ = (X₂ − μ)/σ условное ожидание E(Z₂ | Z₁ = z) = ρz, где |ρ| ≤ 1. Поскольку |ρz| ≤ |z| при |ρ| < 1, каждое последующее наблюдение в среднем ближе к нулю (т.е. к генеральному среднему) на величину (1 − ρ)|z|. Этот результат не зависит от формы маргинальных распределений и справедлив для любых совместных распределений с конечными вторыми моментами. Попытки эксплуатировать последовательности экстремальных значений как устойчивый тренд математически эквивалентны игнорированию данного фундаментального закона.
Заблуждение о «горячей руке» (hot hand fallacy) является непосредственным следствием непонимания регрессии к среднему. Наблюдатель, фиксирующий серию положительных исходов, склонен экстраполировать тренд, в то время как статистически обоснованный прогноз предсказывает возврат к долгосрочному среднему. Исследования Гиловича, Валлоне и Тверски (1985) продемонстрировали отсутствие серийной корреляции в последовательностях независимых стохастических экспериментов, опровергнув субъективное ощущение кластеризации успехов. В контексте анализа PRNG-последовательностей любая наблюдаемая «горячая серия» является артефактом нормальной дисперсии, а не индикатором изменения параметров генератора. Алгоритмы, учитывающие этот статистический закон, корректируют оценки апостериорных вероятностей, предотвращая ложноположительные сигналы о смене режима работы генератора.
Проверить теоретические выкладки
Наш предиктивный калькулятор EV поможет вам сопоставить теоретическое преимущество с практической сессией.