Статистическая значимость — концепция из классической статистики, используется в науке, маркетинге, медицине. Её часто понимают неверно.
Нулевая гипотеза
Это предположение "нет эффекта". Например: "новое лекарство не лучше плацебо". Цель — статистически отвергнуть эту гипотезу и доказать, что эффект есть.
P-value
Вероятность получить наблюдаемый результат (или более экстремальный), если нулевая гипотеза верна. Если p < 0.05 — "статистически значимо". Это произвольный порог.
Пример
Тестируем лекарство на 1000 пациентах. Группа лечения выздоравливает на 5% чаще контрольной. P-value = 0.03. Значит: если бы лекарство не работало, такой результат получался бы в 3% подобных исследований случайно. "Статистически значимо".
Главные ошибки
- P-value не размер эффекта: p < 0.05 не значит, что эффект большой. Может быть крошечным, но статистически значимым при больших выборках
- P-hacking: множественные тесты в одном исследовании искусственно повышают шанс найти "значимый" результат
- Публикационный bias: только значимые результаты публикуются. Это искажает научную картину
- Replicability crisis: многие "значимые" результаты не воспроизводятся в независимых экспериментах
Альтернативы
Байесовская статистика — работает с вероятностями, а не с пороговой значимостью. Доверительные интервалы — показывают не только "есть эффект" но и "какой". Effect size — абсолютная величина эффекта.
Что важно
Значимость ≠ важность. Всегда спрашивайте: а насколько эффект большой? Воспроизводился ли он? Это не математическая формальность — это реальный критерий.
Есть вопрос?
Вопросы и ответы · 0
Не поняли что-то?
Зарегистрируйтесь — и сможете задать вопрос автору объяснения.
Загрузка комментариев…