Размах и стандартное отклонение

До этого мы разбирали меры центра: среднее арифметическое, медиану и моду. Они помогают понять, где находится центр набора данных и какие значения являются «типичными».

Однако очень часто нас интересует не только центр, но и насколько числа разбросаны друг относительно друга, то есть насколько велик разброс значений.

Почему разброс так важен

Рассмотрим пример.

В городе 100 домохозяйств, и средний доход составляет 100 000 долларов в год.
Возникает вопрос: что это за город? Богатый или бедный? Как живут люди?

Для сравнения: медианный доход домохозяйства в США — 51 900 долларов.

Возможные сценарии

Сценарий 1
Все 100 домохозяйств зарабатывают ровно 100 000.
→ каждый зарабатывает почти вдвое больше медианы США
→ город всеобщего благополучия

Сценарий 2
50 домохозяйств зарабатывают 40 000
50 домохозяйств зарабатывают 160 000
→ половина живёт ниже медианы, половина — значительно выше
→ сильное социальное расслоение

Сценарий 3
99 домохозяйств зарабатывают 5 000
1 домохозяйство зарабатывает более 9 000 000
→ формально средний доход тот же
→ фактически почти весь город живёт в крайней бедности

Ключевой вывод

Все три ситуации имеют одинаковое среднее,
но рассказывают радикально разные истории.

Именно поэтому разброс значений — критически важная характеристика данных.

Меры разброса

Подобно тому как среднее и медиана — это меры центра, существуют и меры разброса.

Термины мера центра и мера разброса знать для экзамена не нужно — они используются здесь только для удобства.

Мы рассмотрим две меры разброса:

  1. Range (размах)

  2. Standard Deviation (стандартное отклонение)

Размах (Range)

Размах — самая простая и наименее информативная мера разброса.

Определение

Размах = максимальное значение − минимальное значение

Он учитывает только два числа:

  • самое большое

  • самое маленькое

И не говорит ничего о том, как распределены остальные значения.

Пример

Пусть:

  • среднее = 25

  • размах = 20

Возможные ситуации:

  • почти все значения равны 25, есть два выброса

  • половина значений на минимуме, половина — на максимуме

  • почти все значения близки друг к другу, есть один сильный выброс

Все эти сценарии возможны при одном и том же среднем и одном и том же размахе.

Ограничение размаха

Размах:

  • легко считается

  • даёт очень мало информации

  • полностью игнорирует большинство значений

Поэтому нужна более тонкая мера разброса.

Стандартное отклонение (Standard Deviation)

Стандартное отклонение — более точная мера разброса, которая, как и среднее, учитывает все значения в списке.

Чтобы понять его смысл, введём понятие отклонения от среднего.

Отклонение от среднего

Возьмём любой список и:

  • найдём его среднее;

  • вычтем среднее из каждого значения.

Получившийся список — это список отклонений от среднего.

Пример

Среднее равно 5.

Если число:

  • 1 → отклонение −4

  • 7 → отклонение +2

Числа ниже среднего дают отрицательные отклонения,
числа выше среднего — положительные.

Важное свойство

Если взять обычное среднее всех отклонений, оно всегда равно 0.

Поэтому стандартное отклонение отвечает на другой вопрос:

Насколько далеко в среднем значения находятся от среднего?

Именно это и есть типичный размер отклонения.

Факты о стандартном отклонении (то, что реально нужно для GMAT)

Факт 1

Стандартное отклонение:

  • всегда ≥ 0

  • никогда не бывает отрицательным

Это расстояние, а расстояние не может быть отрицательным.

Факт 2

Стандартное отклонение равно 0 только в одном случае:

Если все числа в списке одинаковы.

Пример:

  • все значения равны 7

  • среднее = 7

  • все отклонения = 0
    → стандартное отклонение = 0

Факт 3 (редкий, но важный)

Если все значения находятся на одинаковом расстоянии от среднего,
то это расстояние и есть стандартное отклонение.

Пример:

  • среднее = 5

  • значения: 2 и 8

  • каждое находится на расстоянии 3 от среднего

→ стандартное отклонение = 3

Это может встречаться в самых сложных задачах Quant.

Факт 4 (самый практичный)

Список, где большинство значений далеко от среднего,
имеет большее стандартное отклонение,
чем список, где большинство значений близко к среднему.

При сравнении стандартных отклонений:

  • почти никогда не требуется считать формулу;

  • достаточно визуального анализа распределения.

Пример:

  • если 8 из 10 значений равны среднему → стандартное отклонение маленькое;

  • если все значения на краях → стандартное отклонение большое.

Факт 5

Если:

  • прибавить одно и то же число ко всем значениям

  • или вычесть одно и то же число из всех значений

стандартное отклонение не меняется.

Почему:

  • расстояния между значениями сохраняются;

  • меняется только положение на числовой прямой.

Сдвиг или отражение не влияет на стандартное отклонение.

Факт 6

Если умножить все значения списка на положительное число k, то:

  • среднее умножится на k;

  • стандартное отклонение тоже умножится на k.

Причина:

  • все расстояния между числами увеличиваются в k раз.

Геометрическая интуиция (очень полезно)

Представь числа как точки на числовой прямой.

  • можно сдвигать их вверх и вниз;

  • можно отражать относительно оси;

  • можно менять знак;

Пока расстояния между точками остаются прежними,
стандартное отклонение не меняется.

Оно измеряет не положение, а расстояния.

Итоговое резюме

  • Размах = максимум − минимум

    • прост

    • малоинформативен

  • Стандартное отклонение показывает,
    насколько далеко значения в среднем находятся от среднего

Ключевые свойства стандартного отклонения:

  • всегда ≥ 0

  • равно 0 только если все значения одинаковы

  • одинаковые расстояния от среднего → SD равно этому расстоянию

  • больше значений далеко от среднего → больше SD

  • добавление или вычитание числа SD не меняет

  • умножение всех значений на k → SD умножается на k

Для GMAT и GRE важно понимать поведение стандартного отклонения,
а не уметь вычислять его по формуле.

Материал подготовлен редакцией HighScoreExams — преподавателями GMAT и GRE с личными результатами 700+ и 310+. Сертификат GMAT 750 одного из преподавателей опубликован на странице команды и предоставляется в оригинале на бесплатной консультации.
О команде

Прокрутить вверх