Размах и стандартное отклонение
До этого мы разбирали меры центра: среднее арифметическое, медиану и моду. Они помогают понять, где находится центр набора данных и какие значения являются «типичными».
Однако очень часто нас интересует не только центр, но и насколько числа разбросаны друг относительно друга, то есть насколько велик разброс значений.
Почему разброс так важен
Рассмотрим пример.
В городе 100 домохозяйств, и средний доход составляет 100 000 долларов в год.
Возникает вопрос: что это за город? Богатый или бедный? Как живут люди?
Для сравнения: медианный доход домохозяйства в США — 51 900 долларов.
Возможные сценарии
Сценарий 1
Все 100 домохозяйств зарабатывают ровно 100 000.
→ каждый зарабатывает почти вдвое больше медианы США
→ город всеобщего благополучия
Сценарий 2
50 домохозяйств зарабатывают 40 000
50 домохозяйств зарабатывают 160 000
→ половина живёт ниже медианы, половина — значительно выше
→ сильное социальное расслоение
Сценарий 3
99 домохозяйств зарабатывают 5 000
1 домохозяйство зарабатывает более 9 000 000
→ формально средний доход тот же
→ фактически почти весь город живёт в крайней бедности
Ключевой вывод
Все три ситуации имеют одинаковое среднее,
но рассказывают радикально разные истории.
Именно поэтому разброс значений — критически важная характеристика данных.
Меры разброса
Подобно тому как среднее и медиана — это меры центра, существуют и меры разброса.
Термины мера центра и мера разброса знать для экзамена не нужно — они используются здесь только для удобства.
Мы рассмотрим две меры разброса:
- Range (размах)
- Standard Deviation (стандартное отклонение)
Размах (Range)
Размах — самая простая и наименее информативная мера разброса.
Определение
Размах = максимальное значение − минимальное значение
Он учитывает только два числа:
- самое большое
- самое маленькое
И не говорит ничего о том, как распределены остальные значения.
Пример
Пусть:
- среднее = 25
- размах = 20
Возможные ситуации:
- почти все значения равны 25, есть два выброса
- половина значений на минимуме, половина — на максимуме
- почти все значения близки друг к другу, есть один сильный выброс
Все эти сценарии возможны при одном и том же среднем и одном и том же размахе.
Ограничение размаха
Размах:
- легко считается
- даёт очень мало информации
- полностью игнорирует большинство значений
Поэтому нужна более тонкая мера разброса.
Стандартное отклонение (Standard Deviation)
Стандартное отклонение — более точная мера разброса, которая, как и среднее, учитывает все значения в списке.
Чтобы понять его смысл, введём понятие отклонения от среднего.
Отклонение от среднего
Возьмём любой список и:
- найдём его среднее;
- вычтем среднее из каждого значения.
Получившийся список — это список отклонений от среднего.
Пример
Среднее равно 5.
Если число:
- 1 → отклонение −4
- 7 → отклонение +2
Числа ниже среднего дают отрицательные отклонения,
числа выше среднего — положительные.
Важное свойство
Если взять обычное среднее всех отклонений, оно всегда равно 0.
Поэтому стандартное отклонение отвечает на другой вопрос:
Насколько далеко в среднем значения находятся от среднего?
Именно это и есть типичный размер отклонения.
Факты о стандартном отклонении (то, что реально нужно для GMAT)
Факт 1
Стандартное отклонение:
- всегда ≥ 0
- никогда не бывает отрицательным
Это расстояние, а расстояние не может быть отрицательным.
Факт 2
Стандартное отклонение равно 0 только в одном случае:
Если все числа в списке одинаковы.
Пример:
- все значения равны 7
- среднее = 7
- все отклонения = 0
→ стандартное отклонение = 0
Факт 3 (редкий, но важный)
Если все значения находятся на одинаковом расстоянии от среднего,
то это расстояние и есть стандартное отклонение.
Пример:
- среднее = 5
- значения: 2 и 8
- каждое находится на расстоянии 3 от среднего
→ стандартное отклонение = 3
Это может встречаться в самых сложных задачах Quant.
Факт 4 (самый практичный)
Список, где большинство значений далеко от среднего,
имеет большее стандартное отклонение,
чем список, где большинство значений близко к среднему.
При сравнении стандартных отклонений:
- почти никогда не требуется считать формулу;
- достаточно визуального анализа распределения.
Пример:
- если 8 из 10 значений равны среднему → стандартное отклонение маленькое;
- если все значения на краях → стандартное отклонение большое.
Факт 5
Если:
- прибавить одно и то же число ко всем значениям
- или вычесть одно и то же число из всех значений
стандартное отклонение не меняется.
Почему:
- расстояния между значениями сохраняются;
- меняется только положение на числовой прямой.
Сдвиг или отражение не влияет на стандартное отклонение.
Факт 6
Если умножить все значения списка на положительное число k, то:
- среднее умножится на k;
- стандартное отклонение тоже умножится на k.
Причина:
- все расстояния между числами увеличиваются в k раз.
Геометрическая интуиция (очень полезно)
Представь числа как точки на числовой прямой.
- можно сдвигать их вверх и вниз;
- можно отражать относительно оси;
- можно менять знак;
Пока расстояния между точками остаются прежними,
стандартное отклонение не меняется.
Оно измеряет не положение, а расстояния.
Итоговое резюме
- Размах = максимум − минимум
- прост
- малоинформативен
- прост
- Стандартное отклонение показывает,
насколько далеко значения в среднем находятся от среднего
Ключевые свойства стандартного отклонения:
- всегда ≥ 0
- равно 0 только если все значения одинаковы
- одинаковые расстояния от среднего → SD равно этому расстоянию
- больше значений далеко от среднего → больше SD
- добавление или вычитание числа SD не меняет
- умножение всех значений на k → SD умножается на k
Для GMAT и GRE важно понимать поведение стандартного отклонения,
а не уметь вычислять его по формуле.
Материал подготовлен редакцией HighScoreExams — преподавателями GMAT и GRE с личными результатами 700+ и 310+. Сертификат GMAT 750 одного из преподавателей опубликован на странице команды и предоставляется в оригинале на бесплатной консультации.
О команде