Дополнительно о стандартном отклонении

Эта тема является частью раздела о статистике в Quant GMAT Focus.

Это занятие охватывает три более продвинутые идеи про стандартное отклонение. Сразу обозначим: для большинства задач GMAT достаточно базовых фактов из предыдущей главы. То, что ниже, встречается редко и обычно относится к самым сложным вопросам Quant.

Тема 1. Как меняется стандартное отклонение при добавлении новых значений

Предположим, у нас есть набор из 20 значений со следующими сводными характеристиками:

  • среднее = 50

  • стандартное отклонение = 5

Мы добавляем 2 новых значения и получаем 22 значения.

Важная граница того, что можно узнать из «summary statistics»

Если нам известны только:

  • старое среднее

  • старое стандартное отклонение
    и мы добавляем новые точки,

то мы не можем вычислить новое стандартное отклонение точно, потому что:

  • при изменении среднего меняются отклонения всех прежних значений,

  • а исходные 20 чисел нам неизвестны.

Если бы у нас был полный список из 20 значений, то стандартное отклонение можно было бы вычислить, но экзамен не будет требовать такой громоздкой процедуры. Вопросы теста — про понимание направления изменения.

1) Добавили сильные выбросы → SD растёт

Если добавить, например, 80 и 80:

  • это значения очень далеко от прежнего среднего 50,

  • то есть сильные выбросы,

стандартное отклонение увеличится.

2) Удобный случай: добавляем симметричную пару, чтобы среднее не изменилось

Если добавить два числа, которые находятся на одинаковом расстоянии от среднего:

  • одно на K выше среднего,

  • другое на K ниже среднего,

то среднее не меняется.

Это позволяет делать более точные выводы, потому что:

  • отклонения старых 20 значений остаются теми же.

Дальше рассмотрим три типовых ситуации (везде исходно: среднее 50, SD = 5).

Случай A: добавляем числа дальше, чем SD → SD увеличивается

Добавим 40 и 60:

  • 40 на 10 ниже 50

  • 60 на 10 выше 50

Каждое из них на расстоянии 10 от среднего, а SD равна 5.
То есть эти два значения находятся дальше от среднего, чем «типичное расстояние» в исходном наборе.

Вывод: стандартное отклонение увеличится.

Случай B: добавляем числа ровно на расстоянии SD → SD не меняется

Добавим 45 и 55:

  • каждое находится на расстоянии 5 от среднего 50,

  • то есть ровно на 1 стандартное отклонение.

Это особый случай:

  • добавляем новые точки с «типичными» отклонениями,

  • тем самым не изменяем характер разброса.

Вывод: новое стандартное отклонение останется равным 5.

Случай C: добавляем числа ближе, чем SD → SD уменьшается

Добавим 47 и 53:

  • расстояния от среднего равны 3,

  • а SD исходно равна 5.

То есть мы добавляем точки, которые ближе к среднему, чем типичное отклонение.

Вывод: стандартное отклонение уменьшится.

Какая пара сильнее всего уменьшит SD?

Чтобы максимально уменьшить стандартное отклонение, нужно добавить значения с минимальным отклонением от среднего. Минимальное возможное отклонение — 0.

Значит, сильнее всего SD уменьшится, если добавить:

  • 50 и 50

Оба значения совпадают со средним и имеют отклонение 0, то есть добавляют «нули» в список отклонений.

Тема 2. Стандартное отклонение как единица измерения «насколько далеко от среднего»

В больших популяциях (например, результаты тестов по стране) важно понимать не просто «выше среднего» или «ниже среднего», а насколько существенно выше или ниже.

Это зависит от величины стандартного отклонения.

Пример идеи

Если среднее = 50, а значение = 60:

  • Если SD = 20, то 60 — это всего лишь 0.5 SD выше среднего. Это неплохо, но не что-то выдающееся.

  • Если SD = 2, то 60 — это 5 SD выше среднего. Это экстремально редкий результат.

Поэтому позицию часто выражают в виде:

  • «на сколько стандартных отклонений выше/ниже среднего»

Пример задачи

Среднее = 300, стандартное отклонение = 25.
Ученик набрал 3 стандартных отклонения выше среднего. Найдите его результат.

Шаги

  1. 3 SD = 3 × 25 = 75

  2. 300 + 75 = 375

Ответ: 375

Такие задачи выглядят «страшно», но вычисление обычно элементарное.

Тема 3. Что происходит внутри формулы стандартного отклонения (концептуально)

Экзамен не будет просить вычислять SD «с нуля» для произвольного списка, но может спросить идею, связанную с деталями определения.

Логика вычисления SD

  1. Находим среднее списка

  2. Строим список отклонений (каждое значение минус среднее)

  3. Возводим отклонения в квадрат (получаем квадраты отклонений)

  4. Находим среднее квадратов отклонений

    • это называется дисперсия (variance)

  5. Берём квадратный корень из дисперсии

    • это и есть стандартное отклонение

Почему квадрат важен

Когда мы возводим отклонения в квадрат:

  • большие отклонения дают намного больший вклад,

  • то есть выбросы усиливают SD сильнее, чем «пропорционально».

Это объясняет, почему стандартное отклонение так чувствительно к крайним значениям.

Разбор типовой сложной задачи на выбор набора, который сильнее всего увеличит SD

В лагере 30 девочек:

  • средний рост = 130 см

  • SD = 4 см

Приходят ещё 4 девочки. Какой набор ростов сильнее всего увеличит SD?

Как мыслить (без вычислений)

  • SD увеличивается, когда добавляем значения далеко от среднего (выбросы).

  • Добавление значений около среднего уменьшает разброс.

  • Если добавить значения ровно на расстоянии SD от среднего, SD может остаться прежним.

Если в одном варианте все четыре новые величины — сильные выбросы, а в других они рядом со средним, то правильный вариант — с выбросами.

В разборе из текста:

  • вариант, где добавляются значения, находящиеся примерно в 2.5 SD от среднего, даст наибольший рост SD, потому что это сильные выбросы и они резко меняют картину отклонений.

Итоговые выводы

  1. При добавлении новых значений:

  • выбросы далеко от среднего увеличивают SD

  • значения близко к среднему уменьшают SD

  • симметричная пара не меняет среднее, что упрощает анализ:

    • дальше, чем SD → SD растёт

    • ровно на SD → SD не меняется

    • ближе, чем SD → SD уменьшается

    • пара, равная среднему → уменьшает SD сильнее всего

  1. Стандартное отклонение — естественная «единица», чтобы говорить:

  • насколько результат необычен относительно среднего

  1. Внутри формулы SD:

  • используются квадраты отклонений

  • из-за этого большие отклонения (выбросы) влияют непропорционально сильно

На этом раздел статистики мы рассмотрели и можем переходить к комбинаторике.

Материал подготовлен редакцией HighScoreExams — преподавателями GMAT и GRE с личными результатами 700+ и 310+. Сертификат GMAT 750 одного из преподавателей опубликован на странице команды и предоставляется в оригинале на бесплатной консультации.
О команде

Прокрутить вверх