Расширенные варианты диаграмм рассеяния в Data Insights
Эта тема является частью раздела Data Insights в GMAT Focus.
GMAT в разделе Data Insights часто усложняет scatterplot, добавляя второй или третий слой информации. Ниже — основные варианты, которые нужно уверенно распознавать и интерпретировать.

1) Scatterplot с разными цветами (группы объектов)
В этом варианте цвет точки (или форма) указывает на принадлежность к группе.
Пример логики:
- тёмные точки — объекты, основанные до 1970;
- светлые точки — объекты, основанные после 1980.
Что проверяет GMAT:
- видите ли вы, что у разных групп разные паттерны;
- можете ли сравнить корреляции внутри каждой группы, а не «в среднем по больнице».
Важно:
- всегда смотрите легенду (key);
- один и тот же тренд может быть положительным для одной группы и отрицательным или отсутствовать для другой.
2) Scatterplot с двумя вертикальными шкалами (dual-axis)
Здесь используются две оси Y — левая и правая — с разными шкалами.
Обычно каждый объект представлен двумя маркерами:
- один маркер читается по левой шкале,
- второй — по правой шкале,
- оба расположены над одним и тем же значением X.
Типичный пример:
- X — колледжи (каждый колледж = вертикальная линия),
- левая шкала — доход от обучения (tuition income),
- правая шкала — инвестиционный доход (investment income).
Как читать:
- круг (например, зелёный) → читается по левой шкале;
- точка (чёрная) → читается по правой шкале;
- вертикальное расстояние между ними не имеет значения само по себе — важно, какой шкалой читать каждый символ.
Типовые вопросы:
- есть ли корреляция между показателями?
- у каких объектов высокий один показатель и низкий другой?
- положительная или отрицательная зависимость?
3) Bubble chart (scatterplot с «пузырями»)
Это scatterplot, где:
- X и Y — как обычно;
- размер круга кодирует третью переменную.
Как интерпретировать:
- центр круга → значения X и Y;
- площадь круга → величина третьего показателя (например, число сотрудников).
Что это даёт:
- те же данные по X и Y,
- плюс более глубокий сюжет, когда учитывается масштаб объекта.
Типичные ловушки:
- не путать радиус и площадь (GMAT ожидает качественную интерпретацию, а не вычисления);
- сравнивать размеры приблизительно, а не «на глаз с точностью до миллиметра».
Пример анализа (dual-axis)
Вопрос:
Как связаны доход от обучения и инвестиционный доход?
Подход:
- смотрим общий тренд при движении по X;
- если при росте tuition income инвестиционный доход падает — это отрицательная корреляция.
Важно помнить:
- корреляция — это тенденция по всей выборке, а не правило для каждого отдельного объекта.
Ключевые правила для сложных scatterplots
- Сначала определите, сколько переменных показано
- 2 переменные → обычный scatterplot;
- цвет/форма → группировка;
- размер круга → третья переменная;
- две шкалы Y → dual-axis.
- цвет/форма → группировка;
- 2 переменные → обычный scatterplot;
- Всегда читайте легенду
- без неё невозможно понять, что кодирует цвет/форма/размер.
- без неё невозможно понять, что кодирует цвет/форма/размер.
- Не сравнивайте «не то с тем»
- маркеры с разными шкалами читаются по своим осям;
- размер круга — отдельная переменная, не путайте её с Y.
- маркеры с разными шкалами читаются по своим осям;
- Ищите тренд, а не исключения
- GMAT не интересуют частные случаи;
- важна общая картина.
- GMAT не интересуют частные случаи;
Итог
Расширенные scatterplots в Data Insights проверяют умение:
- удерживать несколько переменных одновременно,
- корректно читать легенды и шкалы,
- видеть корреляции внутри групп,
- извлекать смысл, а не выполнять вычисления.
Материал подготовлен редакцией HighScoreExams — преподавателями GMAT и GRE с личными результатами 700+ и 310+. Сертификат GMAT 750 одного из преподавателей опубликован на странице команды и предоставляется в оригинале на бесплатной консультации.
О команде