Расширенные варианты диаграмм рассеяния в Data Insights

Эта тема является частью раздела Data Insights в GMAT Focus.

GMAT в разделе Data Insights часто усложняет scatterplot, добавляя второй или третий слой информации. Ниже — основные варианты, которые нужно уверенно распознавать и интерпретировать.

1) Scatterplot с разными цветами (группы объектов)

В этом варианте цвет точки (или форма) указывает на принадлежность к группе.

Пример логики:

  • тёмные точки — объекты, основанные до 1970;

     

  • светлые точки — объекты, основанные после 1980.

     

Что проверяет GMAT:

  • видите ли вы, что у разных групп разные паттерны;

     

  • можете ли сравнить корреляции внутри каждой группы, а не «в среднем по больнице».

     

Важно:

  • всегда смотрите легенду (key);

     

  • один и тот же тренд может быть положительным для одной группы и отрицательным или отсутствовать для другой.

     

2) Scatterplot с двумя вертикальными шкалами (dual-axis)

Здесь используются две оси Y — левая и правая — с разными шкалами.
Обычно каждый объект представлен двумя маркерами:

  • один маркер читается по левой шкале,

     

  • второй — по правой шкале,

     

  • оба расположены над одним и тем же значением X.

     

Типичный пример:

  • X — колледжи (каждый колледж = вертикальная линия),

     

  • левая шкала — доход от обучения (tuition income),

     

  • правая шкала — инвестиционный доход (investment income).

     

Как читать:

  • круг (например, зелёный) → читается по левой шкале;

     

  • точка (чёрная) → читается по правой шкале;

     

  • вертикальное расстояние между ними не имеет значения само по себе — важно, какой шкалой читать каждый символ.

     

Типовые вопросы:

  • есть ли корреляция между показателями?

     

  • у каких объектов высокий один показатель и низкий другой?

     

  • положительная или отрицательная зависимость?

     

3) Bubble chart (scatterplot с «пузырями»)

Это scatterplot, где:

  • X и Y — как обычно;

     

  • размер круга кодирует третью переменную.

     

Как интерпретировать:

  • центр круга → значения X и Y;

     

  • площадь круга → величина третьего показателя (например, число сотрудников).

     

Что это даёт:

  • те же данные по X и Y,

     

  • плюс более глубокий сюжет, когда учитывается масштаб объекта.

     

Типичные ловушки:

  • не путать радиус и площадь (GMAT ожидает качественную интерпретацию, а не вычисления);

     

  • сравнивать размеры приблизительно, а не «на глаз с точностью до миллиметра».

     

Пример анализа (dual-axis)

Вопрос:

Как связаны доход от обучения и инвестиционный доход?

Подход:

  • смотрим общий тренд при движении по X;

     

  • если при росте tuition income инвестиционный доход падает — это отрицательная корреляция.

     

Важно помнить:

  • корреляция — это тенденция по всей выборке, а не правило для каждого отдельного объекта.

     

Ключевые правила для сложных scatterplots

  1. Сначала определите, сколько переменных показано

     

    • 2 переменные → обычный scatterplot;

       

      • цвет/форма → группировка;

         

      • размер круга → третья переменная;

         

      • две шкалы Y → dual-axis.

         

  2. Всегда читайте легенду

     

    • без неё невозможно понять, что кодирует цвет/форма/размер.

       

  3. Не сравнивайте «не то с тем»

     

    • маркеры с разными шкалами читаются по своим осям;

       

    • размер круга — отдельная переменная, не путайте её с Y.

       

  4. Ищите тренд, а не исключения

     

    • GMAT не интересуют частные случаи;

       

    • важна общая картина.

       

Итог

Расширенные scatterplots в Data Insights проверяют умение:

  • удерживать несколько переменных одновременно,

     

  • корректно читать легенды и шкалы,

     

  • видеть корреляции внутри групп,

     

  • извлекать смысл, а не выполнять вычисления.

Далее нас ждет практическое задание.

Материал подготовлен редакцией HighScoreExams — преподавателями GMAT и GRE с личными результатами 700+ и 310+. Сертификат GMAT 750 одного из преподавателей опубликован на странице команды и предоставляется в оригинале на бесплатной консультации.
О команде

Прокрутить вверх