Представление данных корреляционного анализа

Видеоуроки по Statgraphics Учебные пособия по статистике Введение в математическую статистику Генеральная совокупность и выборка Статистические шкалы Эмпирические распределения Числовые характеристики выборки Стандартная ошибка среднего арифметического Представление результатов исследования Точечное и интервальное оценивание числовых характеристик Элементы теории вероятностей Нормальный закон распределения (закон нормального распределения) Критерии проверки статистических гипотез Критерии согласия Условия применения параметрических критериев Обоснование выбора критерия значимости Статистические операции в номинальной шкале Представление данных статистического анализа Корреляционный анализ Представление данных корреляционного анализа Регрессионный анализ Представление результатов регрессионного анализа

Представление данных корреляционного анализа в научных исследованиях

Традиционно данные корреляционного анализа представляются в виде корреляционной матрицы,  табл.1.

Корреляционная матрица (матрица корреляций) – это квадратная таблица, заголовками строк и столбцов которой являются обрабатываемые переменные, а на пересечении строк и столбцов выводятся коэффициенты корреляции для соответствующей пары признаков.

Например, в табл. 1 для пары переменных x1x2, коэффициент корреляции равен 0,8516 (он выделен красным цветом, а переменные — жирным шрифтом).

Корреляционная матрица обладает следующими свойствами:

  1. На главной диагонали находятся коэффициенты корреляции, равные единице.
  2. Матрица симметрична относительно главной диагонали.

Таблица 1 — Корреляционная матрица

x1x2x3x4
x110,85160,44100,7923
x20,851610,44280,6581
x30,44100,442810,2820
x40,79230,65810,28201

После выполнения расчетов в пакете STATGRAPHICS корреляционная матрица выглядит следующим образом (рис.1), на главной диагонали цифра «1» не стоит. Однако в пакете STATGRAPHICS выводится дополнительная информация:

На пересечении пары переменных в ячейке матрицы записываются три значения:

  • Верхнее значение: коэффициент корреляции (r);
  • Среднее (в скобках) – объем выборки (n)
  • Нижнее – значение p-value (это позволяет сразу определить достоверность вычисленного коэффициента корреляции).

По значению  p-value можно сразу определить достоверность вычисленного коэффициента корреляции. Правило такое: если p-value <0,05, то  коэффициент корреляции достоверен.

Корреляционная матрица, полученная после обработки результатов в пакете Statgraphics
Рис.1. Корреляционная матрица, полученная после обработки результатов в пакете Statgraphics

В корреляционной матрице, представленной на рис. 1 достоверны все коэффициента корреляции, кроме коэффициента корреляции, равного 0,2820 (для пары x3x4), потому что p-value равно 0,2914. Это число больше 0,05. Поэтому коэффициент корреляции недостоверен.

Для представления данных корреляционного анализа используется несколько способов.

Первый способ

Значимость коэффициентов корреляции определяется на основе приведенного в заголовке таблицы критического значения коэффициента корреляции (rкрит) при определенном уровне значимости α. Также в заголовке таблицы приведен объем выборки (n). Для читающего таблицу с таким представлением информации ясно, что все коэффициенты корреляции, значения которых больше критического являются значимыми. Так корреляционная матрица представлена в книге Ан. Шалманова и Я. Ланки «Биомеханика толкания ядра».

Таблица 2 — Корреляционная матрица результатов в толкании ядра и скоростно-силовых тестах (n = 32, rкрит= 0,349, α = 0,05)

Упражнение123456
1Толкание ядра с разгона10,970,840,830,730,73
2Толкание ядра с места10,840,820,740,76
3Бросок ядра назад10,850,710,66
4Бросок ядра вперед10,660,62
5Приседание со штангой10,58
6Жим штанги лежа1

Второй способ

Второй способ представления информации характеризуется тем, что в корреляционной матрице оставляются только значимые коэффициенты корреляции. Если коэффициенты корреляции недостоверны, в ячейке ставится прочерк (табл.3). В примечании внизу таблицы указывается, что прочерк  означает недостоверность коэффициента корреляции.

Таблица 3 — Корреляционная матрица результатов  мальчиков-пловцов 13 лет, (n= 13)

Тест12345
1Темп, гр/мин1
2Время проплывания 25 м, с10,9110,6790,859
3Время проплывания 50 м, с

1

0,8610,969
4Время проплывания 100 м, с

1

0,865
5Время проплывания 200 м, с

1

Примечание: «-» — коэффициент корреляции недостоверен, р >0,05

Третий способ

Третий способ представления данных корреляционного анализа наиболее распространен как в Российских научных публикациях, так и в зарубежных. В заголовке таблицы указывается, что это корреляционная матрица, указывается также объем выборки (n).

Значимость коэффициента корреляции обозначается знаком звездочка (*), который ставится над коэффициентом корреляции в правом верхнем углу ячейки.

Правило следующее: одна звездочка (*) ставится при p<0,05; две звездочки (**) ставятся, при p<0,01; три звездочки (***) ставятся при р<0,001. Если у значения коэффициента корреляции нет знака звездочки (*) — это означает, что он недостоверен. В табл.4. показан вариант представления данных третьим способом. Необходимо в примечании под таблицей указать, что означают эти звездочки.

Таблица 4 — Корреляционная матрица результатов мальчиков-пловцов 13 лет, (n= 13)

Тест12345
1Темп, гр/мин10,1350,1670,3710,105
2Время проплывания 25 м, с10,911***0,679*0,859***
3Время проплывания 50 м, с10,861***0,969***
4Время проплывания 100 м, с10,865***
5Время проплывания 200 м, с1

Примечание: * – коэффициент корреляции достоверен, р<0,05; *** – коэффициент корреляции достоверен, р<0,001.

Иногда в исследованиях представление результатов корреляционного анализа выглядит следующим образом (рис. 2)

Корреляционная матрица результатов различных вариантов жима штанги лежа (Penido L.N. et al., 2012)
Рис.2. —  Корреляционная матрица результатов различных вариантов жима штанги лежа (Penido L.N. et al., 2012)

В этом случае авторы разместили коэффициенты корреляции слева-внизу, опустили нули в записи коэффициентов корреляции и не проставили цифру 1 на главной диагонали. Однако внизу под таблицей указали, что означают звездочки. Все это допускается при записи корреляционной матрицы.

Литература

  1. Катранов А.Г. Компьютерная обработка данных экспериментальных исследований: Учебное пособие/ А. Г. Катранов, А. В. Самсонова; СПб ГУФК им. П.Ф. Лесгафта. – СПб.: изд-во СПб ГУФК им. П.Ф. Лесгафта, 2005. – 131 с.
  1. Учебные пособия по статистике
  2. Видеоуроки по Statgraphics
  3. Введение в математическую статистику
  4. Генеральная совокупность и выборка
  5. Статистические шкалы
  6. Эмпирические распределения
  7. Числовые характеристики выборки
  8. Стандартная ошибка среднего арифметического
  9. Представление результатов исследования
  10. Точечное и интервальное оценивание числовых характеристик
  11. Элементы теории вероятностей
  12. Нормальный закон распределения (закон нормального распределения)
  13. Критерии проверки статистических гипотез
  14. Критерии согласия
  15. Условия применения параметрических критериев
  16. Обоснование выбора критерия значимости
  17. Статистические операции в номинальной шкале
  18. Представление данных статистического анализа
  19. Корреляционный анализ
  20. Представление данных корреляционного анализа
  21. Регрессионный анализ
  22. Представление результатов регрессионного анализа