Представление данных корреляционного анализа в научных исследованиях

Традиционно данные корреляционного анализа представляются в виде корреляционной матрицы,  табл.1.

Корреляционная матрица (матрица корреляций) – это квадратная таблица, заголовками строк и столбцов которой являются обрабатываемые переменные, а на пересечении строк и столбцов выводятся коэффициенты корреляции для соответствующей пары признаков.

Например, в табл. 1 для пары переменных x1x2, коэффициент корреляции равен 0,8516 (он выделен красным цветом, а переменные — жирным шрифтом).

Корреляционная матрица обладает следующими свойствами:

  1. На главной диагонали находятся коэффициенты корреляции, равные единице.
  2. Матрица симметрична относительно главной диагонали.

Таблица 1 — Корреляционная матрица

x1x2x3x4
x110,85160,44100,7923
x20,851610,44280,6581
x30,44100,442810,2820
x40,79230,65810,28201

После выполнения расчетов в пакете STATGRAPHICS корреляционная матрица выглядит следующим образом (рис.1), на главной диагонали цифра «1» не стоит. Однако в пакете STATGRAPHICS выводится дополнительная информация:

На пересечении пары переменных в ячейке матрицы записываются три значения:

  • Верхнее значение: коэффициент корреляции (r);
  • Среднее (в скобках) – объем выборки (n)
  • Нижнее – значение p-value (это позволяет сразу определить достоверность вычисленного коэффициента корреляции).

По значению  p-value можно сразу определить достоверность вычисленного коэффициента корреляции. Правило такое: если p-value <0,05, то  коэффициент корреляции достоверен.

Корреляционная матрица, полученная после обработки результатов в пакете Statgraphics
Рис.1. Корреляционная матрица, полученная после обработки результатов в пакете Statgraphics

В корреляционной матрице, представленной на рис. 1 достоверны все коэффициента корреляции, кроме коэффициента корреляции, равного 0,2820 (для пары x3x4), потому что p-value равно 0,2914. Это число больше 0,05. Поэтому коэффициент корреляции недостоверен.

Для представления данных корреляционного анализа используется несколько способов.

Первый способ

Значимость коэффициентов корреляции определяется на основе приведенного в заголовке таблицы критического значения коэффициента корреляции (rкрит) при определенном уровне значимости α. Также в заголовке таблицы приведен объем выборки (n). Для читающего таблицу с таким представлением информации ясно, что все коэффициенты корреляции, значения которых больше критического являются значимыми. Так корреляционная матрица представлена в книге Ан. Шалманова и Я. Ланки «Биомеханика толкания ядра».

Таблица 2 — Корреляционная матрица результатов в толкании ядра и скоростно-силовых тестах (n = 32, rкрит= 0,349, α = 0,05)

Упражнение123456
1Толкание ядра с разгона10,970,840,830,730,73
2Толкание ядра с места10,840,820,740,76
3Бросок ядра назад10,850,710,66
4Бросок ядра вперед10,660,62
5Приседание со штангой10,58
6Жим штанги лежа1

Второй способ

Второй способ представления информации характеризуется тем, что в корреляционной матрице оставляются только значимые коэффициенты корреляции. Если коэффициенты корреляции недостоверны, в ячейке ставится прочерк (табл.3). В примечании внизу таблицы указывается, что прочерк  означает недостоверность коэффициента корреляции.

Таблица 3 — Корреляционная матрица результатов  мальчиков-пловцов 13 лет, (n= 13)

Тест12345
1Темп, гр/мин1
2Время проплывания 25 м, с10,9110,6790,859
3Время проплывания 50 м, с

1

0,8610,969
4Время проплывания 100 м, с

1

0,865
5Время проплывания 200 м, с

1

Примечание: «-» — коэффициент корреляции недостоверен, р >0,05

Третий способ

Третий способ представления данных корреляционного анализа наиболее распространен как в Российских научных публикациях, так и в зарубежных. В заголовке таблицы указывается, что это корреляционная матрица, указывается также объем выборки (n).

Значимость коэффициента корреляции обозначается знаком звездочка (*), который ставится над коэффициентом корреляции в правом верхнем углу ячейки.

Правило следующее: одна звездочка (*) ставится при p<0,05; две звездочки (**) ставятся, при p<0,01; три звездочки (***) ставятся при р<0,001. Если у значения коэффициента корреляции нет знака звездочки (*) — это означает, что он недостоверен. В табл.4. показан вариант представления данных третьим способом. Необходимо в примечании под таблицей указать, что означают эти звездочки.

Таблица 4 — Корреляционная матрица результатов мальчиков-пловцов 13 лет, (n= 13)

Тест12345
1Темп, гр/мин10,1350,1670,3710,105
2Время проплывания 25 м, с10,911***0,679*0,859***
3Время проплывания 50 м, с10,861***0,969***
4Время проплывания 100 м, с10,865***
5Время проплывания 200 м, с1

Примечание: * – коэффициент корреляции достоверен, р<0,05; *** – коэффициент корреляции достоверен, р<0,001.

Иногда в исследованиях представление результатов корреляционного анализа выглядит следующим образом (рис. 2)

 

Корреляционная матрица результатов различных вариантов жима штанги лежа (Penido L.N. et al., 2012)
Рис.2. —  Корреляционная матрица результатов различных вариантов жима штанги лежа (Penido L.N. et al., 2012)

В этом случае авторы разместили коэффициенты корреляции слева-внизу, опустили нули в записи коэффициентов корреляции и не проставили цифру 1 на главной диагонали. Однако внизу под таблицей указали, что означают звездочки. Все это допускается при записи корреляционной матрицы.

Литература

  1. Катранов А.Г. Компьютерная обработка данных экспериментальных исследований: Учебное пособие/ А. Г. Катранов, А. В. Самсонова; СПб ГУФК им. П.Ф. Лесгафта. – СПб.: изд-во СПб ГУФК им. П.Ф. Лесгафта, 2005. – 131 с.