Корреляционный анализ – раздел математической статистики, исследующий зависимости между двумя или более случайными величинами. Термин "Correlation" означает взаимосвязь, взаимоотношение.

Функциональная зависимость и корреляция

Еще Гиппократ обратил внимание на то, что между телосложением и темпераментом людей, между строением их тела и предрасположенностью  к заболеваниям существует определенная взаимосвязь.

В области физической культуры и спорта можно привести много примеров такой взаимосвязи. Например, от уровня силы во многом зависит результат, показанный спортсменом в таких видах спорта, как тяжелая атлетика, пауэрлифтинг, гиревой спорт, метание диска и толкание ядра и т.д.  Результат в беге на 100 м во многом зависит от процента содержания в мышцах спортсменов быстрых мышечных волокон (II типа).  Доказано, что у выдающихся спринтеров этот показатель превышает 80%.  Чтобы определить, насколько сильна взаимосвязь между переменными (признаками) используется корреляционный анализ.

Две случайные величины X и Y могут быть:

  • связаны функциональной зависимостью (жестко, как зависимость переменных в математическом анализе);
  • независимыми;
  • связаны стохастической (вероятностной зависимостью) при которой изменение одной величины влечет изменение распределения другой.

В качестве меры связи между случайными величинами используется коэффициент корреляции. Коэффициент корреляции для генеральной совокупности обозначается ρ. Однако, как правило, он неизвестен. Поэтому он оценивается по экспериментальным данным, представляющим выборку объема n, полученную при совместном измерении двух переменных (признаков) X и Y. Коэффициент корреляции, определяемый по выборочным данным называется выборочным коэффициентом корреляции (или просто коэффициентом корреляции). Его принято обозначать символом r. Наиболее часто в качестве оценок генерального коэффициента корреляции используется коэффициент корреляции Пирсона (r) и коэффициент корреляции Спирмена (rs).

Коэффициент корреляции Пирсона (r)

Условия применения:

  1. Данные представлены в интервальной шкале или шкале отношений.
  2. Распределение экспериментальных данных подчиняется нормальному закону.
  3. Предполагается линейная зависимость между случайными величинами X и Y.

Коэффициент корреляции Спирмена (rS)

Условия применения:

  1. Данные представлены в порядковой, интервальной шкале или шкале отношений.
  2. Любой закон распределения случайных величин X и Y.
  3. Между случайными величинами X и Y существует монотонно-возрастающая или монотонно-убывающая зависимость.

Свойства оценок коэффициентов корреляции

1. r и rs принимают значения от -1 до +1.

2. r =+1 и r = -1 только тогда, когда случайные величины X и Y связаны жесткой линейной зависимостью.

3. Если r ≠ 0, то чем ближе |r| к единице, тем сильнее линейная зависимость случайных величин X и Y.

4. Если r > 0 – положительная корреляция между X и Y.

5. Eсли r < 0 – отрицательная корреляция между X и Y

6. Если r = 0  - корреляции нет; случайные величины X и Y некоррелированы (рис. 1).Корреляционный анализ

Рис. 1. Геометрическая интерпретация коэффициента корреляции

Корреляция считается положительной, если график имеет выраженное направление из левого нижнего угла в правый верхний угол и с увеличением значений одной переменной другая также увеличивается;

Корреляция считается отрицательной, если график имеет направление из левого верхнего угла в правый нижний, и с увеличением одной переменной, другая уменьшается;

Корреляция отсутствует, когда у корреляционного облака нет четко выраженного направления, точки рассеиваются далеко от воображаемой прямой и нельзя сказать, что с увеличением одной переменной другая уменьшается или увеличивается.

Значимость коэффициента корреляции

Очень важно указывать значимость коэффициента корреляции. Например, в эксперименте участвовало 10 человек. Оценивалась взаимосвязь между результатами в беге на 30 м и 100 м. Получен коэффициент корреляции r = 0,611. Чтобы оценить значимость коэффициента корреляции нужно сравнить его с критическим, величина которого зависит от объема выборки и уровня значимости. Если фактическое значение коэффициента корреляции больше, чем критическое, это означает, что коэффициент корреляции достоверен. В нашем случае критическое значение коэффициента корреляции при a = 0,05 составляет r0,05 =0,632. Из этого следует, что рассчитанный коэффициент корреляции статистически недостоверен. Приводить его в своих исследованиях нежелательно.

Таблица 1 - Критические значения коэффициента корреляции Пирсона

n0,050,010,001
30,99690,9998770,99999877
40,9500,99000,9990
50,8780,95970,99114
60,8110,91720,9741
70,7540,8750,9509
80,7070,8340,9244
90,6660,7980,898
100,6320,7650,872
200,4440,5610,679
300,3610,4630,570
400,3120,4020,501
500,2790,3610,451

В итоговой таблице необходимо указать объем выборки, чтобы читающий мог оценить значимость (достоверность) вычисленных коэффициентов корреляции. Иногда в публикациях приводятся только значимые коэффициенты корреляции, а вместо незначимых ставится прочерк. В таблице 4 авторы указали, что объем выборки равен n = 32. Критическое значение коэффициента корреляции при n = 32 и a = 0,05 составляет r0,05 = 0,349 (В.С.Иванов, 1990). Следовательно, все коэффициенты корреляции достоверны.

Таблица 6 - Значения коэффициентов корреляции между результатами в скоростно-силовых тестах и результатом в толкании ядра с разгоном n=32, спортивный результат группы варьировал от 12,00 м до 20,50. (по: Я.Е.Ланка, Ан.А.Шалманов, 1982).

Упражнение

1

2

3

4

5

6

Толкание ядра с разгона

1

0,97

0,84

0,83

0,73

0,73

Толкание ядра с места

1

0,84

0,82

0,74

0,76

Бросок ядра назад

1

0,85

0,71

0,66

Бросок ядра вперед

1

0,66

0,62

Приседание со штангой

1

0,58

Жим штанги лежа

1

Литература

  1. Боровиков В.П., Боровиков И.П. STATISTICA Статистический анализ и обработка данных в среде Windows.– М.: Филинъ, 1995.– 608 с.
  2. Дюк В. Обработка данных на ПК в примерах.– СПб: Питер, 1997.– 240 с.
  3. Ежевская К.А. Особенности динамики показателей скоростных способностей детей 4-6 лет в условиях стандартной тестовой тренировочной программы в детском саду //Теория и практика физической культуры, 1995.– № 3 .–С.15-18.
  4. Жданов Л.Н. Возраст спортивных достижений //Теория и практика физической культуры, 1996.– № 6 .– С. 59-60.
  5. Зациорский В.М. Осторожно: статистика! // Теория и практика физической культуры, 1989.– № 2.– С. 52-55.
  6. Катранов, А.Г. Компьютерная обработка данных экспериментальных исследований / А.Г. Катранов, А.В. Самсонова /Учебное пособие.– СПб: СПбГАФК им. П.Ф. Лесгафта, 2005.– 132 с.
  7. Ланка Я.Е., Шалманов Ан. А. Биомеханика толкания ядра. – М: Физкультура и спорт, 1982.- 72 с.
  8. Лапшина Г.Г. Особенности физического состояния студенток гуманитарного факультета // Теория и практика физической культуры, 1989.–№ 4.– С. 18-20
  9. Марченко В.В., Дворкин Л.С., Рогозян В.Н. Анализ силовой подготовки тяжелоатлета в нескольких макроциклах //Теория и практика физической культуры, 1998.– № 8.– С. 18–22.
  10. Основы математической статистики: Учебное пособие для ин-тов физ. культ./ /Под ред. В.С.Иванова. М.: Физкультура и спорт, 1990.– 176 с.
  11. Тюрин Ю.Н., Макаров А.А. Анализ данных на компьютере.– М.: Финансы и статистика, 1995.– 384 с.