Регрессионный анализ - раздел математической статистики, устанавливающий формы зависимости между случайной величиной Y и значениями одной или нескольких переменных величин, причем значения последних считаются точно заданными.

Такая зависимость обычно определяется некоторой математической моделью (уравнением регрессии).

В области ФКиС регрессионный анализ используется для прогноза результатов (рекордов) на основе математической модели. Однако, когда прогноз распространяется за пределы исследуемых данных интерпретировать результаты необходимо с особой осторожностью.

Второй областью применения регрессионного анализа является вычисление значений признака, который напрямую измерить достаточно трудно.

Самый важный этап регрессионного анализа – выбор подходящей регрессионной модели.

Регрессионная модель – это математическое выражение, связывающее значения зависимой случайной величины Y и значения независимой случайной величины Х.

Существуют различные регрессионные модели:

1.Модели простой регрессии (построены на элементарных математических функциях:

Y=а+bX

Y= exp(a+bX)

Y= aXb

  1. Модель полиномиальной регрессии имеет следующий вид:

Y=b0+b1X+b2X2+…+bnXn

  1. Модель множественной регрессии выражается формулой:

Y= b0+b1X1+b2X2+…bnXn

Приступая к регрессионному анализу, необходимо оценить:

  1. значимость (достоверность) коэффициентов модели.
  2. адекватность модели.

Проверку значимости коэффициентов регрессии осуществляем по критерию Стьюдента. Если p-value < 0,05 – коэффициенты регрессии значимы (достоверны). В статистических пакетах значение p-value выводится рядом с коэффициентами уравнения регрессии.

Для оценки адекватности модели существует несколько критериев:

  • Критерий Фишера
  • Коэффициент детерминации ();
  • Стандартная ошибка предсказания;
  • График «предсказание – наблюдение».

 

КОЭФФИЦИЕНТ ДЕТЕРМИНАЦИИ

R2 (R-squared) - коэффициент детерминации. R2=74,5% показывает, что на 74,5% расчетные параметры модели (то есть сама модель), объясняют зависимость и изменения изучаемого параметра Y от исследуемых факторов -X.

Коэффициент детерминации показывает, какая доля вариации объясняемой переменной учтена в модели и обусловлена влиянием на нее факторов, включенных в модель.

Чем ближе к 100% тем выше адекватность модели. Считается неплохо, когда R2 больше чем 80%, если он меньше 50%, то адекватность модели можно смело ставить под большой вопрос.

 

СТАНДАРТНАЯ ОШИБКА ПРЕДСКАЗАНИЯ

 

Мерой качества приближенного описания реальной зависимости между Y и X является стандартная ошибка предсказания (Standard Error of Est.). Чем ближе наблюдаемые значения к предсказываемым, тем меньше стандартная ошибка предсказания.

 

ЛИТЕРАТУРА

  1. Высшая математика и математическая статистика: учебное пособие для вузов / Под общ. ред. Г. И. Попова. – М. Физическая культура, 2007.– 368 с.
  2. Основы математической статистики: Учебное пособие для ин-тов физ. культ / Под ред. В.С. Иванова. – М.: Физкультура и спорт, 1990. 176 с.