Регрессионный анализ
Определение
Регрессионный анализ — раздел математической статистики, устанавливающий формы зависимости между случайной величиной Y и значениями одной или нескольких переменных величин, причем значения последних считаются точно заданными.
Такая зависимость обычно определяется некоторой математической моделью (уравнением регрессии).
Использование в области физической культуры и спорта
В области ФКиС регрессионный анализ используется для прогноза результатов (рекордов) на основе математической модели. Однако, когда прогноз распространяется за пределы исследуемых данных интерпретировать результаты необходимо с особой осторожностью.
Второй областью применения регрессионного анализа является вычисление значений признака, который напрямую измерить достаточно трудно.
Регрессионная модель
Самый важный этап регрессионного анализа – выбор подходящей регрессионной модели.
Регрессионная модель – это математическое выражение, связывающее значения зависимой случайной величины Y и значения независимой случайной величины Х.
Существуют различные регрессионные модели:
1.Модели простой регрессии (построены на элементарных математических функциях):
Y=а+bX
Y= exp(a+bX)
Y= aXb
- Модель полиномиальной регрессии имеет следующий вид:
Y=b0+b1X+b2X2+…+bnXn
- Модель множественной регрессии выражается формулой:
Y= b0+b1X1+b2X2+…bnXn
Последовательность регрессионного анализа
Приступая к регрессионному анализу, необходимо оценить:
- значимость (достоверность) коэффициентов модели.
- адекватность модели.
Проверку значимости коэффициентов регрессии осуществляем по критерию Стьюдента. Если p-value < 0,05 – коэффициенты регрессии значимы (достоверны). В статистических пакетах значение p-value выводится рядом с коэффициентами уравнения регрессии.
Адекватность регрессионной модели
Для оценки адекватности модели существует несколько критериев:
- Критерий Фишера
- Коэффициент детерминации (R2 );
- Стандартная ошибка предсказания;
- График «предсказание – наблюдение».
Коэффициент детерминации
R2 (R-squared) — коэффициент детерминации. R2=74,5% показывает, что на 74,5% расчетные параметры модели (то есть сама модель), объясняют зависимость и изменения изучаемого параметра Y от исследуемых факторов -X.
Коэффициент детерминации показывает, какая доля вариации объясняемой переменной учтена в модели и обусловлена влиянием на нее факторов, включенных в модель.
Чем ближе к 100% тем выше адекватность модели. Считается неплохо, когда R2 больше чем 80%, если он меньше 50%, то адекватность модели можно смело ставить под большой вопрос.
Стандартная ошибка предсказания
Мерой качества приближенного описания реальной зависимости между Y и X является стандартная ошибка предсказания (Standard Error of Est.). Чем ближе наблюдаемые значения к предсказываемым, тем меньше стандартная ошибка предсказания.
Литература
- Высшая математика и математическая статистика: учебное пособие для вузов / Под общ. ред. Г. И. Попова. – М. Физическая культура, 2007.– 368 с.
- Основы математической статистики: Учебное пособие для ин-тов физ. культ / Под ред. В.С. Иванова. – М.: Физкультура и спорт, 1990. 176 с.