Введение в математическую статистику

Исследователям, работающим в области физической культуры и спорта, знание основ математической статистики необходимо прежде всего потому, что полноценное научное исследование невозможно без статистической обработки экспериментальных данных и грамотного представления их в научной публикации (статье, дипломной работе, магистерской, кандидатской или докторской диссертации).

Кроме того, в большинстве научных публикаций представлены не исходные данные, полученные в результате проведения эксперимента, а результаты, подвергнутые статистической обработке. Поэтому без знания основ статистики невозможно понять смысл написанного.

Современные статистические программные пакеты: STATGRAPHICS, STADIA, STATISTICA и др. позволяют выполнить сложнейшую обработку результатов эксперимента. Обширная литература помогает освоить работу с ними самостоятельно. Однако и в этом случае знание основ математической статистики необходимо, так как непонимание сути статистического метода не позволит автору сделать правильные выводы.

Итак, начнем с некоторых определений.

Математическая статистика — раздел математики, посвященный методам сбора, организации, анализа и обработки статистических данных для научных и практических целей.

Статистические данные (эмпирические данные) — данные, полученные в результате обследования большого числа объектов или явлений. Поэтому можно сказать, что математическая статистика имеет дело с массовыми явлениями.

Математическая статистика может быть разделена на два больших раздела: описательную статистику и аналитическую статистику.

Описательная статистика описывает полученные данные, суммирует и представляет статистические данные в форме таблиц и графиков. 

Аналитическая статистика (теория статистических выводов) позволяет делать предположения по выборочным данным о параметрах генеральной совокупности.

Признак – свойство исследуемого объекта, которое позволяет сравнивать и классифицировать объекты.

Генеральная совокупность – совокупность всех значений признака, которая может быть получена при его измерении (исследовании).

Есть немного другое определение генеральной совокупности.

Генеральная совокупность – множество однородных, но индивидуально различимых объектов, имеющих хотя бы один общий признак, позволяющий их классифицировать, сравнивать друг с другом. Например, общим признаком корзины яблок является их масса. Каждое яблоко будет характеризоваться индивидуальным значением массы. Если мы измерим массу каждого яблока в корзине, мы получим совокупность всех значений признака, которая может быть получена при его измерении.

Выборка – часть генеральной совокупности, выбранная для исследования. Продолжая наш пример, корзина яблок – это выборка из всех яблок сада.

Объем выборки (n) – количество результатов измерений, взятых для исследования. Продолжая наш пример объем выборки – это количество яблок в корзине.

Чтобы по выборке можно было судить о генеральной совокупности должны выполняться следующие условия:

  • выборка должна быть репрезентативной (представительной). Это обеспечивается в тех ситуациях, когда выборка является случайной, то есть любой объект имеет одинаковую вероятность попасть в выборку.
  • выборка должна быть однородной, то есть получена из одной генеральной совокупности (например, результаты спортсменов одного возраста, квалификации, специализации).

Числовые характеристики случайной величины (выборки) – обобщенные показатели, позволяющие:

  • дать количественную оценку эмпирическим распределениям;
  • сравнивать выборки между собой.

Статистической гипотезой (гипотезой) называется утверждение относительно истинных значений параметров исследуемой генеральной совокупности.

Нулевая гипотеза (Но) – предположение о том, что между параметрами генеральных совокупностей  разница равна нулю и различия между ними носят не систематический, а случайный характер.

Альтернативная гипотеза (Н1) – гипотеза, противоположная нулевой.

Уровень значимости  —  вероятность отклонения  нулевой гипотезы, когда она верна или другими словами вероятность ошибки.

Критерий — метод проверки статистических гипотез.

Критерий хи-квадрат, критерий лямбда Колмогорова–Смирнова – критерии согласия, часто используемые для проверки гипотезы о нормальности распределения.

t – критерий Стьюдента – критерий, позволяющий оценить, насколько статистически существенно различаются средние арифметические двух выборок.

F – критерий Фишера – метод, позволяющий проверить гипотезу, что две независимые выборки получены из генеральных совокупностей X и Y  с одинаковыми дисперсиями sx2 и sY2 .

Критерий Манна-Уитни — непарамтерический критерий проверки статистических гипотез.  Применяется для независимых выборок.

Критерий Вилкоксона – непараметрический критерий проверки статистических гипотез. Применяется для связанных выборок.

Корреляционный анализ метод статистической обработки результатов, сущность которого состоит в определении степени взаимосвязи между двумя случайными величинами X  и Y.

Более подробное эта тема рассмотрена в литературе, ссылки на которую приведены ниже.

ЛИТЕРАТУРА

  1. Высшая математика и математическая статистика: учебное пособие для вузов / Под общ. ред. Г. И. Попова. – М. Физическая культура, 2007.– 368 с.
  2. Катранов А.Г. Компьютерная обработка данных экспериментальных исследований: Учебное пособие/ А. Г. Катранов, А. В. Самсонова; СПб ГУФК им. П.Ф. Лесгафта. – СПб.: изд-во СПб ГУФК им. П.Ф. Лесгафта, 2005. – 131 с.
  3. Основы математической статистики: Учебное пособие для ин-тов физ. культ / Под ред. В.С. Иванова.– М.: Физкультура и спорт, 1990. 176 с.