Введение в математическую статистику
Исследователям, работающим в области физической культуры и спорта, знание основ математической статистики необходимо прежде всего потому, что полноценное научное исследование невозможно без статистической обработки экспериментальных данных и грамотного представления их в научной публикации (статье, дипломной работе, магистерской, кандидатской или докторской диссертации).
Кроме того, в большинстве научных публикаций представлены не исходные данные, полученные в результате проведения эксперимента, а результаты, подвергнутые статистической обработке. Поэтому без знания основ статистики невозможно понять смысл написанного.
Современные статистические программные пакеты: STATGRAPHICS, STADIA, STATISTICA и др. позволяют выполнить сложнейшую обработку результатов эксперимента. Обширная литература помогает освоить работу с ними самостоятельно. Однако и в этом случае знание основ математической статистики необходимо, так как непонимание сути статистического метода не позволит автору сделать правильные выводы.
Итак, начнем с некоторых определений.
Математическая статистика — раздел математики, посвященный методам сбора, организации, анализа и обработки статистических данных для научных и практических целей.
Статистические данные (эмпирические данные) — данные, полученные в результате обследования большого числа объектов или явлений. Поэтому можно сказать, что математическая статистика имеет дело с массовыми явлениями.
Математическая статистика может быть разделена на два больших раздела: описательную статистику и аналитическую статистику.
Описательная статистика описывает полученные данные, суммирует и представляет статистические данные в форме таблиц и графиков.
Аналитическая статистика (теория статистических выводов) позволяет делать предположения по выборочным данным о параметрах генеральной совокупности.
Признак – свойство исследуемого объекта, которое позволяет сравнивать и классифицировать объекты.
Генеральная совокупность – совокупность всех значений признака, которая может быть получена при его измерении (исследовании).
Есть немного другое определение генеральной совокупности.
Генеральная совокупность – множество однородных, но индивидуально различимых объектов, имеющих хотя бы один общий признак, позволяющий их классифицировать, сравнивать друг с другом. Например, общим признаком корзины яблок является их масса. Каждое яблоко будет характеризоваться индивидуальным значением массы. Если мы измерим массу каждого яблока в корзине, мы получим совокупность всех значений признака, которая может быть получена при его измерении.
Выборка – часть генеральной совокупности, выбранная для исследования. Продолжая наш пример, корзина яблок – это выборка из всех яблок сада.
Объем выборки (n) – количество результатов измерений, взятых для исследования. Продолжая наш пример объем выборки – это количество яблок в корзине.
Чтобы по выборке можно было судить о генеральной совокупности должны выполняться следующие условия:
- выборка должна быть репрезентативной (представительной). Это обеспечивается в тех ситуациях, когда выборка является случайной, то есть любой объект имеет одинаковую вероятность попасть в выборку.
- выборка должна быть однородной, то есть получена из одной генеральной совокупности (например, результаты спортсменов одного возраста, квалификации, специализации).
Числовые характеристики случайной величины (выборки) – обобщенные показатели, позволяющие:
- дать количественную оценку эмпирическим распределениям;
- сравнивать выборки между собой.
Статистической гипотезой (гипотезой) называется утверждение относительно истинных значений параметров исследуемой генеральной совокупности.
Нулевая гипотеза (Но) – предположение о том, что между параметрами генеральных совокупностей разница равна нулю и различия между ними носят не систематический, а случайный характер.
Альтернативная гипотеза (Н1) – гипотеза, противоположная нулевой.
Уровень значимости — вероятность отклонения нулевой гипотезы, когда она верна или другими словами вероятность ошибки.
Критерий — метод проверки статистических гипотез.
Критерий хи-квадрат, критерий лямбда Колмогорова–Смирнова – критерии согласия, часто используемые для проверки гипотезы о нормальности распределения.
t – критерий Стьюдента – критерий, позволяющий оценить, насколько статистически существенно различаются средние арифметические двух выборок.
F – критерий Фишера – метод, позволяющий проверить гипотезу, что две независимые выборки получены из генеральных совокупностей X и Y с одинаковыми дисперсиями sx2 и sY2 .
Критерий Манна-Уитни — непарамтерический критерий проверки статистических гипотез. Применяется для независимых выборок.
Критерий Вилкоксона – непараметрический критерий проверки статистических гипотез. Применяется для связанных выборок.
Корреляционный анализ – метод статистической обработки результатов, сущность которого состоит в определении степени взаимосвязи между двумя случайными величинами X и Y.
Более подробное эта тема рассмотрена в литературе, ссылки на которую приведены ниже.
ЛИТЕРАТУРА
- Высшая математика и математическая статистика: учебное пособие для вузов / Под общ. ред. Г. И. Попова. – М. Физическая культура, 2007.– 368 с.
- Катранов А.Г. Компьютерная обработка данных экспериментальных исследований: Учебное пособие/ А. Г. Катранов, А. В. Самсонова; СПб ГУФК им. П.Ф. Лесгафта. – СПб.: изд-во СПб ГУФК им. П.Ф. Лесгафта, 2005. – 131 с.
- Основы математической статистики: Учебное пособие для ин-тов физ. культ / Под ред. В.С. Иванова.– М.: Физкультура и спорт, 1990. 176 с.