Статистические операции в номинальной шкале
Определения
Номинальная шкала — качественная шкала. Относится к самому элементарному типу измерения. В ней каждому оцениваемому объекту приписывается наименование или число.
Для области физической культуры и спорта использование номинальной шкалы очень важно, так как очень часто используется метод анкетного опроса. При этом результаты представлены в виде таблицы, в которой представлена абсолютная частота ответов на тот или иной вопрос.
Для выполнения статистических операций с данными, представленными в номинальной шкале используются таблицы сопряженности.
Таблица сопряжённости (RxC)— это форма представления данных об объектах исследования на основе группировки двух или более признаков по принципу их сочетаемости. R (Row) – строка, C (Column)- ряд.
Пример таблицы сопряженности представлен в табл.1.
Таблица 1 Частота упоминания силовых упражнений в специальной литературе и ИНТЕРНЕТ-сайтах
Упражнение | Вид рекомендации | Тип источника | Всего | |
книга | сайт | |||
Приседание со штангой на плечах | рекомендуется | 47 | 26 | 73 |
не рекомендуется | 5 | 4 | 9 | |
Всего | 52 | 30 | 82 |
На пересечении строки и столбца указывается фактическая (наблюдаемая) частота их совместного появления fн.
Для проверки статистических гипотез с данными, представленными в номинальной шкале, применяются следующие критерии.
Если сравниваются независимые выборки:
- критерий хи-квадрат (chi-square test);
- критерий хи-квадрат с поправкой Йетса (Chi-square with Yates’ correction);
- Точный критерий Фишера (Fisher’s exact test).
Если сравниваются связанные выборки то используются:
- Критерий МакНемара (McNemar)
- Критерий φ* – угловое преобразование Фишера
Теперь разберем эти критерии более подробно
Критерий хи-квадрат (независимые выборки)
Предложен Карлом Пирсоном в 1904 году для анализа таблиц сопряжённости. Позволяет сравнивать наблюдаемые (fн) и теоретические (fт) (ожидаемые) частоты.
Условия применения:
- Независимость выборок (критерий нельзя применять для исследований типа «до-после»);
- Объем каждой выборки должен быть больше 30
- Доля ячеек, в которых значения теоретических частот ≤ 5 должна составлять не более 20%.
- Для расчета критерия используются только абсолютные значения наблюдаемых (фактических) и теоретических частот (проценты и доли для расчетов не используются !)
Критерий хи-квадрат с поправкой Йетса (независимые выборки)
Распределение (хи–квадрат) относится к числу непрерывных распределений, в то время, как распределение частот всегда дискретно. Отсюда следует, что применение критерия при сравнении фактических и ожидаемых частот дает только приближенные результаты. Для уменьшения числа искажений в случаях с малыми выборками для критерия вводится поправка Ф. Йетса на непрерывность.
Точный критерий Фишера (независимые выборки)
Предложен Рональдом Фишером для анализа таблиц сопряжённости в 1922 году. В основе критерия Фишера используются перестановки, то есть перебор всех вариантов заполнения таблицы. Критерий Фишера показывает точное значение вероятности, а хи-квадрат – ее приближенное значение.
Условия применения:
- Независимость групп (критерий нельзя применять для исследований типа «до-после»);
- Применяется для выборок небольшого объема (объем выборки не более 100);
- Применяется для таблиц сопряженности 2х2.
Критерий МакНемара (связанные выборки)
Предложен американским психологом и статистиком Куином МакНемаром в 1947 году.
Условия применения:
- Выборки связанные
- Признаки, представленные в номинальной шкале, имеют только две категории: «да-нет», «успех-неуспех» «выполнено-не выполнено»;
- Каждый участник представлен в ячейке таблицы только один раз.
- Абсолютные частоты в ячейках, в которых происходит изменение, не должны быть равными (b ≠ c).
На сайте «Медицинская статистика есть калькулятор для расчета критерия МакНеймара. http://medstatistic.ru/calculators/calcmac.html
Критерий Φ* – угловое преобразование Фишера (независимые и связанные выборки)
Многофункциональный критерий, который дает возможность сравнения двух выборок по частоте встречаемости интересующего исследователя эффекта. Позволяет исследовать независимые и связанные выборки. Может быть использован как при малых выборках (n=5), так и при больших выборках. Для оценки достоверности различий двух выборок необходимо перевести доли в значения центрального угла. Идея состоит в том, что чем больше процентная доля, тем больший угол φ* ей будет соответствовать.
Программа расчета углового преобразования Фишера. Programma-rascheta-kriterija-fi.xlsx .
Все вышеописанные критерии (кроме критерия МакНемара и углового преобразования Фишера) имеются в статистическом пакете Statgraphics.
Более подробная информация представлена в учебных пособиях, ссылки на которые даны ниже.
Литература
- Барникова, И.Э. Информационные технологии в обработке анкетных данных в педагогике и биомеханике спорта: учеб. пособие / И.Э. Барникова; А.В. Самсонова; Национальный государственный университет физической культуры, спорта и здоровья им. П.Ф. Лесгафта, Санкт–Петербург. – СПб.: [Б.и.], 2017. – 103 с.
- Высшая математика и математическая статистика: учебное пособие для вузов / Под общ. ред. Г. И. Попова. – М. Физическая культура, 2007.– 368 с.