Статистические операции в номинальной шкале

Определения

Номинальная шкала — качественная шкала. Относится к самому элементарному типу измерения. В ней каждому оцениваемому объекту приписывается наименование или число.

Для области физической культуры и спорта использование номинальной шкалы очень важно, так как очень часто используется метод анкетного опроса. При этом результаты представлены в виде таблицы, в которой представлена абсолютная частота ответов на тот или иной вопрос.

Для выполнения статистических операций с данными, представленными в номинальной шкале используются таблицы сопряженности.

Таблица сопряжённости (RxC)— это форма представления данных об объектах исследования на основе группировки двух или более признаков по принципу их сочетаемости. R (Row) – строка, C (Column)- ряд.

Пример таблицы сопряженности представлен в табл.1.

Таблица 1 Частота упоминания силовых упражнений в специальной литературе и ИНТЕРНЕТ-сайтах

УпражнениеВид рекомендации

Тип источника

Всего
книгасайт
Приседание со штангой на плечахрекомендуется472673
не рекомендуется549
Всего523082

На пересечении строки и столбца указывается фактическая (наблюдаемая) частота их совместного появления fн.

Для проверки статистических гипотез с данными, представленными в номинальной шкале, применяются следующие критерии.

Если сравниваются независимые выборки:

  • критерий хи-квадрат (chi-square test);
  • критерий хи-квадрат с поправкой Йетса (Chi-square with Yates’ correction);
  • Точный критерий Фишера (Fisher’s exact test).

Если сравниваются связанные выборки то используются:

  • Критерий МакНемара (McNemar)
  • Критерий φ* – угловое преобразование Фишера

Теперь разберем эти критерии более подробно

Критерий хи-квадрат (независимые выборки)

Предложен Карлом Пирсоном в 1904 году для анализа таблиц сопряжённости. Позволяет сравнивать наблюдаемые (fн) и теоретические (fт) (ожидаемые) частоты.

Условия применения:

  • Независимость выборок (критерий нельзя применять для исследований типа «до-после»);
  • Объем каждой выборки должен быть больше 30
  • Доля ячеек, в которых значения теоретических частот ≤ 5 должна составлять не более 20%.
  • Для расчета критерия используются только абсолютные значения наблюдаемых (фактических) и теоретических частот (проценты и доли для расчетов не используются !)

Критерий хи-квадрат с поправкой Йетса (независимые выборки)

Распределение  (хи–квадрат) относится к числу непрерывных распределений, в то время, как распределение частот всегда дискретно. Отсюда следует, что применение критерия  при сравнении фактических и ожидаемых частот дает только приближенные результаты. Для уменьшения числа искажений в случаях с малыми выборками для критерия  вводится поправка Ф. Йетса на непрерывность.

Точный критерий Фишера (независимые выборки)

Предложен Рональдом Фишером для анализа таблиц сопряжённости в 1922 году. В основе критерия Фишера используются перестановки, то есть перебор всех вариантов заполнения таблицы. Критерий Фишера показывает точное значение вероятности, а хи-квадрат – ее приближенное значение.

Условия применения:

  • Независимость групп (критерий нельзя применять для исследований типа «до-после»);
  • Применяется для выборок небольшого объема (объем выборки не более 100);
  • Применяется для таблиц сопряженности 2х2.

Критерий МакНемара (связанные выборки)

Предложен американским психологом и статистиком Куином МакНемаром в 1947 году.

Условия применения:

  • Выборки связанные
  • Признаки, представленные в номинальной шкале, имеют только две категории: «да-нет», «успех-неуспех» «выполнено-не выполнено»;
  • Каждый участник представлен в ячейке таблицы только один раз.
  • Абсолютные частоты в ячейках, в которых происходит изменение, не должны быть равными (b ≠ c).

На сайте «Медицинская статистика есть калькулятор для расчета критерия МакНеймара. http://medstatistic.ru/calculators/calcmac.html

Критерий  Φ* – угловое преобразование Фишера (независимые и связанные выборки)

Многофункциональный критерий, который дает возможность сравнения двух выборок по частоте встречаемости интересующего исследователя эффекта. Позволяет исследовать независимые и связанные выборки. Может быть использован как при малых выборках (n=5), так и при больших выборках. Для оценки достоверности различий двух выборок необходимо перевести доли в значения центрального угла. Идея состоит в том, что чем больше процентная доля, тем больший угол φ* ей будет соответствовать.

Программа расчета углового преобразования Фишера. Programma-rascheta-kriterija-fi.xlsx .

Все вышеописанные критерии (кроме критерия МакНемара и углового преобразования Фишера) имеются в статистическом пакете Statgraphics.

Более подробная информация представлена в учебных пособиях, ссылки на которые даны ниже.

Литература

  1. Барникова, И.Э. Информационные технологии в обработке анкетных данных в педагогике и биомеханике спорта: учеб. пособие / И.Э. Барникова; А.В. Самсонова; Национальный государственный университет физической культуры, спорта и здоровья им. П.Ф. Лесгафта, Санкт–Петербург. – СПб.: [Б.и.], 2017. – 103 с.
  2. Высшая математика и математическая статистика: учебное пособие для вузов / Под общ. ред. Г. И. Попова. – М. Физическая культура, 2007.– 368 с.