Статистические операции в номинальной шкале

Статистический анализ

Статистические операции в номинальной шкале (теория и практика)

Определения

Номинальная шкала — качественная шкала. Относится к самому элементарному типу измерения. В ней каждому оцениваемому объекту приписывается наименование или число.

Для области физической культуры и спорта использование номинальной шкалы очень важно, так как очень часто используется метод анкетного опроса. При этом результаты представлены в виде таблицы, в которой представлена абсолютная частота ответов на тот или иной вопрос.

Для выполнения статистических операций с данными, представленными в номинальной шкале используются таблицы сопряженности.

Таблица сопряжённости (RxC)— это форма представления данных об объектах исследования на основе группировки двух или более признаков по принципу их сочетаемости. R (Row) – строка, C (Column)- ряд.

Пример таблицы сопряженности представлен в табл.1.

Таблица 1 Частота упоминания силовых упражнений в специальной литературе и ИНТЕРНЕТ-сайтах

Упражнение	Вид рекомендации	Тип источника		Всего
Упражнение	Вид рекомендации	книга	сайт	Всего
Приседание со штангой на плечах	рекомендуется	47	26	73
Приседание со штангой на плечах	не рекомендуется	5	4	9
	Всего	52	30	82

На пересечении строки и столбца указывается фактическая (наблюдаемая) частота их совместного появления f_н.

Более подробно о методах статистической обработки данных рассказано в книгах:

Для проверки статистических гипотез с данными, представленными в номинальной шкале, применяются следующие критерии.

Если сравниваются независимые выборки:

критерий хи-квадрат (chi-square test);
критерий хи-квадрат с поправкой Йетса (Chi-square with Yates’ correction);
Точный критерий Фишера (Fisher’s exact test).

Если сравниваются связанные выборки то используются:

Критерий МакНемара (McNemar)
Критерий φ* – угловое преобразование Фишера

Теперь разберем эти критерии более подробно

Критерий хи-квадрат (независимые выборки)

Предложен Карлом Пирсоном в 1904 году для анализа таблиц сопряжённости. Позволяет сравнивать наблюдаемые (f_н) и теоретические (f_т) (ожидаемые) частоты.

Условия применения:

Независимость выборок (критерий нельзя применять для исследований типа «до-после»);
Объем каждой выборки должен быть больше 30
Доля ячеек, в которых значения теоретических частот ≤ 5 должна составлять не более 20%.
Для расчета критерия используются только абсолютные значения наблюдаемых (фактических) и теоретических частот (проценты и доли для расчетов не используются !)

Критерий хи-квадрат с поправкой Йетса (независимые выборки)

Распределение (хи–квадрат) относится к числу непрерывных распределений, в то время, как распределение частот всегда дискретно. Отсюда следует, что применение критерия при сравнении фактических и ожидаемых частот дает только приближенные результаты. Для уменьшения числа искажений в случаях с малыми выборками для критерия вводится поправка Ф. Йетса на непрерывность.

Точный критерий Фишера (независимые выборки)

Предложен Рональдом Фишером для анализа таблиц сопряжённости в 1922 году. В основе критерия Фишера используются перестановки, то есть перебор всех вариантов заполнения таблицы. Критерий Фишера показывает точное значение вероятности, а хи-квадрат – ее приближенное значение.

Условия применения:

Независимость групп (критерий нельзя применять для исследований типа «до-после»);
Применяется для выборок небольшого объема (объем выборки не более 100);
Применяется для таблиц сопряженности 2х2.

Критерий МакНемара (связанные выборки)

Предложен американским психологом и статистиком Куином МакНемаром в 1947 году.

Условия применения:

Выборки связанные
Признаки, представленные в номинальной шкале, имеют только две категории: «да-нет», «успех-неуспех» «выполнено-не выполнено»;
Каждый участник представлен в ячейке таблицы только один раз.
Абсолютные частоты в ячейках, в которых происходит изменение, не должны быть равными (b ≠ c).

На сайте «Медицинская статистика есть калькулятор для расчета критерия МакНеймара. http://medstatistic.ru/calculators/calcmac.html

Критерий Φ* – угловое преобразование Фишера (независимые и связанные выборки)

Многофункциональный критерий, который дает возможность сравнения двух выборок по частоте встречаемости интересующего исследователя эффекта. Позволяет исследовать независимые и связанные выборки. Может быть использован как при малых выборках (n=5), так и при больших выборках. Для оценки достоверности различий двух выборок необходимо перевести доли в значения центрального угла. Идея состоит в том, что чем больше процентная доля, тем больший угол φ* ей будет соответствовать.

Программа расчета углового преобразования Фишера. Programma-rascheta-kriterija-fi.xlsx .

Все вышеописанные критерии (кроме критерия МакНемара и углового преобразования Фишера) имеются в статистическом пакете Statgraphics.

Более подробная информация представлена в учебных пособиях, ссылки на которые даны ниже.

Литература

Барникова, И.Э. Информационные технологии в обработке анкетных данных в педагогике и биомеханике спорта: учеб. пособие / И.Э. Барникова; А.В. Самсонова; Национальный государственный университет физической культуры, спорта и здоровья им. П.Ф. Лесгафта, Санкт–Петербург. – СПб.: [Б.и.], 2017. – 103 с.
Высшая математика и математическая статистика: учебное пособие для вузов / Под общ. ред. Г. И. Попова. – М. Физическая культура, 2007.– 368 с.
Самсонова, А.В. Математическая статистика в спортивных исследованиях: учебное пособие / А.В. Самсонова, И.Э. Барникова: НГУ им.П.Ф.Лесгафта, Санкт-Петербург.- СПб [б.и.], 2022.- 122 c.

С уважением, А.В. Самсонова