Статистические операции в номинальной шкале

Видеоуроки по Statgraphics Учебные пособия по статистике Введение в математическую статистику Генеральная совокупность и выборка Статистические шкалы Эмпирические распределения Числовые характеристики выборки Стандартная ошибка среднего арифметического Представление результатов исследования Точечное и интервальное оценивание числовых характеристик Элементы теории вероятностей Нормальный закон распределения (закон нормального распределения) Статистические гипотезы Критерии проверки статистических гипотез Критерии согласия Условия применения параметрических критериев Обоснование выбора критерия значимости Статистические операции в номинальной шкале Представление данных статистического анализа Корреляционный анализ Представление данных корреляционного анализа Регрессионный анализ Представление результатов регрессионного анализа

Статистические операции в номинальной шкале

Определения

Номинальная шкала — качественная шкала. Относится к самому элементарному типу измерения. В ней каждому оцениваемому объекту приписывается наименование или число.

Для области физической культуры и спорта использование номинальной шкалы очень важно, так как очень часто используется метод анкетного опроса. При этом результаты представлены в виде таблицы, в которой представлена абсолютная частота ответов на тот или иной вопрос.

Для выполнения статистических операций с данными, представленными в номинальной шкале используются таблицы сопряженности.

Таблица сопряжённости (RxC)— это форма представления данных об объектах исследования на основе группировки двух или более признаков по принципу их сочетаемости. R (Row) – строка, C (Column)- ряд.

Пример таблицы сопряженности представлен в табл.1.

Таблица 1 Частота упоминания силовых упражнений в специальной литературе и ИНТЕРНЕТ-сайтах

УпражнениеВид рекомендации

Тип источника

Всего
книгасайт
Приседание со штангой на плечахрекомендуется472673
не рекомендуется549
Всего523082

На пересечении строки и столбца указывается фактическая (наблюдаемая) частота их совместного появления fн.

Для проверки статистических гипотез с данными, представленными в номинальной шкале, применяются следующие критерии.

Если сравниваются независимые выборки:

  • критерий хи-квадрат (chi-square test);
  • критерий хи-квадрат с поправкой Йетса (Chi-square with Yates’ correction);
  • Точный критерий Фишера (Fisher’s exact test).

Если сравниваются связанные выборки то используются:

  • Критерий МакНемара (McNemar)
  • Критерий φ* – угловое преобразование Фишера

Теперь разберем эти критерии более подробно

Критерий хи-квадрат (независимые выборки)

Предложен Карлом Пирсоном в 1904 году для анализа таблиц сопряжённости. Позволяет сравнивать наблюдаемые (fн) и теоретические (fт) (ожидаемые) частоты.

Условия применения:

  • Независимость выборок (критерий нельзя применять для исследований типа «до-после»);
  • Объем каждой выборки должен быть больше 30
  • Доля ячеек, в которых значения теоретических частот ≤ 5 должна составлять не более 20%.
  • Для расчета критерия используются только абсолютные значения наблюдаемых (фактических) и теоретических частот (проценты и доли для расчетов не используются !)

Критерий хи-квадрат с поправкой Йетса (независимые выборки)

Распределение  (хи–квадрат) относится к числу непрерывных распределений, в то время, как распределение частот всегда дискретно. Отсюда следует, что применение критерия  при сравнении фактических и ожидаемых частот дает только приближенные результаты. Для уменьшения числа искажений в случаях с малыми выборками для критерия  вводится поправка Ф. Йетса на непрерывность.

Точный критерий Фишера (независимые выборки)

Предложен Рональдом Фишером для анализа таблиц сопряжённости в 1922 году. В основе критерия Фишера используются перестановки, то есть перебор всех вариантов заполнения таблицы. Критерий Фишера показывает точное значение вероятности, а хи-квадрат – ее приближенное значение.

Условия применения:

  • Независимость групп (критерий нельзя применять для исследований типа «до-после»);
  • Применяется для выборок небольшого объема (объем выборки не более 100);
  • Применяется для таблиц сопряженности 2х2.

Критерий МакНемара (связанные выборки)

Предложен американским психологом и статистиком Куином МакНемаром в 1947 году.

Условия применения:

  • Выборки связанные
  • Признаки, представленные в номинальной шкале, имеют только две категории: «да-нет», «успех-неуспех» «выполнено-не выполнено»;
  • Каждый участник представлен в ячейке таблицы только один раз.
  • Абсолютные частоты в ячейках, в которых происходит изменение, не должны быть равными (b ≠ c).

На сайте «Медицинская статистика есть калькулятор для расчета критерия МакНеймара. http://medstatistic.ru/calculators/calcmac.html

Критерий  Φ* – угловое преобразование Фишера (независимые и связанные выборки)

Многофункциональный критерий, который дает возможность сравнения двух выборок по частоте встречаемости интересующего исследователя эффекта. Позволяет исследовать независимые и связанные выборки. Может быть использован как при малых выборках (n=5), так и при больших выборках. Для оценки достоверности различий двух выборок необходимо перевести доли в значения центрального угла. Идея состоит в том, что чем больше процентная доля, тем больший угол φ* ей будет соответствовать.

Программа расчета углового преобразования Фишера. Programma-rascheta-kriterija-fi.xlsx .

Все вышеописанные критерии (кроме критерия МакНемара и углового преобразования Фишера) имеются в статистическом пакете Statgraphics.

Более подробная информация представлена в учебных пособиях, ссылки на которые даны ниже.

Литература

  1. Барникова, И.Э. Информационные технологии в обработке анкетных данных в педагогике и биомеханике спорта: учеб. пособие / И.Э. Барникова; А.В. Самсонова; Национальный государственный университет физической культуры, спорта и здоровья им. П.Ф. Лесгафта, Санкт–Петербург. – СПб.: [Б.и.], 2017. – 103 с.
  2. Высшая математика и математическая статистика: учебное пособие для вузов / Под общ. ред. Г. И. Попова. – М. Физическая культура, 2007.– 368 с.
  1. Учебные пособия по статистике
  2. Видеоуроки по Statgraphics
  3. Введение в математическую статистику
  4. Генеральная совокупность и выборка
  5. Статистические шкалы
  6. Эмпирические распределения
  7. Числовые характеристики выборки
  8. Стандартная ошибка среднего арифметического
  9. Представление результатов исследования
  10. Точечное и интервальное оценивание числовых характеристик
  11. Элементы теории вероятностей
  12. Нормальный закон распределения (закон нормального распределения)
  13. Статистические гипотезы
  14. Критерии проверки статистических гипотез
  15. Критерии согласия
  16. Условия применения параметрических критериев
  17. Обоснование выбора критерия значимости
  18. Статистические операции в номинальной шкале
  19. Представление данных статистического анализа
  20. Корреляционный анализ
  21. Представление данных корреляционного анализа
  22. Регрессионный анализ
  23. Представление результатов регрессионного анализа