Числовые характеристики выборки (случайной величины)

В.С. Иванов (1990) в книге «Основы математической статистики» пишет: «Вариационные ряды и графики эмпирических распределений дают наглядное представление о том, как варьирует признак в выборочной совокупности. Но они недостаточны для полной характеристики выборки, поскольку содержат много деталей, охватить которые невозможно без обобщающих числовых характеристик. Числовые характеристики выборки дают количественное представление об эмпирических данных и позволяют сравнивать их между собой».

Наибольшее практическое значение имеют характеристики положения, рассеивания и асимметрии (табл.1).

Таблица 1 — Название и обозначение числовых характеристик выборки (случайной величины)

Числовые характеристики случайной величины

ПоложенияВариативностиФормы распределения
Среднее арифметическое (М)Размах вариации (R)Коэффициент асимметрии (As)
Мода (Мо)Дисперсия (S2)Коэффициент эксцесса (Ex)
Медиана (Ме)Стандартное отклонение (S)

Коэффициент вариации (V%)

 Характеристики положения

Среднее арифметическое  (М) – одна из основных характеристик выборки. Этот показатель характеризуется тем, что сумма отклонений от него выборочных значений (с учетом знака) равна нулю.

Для вычисления среднего арифметического сумму всех значений признака делим на объем выборки.

Пример: xi : 20, 15, 15, 20, 30, среднее арифметическое равно 20. При этом сумма отклонений вариант от среднего арифметического равна нулю: сумма отклонений= 0 +(-5) + (-5) + 0 + 10 = 0.

М=(20+15+15+20+30)/5=20

Следует заметить, что среднее арифметическое измеряется в тех же единицах, что и признак. Например, если масса человека измеряется в кг, то и среднее арифметическое измеряется в кг.

Среднее арифметическое, вычисленное на основе выборочных данных, то есть данных, полученных на выборке, называется выборочным средним арифметическим. Оно обозначается как М. Среднее арифметическое генеральной совокупности называется генеральным средним. Оно обозначается буквой мю (μ).

Мода (Мо) – характеристика положения. Представляет собой значение признака, встречающееся в выборке наиболее часто.

В качестве примера рассмотрим выборку: xi :3; 3; 3; 5; 5; 3; 4; 6; 7; 5; 3.

В выборке цифра «3» встречается 5 раз, поэтому Мо = 3.

Медиана (Ме)- характеристика положения, представляет собой такое значение признака, при котором одна половина значений меньше ее, а другая – больше.

В качестве примера рассмотрим выборку: xi :3; 3; 3; 5; 5; 3; 4; 6; 7; 5; 3.

Чтобы легко было определить медиану расположим варианты по возрастанию.

xi :3; 3; 3; 3; 3; 4; 5; 5; 5; 6; 7. Варианта со значением «4» стоит в середине этой выборки. Это и есть медиана.

Характеристики варативности

Средние значения не дают полной информации о вариации признака, поэтому наряду со средними значениями вычисляют характеристики вариативности.

К этим характеристикам относятся:

  • размах вариации (R);
  • дисперсия (S2)
  • стандартное отклонение (S)
  • коэффициент вариации (V%)

Размах вариации

Размах вариации (R) вычисляется как разность между максимальным и минимальным значением признака:

R= Xmax-Xmin.

Размах вариации измеряется в тех же единицах, что и признак. Информативность этого показателя невелика, так как эмпирические распределения результатов могут иметь одинаковый размах варьирования, а их форма будет очень отличаться.

Дисперсия

Дисперсия (S2) – средний квадрат отклонений значений признака от среднего арифметического. Если признак измеряется в метрах, то дисперсия – в м2. Это является недостатком, поэтому наиболее часто в публикациях приводится не дисперсия, а стандартное отклонение (S). Этот показатель также называется среднеквадратическим отклонением или СКО. Стандартное отклонение представляет собой корень квадратный из дисперсии. Чем больше стандартное отклонение, тем больше варьирует признак.

Коэффициент вариации

Коэффициент вариации (V%). Чтобы сопоставить вариативность признаков, измеренных в различных единицах, используется относительный показатель (V%), который называется коэффициентом вариации.

Коэффициент вариации рассчитывается следующим образом. Стандартное отклонение делится на среднее арифметическое и умножается на 100%.

V%=100% (S /M)

 Например, если среднее арифметическое роста спортсменок равно М=170 см, а стандартное отклонение S=5 см, тогда коэффициент вариации равен: V%= 100% (5/170)=2,94.

 Коэффициент вариации часто используют для оценки однородности выборки. Если V<10% – выборка однородна, то есть, получена из одной генеральной совокупности.

Характеристики формы распределения

Коэффициент асимметрии (As) характеризует “скошенность“ эмпирического распределения. Если коэффициент асимметрии равен нулю – распределение симметричное. Если больше нуля – скошено влево, если  меньше нуля – вправо.

Коэффициент эксцесса (Ex) определяет характер эмпирического распределения: остро- или плосковершинный.

Литература

  1. Высшая математика и математическая статистика: учебное пособие для вузов / Под общ. ред. Г. И. Попова. – М. Физическая культура, 2007.– 368 с.
  2. Гласс Дж., Стэнли Дж. Статистические методы в педагогике и психологии. М.: Прогресс. 1976.- 495 с.
  3. Катранов А.Г. Компьютерная обработка данных экспериментальных исследований: Учебное пособие/ А. Г. Катранов, А. В. Самсонова; СПб ГУФК им. П.Ф. Лесгафта. – СПб.: изд-во СПб ГУФК им. П.Ф. Лесгафта, 2005. – 131 с.
  4. Основы математической статистики: Учебное пособие для ин-тов физ. культ / Под ред. В.С. Иванова.– М.: Физкультура и спорт, 1990. 176 с.