Часто в статистике при анализе какого-либо явления или процесса необходимо учитывать не только информацию о средних уровнях исследуемых показателей, но и разброс или вариацию значений отдельных единиц , которая является важной характеристикой изучаемой совокупности.
В наибольшей степени вариации подвержены курсы акций, объемы спроса и предложения, процентные ставки в разные периоды времени и в разных местах.
Основными показателями, характеризующими вариацию , являются размах, дисперсия, среднее квадратическое отклонение и коэффициент вариации.
Размах вариации представляет собой разность максимального и минимального значений признака: R = Xmax – Xmin . Недостатком данного показателя является то, что он оценивает только границы варьирования признака и не отражает его колеблемость внутри этих границ.
Дисперсия лишена этого недостатка. Она рассчитывается как средний квадрат отклонений значений признака от их средней величины:
Упрощенный способ расчета дисперсии осуществляется с помощью следующих формул (простой и взвешенной):
Примеры применения данных формул представлены в задачах 1 и 2.
Широко распространенным на практике показателем является среднее квадратическое отклонение :
Среднее квадратическое отклонение определяется как квадратный корень из дисперсии и имеет ту же размеренность, что и изучаемый признак.
Рассмотренные показатели позволяют получить абсолютное значение вариации, т.е. оценивают ее в единицах измерения исследуемого признака. В отличие от них, коэффициент вариации измеряет колеблемость в относительном выражении - относительно среднего уровня, что во многих случаях является предпочтительнее.
Формула для расчета коэффициента вариации.
Примеры решения задач по теме «Показатели вариации в статистике»
Задача 1 . При изучении влияния рекламы на размер среднемесячного вклада в банках района обследовано 2 банка. Получены следующие результаты:
Определить:
1) для каждого банка: а) средний размер вклада за месяц; б) дисперсию вклада;
2) средний размер вклада за месяц для двух банков вместе;
3) Дисперсию вклада для 2-х банков, зависящую от рекламы;
4) Дисперсию вклада для 2-х банков, зависящую от всех факторов, кроме рекламы;
5) Общую дисперсию используя правило сложения;
6) Коэффициент детерминации;
7) Корреляционное отношение.
Решение
1) Составим расчетную таблицу для банка с рекламой . Для определения среднего размера вклада за месяц найдем середины интервалов. При этом величина открытого интервала (первого) условно приравнивается к величине интервала, примыкающего к нему (второго).
Средний размер вклада найдем по формуле средней арифметической взвешенной:
29 000/50 = 580 руб.
Дисперсию вклада найдем по формуле:
23 400/50 = 468
Аналогичные действия произведем для банка без рекламы :
2) Найдем средний размер вклада для двух банков вместе. Хср =(580×50+542,8×50)/100 = 561,4 руб.
3) Дисперсию вклада, для двух банков, зависящую от рекламы найдем по формуле: σ 2 =pq (формула дисперсии альтернативного признака). Здесь р=0,5 – доля факторов, зависящих от рекламы; q=1-0,5, тогда σ 2 =0,5*0,5=0,25.
4) Поскольку доля остальных факторов равна 0,5, то дисперсия вклада для двух банков, зависящая от всех факторов кроме рекламы тоже 0,25.
5) Определим общую дисперсию, используя правило сложения.
= (468*50+636,16*50)/100=552,08
= [(580-561,4)250+(542,8-561,4)250] / 100= 34 596/ 100=345,96
σ 2 = σ 2 факт + σ 2 ост = 552,08+345,96 = 898,04
6) Коэффициент детерминации η 2 = σ 2 факт / σ 2 = 345,96/898,04 = 0,39 = 39% - размер вклада на 39% зависит от рекламы.
7) Эмпирическое корреляционное отношение η = √η 2 = √0,39 = 0,62 – связь достаточно тесная.
Задача 2 . Имеется группировка предприятий по величине товарной продукции:
Определить: 1) дисперсию величины товарной продукции; 2) среднее квадратическое отклонение; 3) коэффициент вариации.
Решение
1) По условию представлен интервальный ряд распределения. Его необходимо выразить дискретно, то есть найти середину интервала (х"). В группах закрытых интервалов середину найдем по простой средней арифметической. В группах с верхней границей - как разность между этой верхней границей и половиной размера следующего за ним интервала (200-(400-200):2=100).
В группах с нижней границей – суммой этой нижней границы и половины размера предыдущего интервала (800+(800-600):2=900).
Расчет средней величины товарной продукции делаем по формуле:
Хср = k×((Σ((х"-a):k)×f):Σf)+a. Здесь а=500 - размер варианта при наибольшей частоте, k=600-400=200 - размер интервала при наибольшей частоте. Результат поместим в таблицу:
Итак, средняя величина товарной продукции за изучаемый период в целом равна Хср = (-5:37)×200+500=472,97 тыс. руб.
2) Дисперсию найдем по следующей формуле:
σ 2 = (33/37)*2002-(472,97-500)2 = 35 675,67-730,62 = 34 945,05
3) среднее квадратическое отклонение: σ = ±√σ 2 = ±√34 945,05 ≈ ±186,94 тыс. руб.
4) коэффициент вариации: V = (σ /Хср)*100 = (186,94 / 472,97)*100 = 39,52%
представляет собой отношение среднего квадратического отклонения к среднему ожидаемому значению и показывает степень отклонения получаемых результатов.
V = -* 100%, Х
гдеV - коэффициент вариации, %;
G- среднее квадратическое отклонение;
X - среднее ожидаемое значение.
Так как коэффициент вариации - величина относительная, то на его размер не оказывают влияние абсолютные значения изучаемого показателя. С помощью коэффициента вариации можно сравнивать даже колебле-
мость признаков, выраженных в разных единицах измерения. Коэффициент вариации изменяется в пределах от 0 до 100%, при этом, значение коэффициента прямо пропорционально силе колеблемости. Установлена следующая качественная оценка различных коэффициентов вариации:
до 10% - слабая колеблемость;
10-25% - умеренная колеблемость;
свыше 25% - высокая колеблемость.
В качестве варианта может быть использован несколько упрощенный метод определения степени риска. Так как количественно риск характеризуется оценкой вероятной величины максимального и минимального результатов, то «чем больше диапазон между этими величинами при равной их вероятности, тем выше степень риска»1 . Тогда для расчета дисперсии можно использовать следующую формулу:
&2 = PMAX * (max - XУ + Pmin * (X - Xmin У,
2
гдеа2 - дисперсия;
Pmax - вероятность получения максимального результата;
Xmax - максимальная величина результата;
X - средняя ожидаемая величина результата;
Pmjn - вероятность получения минимального результата;
Xmjn - минимальная величина результата.
Полученные показатели следует учитывать в комплексе, так как использование отдельного критерия оценки риска не может служить основой принятия решения в пользу какой-либо стратегии.
В практике встречаются ситуации, когда отсутствует информация о вероятностях состояний среды, т.е. необходима оценка риска в условиях полной неопределенности - (2). В таких случаях для определения наилучших решений используются следующие критерии: максимакса, Вальда, Сэвиджа, Гурвица. Применение каждого из перечисленных критериев рассмотрим на примере матрицы выигрышей А (1) и матрицы рисков R (2).
Еще по теме Коэффициент вариации:
- ВАРИАЦИИ В СТРУКТУРЕ И СТРУКТУРНО-ОБУСЛОВЛЕННЫЕ ВАРИАЦИИ
- 1.2.10. Определение. Если существует производная функциив точке, то она называется первой вариацией функционала в точке при данной вариации аргумента, и обозначается:
Вариация - это принятие единицами совокупности или группами различных, отичающихся друг от друга, значений знака. Вариация является результатом воздействия на единицу совокупности множества факторов. Синонимами терминация являются понятия изменение (изменчивость, вариативность’).
Вариация - одна из важнейших категорий статистической науки. Явления, подверженньие вариации, лежат в области исследования статистической науки, в то время как явления неизменные, статистические, постоянные в статистике не рассматриваются.
Практически все явления, имеющие естественный характер происхождения, подвержены изменчивости (например, химические процессы, изменчивость наследственных признаков у каждого человека и др.). Явления, а также ряд естественных законов могут иметь неизменный характер (например, минимальный размер заработной платы)
Необходимо подчеркнуть значение исследования вариации в статистической науке:
1 . Выявление измеычввости размеров явления дает возможность оценить степень зависимости изучаемого явления от других факторов, в свою очередь подверженньих изменчивости, или, другими словами, - оценить степень устойчивоти явленияк внешним воздействиям.
2. Вариация предполагает оценку однородности изучаемого явления, т. е. меру типичности, рассчитанной для этого явления средней величины.
Вариационным рядом называется последовательность различных вариант, записанных в возрастающем порядке вместе с соответствующими частотами.
В зависимости от типа признака различают дискретньие и интервальные вариационньие ряды. В зависимости от объема исходных данных и области допустимых значений одномерного количествснного признака, частотные распределения также подразделяются на дискретньие и интервальные. Если различных очень много (более 10-15), то эти варианты группируют вьибирая определенное число интервалов группировки и таким образом интервальное частотное распределение.
Первым шагом при построении интервального вариационого ряда является выбор определенного принципа, который дается в основу построения интервального ряда. Выбор этого принципа зависит от степени однородности рассматриваемой совокуности. Если совокупность однородна, то при построении ряда используют принцип равных интервалов. При этом вопрос однородности решается содержательным анализом изучаемых явлений.
Изменчивость явления в статистическом анализе отображается с помощью целого ряда характеристик, называемых системой показателей вариации . В нее входят:
абсолютные показатели вариации :
1) размах вариации;
2) средние величины (групповые и общие):
- степенные средние величины;
- структурные средние величины;
3) среднее линейное отклонение;
4) дисперсии (групповая, межгрулповая и общая) и среднее квадратическое отклонение;
относительные показатели вариации:
1) коэффициент осцилляции;
2) коэффициенты вариации (в том числе линейный);
3) коэффициенты детерминации (эмпирические и теоретические).
Размах вариации отражает пределы изменчивости признака или, другими словами, амплитуду вариации. Размах вариации рассчитывается как разность между максимальной величиной при знака (х) и минимальной величиной признака (х), т.е. по фор муле:
х - наибольшее значение признака;
х. - наименьшее значение признака.
Дисперсия - средний квадрат отклонений индивидуальньх значений признака от их средней величины:
Для вариационного ряда дисаерсия вычисляется по следующей формуле: (см. таблицу 2.)
Часто для исследования удобно представлять меру рассеяния в тех же единицах измерения, что и варианты. Тогда вместо дисперсии используют среднее квадратическое отклонение , которое является квадратным корнем из дисперсии, т.е. среднее квадратичное отклонение вычисляется по формуле: (см. таблицу 2)
Рассмотренные выше меры рассеявия (размах вариации, дисперсия, среднее квадратическое отклонение) являются абсолютными величинами, судить по ним о степени колеблимости признака не всегда возможно, в некоторых задачах необходимо использовать относительные показатели рассеяния. Таким показателем является коэффициент вариации (V), который представляет собой отношение среднего квадратичного отклонения к средней арифметической, выраженное в процентах:
Коэффициент вариации позволяет:
Сравнивать вариацию одного и того же признака у разных групп объектов;
Выявить степень различия одного и того же признака одной и той же группы объектов в разное время;
Сопоставить вариацию разных признаков у одних и тех групп объектов.
Если значение коэффициента вариации не превышает 33 то изучаемая совокупность считается однородной .
Рассмотрим на примере методику расчёта среднего квадратического отклонения и дисперсии признака.
ПРИМЕР 5 . В результате выборочной проверки расфасовки чая получены следующие данные:
Масса пачки чая, г. Число пачек чая, шт.
52 и выше 3
Исчислить среднюю массу пачки чая,среднее квадратическое отклонение,дисперсию признака.
Для расчёта используем формулы из таблицы 2.
Все расчёты желательно оформить в виде таблицы. Для определения середины интервала
В каждой группе,т.е. среднего значения,необходимо от интервального перейти к дискретному ряду. Величина интервала равна 1 (например,50 – 49 =1).Значит среднее значение для первой группы составит ((48 +49) /2 = 48,5 ;для второй и третьей групп соответственно 49,5 и 50,5 и т. д.
Масса Число Середина Х*f Х – Х (Х – Х) (Х – Х) * f
Вариация измеряется с помощью относительных величин, называемых коэффициентами вариации и определяемых в виде отношения среднего отклонения к средней величине. Коэффициент вариации используют не только для сравнительной оценки вариации единиц совокупности, но и как характеристику однородности совокупности. Значения коэффициента вариации изменяются от 0 до 100% и чем ближе он к нулю, тем типичнее найденная средняя величина для изучаемой статистической совокупности, а значит и качественнее подобраны статистические данные. Совокупность считается количественно однородной, если коэффициент вариации не превышает 33% (для распределений, близких к нормальному). Различают следующие относительные показатели вариации:
Коэффициент вариации:
где - среднее квадратическое отклонение, - средняя арифметическая.
Линейный коэффициент вариации:
где - среднее линейное отклонение.
Коэффициент осцилляции:
где - размах вариации.
Вычислим коэффициенты вариации для группы организаций по грузообороту автомобильного транспорта (таблица 5.1) по формулам 5.9, 5.10, 5.11
Коэффициент вариации будет равен:
, что превышает 33%, следовательно, совокупность неоднородна.
Вычислим линейный коэффициент вариации:
. Следовательно, доля усредненного значения абсолютных отклонений организаций от средней величины равна 30,7%
Найдем коэффициент осцилляции:
. Из этого следует, что разница между максимальным и минимальным значениями организаций превышает среднее значение почти в 1,078 раз.
Определим коэффициенты вариации для группировки площадей жилых помещений (в среднем на одного жителя) (таблица 5.3).
Вычислим коэффициент вариации по формуле (5.9):
. Это значит что коэффициент вариации не превышает 33%, следовательно, совокупность однородна.
Рассчитаем линейный коэффициент вариации по формуле (5.10):
. Это значит, что доля усредненного значения абсолютных отклонений площадей жилых помещений от средней величины равна 5,56%.
Найдем коэффициент осцилляции по формуле (5.11):
. Разница между максимальным и минимальным значениями площадей жилых помещений не превышает среднее значение.
РАСЧЕТ И ПОСТРОЕНИЕ СТРУКТУРНЫХ ХАРАКТЕРИСТИК ВАРИАЦИОННОГО РЯДА
Немного больше по теме
Повышение эффективности работы предприятия
В настоящее время все более
актуальным становится получение информации для эффективного управления. В
условиях жесткой рыночной экономики предприятию нужно эффективно работать при
условии максимального использования всех имеющихся ресурсов, просчета всех
имеющихся вариантов, нахождения самого эффективного решения, а самое главное,
оптимального соотношения затрат и результатов деят...
Вариация признака определяется различными факторами, часть этих факторов можно выделить, если статистическую совокупность разделить на группы по определенному признаку. Тогда, наряду с изучением вариации признака по совокупности в целом, можно изучить вариацию для каждой из составляющих ее группы и между этими группами. В простом случае, когда совокупность разделена на группы по одному фактору, изучение вариации достигается посредством вычисления и анализа трех видов дисперсий: общей, межгрупповой и внутригрупповой.
Эмпирический коэффициент детерминации
Эмпирический коэффициент детерминации широко применяется в статистическом анализе и является показателем, представляющим долю межгруппопой дисперсии в результативного признака и характеризует силу влияния группировочного признака на образование общей вариации. Он может быть рассчитан по формуле:
Показывает долю вариации результативного признака у под влиянием факторного признака х, он связан с коэффициентом корреляции квадратичной зависимостью. При отсутствии связи эмпирический коэффициент детерминации равен нулю, а при функциональной связи - единице.
Например, когда изучается зависимость производительности труда рабочих от их квалификации коэффициент детерминации равен 0,7, то на 70% вариация производительности труда рабочих обусловлена различиями в их квалификации и на 30% - влиянием прочих факторов.
Эмпирическое корреляционное отношение - это квадратный корень из коэффициента детерминации. Отношение показывает тесноту связи между группировочным и результативным признаками. Эмпирическое корреляционное отношение принимает значения от -1 до 1. Если связи нет, то корреляционное отношение равняется нулю, т.е. все групповые средние равняются между собой и межгрупповой вариации нет. Значит, группировочный признак не влияет на образование общей вариации.
Если связь функциональная, то корреляционное отношение равняется единице. В таком случае дисперсия групповых средних равна общей дисперсии, т.е. внутригрупповой вариации нет. Это значит, что группировочный признак полностью определяет вариацию результативного признака.
Чем ближе значение корреляционного отношения к единице, тем сильнее и ближе к функциональной зависимости связь между признаками. Для качественной оценки силы связи на основе показателя эмпирического коэффициента корреляции можно использовать соотношение Чэддока.
Соотношение Чэддока
- Связь весьма тесная — коэффициент корреляции находится в интервале 0,9 — 0,99
- Связь тесная — Rxy = 0,7 — 0,9
- Связь заметная — Rxy = 0,5 — 0,7
- Связь умеренная — Rxy = 0,3 — 0,5
- Связь слабая — Rxy = 0,1 — 0,3

