Правило сложения дисперсии
s2=Ssi2*Fi/SFi,
где si2 — частная дисперсия i-той группы
Fi — объем i-той группы
SFi — объем совокупности
Ž Межгрупповая дисперсия
Это дисперсия результативного признака за счет факторного, положенного в основу группировки. Факторный признак, являющийся основанием группировки должен быть самым весомым
d2=S(хi-х)2*Fi/SFi
хi— средняя i-той группы
х — средняя по совокупности
Межгрупповая дисперсия служит мерой измерения колеблемости частных средних вокруг общей средней
Правило сложения дисперсии
s2общ=s2+d2
s2общ — за счет всех факторов
s2 — за счет всех факторов, кроме фактора, положенного в основу груп пировки
d2 — за счет фактора, положенного в основу группировки.
Общая дисперсия результативного признака = сумма средней из групповых дисперсий и межгрупповой дисперсии.
Зная значение s2общ и d2, т. е. общей и межгрупповой дисперсий, вычисляют корреляционное отношение: h=Öd2/s2
Корреляционное отношение (h) применяется для оценки степени взаимосвязи между признаками.
d2/s2 — доля межгрупповой дисперсии в общей дисперсии.
Коэффициент детерминации (h2=d2/s2) показывает долю межгрупповой дисперсии в общей дисперсии. Чем больше доля межгрупповой дисперсии в общей дисперсии, тем теснее связаны между собой факторный и результативный признаки.
1³ïhï. Чем ближе ïhï к единице, тем сильнее взаимосвязь между факторным и результативным признаками. Чем ближе ïhï к нулю, тем слабее связь между этими признаками.
Знак корреляционного отношения исследователь ставит самостоятельно, определив характер изменения признака. Если признаки меняются в одном направлении, знак h +, если в разных, то h -.
Рассмотрим некоторые случаи анализа корреляционных отношений и правила сложения дисперсии.
s2общ=s2+d2
h=Öd2/s2
1. Если s2=0, то s2общ=d2, h=ï1ï
Это значит, что вариация результативного признака обусловлена воздействием только фактического признака, положенного в основу группировки, а вариация за счет всех прочих факторов равна нулю.
1.1.Если h=+1, связь между признаками полная прямая
1.2.Если h=-1, связь между признаками полная обратная.
2. d2=0; s2общ=s2
Тогда h=0, это значит, что связь между фактическим признаком, положенным в основу группировки, и результативным признаком отсутствует, т. е. исследователь выбрал факторный признак, оказывающий наибольшее влияние на результативный.
Пример расчета показателя вариации для сгруппированных данных
Групы участков удобрений |
Урожайность, ц/га |
Посевная пл-дь, га |
¦ |
||
Не вносили |
10 11 13 |
50 150 50 |
50 165 65 |
100 121 169 |
500 1815 845 |
Итого по 1 группе |
— |
250 |
280 |
— |
3160 |
Вносили |
15 18 20 |
50 70 30 |
75 126 60 |
225 324 400 |
1125 2268 1200 |
Итого по 2 группе |
— |
150 |
261 |
— |
4593 |
1)
2)
3)
4)
5)
6)
7)
8)
9)
6.5. Математические свойства дисперсии
1.Дисперсия постоянной величины равна нулю
2.Если величину признака уменьшить на постоянную величину А, то величина дисперсии не изменится
3.Если все значения варианта уменьшить в k раз, то значение дисперсии уменьшится в раз.
6.6. Расчет дисперсии упрощенным способом
Для расчета дисперсии упрощенным способом используют её свойства. При этом последовательно выполняется ряд шагов:
1. Выбирается условный нуль – вариант , находящийся в середине ряда распределения или вариант с наибольшей частотой.
2. Все значения признака уменьшаются на величину А – условный нуль, т. е. находится отклонение вариантов признака от условного нуля.
3. Все отклонения значений от условного нуля уменьшаются в k раз, часто за k принимают величину интервала или значение, кратное величине отклонения. В результате этих действий получают ряд распределения от условной величины ,равной
4.Исчисляют условную среднюю
5.Исчисляют среднюю из квадратов условных величин
6.Исчисляется условная дисперсия.
7.Исчисляется дисперсия от величины х:
Пример:
% выполнения норм выработки |
Число рабочих, чел |
х |
а=125 х — А |
90-100 |
2 |
95 |
-30 |
100-110 |
6 |
105 |
-20 |
110-120 |
8 |
115 |
-10 |
120-130 |
18 |
125 |
0 |
130-140 |
5 |
135 |
10 |
140-150 |
4 |
145 |
20 |
150-160 |
3 |
155 |
30 |
160-170 |
2 |
165 |
40 |
170-180 |
2 |
175 |
50 |
Итого |
50 |
— |
— |
K=10 |
|||
-3 |
-6 |
9 |
18 |
-2 |
-12 |
4 |
24 |
-1 |
-8 |
1 |
8 |
0 |
0 |
0 |
0 |
1 |
5 |
1 |
5 |
4 |
8 |
4 |
16 |
3 |
9 |
9 |
27 |
4 |
8 |
16 |
32 |
5 |
10 |
25 |
50 |
— |
14 |
— |
180 |
6.7. Дисперсия альтернативного признака
Наряду с количественной вариацией признака может иметь место качественная вариация. Если имеют место два взаимоисключающих друг друга признака, то вариация называется альтернативной. Вариация альтернативного признака выражается в том, что одни единицы обладают данным признаком, а другие нет. Наличие признака у единицы совокупности обозначается 1, а его отсутствие – 0, долю единиц, обладающих данным признаком, обозначают p, а не обладающих данным признаком – q.
Рассчитаем дисперсию альтернативного признака:
x |
f |
1 |
p |
0 |
q |
,где p+q=1
Если распределение альтернативного признака в совокупности неизвестно, то принимают p=q=0,5. В этом случае дисперсия альтернативного признака принимает максимальное значение, равное 0,25.
Пример:
В результате экзамена 90% студентов получили “удовлетворительно”, остальные – “неудовлетворительно”. Определить дисперсию альтернативного признака.
x |
f |
1 |
0,9 |
0 |
0,1 |
Тема 7. Статистическое изучение взаимосвязи социально – экономических явлений
1. Характеристика статистической связи
2. Формально статистические методы изучения связи.
3. Корреляционно – регрессионный метод изучения связи
Парная корреляция
Логический смысл параметров уравнения линейной регрессии
Множественная корреляция
4. Показатели тесноты связи
Параметрические показатели тесноты связи
Непараметрические показатели тесноты связи (эмпирические меры тесноты связи)
7.1. Характеристика статистической связи
Изучение взаимосвязи – важнейшая познавательная задача статистики. Её решение начинается с выяснения социально – экономической сущности явлений. Явления и процессы природы и общества органически связаны между собой. Зависят друг от друга, взаимообуславливают друг друга. Статистический анализ позволяет установить причинно – следственное отношение между явлениями и выявить признаки, Факторы, оказывающие решающее воздействие на вариацию изучаемого явления. Статистические методы изучения взаимосвязи между социально – экономическими явлениями и признаками позволяют:
` Выявить наличие и направление связи
` Измерять её количественно
` Выразить связь аналитически
Статистика разработала методы, дающие возможность изучения не только простых парных связей между двумя явлениями или признаками, но и множественных связей между многими явлениями и признаками.
Связи между признаками принято характеризовать по ряду оснований:
1.По роли признака во взаимосвязи
c Факторные признаки,
оказывающие воздействие на вариацию изучаемого явления.
c Результативные признаки,
меняющиеся под воздействием факторного.
2.По характеру зависимости явлений.
c %:Функциональная связь (полная) связь.
Функциональными называют такие связи, в которых строго определенному значению факторного признака соответствует строго определенное значение результативного признака.
c Корреляционная (неполная, статистическая).
В статистических взаимосвязях такой однозначности нет: одной и той же величине факторного признака соответствуют различные значения результативного признака, образующие ряд распределения. Такие взаимосвязи называются корреляционными. Корреляционная связь проявляется лишь в среднем, в массе случаев!!!
3.По направлению различают:
c Прямые.
При прямой связи значения признаков изменяются в одном направлении.
c Обратные связи.
При обратной связи значения признаков изменяются в разных направлениях. Направления связи обычно устанавливаются с помощью формально – статистических методов анализа.
4.По степени тесноты связи различают:
c Сильные;
c Средние;
c Слабые связи.
5.По числу взаимодействующих признаков различают:
c Парную связь
парную корреляционную, т. е. связь двух признаков
c Множественную связь
связь нескольких признаков (больше двух),- множественная корреляция.
6.По аналитическому выражению различают:
c Линейные (прямолинейные) связи;
c Нелинейные (криволинейные) связи;
7.По опосредованности связи:
c Непосредственные связи;
при непосредственных связях фактор х непосредственно воздействует на результат.
c Косвенные связи
(опосредованные);при косвенной связи фактор х влияет на фактор через косвенную связь.(через z).
7.2. Формально статистические методы изучения связи.
Для выявления связи, её характера и направления пользуются формально – статистическими методами. К ним относятся:
_ Метод параллельных рядов.
_ Балансовый метод.
_ Метод аналитических группировок.
_ Графический метод.
Метод параллельных рядов – метод статистического явления, заключающийся в проведении и анализе рядов статистических данных о взаимосвязанных явлениях. По характеру изменения (вариации) данных того и другого ряда судят о наличии или отсутствии связи. Если устойчивого соответствия в признаках нет, то связь между явлениями отсутствует.
Балансовый метод — метод изучения связи, заключающийся в сопоставлении систем показателей, отражающих состояние взаимосвязанных объектов изучаемого явления. Например, систем показателей, характеризующих производство и распределение, производство и потребление, ресурсы и их использование. Балансовый метод широко применяется в бухгалтерском учете, анализе хозяйственной деятельности и других экономических науках. С помощью балансового метода выявляются и определяются взаимосвязи, вскрываются резервы. Балансовые сопоставления производятся в натуральной и стоимостной форме. Основой балансового метода является балансовое уравнение. Например, Офкг=Офнг+П-В, где