Виды группировок в статистике
xmax — максимальное значение признака в группе,
xmin — минимальное значение признака в группе,
xmax-xmin=R — размах вариации
Иногда для определения интервала может быть использована формула Стерджеса (обычно при незначительных вариациях признаков):
d=(xmax-xmin)/(1+lnN), где
N — объем совокупности.
Величину неравных интервалов обычно задает сам исследователь, сообразуя с задачами группировки. Они могут быть прогрессивно возрастающими и убывающими. В большинстве случаев неравные интервалы возрастают и переходят к большим значениям признаков.
Интервалы могут быть открытыми и закрытыми. Открытые имеют одну границу. Они либо открывают либо закрывают группировку. Закрытый интервал имеет две границы: нижнюю и верхнюю. Нижняя указывает на min возможное значение признаков в данной группе, а верхняя — на max.
Метод группировок обычно предшествует всем прочим методам статистического анализа.
3. Виды группировок
С помощью метода группировок решаются следующие задачи:
þ выделение типов социально-экономических явлений
þ изучение структуры социально-экономических явлений
þ выявление взаимосвязи между явлениями
В связи с этим различают 3 вида группировок:
1) типологические
Распределение численности занятого населения на предприятиях и организациях различных форм собственности (по типам занятости):
Показатели |
млн. |
чел. |
90г. |
94г. |
|
Всего занято в экономике |
75,3 |
68,5 |
в том числе: |
||
На государственных и муниципальных предприятиях и организациях |
62,2 |
30,6 |
В частном секторе |
9,4 |
22,6 |
В общественных организациях и фондах |
0,6 |
0,5 |
На совместных предприятиях |
0,1 |
0,3 |
На предприятиях и организациях смешанной формы собственности |
3,0 |
14,5 |
Пример группировки: группировка семей по социально-экономическим типам.
2) структурные
решают задачи по изучению строения (структуры) однородной в качественном отношении статистической совокупности.
Пример: структура денежных доходов/расходов населения.
Денежные расходы всего в том числе: |
на покупку |
продуктов питания |
непродовольственных товаров |
||
на оплату услуг: |
Сопоставление данных о структуре совокупности в динамике позволяет проанализировать структурные сдвиги, происшедшие в строении совокупности под воздействием социально-экономических факторов.
3) аналитические
позволяет выявить влияние одних признаков на другие, то есть установить взаимосвязь между ними. Взаимосвязанные признаки делятся на факторные и результативные. В статистике зависимые признаки называются результативными, а признаки, оказывающие влияние, — факторными. При проведении аналитической группировки совокупность разбивается на группы как правило по факторному признаку, а для каждой группы рассчитывается либо среднее значение результативного признака, либо относительная величина, если он качественный. Взаимосвязь при этом проявляется в систематическом изменении результативного признака в связи с изменением признака факторного.
Пример: Потребление фруктов и ягод в домохозяйствах в зависимости от уровня среднедушевого денежного дохода в 1994 г. (децильное распределение(10%)) кг на душу в месяц:
Децильная группа домохозяйств по уровню денежного дохода |
Потребление фруктов и ягод в кг |
1. с наименьшим денежным доходом |
1,4 |
2. |
1,7 |
3. |
2,0 |
4. |
2,1 |
5. |
2,3 |
6. |
2,5 |
7. |
2,7 |
8. |
2,9 |
9. |
3,1 |
10. с наивысшим денежным доходом |
3,3 |
4. Вторичные группировки
Метод вторичной группировки — прием, используемый в статистическом исследовании для образования новых групп на основе ранее произведенной (первичной) группировки.
К вторичной группировке прибегают:
ÿ если результаты первичной группировки не удовлетворили исслед-ля
ÿ при появлении новых задач исследования
Она производится путем сведения статистических данных в новые группы по тому же признаку, что и первичная. При этом исходная статистическая информация не используется.
При проведении вторичной группировки производится либо дробление интервалов на более мелкие, либо их укрупнение. Осуществляя вторичную группировку, исходят из предположения о равном распределении признака внутри интервала.
Пример: Распределение населения РФ по размерам среднедушевого денежного дохода в 1996 г.
Группы населения по уровню среднедушевого дохода (тыс. руб. в месяц) |
Население (в % к итогу) |
Все население |
100 |
в том числе со среднедушевым денежным доходом открытый интервал: до 120,0 |
39,2 |
120,1 — 240,0 |
34,1 |
240,1 — 360,0 |
14,2 |
360,1 — 480,0 |
6,2 |
480,1 и выше |
6,3 |
Итого: |
100 |
Для проведения группировки нам необходимо определить новые группы и построить таблицу.
Группы населения по уровню среднедушевого дохода (тыс. руб. в месяц) |
Население (в % к итогу) |
Все население |
100 |
в том числе со среднедушевым денежным доходом открытый интервал: до 200,0 |
39,2+34,1/120*80=61,9 |
200,1 — 400 |
(34,1-22,7)+14,2+6,2*40/120=27,7 |
400,1 и выше |
(6,2-2,1)+6,3=10,4 |
Итого: |
100 |
5. Комбинированные группировки
Комбинированная группировка предполагает расчленение статистической совокупности по 2 и более признакам, взятым в сочетании. При этом сперва образуются группы по первому признаку, затем внутри выделяются подгруппы.
Комбинированная группировка обладает большими аналитическими возможностями, однако следует учитывать, что проведение группировки по большому числу признаков может привести к недостаточной численности единиц в группах. Поэтому к комбинированной группировке прибегают при достаточно большом объеме совокупности. Выбор группировочных признаков диктуется целью группировки.
6. Ряды распределения
В результате распределения единиц совокупности по величине какого-либо варьирующегося признака получают ряды распределения, которые дают возможность судить о закономерности распределения, однородности статистической совокупности и о границах вариации признаков совокупности. На основе рядов распределения исчисляются различные обобщающие показатели. Ряды распределения могут быть образованы как по атрибутивному, так и по количественным признакам. В зависимости от этого различают атрибутивные и вариационные ряды распределения. Они состоят из вариантов признаков и частот.
Пример атрибутивного ряда:
Национальность студента |
Количество студентов |
русские |
2000 |
украинцы |
300 |
белорусы |
105 |
молдаване |
31 |
казахи |
25 |
Пример: дискретный вариационный ряд распределения:
Оценка |
Количество студентов |
2 |
5 |
3 |
7 |
4 |
12 |
5 |
8 |
Дискретные ряды основаны на прерывных или дискретных признаках. Графиком является полигон (ОХ — варианты признака, ОУ — частости). График — ломаная кривая, соединяющая все пары чисел, имеющие координатами вариант и частоту.
Интервальные ряды распределения получаются в результате интервальной группировки. Признак в этих рядах распределения варьируется непрерывно внутри интервала. График — гистограмма (ОХ — отрезки, соответствующие границам изменения признака в интервале, ОУ — частоты).