Метод ранговой корреляции
Ряды распределения. Признак, по котрому группируют совок-ть, называют группировочным. Ряды распределения по количественному варьирующему призна-ку, называют вариационными рядами распределения. Эти ряды имеют след. элементы: вариант характеризует уровень признака и может быть представлен 1 числом или интегралом. Если вариант представлен 1 числом, то это дискретный вариационный ряд распределения, а если интервалом, то это – интервальный ряд распределения. Частота показывает как часто встречается данный вариант в совокупности. Пример:
Число детей в семье, хі |
Число семей, fі |
1 2 3 4 5 |
200 250 30 19 1 |
∑=500 |
Интервальній ряд
размер з/п, хі колво. раб, fі
150-200 10
200-250 15
250-300 10
300-350 5
350-400 10
400-450 20
∑=70
Рекомендуемые(приблизительное число групп) расч. По формуле n=1+3,322 lg N, где N — число единиц совокупности).
Ширина равномерного интервала(шаг) интервала рассчитывается по формуле h=(Xmax – Xmin)/n.
Балансовый метод.
Для изуч функц взаимосв в ст использ 2 метода: Индексный; Балансовый – система взаимосвязан величин соединенных знаком равенства Оп+П = Ок+Р, где Оп – остаток на начало периода, П – приход, Ок – остаток на конец периода, Р – расход.
Метод ранговой корреляции — метод ислед корреляции. Метод заключ в том что фактор и результ признаки строим в паралельных рядах, причем факторный признак строим в порядке убыв или возраст.
n |
Энерго эмкость Хi |
Производительность, Уі |
Ранги по Х У |
Разность рангов d |
1 |
6 |
1 |
1 1 |
0 |
2 |
6,2 |
2 |
2 2 |
0 |
3 |
7,8 |
5 |
4 5 |
-1 |
4 … |
7,9 …. |
4 … |
5 4 ……… |
1 ……. |
25 |
10 |
8 |
25 8 |
2 |
Допустим что у нас есть данные по 25 заводам. Имея данные таблицы расчитаем коэф. коррел рангов:
r=1-6*åd2 / n(n2–1) где п – число едениц в ряду, r — изменяется от –1 до 1. Если все ранги строго изменяются в одном и том же порядке то d=0, а r = 1, что указывает на тесную прямую связь. Если ранги изм наоборот то r = -1.(Это тесная обратная связь). If r = 0 то связи нет. Коэф коррел рангов имеет определ преимущества перед другими характеристиками тесноты связи: его можно определять при исследов данных кот не поддаются измерению но регистрируются, напр: оттенки цветов, кач духов и т д
Кроме того он удобен и при анализе некотор измеряемых данных. В случае когда нет необход их точн измерения. Наприм: мы можем легко ранжировать группу студентов по росту не прибегая к его фактическому измерению.
Метод аналитических группировок.
Данные по 25 заводам можно представить в виде, напр, 4 групп с интервалом по факторном признаку = 2; 5 групп с интервалом 1,5 ; 6 групп – 1,25. Нужно избрать золотую середину: оптимальное число групп для данного конкр случая, когда групповые ср перестанут носить случ характер и в то же время группировачный признак проявит себя в полной мере. При 4 группах – нет уверенности что групп признак проявил себя в полной мере, При 6 группах – может быть нарушена тенденция измен средней, 5 групп — супер!
Групповая дисперсия
nгр — количество предприятий в группе
xгр — средняя груп. производительность
xi — производ-ность пред-тий в группе
Необходимо расчитать групповую общую и внутреннюю межгрупповую дисперсии.
Внутригрупповая дисперсия (остаточ-ная) – ср-арифмет из групповых дисперсий взвешенная по численности групп sвг2=Ssi2*ni / Sni где ni – численность вариантов в группах. В нашем случ она характериз влияние на производительность прочих факторов, кроме исследуемого. Межгрупповая дисперсия – дисперсия групповых средних относительно общей средней sмг2=S(X(ср)грi –X(ср)общ)2*ni / Sni Она хар-ет влияние исследуемого фактора на изменчивость результатив-ного фактора. Общ дисперсия хар-ет изменчивость всех признаков под влиянием всех факторов sобщ2=S(xi-Xср)*ni / Sni
Отсюда правило сложения дисперсий sобщ2=sвг2+sмг2 Расчет дисперсии группо-вых средних для выбранной нами группировки (5 групп) по формуле sмг2=4,06. Расчитаем общую дисперс по форм как разность среднего квадрата вариантов и квадрата их средней sобщ2= Sх2 /n – (хср)2; Sх2 /n =(хср)2 Для нашего случая sобщ2=5,6 Далее коэф детерминации h2=sмг2 / sобщ2 =0,714=71,4%. Коэф детерминации показывает какова доля влияния всех факторов. В нашем примере видно, что енерговооруженность труда на 71,4% определяет вариацию производитель-ности труда. Исходя из коэф детер можно расчитать емпирическое коррел отноше-ние кот характериз тесноту коррел зависимости т. е. степень приближения к функциональной связи
h=h2==0,845
Пределы изменения h от 0 до 1. Для качественной оценки тесноты связи на основе корел отношения можно воспользоваться этим:
h |
Сила связи |
0,1-0,3 0,3-0,5 0,5-0,7 0,7-0,9 0,9-0,99 |
Слабая Умеренная Заметная Тесная Весьма тесн. |
Системы взаимосвязанных индексов.
Важной особенностью индексного метода явл. то, что он дает возм-ть строить взаимосвяз. сис-мы, в основе кот. лежит принцип взаимосвязи между исходными показ-лями (товарооборот представляет собой произвед-е кол-ва проданного товара на цену). Такая же взаимосвязь существ. и между индексами этих величин : Ipq=Ip*Iq – товарооборот;
W=q/T – производ-ть труда; Iw= Iq/It – индекс производ-ти труда; Iп. сп = 1/Ip – индекс покупательной способности
Корреляционно-регресионное равенство заключается в определении стат модели взаимосв в виде ур-ия регресиии. Убедившись в том что между факторным и результативным признаками существует взаимосвязь и она достаточно высокая можно перейти к установлению ур-ния этой взаимосвязи т. е. найти такое ур-ния линии кот наилучшим образом описывало бы эту взаимосвязь. С этой целью мы строим график на кот наносим наши емпирические данные график Место расположения точек на графике наз. Корреляционным полем. Соединив точки линией получаем ломанную линию. Изломы свидетельствуют о том что кроме фактора енерговооруженности на производительность оказыв влияние другие внешние факторы. Для того чтобы найти ур-ние линии, наилучшим образом описывающим взаимосвязь необходимо прибегнуть к выравниванию ломанной лин регресии. По характеру расположения точек выбираем линию по кот осущ выравнивание Утеор=a0+a1*х. Коэф регресии a0 ,a1 и т. д. опрделяем решая систему ур-ний с использованием наименьших квадратов. Если эта зависимость носит характер прямой линии то a0 ,a1 и т. д можно определять графически. a1 = tga Охарактеризовать тесноту связи найденного теоретического ур-ния и емпиричкского распределения точек можно с помощью показателя индекса корреляции R=(sобщ2-s2Yi-Yтеор) / sобщ2 ; s2Yi-Yтеор = S( Уі-Утеор)2 / n; R= [ 0;1]
Виды рядов динамики
Ряды динамики – это табличное изменение показателя во времени. Они могут быть интервальные и моментные. Интервальные хар-т объем признака за определ. момент времени. Например, производство стали по годам. Моментные хар-т состояния явления или процесса на определенную дату или на определ. момент времени. Различают ряды динамики абсолютных, относительных и средних величин. Показатели интервальных рядов обладают свойством суммарности, т. е. их можно суммировать, получая новые показатели. Моментные ряды суммировать нельзя. В рядах динамики различают yi – текущие уровни ряда динамики; у1 – начальный уровень ряда динамики; уn – конечный уровень ряда динамики; у0 – базисный уровень ряда динамики. Для интервальных рядов средний уровень динамики определяется по ф-ле средней арифметич. простой:
. Для моментных рядов с равными промежутками времени для расчета уср. применяют ф-лу средней хронологической: , где n – число временных точек.