Предельная ошибка и необходимый объем выборки
Точечные оценки неизвестного параметра Ɵ хороши в качестве первоначальных результатов обработки наблюдений, их недостаток в том, что неизвестно с какой точностью они дают оцениваемый параметр.
Оценка неизвестного параметра Ɵ называется интервальной, если она определяется двумя числами – концами интервала.
43.ПРЕДЕЛЬНАЯ ОШИБКА И НЕОБХОДИМЫЙ ОБЪЕМ ВЫБОРКИ.
Δxср=uα/2Ϭ(Хср) – предельная ошибка выборочной средней.
Необходимый объем выборки для собственно-случайной выборки:
Повторная:
Хср – t2Ϭ2/Δ2
Доля, Ṗ – t2pq/Δ2
Бесповторная:
Хср – t2Ϭ2N/ t2Ϭ2+Δ2N
Доля, Ṗ – t2Npq/t2pq+Δ2N
44.СТАТИСТИЧЕСКИЕ ГИПОТЕЗЫ.
Статистическая гипотеза – всякое высказывание о генеральной совокупности, проверяемая по выборке. Одну из гипотез выделяют в качестве основной (нулевой) и обозначают Н0, а другую противоположную ей, обозначают Н1.
45.УРОВЕНЬ ЗНАЧИМОСТИ И МОЩНОСТЬ КРИТЕРИЯ.
При проверке гипотезы может быть принято неправильное решение, могут быть допущены ошибки 2 родов:
1-го рода состоит в том, что отвергается нулевая гипотеза, хотя на самом деле она верна. Вероятность ошибки 1-го рода обозначается α-уровень значимости критерия. Чем меньше α, тем меньше вероятность отклонить верную гипотезу.
2-го рода состоит в том, что отвергается альтернативная гипотеза Н1, хотя она верна. Вероятность ошибки второго рода обозначается через β. Вероятность β – мощность критерия. Чем больше мощность, тем вероятность ошибки второго рода меньше.
46.ПРОВЕРКА СТАТИСТИЧЕСКИХ ГИПОТЕЗ.
Основной принцип гипотез состоит в следующем: множество возможных значений статистики критерия Tn разбивается на два непересекающихся подмножества – критическую область, т. е. область отклонения гипотезы Н0, и область принятия этой гипотезы. Если фактически наблюдаемое значение статистики критерия (т. е. значение критерия, вычисленное по выборке) попадает в критическую область, то основная гипотеза Н0 отклоняется и принимается альтернативная Н1, если же в область принятие этой гипотезы, то принимается Н0, а Н1 – отклоняется.
47.КРИТЕРИИ СОГЛАСИИ ПИРСОНА И КОЛМОГОРОВА.
Критерий согласия – статистический критерий проверки гипотезы о предполагаемом законе распределения.
В качестве меры расхождения между эмпирическими частотами (ni) и теоретическими (ni’) для i(1,m) используют критерий Пирсона.
χ2=(ni-n*pi)2/npi(1*)
Дифференциальная функция распределения χ2 с v=n степенями свободы задается формулой:
f(χ2)=1/(2n/2*Г(n/2))* (χ2)(n/2-1)*ex^2/2
где Г(х) – гамма, функция Эйлера.
Г(х)=
Согласно теореме Пирсона при n→∞, статистика χ2 имеет χ2 распределение k=l-r-1.
Правило применения критерия Пирсона: 1)по формуле (1*) вычисляют «хи2» наблюдаемое – выборочное значение критерия. 2) выбрав уровень значимости «хи2»-критерия по таблице «хи2»-распределения находим критические точки. 3) если «хи2» наблюдений ≤критическим точкам, то гипотеза Н0 не противоречит опытным данным, и наоборот.
Сущность критерия Колмогорова состоит в том, что вводят в рассмотрение функцию Dn=max|Fn*(x)-F(x)| — статистика Колмогорова, представляющая мах. отклонение эмпирической функции распределения Fn*(x) от теоретической функции F(x). При n→∞ ЗР СВ*Dn независимо от рода распределения СВ Х стремится к ЗР Колмогорова, т. е. Р(*Dn<x)→K(x)-функция распределения Колмогорова.
48.ОСНОВНЫЕ ПОНЯТИЯ ДИСПЕРСИОННОГО АНАЛИЗА.
Дисперсионный анализ дает возможность установить, существенное ли влияние оказывает тот или иной из рассматриваемых факторов на изменчивость признака, а также определить количественно «удельный вес» каждого из источников изменчивости в их общей совокупности.
Основные термины в ДА:
Фактор (Х) – то, что, как мы считаем, должно оказывать влияние на результат Y.
Фровень фактора – значения, которые может принимать фактор.
Отклик – значение измеряемого признака.
51.ЛИНЕЙНАЯ КОРРЕЛЯЦИОННАЯ ЗАВИСИМОСТЬ И ЛИНИИ РЕГРЕССИИ.
Выборочное уравнение регрессии Y на X имеет вид:
yx-yср= rb*Ϭ0y/Ϭ0x*(x-xср)
где rb – выборочный коэффициент корреляции, ух=by/x*x+ay/x,
by/x=rb* Ϭ0y ср/Ϭ0x ср,
ay/x=yср – хср* rb* Ϭ0y ср/Ϭ0x ср
Выборочное уравнение регрессии Х на Y:
xy-xср= rb*Ϭ0x/Ϭ0y*(y-yср)
Если rb = ±1, то у и х связаны линейной функциональной зависимостью, т. е. rbизмеряет тесноту линейной связи между X и Y.
52.ПРОВЕРКА ЗНАЧИМОСТИ УРАВНЕНИЯ И КОЭФФИЦИЕНТОВ УРАВНЕНИЯ РЕГРЕССИИ.
Гипотеза Н0: bj = 0 о значимости коэффициентов регрессии y=β0bjxj определяется с использованием t-критерия Стьюдента для двусторонней области при заданном уровне значимости α и ν=n-k-1 степенями свободы:
tрасч=|bj|/
n-число наблюдений,
k-число факторов,
– дисперсия остатков.
Если гипотеза принимается для всех j, то на этом регрессионный анализ заканчивается. Для значимых факторов уравнения регрессии рассматривают интервальные оценки коэффициентов и самого уравнения регрессии.
53.РАНГОВАЯ КОРРЕЛЯЦИЯ.
В случаях, когда вид распределения неизвестен, используют меры связи, не регламентирующие нормальность выборок, например, коэффициент ранговой корреляции Спирмена –rs:
Rs=1-6Ʃd2i/n(n2-1), где d2i– квадраты разности рангов, n – число наблюдений.
Ранг – это порядковый номер значений признака, расположенных в порядке возрастания или убывания их величин.