Средняя ошибка выборки
2. Виды отбора.
3. Ошибки выборки, определение объема выборочной совокупности.
4. Способы распространения выборочных характеристик.
1. Понятие выборочного наблюдения, репрезентативность выборочного наблюдения.
1. Выборочное наблюдение несложное наблюдение, при котором обследуется не вся совокупность, а лишь часть, отобранная по определенным правилам выборки и обеспечивающая получение данных, характеризующих всю совокупность в целом.
При проведении выборочного наблюдения нельзя получить абсолютно точные данные, как при сплошном, т. к. обследованию подвергается не вся совокупность, а ее часть. Поэтому при проведении выборочного наблюдения неизбежна некоторая свойственная ему погрешность, ошибка.
Ошибки, свойственные выборочному наблюдению, называются ошибками репрезентативности, т. е. представительства. Они характеризуют размер расхождения между данными выборочного наблюдения и всей совокупности.
Ошибки репрезентативности делятся на случайные и систематические.
Случайные ошибки возникают вследствие того, что выборочная совокупность недостаточно точно воспроизводит совокупность, вследствие несплошного характера наблюдения. Случайные ошибки м. б. доведены до незначительных размеров, а главное размеры и пределы их можно определить с достаточной точностью на основании закона больших чисел и теории вероятности.
Систематические ошибки возникают в результате нарушения принципа случайности отбора единиц совокупности для наблюдения.
Вся совокупность единиц, из которой производится отбор, называется генеральной совокупностью и обозначается буквой N. Часть генеральной совокупности, попавшая в выборку, называется выборочной совокупностью и обозначается n.
Обобщающие показатели генеральной совокупности средняя, дисперсия, доля называются генеральными и соответственно обозначаются доля отнесения М единиц, обладающих определенным признаком, ко всей численности генеральной совокупности, т. е. М/N.
Обобщающие характеристики в выборочной совокупности называются выборочными и обозначаются соответственно x*, частость отношение числа единиц, обладающих данным признаком, в выборочной совокупности n, т. е.
Теория выборочного метода дает возможность определить случайные ошибки обобщающих характеристик в выборочной совокупности.
Ошибка репрезентативности разность между выборочной средней и генеральной средней при достаточно большом числе наблюдений будет сколько угодно малой, т. е.
где абсолютная величина расхождения между генеральной средней и выборочной средней, составляющая ошибку репрезентативности.
— среднее квадратическое отклонение вариантов выборочной средней от генеральной средней (средняя ошибка выборки). Она зависит от колеблемости признака в генеральной совокупности и числа отобранных единиц n: . Величина m зависит также от способа образования выборочной совокупности, т. к. между средней ошибкой выборки и n числом отбираемых единиц существует обратно пропорциональная связь. Отсюда вытекает следующее правило: если надо уменьшить ошибку выборки, например, в 3 раза, необходимо увеличить объем выборки в девять раз.
Увеличение колеблемости признака в генеральной совокупности влечет за собой увеличение среднего квадратического отклонения, и следовательно и ошибки выборки.
Доказано, что соотношение между дисперсиями генеральной и выборочной совокупностей выражаются формулой:
, т. к. при больших n приближается к 1, то
Средняя ошибка выборки показывает, какие возможны отклонения характеристик выборочной совокупности от соответствующих характеристик генеральной совокупности. Однако о величине этой ошибки можно судить с определенной вероятностью, на величину которой указывает коэффициент доверия t.
Величина обозначается называется предельной ошибкой выборки. Следовательно предельная ошибка выборки определяется формулой = . С увеличением t увеличивается вероятность нашего утверждения, но вместе с тем увеличивается и величина ошибки.
2. Виды и схемы отбора.
Формирование выборочной совокупности из генеральной может осуществляться по-разному: в зависимости от вида и схемы отбора, и т. д. От их особенностей зависит размер ошибки и методы определения. Различаются 4 вида отбора:
1. собственно-случайный
2. механический
3. типический
4. серийный (гнездовой)
Собственно-случайный отбор включение единиц совокупности осуществляется наудачу. Наиболее распространенным способом отбора в случайной выборке является жеребьевка, при которой на каждую единицу заготавливают билет с порядковым номером. Затем в случайном порядке отбирают необходимое количество единиц совокупности. При этих условиях каждая из них имеет одинаковую вероятность попасть в выборку.
Механический отбор вся совокупность разбивается на равные по объему группы по случайному признаку. Затем из каждой группы случайно отбирается одна единица.
Типичный отбор совокупность расчленяется по существенному, типическому признаку на качественно однородные, однотипные группы. Затем из каждой группы случайным или механическим способом отбирается количество единиц, пропорциональное удельному весу группы во всей совокупности.
Типический отбор дает более точные результаты чем случайный или механический, потому что при нем в выборку в такой же пропорции как и в генеральной совокупности, попадают представители всех типических групп.
Серийный отбор (гнездовой) отбору подлежат не отдельные единицы совокупности, а целые группы, серии, гнезда, отобранные случайным или механическим способом. В каждой такой группе, серии проводится сплошное наблюдение, а результаты переносятся на всю совокупность.
Точность выборки зависит и от схемы отбора. Выборка м. б. проведена по схеме повторного или бесповторного отбора.
Повторный отбор каждая отобранная единица или серия возвращается во всю совокупность и может вновь попасть в выборку.
Бесповторный отбор каждая обследованная единица не возвращается в совокупность и не м. б. подвергнута повторному обследованию. Бесповторный отбор дает более точные результаты, т. к. при одном и том же объеме выборки наблюдение охватывает большее количество единиц изучаемой совокупности.
Обе схемы отбора могут применяться в сочетании с разными видами отбора, за исключением механического, который всегда бывает бесповторным.
3. Ошибки выборки, определение объема выборочной совокупности
Для суждения о праве распространения данных выборочного наблюдения на генеральную совокупность определяют величину ошибок между сводимыми показателями выборочной и генеральной совокупностей.
Обычно сопоставляют такие показатели:
1. Среднюю выборочной совокупности со средней генеральной совокупности, в результате чего получаем ошибку средней.
2. Частость выборочной совокупности с долей генеральной совокупности, что дает возможность определить ошибку частостей:
Разность между показателями выборочной и генеральной совокупностей называется ошибкой репрезентативности. Если эти показатели достаточно близки, то выборка считается репрезентативной.
Выборочная средняя и частость являются переменными величинами, т. е. могут принимать различные значения в зависимости от того, какие единицы совокупности попали в выборку. Следовательно, ошибки выборки также являются переменными величинами и также могут принимать различные значения в зависимости от единиц совокупности, попавшие в выборку. Вот почему определяется средняя из возможных ошибок, которая обозначается буквой . Величина зависит от степени колеблемости значений признака в генеральной совокупности и от численности выборки n. Степень колеблемости в генеральной совокупности определяется средним квадратом отклонений или дисперсией . Из математических теорем и закона больших чисел следует, что при случайном отборе, проведенном по системе повторной выборки, между и п существует следующая зависимость:
Ошибка выборочного наблюдения это разность между величиной параметра в генеральной совокупности и его величиной, вычисленной по результатам выборочного наблюдения
Чебышев доказал, что при достаточно большом числе независимых наблюдений можно с вероятностью, близкой к единице утверждать, что отклонение выборочной средней от генеральной будет сколь угодно малым.
, величину называют средней ошибкой выборки.
Соотношение между дисперсиями генеральной и выборочной совокупности выражается формулой
Если выборочное наблюдение применяется для определения доли признака, то средняя ошибка доли исчисляется по формуле
, т. к. дисперсия альтернативного признака , где p доля единиц совокупности, обладающих данным признаком, а q не обладающим данным признаком.
В этих формулах и pq характеристики генеральной совокупности, которые при выборочном наблюдении неизвестны. На практике их заменяют аналогичными характеристиками выборочной совокупности, что вполне правомерно, т. к. основано на законе больших чисел, по которому выборочная совокупность при достаточно большом объеме выборки достаточно точно воспроизводит характеристики генеральной совокупности.
При бесповторном отборе средняя ошибка выборки равна
, а ошибка доли , где N численность единиц генеральной совокупности.
Множитель всегда меньше единицы, т. к. n < N. Поэтому величина средней ошибки выборки при бесповторном отборе меньше чем при повторном.
Для решения практических задач выборочного обследования средней ошибки выборки недостаточно, потому что при исчислении ошибки конкретной выборки фактическая ошибка м. б. больше или меньше средней ошибки выборки . Поэтому пользуются не средней, а предельной ошибкой выборки, т. е. пределами, за которые не выйдет фактическая ошибка выборки.
Предельная ошибка выборки зависит от того, с какой вероятностью должна гарантироваться ошибка выборки. Уровень вероятности определяется на основе теорем Чебышева и Ляпунова при помощи специального коэффициента t.
Если предельную ошибку выборки обозначить буквой , то , где t коэффициент, зависящий от вероятности, с которой гарантируется ошибка выборки. Он называется еще коэффициентом доверия. Чтобы определить величину вероятности для различных значений t на практике пользуются готовой таблицей.
Систематизируем формулы для определения предельной ошибки средней и доли
Схема отбора |
Предельная ошибка выборки |
|
Для средней |
Для доли |
|
Повторный отбор Бесповторный отбор |
Из формул видно, что предельная ошибка выборки прямо пропорциональна коэффициенту t, дисперсии и обратно пропорциональна корню квадратному из численности выборки.
Дисперсия величина конкретная, свойственная данной совокупности. Обычно она неизвестна, а известна *, которой и заменяют величину , потому что в силу действия закона больших чисел при достаточно большом объеме выборки n распределение признака x в выборочной совокупности близко воспроизводит распределение этого признака в генеральной совокупности.
Ошибка выборки зависит и от ее объема n. Чем больше объем выборки, тем меньше предельная ошибка (при данных и t)
Рассмотренные формулы средней и предельной ошибки и доли применяются при случайном и механическом видах отбора.
При типическом отборе предельная ошибка выборки и доли определяется по формулам:
Схема отбора |
Предельная ошибка выборки |
|
Для средней |
Для доли |
|
Повторный отбор Бесповторный отбор |
т. е. при типичном отборе надо брать средние из внутригрупповых дисперсий и доли, полученные по каждой типической группе.
Из этих формул видно, что при типическом отборе в отличие от случайного исключается влияние межгрупповой вариации на точность выборки, т. к. в выборку обязательно попадают представители всех групп в тех же пропорциях, что и в генеральной совокупности. Ошибка выборки при типичном отборе зависит только от средней из внутригрупповых дисперсий, а не от общей дисперсии, как при случайном отборе т. к.
, откуда
Следовательно ошибка выборки при типическом отборе всегда меньше ошибки выборки, проведенной случайным отбором.
При серийном отборе каждая серия рассматривается как единица совокупности, и мерой колеблемости будет межсерийная выборочная дисперсия, т. е. средний квадрат отклонений серийных средних от общей выборочной средней:
, где средняя по каждой серии, x* общая выборочная средняя, s число отобранных серий.
Предельная ошибка выборки и доли при серийном отборе с равновеликими сериями определяется по формулам, где S общее число серий в генеральной совокупности.
Схема отбора |
Предельная ошибка выборки |
|
Для средней |
Для доли |
|
Повторный отбор Бесповторный отбор |
Выборочное наблюдение, объем которого превышает 20 единиц, называется малой выборкой. Для определения средней и предельной ошибок при малой выборке пользуются теми же формулами, что и при большой, но только с некоторыми особенностями, так , а .
Кроме того, в случае малой выборки действует особый закон распределения величин t, и при определении вероятности учитывается не только коэффициент t, но и объем выборки n.
Необходимая численность выборки (n) определяется на основе формул предельной ошибки выборки.
Если выборка повторная, то при случайном и механическом отборах определяется по формуле
, при бесповторном отборе
4. Способы распространения выборочных характеристик.
Есть два способа распространения выборочных характеристик на всю совокупность прямой пересчет и способ коэффициентов
Способ прямого пересчета заключается в том, что средние или частости выборочной совокупности умножаются на числа единиц генеральной совокупности.
Когда выборочное обследование проводится в целях уточнения данных сплошного наблюдения, применяется способ коэффициентов. В этом случае данные сплошного наблюдения сопоставляют с данными выборочного наблюдения и устанавливают процент расхождения между ними, т. е. процент надоучета или переучета. Коэффициенты, полученные в результате такого сопоставления, используются для внесения поправок в данные сплошного учета.
Пример.
1) способ прямого пересчета
Для определения качества продукции проверено 500 изделий из 10000. В результате чего установлено, что средний % изделий 3-го сорта всей партии будет находиться в пределах 6,1-13,9%. Способом прямого пересчета определяем, что обще кол-во изделий 3-го сорта всей партии составит от 610 до 1390
10000*0,061= 610
10000*0,139 = 1390
2) способ коэффициентов
Пример
Необходимо определить численность выборки, которая позволила бы оценить долю брака в партии продукции с точностью до 2%, с вероятностью Р =0,954. Партия состоит из 10000 изделий
,
, P =0,954, t =2
pq=0,25 (p=0,5; q=0,5)