Статистическая оценка параметров распределения
Сумма вер-тей, стоящих в скобках, выражает вер-ть того, что P([X-MX]≥ε), поэтому
DX= ε2p([X-MX]≥ε) – отсюда эта вер-ть
p([X-MX]≥ε)≤DX/ε2 – откуда и следует – утверждение Леммы верно.
ПР:
Теорема Чебышева: если х1,х2….хn – попарно независимы с. в и их дисперсии равномерно ограничены, то для всякого ε>0
. Среднее значение сл. величин стремится к среднему их мат ожиданию при n→∞.
Док-во: Рассмотрим сл. вел-ну Х, среднее:
Х=(х1+х2+…хn)/ n, тогда M(X)=(MX1+MX2+…+MXn)/n. Воспользуемся вероятностью, оно примет вид: P([X-MX]<ε)>1 – DX/ε2.
По условию теоремы и по св-вам дисперсии:
DX=D()=, =>=> , n→∞
P([]<ε)≥1,а т. к вер — по опрелению не моет превышать 1, то она =1, ЧТД!
Сущьность теоремы Ч-ва закл-ся в след-м, для большого n:
1/n∑Xk≈1/n∑MXk, т. е среднее арифмет-е для больших nбольшого числа независимых сл. величин утрачивает характер случайности и становится близкое к своему мат. ожиданию.
22)Статистическая оценка параметров распределения.
Математическая статистика занимается обработкой больших массивов информации, используя методы теории вероятностей. В его основе лежат 2 понятия:
1.генеральная совокупность
2.выборка
Опр: Генеральной совокупностью называется всё мыслимое мн-во объектов.
Выборкой называется часть этой совокупности, полученное по определённому правилу.
Обычно всю ген. совокупность исследовать невозможно, поэтому исследуется различные выборки, и по их арактеристикам делается заключение о ген. совокупности.
(Лампочки)
Опр: Выборкой называется представительной или репрезентативной, если она правильно отражает характеристику ген. совокупности.
На наши данные влияет целый ряд факторов. Эти данные разделяются на 2 большие группы:1. — основные факторы, 2.- случ-е фак-ы.
1)Основные факторы – это факторы, которые не меняются на протяжении времени.
2)Случ-е факторы – это факторы, которые непредсказуемо меняются в процессе наблюдения. (Случайность-мера нашего незнания). При наблюдении возможны три вида ошибок: системные(ПР: весы), грубые(ПР: швыряют кусок мяса на весы), случайные( их изучает ТВ).
Любое суждение о ген. совокупности, сделанное по выборке, является случайным.
Для нахождения неизвестного распределения ген. совок-ти при производстве наблюдений нужно каждому полученному значению xi из n наблюдений pi=. Получаем эмпирическое, или выборочное, распределение: Хn. Если n — велико, то Xn≈X юлизко к теорет-у распределению Х. Точнее говоря, справедлива теорема Гливенко:
С вероятностью 1 при n→∞ разность распределений – [X—Xn]→0 – стремится к нулю.
Статистические оценки параметра распределений.
Пусть у нас неизвестен параметр ген. совок-ти – , *- оценка; возникает вопрос на сколько эта оценка — * — близка к истинному значению .
Различают три хар-ки и близости оценки:
-несмещенность,
-эффективность,
-состоятельность.
Оценка наз-ся несмещенной, если ее МХ = ген. параметру: М(*)=.
Оценка наз-ся эффективной, если DX этой оценки минимальна среди др оценок: D(*)-min. Оценка наз-ся состоят-й, если при n→∞ она стремится к ген. параметру: *=.
Оценка МХ, отвечающая всем трем указанным хар-ам является среднее значение: М(Х)=МХ., Х=(Х1+Х2+…+Хn)/n.
Выборочная дисперсия является смещенная оценка: М(DXn)=, поэтому вместо DXn рассматривается – — несмещенная оценка DX.
Доверительные интервалы и довер-е вер-ти. Среднее значение выборочной DX это точечные оценки: Х, S-точечные оценки.
При небольших V выборки n, гораздо больше интерес преобретает – интервальные оценки.
Опр: Довер-й вер-ю оценки * ген. параметра , наз-ся вер-ть того, что
P(—*]<δ)=γ – довер-я вер-ть. Интервал (*-δ,*+δ) – доверит. интервал. Обычто задается γ, а по заданному γ уже отыскивается довер. интервал.
Стандарт. значения γ: γ1=0,9; γ2=0,95; γ3=0,99. Чем больше довер-ая вер-ть, тем шире довер. интервал.
23)Проверка статистических гипотез.
В основе такой проверки лежит правило практич-й невозможности. События с очень малой вер-тью, практически никогда не происходят. Использование принципа практической невозможности для док-ва неслучайности появления события с малой вер-тью наз-ся пирнципом значимости. Наибольшее значение вер-ти, несовместимо со случайностью событий наз-ся уровень значимости. Ур. знач-ти=(1-γ),
Ур. знач-ти + Ур. достовер-ти=1, max=100 случаев – событие практически не возможно. На практике ур. значимости устанав-ся взависимости от конкретной задачи. Ур. знач-ти, выраженный в %, означает – сколько раз мы рискуем ошибиться, признав изучаемое событие неслучайным. Принцип знач-ти применяется для проверки статистических гипотез. Эта гипотеза о виде неизвестного распределния или параметрах неизвестных распределений.
Проверка гипотез осуществляется по следующему алгоритму:
1)Выдвигается основная гипотеза,
2)Альтернативная гипотеза.
Проверка этих гипотез осуществляется статистическим методом – с помошью таблиц – при этом возможны ошибки:
1)ош-ка 1 рода – отвергнуть верную гипотезу,
2)ош-ка 2 рода – принять неверной гипотезу,
Вер-ть ош-ки 1 рода не превышает уровня значимости, вер-ть ош-ки 2 рода вычисляется значительно сложнее.
Каждый способ в исследовании гипотез с помощью различных случ-х величин, называется критерием согласия.
24) Коэффициент корреляции и его св-ва!
Изучается взаимоотношение м/у двумя сл. величинами. Основные факторы, действующие на каждую из них одинакого. Кроме этого, каждый из них зависит от их случ. факторов, поэтому зависимость м/у ними завуалирована. Связь м/у X и Y рападается на 2-е компоненты:
1)Стохостическая – эта та часть зав-ти, к-ая вызвана тем, что при изменении величины X, изменяется распреление в-ны Y.
2)Случайная – связанная только с воздействием сл. факторов.
Узнать стоимость за 15 минут
Распродажа дипломных
Скидка 30% по промокоду Diplom2020
Подпишись на наш паблик в ВК
Нужна работа?
Контрольная работа у наших партнеров