Лабораторные работы (Лабораторная работа №4)

Посмотреть архив целиком







Лабораторная работа №4

по курсу «Теория вероятностей

и математическая статистика»














Выполнил : студент группы А-13-03
Орлов Алексей Васильевич





Москва 2006Определения и построение интервалов

Пусть (x1,...,xn) º x - n независимых наблюдений над случайной величиной с законом распределения F(z/a), зависящим от параметра a, значение которого неизвестно.

Определение 1. Функция наблюдений a1(x1,...,xn) (заметим, что это случайная величина) называется нижней доверительной границей для параметра a с уровнем доверия РД (обычно близким к 1), если при любом значении

P{ a1(x1,...,xn)£ a} ³ PД

Определение 2. Функция наблюдений a2(x1,...,xn) (случайная величина) называется верхней доверительной границей для параметра с уровнем доверия РД , если при любом значении

P{ a2(x1,...,xn) ³ a } ³ PД .

Определение 3. Интервал со случайными концами (случайный интервал)

I(x) = ( a1(x), a2(x) ) ,

определяемый двумя функциями наблюдений, называется доверительным интервалом для параметра a с уровнем доверия РД , если при любом значении a

P{ I(x)' a } º P{ a1(x1,...,xn) £ a £ a2(x1,...,xn) } ³ PД ,

т.е. вероятность (зависящая от a) накрыть случайным интервалом I(x) истинное значение a - велика: больше или равна РД.

Построение доверительных границ и интервалов. Для построения доверительного интервала (или границы) необходимо знать закон распределения статистики z=z(x1,...,xn), по которой оценивается неизвестный параметр (такой статистикой может быть оценка z = â(x1,...,xn) ). Один из способов построения состоит в следующем. Предположим, что некоторая случайная величина j = j(z, a), зависящая от статистики z и неизвестного параметра a такова, что

1) закон распределения известен и не зависит от a;

2) j(z, a) непрерывна и монотонна по .

Выберем диапазон для - интервал так, чтобы попадание в него было практически достоверно:

P{ f1 £ j(z, a) £ f2 } ³ PД , (1)

для чего достаточно в качестве и взять квантили распределения уровня (1- РД )/2 и (1+ РД )/2 соответственно. Перейдем в (1) к другой записи случайного события, разрешив неравенства относительно параметра a; получим (полагая, что монотонно возрастает по ):

P{ g(z, f1) £ a £ g(z, f2) } ³ PД .

Это соотношение верно при любом значении параметра a (поскольку это так для (1)), и потому, согласно определению, случайный интервал

( g(z, f1) , g(z, f2) )

является доверительным для a с уровнем доверия РД . Если убывает по , интервалом является ( g(z, f2) , g(z, f1) ).

Для построения односторонней границы для a выберем значения и так, чтобы

P{ j(z, a) ³ f1 } ³ PД , f1=Q(1 - PД )

или P{ j(z, a) £ f2 } ³ PД , f2 = Q( PД ),

где - квантиль уровня . После разрешения неравенства под знаком получим односторонние доверительные границы для a.

Пример. Доверительный интервал с уровнем доверия РД для среднего a нормальной совокупности при известной дисперсии s.

Пусть x, ... , xn - выборка из нормальной N(a, s) совокупности. Достаточной оценкой для а является

â = â(x,...,xn) = ,

распределенная по закону N(a, ) ; пронормируем её, образовав случайную величину

, (2)

которая распределена нормально N(0,1) при любом значении а.

По заданному уровню доверия РД определим для j отрезок [-fp, fp] так, чтобы

, (3)

т.е. fp - квантиль порядка (1+ РД )/2 распределения N(0,1); заметим, что j зависит от а , но (3) верно при любом значении а. Подставим в (3) выражение для j из (2) и разрешим неравенство под знаком вероятности в (3) относительно а ; получим соотношение

, (4)

верное при любом значении а. под знаком вероятности две функции наблюдений

, ( 5)

определяют случайный интервал

I( x1, ... , xn) =(a1( x1, ... , xn), a2( x1, ... , xn)), (5a)

который в силу (4) обладает тем свойством , что накрывает неизвестное значение параметра а с большой вероятностью РД при любом значении а, и потому, по определению доверительно интервала, он является доверительным с уровнем доверия РД .

В общем случае случайную величину j в (1) можно построить следующим образом. Определим функцию распределения F(z/a) статистики z (F, конечно, зависит от а). Для непрерывной z случайная величина j(z, а)º F(z /a), как нетрудно видеть, распределена равномерно на отрезке [0, 1] при любом значении а; приняв f1= (1- PД)/2, f2 =(1+PД)/2, будем иметь в качестве (4)

P{f1 £ F(z /a) £ f2} = PД .

Для дискретной z ситуация аналогична.

Можно рассуждать иначе: при любом фиксированном значении а определим отрезок [z1(a), z2(a) ] так, что

P{ z1(a) £ z £ z2(a) } ³ РД ; (6)

ясно, что в качестве z1 и z2 можно взять квантили, т.е. определить из условий

F(z!/a)=(1- РД )/2, F(z2/a)=(1+ РД )/2.

Если z1(a) и z2(a) монотонно возрастают по а, то, разрешив два неравенства под знаком Р в (6) и учитывая, что z1(a) < z2(a), получим:

P{ z2-1(z) £ a £ z1-1(z) } ³ РД ,

вверное при любом а; ясно, что интервал ( z2-1(z) , z1-1(z) ), определяемый двумя функциями от z , является доверительным с уровнем доверия РД.

Уровень доверия

Уровень доверия РД означает, что правило определения интервала дает верный результат с вероятностью РД, которая обычно выбирается близкой к 1, однако, 1 не равно.Убедимся статистически на примере в том, что доверительный интервал с уровнем доверия РД может не содержать (с малой вероятностью 1- РД ) истинное значение параметра.

Пример. рассмотрим приведенный в (5) случайный интервал I(x1, ..., xn), который при любом значении а накрывает это значение с большой вероятностью РД:

Р{ I(x1,...,xn) ' a } = РД ,

и потому, если пренебречь возможностью осуществления события aÏI, имеющего малую вероятность (1-РД), можно считать событие aÎI(x1,...,xn) практически достоверным, т.е. можно верить тому, что вычисленный по конкретным наблюдениям x1,...,xn интервал I содержит неизвестное значение параметра а.

Интервалы для параметров нормального распределения

Пусть х1, … ,хn - выборка из нормального N(a,s2) распределения; значения среднего а и дисперсии s2 неизвестны. Оценки для а и s2:

, . (7)

Как известно, доверительным интервалом для среднего а с уровнем доверия РД при неизвестной дисперсии является интервал

I(x) = (a1(х), a2(х) ), (8)

где , , (9)

tp - квантиль порядка (1+ РД)/2 распределения Стьюдента с n-1 степенями свободы.

Доверительным интервалом для стандартного отклонения s с уровнем доверия РД является интервал

I (x)=(s1(х), s2(х)) , (10)

где , , (11)

t1 и t2- квантили порядков соответственно (1+ РД)/2 и (1- РД)/2 распределения хи-квадрат с n-1 степенями свободы.

Если нас интересуют не интервалы, а верхние или нижние доверительные границы, то, как известно, они определяются теми же формулами (9) и (11), однако, значения порогов t изменяются. Например, нижней доверительной границей для a с уровнем доверия РД является значение

,

где tp - квантиль порядка РД распределения Стьюдента с n-1 степенями свободы, а верхней границей для s с уровнем доверия РД является

,

где t2 - квантиль порядка 1- РД распределения хи-квадрат с n-1 степенями свободы.

1. Определить, сколько раз из k =50 доверительный интервал оказался неверным для трех значений РД =0.9, 0,99, 0,999.


=vnormal(rnd(1); 17; 3)


2. Провести аналогично 50 испытаний доверительного интервала для случая неизвестной дисперсии.


=vnormal(rnd(1); 17; 3)


3. Определить верхние доверительные границы для а и s с уровнем доверия РД = 0.95.


=vnormal(rnd(1); 17; 3)


4. Расстояние а до некоторого объекта измерялось n1 = 5 раз одним прибором и

n2 = 10 - вторым; результаты х1,…,хn1; y1,…,yn2. Оба прибора при каждом измерении дают независимые случайные ошибки, нормально распределенные со средним 0 и стандартными отклонениями s1 = 3 и s2 = 5 соответственно. Методом максимального правдоподобия построить оценку â для а = 300 и доверительный интервал с уровнем доверия РД = 0,95 .

1. Результаты моделирования и границы доверительных интервалов.