Лабораторные работы (lab1)

Посмотреть архив целиком

  1. Теорема Бернулли


Если проводится n независимых испытаний случайного события A, вероятность которого P(A) = p, то относительная частота /n появления события A ( число появлений A) при большом n приближенно равна вероятности p:

.

уточнение: будем писать

при ,

если для любого >0 и для достаточно больших n соотношение

(1)

выполняется с вероятностью, стремящейся к 1 с ростом n; запишем это так:

при .

В этом состоит теорема Бернулли. Заметим, что теорема не утверждает, что соотношение (1) достоверно, однако, если n достаточно велико, то вероятность его выполнения близка к 1 (например, 0.98 или 0.999), что практически достоверно. Если собираемся провести эксперимент, состоящий из этого достаточно большого числа n испытаний, то можем быть уверены, что соотношение (1) будет выполнено. Проверим это не абсолютно достоверное утверждение.


Пример. Бросание симметричной монеты.

Вероятность появления герба p=0.5. можно показать (с помощью центральной предельной теоремы), что, например, если n (1.5/)2, то соотношение (1) выполняется с вероятностью 0.997, а если n (1.3/)2, то с вероятностью 0.99; последняя в данном случае нас вполне устраивает как практическая достоверность. Положим = 0.1; тогда соотношение

| / n - 0.5 | < 0.1 (a)

выполняется с вероятностью 0.99 при n170. если =0.03, то соотношение

| / n - 0.5 | < 0.03 (б)

выполняется с вероятностью 0.99 при n 1850. Мы уверены, что, проведя 170 бросаний монеты, получим (а), а, проведя 1850 бросаний, получим (б).

Бросание монеты моделируем генерацией случайной величины , принимающей значения 1 ("герб") и 0 ("цифра") с вероятностями 1/2. Число появлений "герба" в n испытаниях , где k- результат k-го испытания.

Выполнение в пакете Statistica

В главном меню пакета, в окне STATISTICA Module Switcher выбираем Data Management (управление данными) или Basic Statistics/Tables (основные статистики и таблицы). При появлении предложений отвечаем согласием.

а) Образование вектора длины n = 1850.

File - New Data - File Name: Limit (например) на диске D в директории ТМP -OK. Появляется таблица 10v 10c (10 переменных-строк и 10 столбцов-“случаев”, т.е. наблюдений), преобразуем ее в 1v 1850c: кнопка Vars - Delete...- From variable: var 2, to variable: var 10 - OK. Кнопка Cases - Add - Number of Cases to Add: 1840 - OK.

Можно убедиться прокруткой, что заготовлена матрица 1v 1850c; это же видно в заголовке таблицы.

б) генерация n = 1850 значений .

Analisis - Modifi Variables...- Current Specs - назовем переменную Name: alpha, введем определяющее выражение Long name:

= trunc (rnd (1) + 0,5)

что означает взять целую часть от случайной величины, распределенной равномерно на отрезке [0,5, 1,5] (оператор rnd(1) генерирует случайные числа, распределенные равномерно на отрезке [0, 1]) - OK. Вводить можно с клавиатуры или с помощью кнопки Function. Отметим, что генерацию можно было бы осуществлять не во все клетки столбца, а в заранее выделенные.

в) Определение числа появлений “герба” и относительной частоты fn в серии из n = 170 испытаний.

Выделим первые 170 наблюдений: выделим 1-ю клетку, нажмем и держим Shift, прокрутим таблицу до 170-й клетки и кликнем по ней. Далее:

Edit - Block Stats/Columns - Sum’s (во 2-й раз - Means).

Результат получаем во вновь образованных двух последних строках. Результат записываем и убеждаемся, что fn 0.5 < 0.1.

Получим fn = 88/170 = 0.02 => fn 0.5 < 0.1

г) Определение числа появлений “герба” и относительной частоты fn в серии из n = 1850 испытаний.

Выделяем все наблюдения, кликнув по заголовку столбца. Далее так же. Убеждаемся, что fn 0.5 < 0.03.

Получим fn = 924/1850 => fn 0.5 < 0.03.


    1. Закон больших чисел в форме Чебышева

      1. Основное утверждение

Одно из основных утверждений закона больших чисел состоит в том, что значение среднеарифметического случайных величин с равными математическими ожиданиями при большом n (при некоторых широких условиях) оказывается приближенно равным a:

уточним: будем писать

при ,

если для любого >0 и достаточно больших n соотношение

(2)

выполняется с вероятностью, стремящейся к 1 с ростом n; запишем это так:

при n .

это одно из утверждений закона больших чисел. Заметим, что, как и теорема Бернулли, оно не означает, что соотношение (2) достоверно; однако, если n достаточно велико, то вероятность его выполнения близка к 1, например, 0.98 или 0.999, что означает практически достоверно. Приведем полную формулировку одной из теорем закона больших чисел в форме Чебышева,

Теоремы Чебышева. Если - последовательность попарно независимых случайных величин, имеющих конечные дисперсии, ограниченные одной и той же постоянной:

,

то для любого >0

при .

      1. Испытание практически достоверного события

Убедимся в выполнении (2) статистически на примере1.

Пример1. Случайные величины распределены равномерно на отрезке [0,1]. Если значение задавать произвольно, а число испытаний выбирать из условия n (9D/2), то (как нетрудно показать) соотношение (2) выполняется с вероятностью P=0.997, а если n (5.4D/2) - то с P=0.98. Последняя нас устраивает, как практическая достоверность.

Положим 1 =0.1 и 2 =0.02, определим два соответствующих значения n1 =45 и n2 =1125, и проверим (2) экспериментально (в нашем случае a=0.5). Выполнение аналогично п.1. При генерации случайных чисел нужно задать полное имя новой переменной, например, LIMIT.unif.


Задание. Проверить (2) экспериментально для экспоненциально распределенных слагаемых с M=1. Принять 1 =0.2 и 2 =0.05. При выполнении в пакете SPSS учесть, что - ln , где ~ R[0, 1], имеет требуемое распределение.


Пример 2. Невыполнение закона больших чисел

Рассмотрим случайную величину, распределенную по закону Коши с плотностью

(3)

Заметим, что плотность симметрична относительно нуля, однако, 0 не является математическим ожиданием; это распределение не имеет математического ожидания. Напомним, что математическим ожиданием называется , если ; последнее, очевидно, для распределения Коши не выполняется. Для последовательности независимых случайных величин, распределенных по закону Коши (3), закон больших чисел не выполняется. Если бы среднеарифметическое сходилось с ростом n к какой-либо константе, то, в силу симметрии распределения, такой константой мог быть только 0. Однако, 0 не является точкой сходимости. Действительно, можно показать, что при любом >0 и при любом сколь угодно большом n

(4)

с вероятностью arctg . (Поясним сказанное: с помощью характеристических функций легко показать, что распределена по (3), а функция распределения для (3) есть arctg x). Эта вероятность, как видно, не стремится к 0 с ростом n. Например, если = 0.03, то вероятность выполнения (4) равна приближенно P 0.98, т.е. событие (4) практически достоверно, и можно уверенно ожидать его выполнения с одного раза. Если =1, то вероятность (4) равна 0.5, и выполнение его хотя бы раз можно уверенно ожидать, проделав 7 экспериментов (т.к. вероятность невыполнения ни разу равна (0.5)7 = 1/128). И это при любом фиксированном n, например, n = 1000. Проверим это экспериментально.

При выполнении в пакетах, где нет закона Коши, учтем, что, если случайная величина X распределена равномерно на отрезке длины , то случайная величина

Y = tg X (5)

имеет плотность (3). Сгенерируем 7 выборок объемом n=1000 и проверим (4) при =1.


Выполнение в пакете STATISTICA

Сгенерируем 7 выборок объема n = 1000 с распределением Коши и определим по каждой среднее значение.

а) Заготовим таблицу 7v 1000c, изменив имеющуюся.

б) Сгенерируем выборки.

Vars - All Specs - выделяем любую клетку в 4 столбце и вводим определяющее выражение, соответствующее плотности (3),

= VCauchy (rnd (1); 0; 1)

здесь а = 0 – параметр сдвига, b = 1 – параметр масштаба в плотности

p (x a, b) = ;

переносим выражение в остальные 6 клеток:

Edit - Copy (переносим запись в буфер), выделяем другую клетку и

Edit - Paste (вставляем запись); это же можно сделать короче с помощью кнопок Copy и Paste; закрываем окно и исполняем

кнопка Х = ? (Recalculate) - All variables - OK.

в) Определим среднее значение на всех 7 выборках:

выделим всю матрицу (щелчок на пересечении заголовков строк и столбцов) - Edit - Block Sats/Columns - Means.

Убеждаемся, что хотя бы в одной выборке модуль среднего превосходит 1. Если же это не так, то нам крупно не повезло: произошло событие с вероятностью менее 0,01.

г) Посмотрим график выборки из распределения Коши (рис.1):

Graphs - Stats 2D Graphs - Line Plots (Variables)... - в поле Line Plots вводим Variables: x1 (например), Graph Tipe: Regular, Fit: off.

обратим внимание на то, что имеются редкие наблюдения, отстоящие очень далеко от центра распределения – точки 0.


Рис. 1.Выборка наблюдений, распределенных по закону Коши (N = 200).


      1. Сжатие распределения с ростом числа слагаемых

Закон больших чисел в форме Чебышева означает, что распределение случайной величины

сжимается с ростом n. Если математические ожидания одинаковы, т.е. Mi=a, то сжатие происходит в окрестности точки a.

Аналитически иллюстрировать сжатие можно, если распределение для легко выписывается. Например, если i распределены нормально N(a, 2), то случайная величина распределена по N(a, 2/n). Построим графики плотностей для n =1, 4, 25, 100 и =1, a =1 (сделаем это в целях освоения пакета).


Случайные файлы

Файл
21872-1.rtf
11797.rtf
19337.rtf
100086.rtf
158272.rtf




Чтобы не видеть здесь видео-рекламу достаточно стать зарегистрированным пользователем.
Чтобы не видеть никакую рекламу на сайте, нужно стать VIP-пользователем.
Это можно сделать совершенно бесплатно. Читайте подробности тут.