Лабораторные по Теория вероятностей (lr1)

Посмотреть архив целиком

32



Работа №1. Предельные теоремы


Цель работы: статистически пронаблюдать существо основных предельных теорем.

Содержание.

1. Теорема Бернулли.

2. Закон больших чисел в форме Чебышева.

2.1. Основное утверждение.

2.2. Испытание практически достоверного события.

2.3. Сжатие распределения с ростом числа слагаемых.

3. Усиленный закон больших чисел.

4. Теорема Гливенко основная теорема статистики.

5. Центральная предельная теорема.

5.1. Содержание теоремы.

5.2. Одинаково распределенные слагаемые.

5.3. Различно распределенные слагаемые.

    1. Теорема Бернулли


Если проводится n независимых испытаний случайного события A, вероятность которого P(A) = p, то относительная частота /n появления события A ( число появлений A) при большом n приближенно равна вероятности p:

.

уточнение: будем писать

при ,

если для любого >0 и для достаточно больших n соотношение

(1)

выполняется с вероятностью, стремящейся к 1 с ростом n; запишем это так:

при .

В этом состоит теорема Бернулли. Заметим, что теорема не утверждает, что соотношение (1) достоверно, однако, если n достаточно велико, то вероятность его выполнения близка к 1 (например, 0.98 или 0.999), что практически достоверно. Если собираемся провести эксперимент, состоящий из этого достаточно большого числа n испытаний, то можем быть уверены, что соотношение (1) будет выполнено. Проверим это не абсолютно достоверное утверждение.




Пример. Бросание симметричной монеты.

Вероятность появления герба p=0.5. можно показать (с помощью центральной предельной теоремы), что, например, если n (1.5/)2, то соотношение (1) выполняется с вероятностью 0.997, а если n (1.3/)2, то с вероятностью 0.99; последняя в данном случае нас вполне устраивает как практическая достоверность. Положим = 0.1; тогда соотношение

| / n - 0.5 | < 0.1 (a)

выполняется с вероятностью 0.99 при n170. если =0.03, то соотношение

| / n - 0.5 | < 0.03 (б)

выполняется с вероятностью 0.99 при n 1850. Мы уверены, что, проведя 170 бросаний монеты, получим (а), а, проведя 1850 бросаний, получим (б).

Бросание монеты моделируем генерацией случайной величины , принимающей значения 1 ("герб") и 0 ("цифра") с вероятностями 1/2. Число появлений "герба" в n испытаниях

,

где k- результат k-го испытания.


1) Выполнение в пакете STATGRAPHICS

сгенерируем n = 1850 значений процедурой H.5.Random Number Generation (генерация случайных чисел); при этом потребуется задать закон распределения 1.Bernulli и прописными буквами имя файла (т.e. таблицы, с которой работаем) и имя переменной (столбца таблицы) в соответствующих полях; полное имя переменной, например, LIMIT.alpha (в файл LIMIT впоследствии будем записывать другие переменные столбцы).

вычислим относительную частоту fn = / n :

войдем в исполнительное окно Execution Window ( F8 - команда EXEC вызова окна - F6), набeрем выражение

SUM (170 TAKE alpha) / 170

которое означает: взять первые 170 элементов массива alpha, разделить на 170 и просуммировать; результат запишем и убедимся, что | / n - 0.5 | <0.1.

повторим вычисления, набрав

SUM alpha /1850

результат записшем; убедимся, что | /n - 0.5 | <0.03.


2) Выполнение в пакете Statistica

В главном меню пакета, в окне STATISTICA Module Switcher выбираем Data Management (управление данными) или Basic Statistics/Tables (основные статистики и таблицы). При появлении предложений отвечаем согласием.

а) Образование вектора длины n = 1850.

File - New Data - File Name: Limit (например) на диске D в директории ТМP -OK. Появляется таблица 10v 10c (10 переменных-строк и 10 столбцов-случаев, т.е. наблюдений), преобразуем ее в 1v 1850c: кнопка Vars - Delete...- From variable: var 2, to variable: var 10 - OK. Кнопка Cases - Add - Number of Cases to Add: 1840 - OK.

Можно убедиться прокруткой, что заготовлена матрица 1v 1850c; это же видно в заголовке таблицы.

б) генерация n = 1850 значений .

Analisis - Modifi Variables...- Current Specs - назовем переменную Name: alpha, введем определяющее выражение Long name:

= trunc (rnd (1) + 0,5)

что означает взять целую часть от случайной величины, распределенной равномерно на отрезке [0,5, 1,5] (оператор rnd(1) генерирует случайные числа, распределенные равномерно на отрезке [0, 1]) - OK. Вводить можно с клавиатуры или с помощью кнопки Function. Отметим, что генерацию можно было бы осуществлять не во все клетки столбца, а в заранее выделенные.

в) Определение числа появлений герба и относительной частоты fn в серии из n = 170 испытаний.

Выделим первые 170 наблюдений: выделим 1-ю клетку, нажмем и держим Shift, прокрутим таблицу до 170-й клетки и кликнем по ней. Далее:

Edit - Block Stats/Columns - Sum’s (во 2-й раз - Means).

Результат получаем во вновь образованных двух последних строках. Результат записываем и убеждаемся, что fn 0.5 < 0.1.

г) Определение числа появлений герба и относительной частоты fn в серии из n = 1850 испытаний.

Выделяем все наблюдения, кликнув по заголовку столбца. Далее так же. Убеждаемся, что fn 0.5 < 0.03.


3) Выполнение в пакете SPSS

а) Генерация n = 170 бросаний монеты.

Для образования вектора длины n = 170 прокрутим таблицу до 170 строки, выделим клетку в 1-м столбце, введем точку. Вектор размерности n = 170 создан; присвоим ему имя alpha:

Data - Define Variable...- Var Name: alpha - OK.

Сгенерируем значения :

Transform - Compute - Target Variable: alpha, Numeric Expression:

TRUNC (UNIFORM (2)) - OK

б) Определение числа появлений “герба” и относительной частоты fn в серии из n = 170 испытаний:

Statistics - Summarise - Descriptives... - в список Variables переносим alpha, Display labels - Options...- отметим Sum и Mean - Continue - OK.

в окне Output олучаем Sum - число выпадений “герба”, Mean - частота выпадений герба. Записываем результаты, убеждаемся, что fn – 0.5 < 0.1.

в) Определение частоты появлений “герба” в серии из n = 1850 испытаний.

Действия повторяются, кроме образования массива - столбца длины n =1850 (слишком долго прокручивать таблицу). Образуем столбец длиной 60, а затем многократно удвоим его с помощью операций Copy и Paste:

выделяем столбец - Edit - Copy - прокручиваем таблицу до конца, выделяем клетку 61 - Edit - Paste. Массив - столбец длины 120 образован. Повторяем эти действия несколько раз, пока не будет образован столбец длины 1920, из которого удалим последние 70 строк: выделим имена строк с 1920 по 1851, затем Del. Столбец длиной n = 1850 заготовлен.

Сгенерируем значения , определим число появлений “герба” и относительную частоту. Убеждаемся, что fn – 0.5 < 0.03.


    1. Закон больших чисел в форме Чебышева

      1. Основное утверждение

Одно из основных утверждений закона больших чисел состоит в том, что значение среднеарифметического случайных величин с равными математическими ожиданиями при большом n (при некоторых широких условиях) оказывается приближенно равным a:

уточним: будем писать

при ,

если для любого >0 и достаточно больших n соотношение

(2)

выполняется с вероятностью, стремящейся к 1 с ростом n; запишем это так:

при n .

это одно из утверждений закона больших чисел. Заметим, что, как и теорема Бернулли, оно не означает, что соотношение (2) достоверно; однако, если n достаточно велико, то вероятность его выполнения близка к 1, например, 0.98 или 0.999, что означает практически достоверно. Приведем полную формулировку одной из теорем закона больших чисел в форме Чебышева,

Теоремы Чебышева. Если - последовательность попарно независимых случайных величин, имеющих конечные дисперсии, ограниченные одной и той же постоянной:

,

то для любого >0

при .

      1. Испытание практически достоверного события

Убедимся в выполнении (2) статистически на примере1.

Пример1. Случайные величины распределены равномерно на отрезке [0,1]. Если значение задавать произвольно, а число испытаний выбирать из условия n (9D/2), то (как нетрудно показать) соотношение (2) выполняется с вероятностью P=0.997, а если n (5.4D/2) - то с P=0.98. Последняя нас устраивает, как практическая достоверность.

Положим 1 =0.1 и 2 =0.02, определим два соответствующих значения n1 =45 и n2 =1125, и проверим (2) экспериментально (в нашем случае a=0.5). Выполнение аналогично п.1. При генерации случайных чисел нужно задать полное имя новой переменной, например, LIMIT.unif.


Задание. Проверить (2) экспериментально для экспоненциально распределенных слагаемых с M=1. Принять 1 =0.2 и 2 =0.05. При выполнении в пакете SPSS учесть, что - ln , где ~ R[0, 1], имеет требуемое распределение.


Пример 2. Невыполнение закона больших чисел

Рассмотрим случайную величину, распределенную по закону Коши с плотностью

(3)

Заметим, что плотность симметрична относительно нуля, однако, 0 не является математическим ожиданием; это распределение не имеет математического ожидания. Напомним, что математическим ожиданием называется , если ; последнее, очевидно, для распределения Коши не выполняется. Для последовательности независимых случайных величин, распределенных по закону Коши (3), закон больших чисел не выполняется. Если бы среднеарифметическое сходилось с ростом n к какой-либо константе, то, в силу симметрии распределения, такой константой мог быть только 0. Однако, 0 не является точкой сходимости. Действительно, можно показать, что при любом >0 и при любом сколь угодно большом n

(4)

с вероятностью arctg . (Поясним сказанное: с помощью характеристических функций легко показать, что распределена по (3), а функция распределения для (3) есть arctg x). Эта вероятность, как видно, не стремится к 0 с ростом n. Например, если = 0.03, то вероятность выполнения (4) равна приближенно P 0.98, т.е. событие (4) практически достоверно, и можно уверенно ожидать его выполнения с одного раза. Если =1, то вероятность (4) равна 0.5, и выполнение его хотя бы раз можно уверенно ожидать, проделав 7 экспериментов (т.к. вероятность невыполнения ни разу равна (0.5)7 = 1/128). И это при любом фиксированном n, например, n = 1000. Проверим это экспериментально.

При выполнении в пакетах, где нет закона Коши, учтем, что, если случайная величина X распределена равномерно на отрезке длины , то случайная величина

Y = tg X (5)

имеет плотность (3). Сгенерируем 7 выборок объемом n=1000 и проверим (4) при =1.


1) Выполнение в пакете STATGRAPHICS

а) Сгенерируем 7 выборок (переменные x1,...,x7) объемом n с распределением R [-1, 1 ], разместив их в файл с именем LIMIT (как и выше).

б) Для экономичного использования рабочей области WORKAREA оперативной памяти часть операторов, в том числе TAN (тангенс), необходимо загружать процедурой V.1.Load Operators and Functions (загрузка операторов и функций); выполним ее, выбрав внутри нее опции Mathematical functions и Read (после использования ненужных операторов рекомендуется выгрузить их опцией Erase).

в) Получим 7 выборок, распределенных по закону Коши:

выберем процедуру A.2.File Operations (операции с файлами), введем имя файла LIMIT в окне file name; в окне Desired operation клавишей "пробел" установим операцию J, что означает, в соответствии с приводимым на экране списком, операцию Update (изменение);

в нижней части экрана указаны операции; выберем операцию A (ASSIGNMENT - назначение), нажав на клавишу A; в ответ на запрос пакета Enter assignment (ввести значение), введем по (5) определяющее выражение

TAN (1.570796*x1)

после его выполнения на месте переменной x1 будет располагаться выборка, распределенная по закону Коши; повторим это для x2, ..., x7.

г) Вычислим среднеарифметические для семи выборок (аналогично fn в п.1); убедимся в том, что хотя бы раз из семи событие (4) выполняется. (Если же это не так, значит, нам крупно не повезло: произошло событие с вероятностью, меньшей 0.01)

д) В заключение этого примера посмотрим гистограмму выборки (в различных диапазонах по оси абсцисс); обратим внимание на то, что имеются редкие наблюдения, отстоящие очень далеко от центра (точки 0).

Выполняется процедурой F.3.Frequency Histogram (гистограмма частот). Использовать по оси абсцисс диапазоны: полный (предлагаемый пакетом), 400, 200, 100, 50, 20, 10, 6.


2) Выполнение в пакете STATISTICA

Сгенерируем 7 выборок объема n = 1000 с распределением Коши и определим по каждой среднее значение.

а) Заготовим таблицу 7v 1000c, изменив имеющуюся.

б) Сгенерируем выборки.

Vars - All Specs - выделяем любую клетку в 4 столбце и вводим определяющее выражение, соответствующее плотности (3),

= VCauchy (rnd (1); 0; 1)

здесь а = 0 – параметр сдвига, b = 1 – параметр масштаба в плотности

p (x a, b) = ;

переносим выражение в остальные 6 клеток:

Edit - Copy (переносим запись в буфер), выделяем другую клетку и

Edit - Paste (вставляем запись); это же можно сделать короче с помощью кнопок Copy и Paste; закрываем окно и исполняем

кнопка Х = ? (Recalculate) - All variables - OK.

в) Определим среднее значение на всех 7 выборках:

выделим всю матрицу (щелчок на пересечении заголовков строк и столбцов) - Edit - Block Sats/Columns - Means.

Убеждаемся, что хотя бы в одной выборке модуль среднего превосходит 1. Если же это не так, то нам крупно не повезло: произошло событие с вероятностью менее 0,01.

г) Посмотрим график выборки из распределения Коши (рис.1):

Graphs - Stats 2D Graphs - Line Plots (Variables)... - в поле Line Plots вводим Variables: x1 (например), Graph Tipe: Regular, Fit: off.

обратим внимание на то, что имеются редкие наблюдения, отстоящие очень далеко от центра распределения – точки 0.


Рис. 1.Выборка наблюдений, распределенных по закону Коши (N = 200).


3) Выполнение в пакете SPSS

Сгенерируем 7 выборок объема n = 1000 с распределением Коши и определим по каждой среднее значение.

а) Образуем вектор - столбец длины n = 1000 удвоением (см. выше), начав, например, с 125. присвоим ему имя:

Data - Define Variable... - Name: x1 - OK.

б) Сгенерируем выборки:

Transform - Compute - Target Variable: x1, Numeric Expression:

UNIFORM (3,14159265).


Случайные файлы

Файл
113498.rtf
73023.rtf
141317.rtf
158705.rtf
4879-1.rtf