65


Работа № 3. Оценки

1. Cpавнение оценок

1.1. Определения

Пусть x1, ..., xn выборка , т.е. n независимых испытаний случайной величины X , имеющeй функцию распределения F(x / a), зависящую от параметра a, значение которого неизвестно. требуется оценить значение параметра a.

Оценкой â = (x1, ..., xn) называется функция наблюдений, используемая для приближенного определения неизвестного параметра. Значение â оценки является случайной величиной, поскольку (x1, ..., xn) случайная величина (многомерная).

Свойства оценок

1. Оценка â= (x1, ..., xn) называется состоятельной, если при n â a по вероятности при любом значении a.

2. Оценка â = (x1, ..., xn) называется несмещенной, если при любом a Mâ = M(x1, ..., xn) = a.

состоятельность - обязательное свойство используемых оценок. свойство несмещенности является желательным; многие применяемые оценки свойством несмещенности не обладают.

3. Оценка * называется оптимальной, если для неё средний квадрат ошибки

M(â- a)2= M[*(x1, ..., xn) - a]2= min M[(x1, ..., xn) - a]2

минимален среди всех оценок {}; здесь критерием качества оценки принят квадарт ошибки (â - a)2. В более общей ситуации, если критерием качества служит некоторая величина L(â, a), называемая функцией потерь (или функцией штрафа), то оптимальная оценка та, для которой минимальна величина ML(â, a); последняя есть функциея неизвестного a и называется функцией условного риска. Ясно, что оптимальной оценки может не существовать (так как характеристикой является функция, а не число).


1.2. Постановка конкретной задачи.

Пример. Пусть на заводе имеется большая партия из N (тысячи) транзисторов, используемых для сборки некоторого прибора. Выходные параметры прибора (например, надежность, уровень шума, вероятность выхода из режима и т.д.) зависят от обратных токов транзисторов; обратный ток у разных экземпляров различен, и потому можно считать его случайной величиной, причем, как известно технологам, распределённой равномерно в диапазоне от 0 до Imax, где Imax порог отбраковки, установленный на заводе - изготовителе транзисторов. Следовательно, выходные параметры прибора определяются величиной Imax. Предположим, что по каким-либо причинам значение Imax производителю приборов неизвестно. Ясно, что в этом случае из партии нужно случайным выбором извлечь n (сравнительно немного: десятки) транзисторов, измерить их ток, и по измерениям оценить Imax (неизвестный параметр а). Таким образом, возникает


Статистическая задача: по наблюдениям x1, ..., xn над случайной величиной , распределённой равномерно на отрезке [0, a], оценить неизвестный параметр a.

сравним три способа оценивания (три оценки):

оценку, полученную методом моментов,

â1 = , (1)

оценку, полученную методом максимального правдоподобия (после исправления смещённости),

â2 = max xi (2)

и оценку, полученную методом порядковых статистик,

â3 = 2 0.5 = x(k) + x(k+1), (3)

где 0.5 = выборочная квантиль порядка 0.5, т.е. выборочная медиана; x(k) член вариационного ряда с номером k; здесь полагаем n = 2k. Точность этих оценок можно сравнить теоретически и экспериментально (статистически).

Замечание. Точность, однако, не является единственным критерием качества оценок. Весьма важно, например, свойство устойчивости оценки к изменению закона распределения или к засорению; в этом смысле, как оказывается, â3 наиболее хороша, а â2 наименее; действительно, пусть, например, в нашу выборку случайно попало наблюдение, резко превосходящее все остальные (в случае с партией триодов, попался триод, не прошедший отбраковку); значение оценки â2 резко изменится, значение â3 почти не изменится.

1.3. Теоретическое сравнение оценок

Все три оценки несмещённые, что можно проверить методами теории вероятностей. определим дисперсии оценок :

Dâ1 = D( ) = ,

Dâ2 = D(max xi ) = ,

Dâ3 = D(x(k) + x(k+1)) ,


откуда ясно, что â2 наиболее точная оценка, а â3 наименее.

Поясним приведенные формулы для дисперсий .

Первая :

Dâ1 = = = = .


Вторая. определим функцию распределения статистики max xi :

F(z) P{ max xi < z} = P{x1 < z, ..., xn < z} = = ;

плотность распределения

p(z) = F(z) = , z[0, a].

Далее

Mâ 2 = M( max xi ) = = ,

Mâ22 = M=,

Dâ2 = Mâ22 (Mâ2)2=

Третья. используем теорему Крамера, согласно которой выборочная p - квантиль имеет дисперсию, равную приближенно , где xp истинная p-квантиль, f(x) - плотность распределения наблюдений выборки. В нашем случае (при n = 2k) статистика

0.5 (x(k) +x (k+1) ) m

является выборочной медианой (p = 0.5) , f(x0.5) = 1/a , â3 = 2m, и потому

Dâ3=Dm = =.


1.4. Статистическое сравнение оценок

Далеко не всегда удается аналитически вычислить дисперсию оценки. Как экспериментально определить, какой из оценок пользоваться? По одной выборке нельзя судить о разбросе значений оценки, поскольку значение всего одно; необходимо иметь несколько выборок, например, k = 20, (или хотя бы 5 10), оценить разброс значений для каждой оценки и предпочесть ту оценку (тот способ оценивания), для которой разброс меньше. Если же выборка всего одна, то следует (если n достаточно велико) разбить её случайным образом на несколько выборок, и по ним сравнивать качество оценок.

Сформируем k =20 выборок из распределения R[0, a=10] объема n для различных n=10, 40, 160 и определим разброс оценок. Характеристиками разброса значений а1,...,аk оценки â будем считать размах

w = max ai - min ai

и среднеквадратичное отклонение (ско)

Sa= , .


В качестве примера в табл.1 и на рис.1 приведены результаты сравнения трех оценок.

Таблица 1. Разброс значений оценок.



â1

â2

â3


amin

7.98

9.21

6.04

n = 10

amax

13.80

10.98

15.69


w

5.82

1.77

9.65


Sa

1.51

0.53

2.35


amin

8.59

9.77

7.02

n = 40

amax

11.35

10.24

12.89


w

2.76

0.47

5.86


Sa

0.84

0.14

1.56


amin

9.12

9.85

8.67

n = 160

amax

11.26

10.06

12.24


w

2.14

0.21

3.57


sa

0.50

0.05

0.94

Сравнение значений размахов w и ско Sа для 3 оценок показывает, что оценка â21, ... , хn) наиболее точна, а оценка â31, ... , хn) - наименее.

Приведенные результаты экспериментального сравнения 3 способов обработки наблюдений показывают следующее.

1. Значения оценок концентрируются в окрестности оцениваемого параметра (проявление свойства несмещенности оценок).

2. С ростом числа наблюдений точность (величина разброса) оценок улучшается (проявление свойства состоятельности).

3. Различные оценки различаются по величине средней ошибки, откуда ясно, что различные способы обработки наблюдений нужно сравнивать по величине среднего значения некоторого критерия качества, например, среднего значения квадрата ошибки.


Задание для самостоятельной работы

Сравнить статистически на выборках объема n=10 две оценки: оценку максимального правдоподобия и медианную оценку

1) среднего нормального распределения и

2) параметра показательного распределения.

Отчет по работе должен содержать:

1) постановку задачи оценивания, анализируемые оценки, выражения для их дисперсий (если их нетрудно получить);

2) результаты экспериментов:

распечатки 3-5 выборок, распечатку значений оценок на всех k = 20 выборках для объема n = 10,

графическое представление результатов сравнения оценок на всех выборках, таблицу разброса значений оценок,

графическую зависимость Sа от объема n для различных оценок.


2. Выполнение в пакете STATGRAPHICS


Оценивание по выборкам объема n = 10

Сформируем k = 20 выборок объёма n = 10 и определим значения оценок â1, â2 и â3 на каждой выборке. Предварительно получим массив случайных чисел, распределенных равномерно на отрезке [0, a]; из этого массива в дальнейшем будем формировать выборки для значений n= 10, 40, 160; всего k.nmax = 20.160 = 3200.

Сгенерируем случайные числа:

процедура H.5.Random Generation, в окне Distribution number укажем 17( Uniform); после F6 на запрос пакета о параметрах отвечаем : Lower limit : 0, Upper limit : 10, Number of samples : 3200. Поместим сгенерированные числа ( в ответ на запрос пакета об имени) в переменную EST.z (estimaion - оценивание). Вернёмся в главное меню : Ctrl + Break.

Сформируем k = 20 выборок объемом n = 10:

выберем процедуру A.2. File Operations, введем имя файла в окно file name : EST и в окно Desired oeprations : J (Update) (клавишей "пробел"), образуем новую переменную (клавиша N), введя ее имя в окно new varitable : X, а затем формирующий ее опреатор в окне Enter assignment :

10 20 RESHAPE z (4)

(на последующий запрос Enter comment можно ответить клавишей ENTER); оператор сформирует из первых 10.20 = 200 значений переменной z матрицу X с 20 столбцами (выборками) по 10 в каждом; X можем посмотреть, подведя курсор на X и нажав D. Распечатаем первые несколько выборок (клавиша F4) определим значения оценок â1, â2 и â3 по каждой выборке (т.е. по каждому столбцу).

Оценка â1

Образуем новую переменную (клавиша N) с именем a1, определив её значение согласно (1) :

(2 * SUM X) / 10 (5)

этот оператор суммирует элементы каждого столбца матрицы X (получается вектор длины k = 20), умножает его элементы на 2 и делит на 10. Посмотрим полученные k = 20 значений оценки â1 : курсор на a1 и клавиша D. Распечатаем a1. Оценим разброс для â1: определим минимальное значение amin и максимальное amax, размах w и ско Sa (табл. 1, как пример).

Оценка â2

Образуем новую переменную с именем а2, определив ее значение по (2):

(11/10)*(MAX X) (6)

Этот оператор определит максимальные значения в каждом столбце матрицы Х и затем умножит на 11/10. посмотрим полученные k =20 значений оценки â2 и распечатаем а2. Определим amin, amax и w и запишем их в таблицу.

Оценка â3

Для вычислений по (3) по каждой из k=20 выборок построим вариационный ряд. Образуем новую переменную с именем Xsort, определив ее оператором

SORTUP X (7),

Он элементы каждого столбца (выборки) матрицы Х расположит в порядке возрастания; этот оператор относится к числу загружаемых, поэтому предварительно следует выполнить загрузку процедурой V.1.Load Operators and Functions (LOAD), опция Mathematical Functions, затем Read, вернуться в главное меню (Ctrl+Break) и в процедуру A.2.File Operations, опция J.(Update).

Образуем новую переменную а3, определив ее значение согласно (3):

Xsort[5;]+Xsort[6;] (8)

Этот оператор выделит строки с номерами 5 и 6 и сложит их (оператор X[n;k] выделяет в матрице Х элемент n-й строки и k-го столбца; оператор X[n], если Х-вектор, выделяет n-й элемент). Посмотрим полученные k = 20 значений оценки â3 и распечатаем их; в табл. 1 запишем результаты.

Определим сразу все необходимые характеристики разброса для наших 3 оценок. Выберем процедуру F.1.Summary Statistics, в окно Data vectors введем в 1 строку а1, во 2 строку - а2, в 3 - а3; в окне Statistics оставим F (Std. deviation - стандартное отклонение, т.е. ско), H (Minimum), I (Maximum), J (Range - размах); результаты выводятся на экран таблицей. Запишем в табл. 1 значение Sа1. Аналогично определим Sа2 и Sа3. Сравнение размахов w и стандартных отклонений Sа для 3 оценок показывает,что оценка â21, ... , хn) наиболее точна, а оценка â31, ... , хn) - наименее.


Сравнение оценок графически (n=10).

Сравним результаты действия оценок â21, ..., хn) и â31, ..., хn).

Один способ.

Образуем вспомогательную переменную k - номер выборки, определив ее

COUNT 20

Этот оператор создает массив целых чисел от 1 до 20. Выберем процедуру F.2.Multiple X-Y Plots, введя в качестве Х переменную k, в качестве Y - а2, второго Y- a3. После F6 на экране наблюдаем значения оценок â2 и â3 на k =20 выборках. Видно, что оценка â2 в среднем точнее, чем â3, хотя и не исключены такие выборки, на которых ошибка оценки â2 будет больше ошибки оценки â3.

Другой способ.

Выбираем процедуру E.1. X - Y Line and Scatterplots. В строку Х введем

а1 , а2, а3

что означает соединение 3-х векторов в один (длиной 3k =60); в строку Y введем

20 REP 1 2 3

что означает создание массива, в котором 20 раз повторена 1, затем 2 и 3. После F6 на экране все значения оценок будут расположены на 3 уровнях, на одном (1) значения â1, на втором (2) - â2, на третьем (3) - â3. Изображение можно отредактировать: сменить надписи и диапазон по Y (от 0 до 4): F5 - Plot options - ... - F6 - Peplot и затем отпечатать (F4).

Комментарии.

1. Вычисления можно было бы сделать иначе, например, определить а1, объединив (4) и (5), оператором

(2 * SUM(10 20 RESHAPE z))/10.

Аналогично - для а2 и а3.

2. Вычислить â3, если бы k было мало, было бы удобнее другим способом, а именно, по формуле â3=:

используем процедуру F.5.Percentiles (PTILE - процентили, т.е. квантили); в окно Data vector введем 2*X[;1], что означает 1-й столбец (1-ю выборку) умножить на 2, в окне Percentages укажем 50% (поскольку х0.5 - выборочная медиана). И так со всеми выборками. Можно было бы также медианы определять процедурой F.1.Summary Statistics.


Оценивание по выборкам объема n=40

Наши действия повторяются.

Выберем процедуру A.2.File Operations, опцию J(Update), file name: EST. Новое значение Х задается теперь не через N=New (так как Х уже существует), а, выставляя курсор на Х, клавишей A=Assign (назначение) и оператором

40 20 RESHAPE z

Пересчитаем оценки â1, â2, â3 :

( 2 * SUM X ) / 40

( 41 / 40 ) * MAX X

SORTUP X

Xsort[20;] + Xsort[21;]

Процедурой F.1.Summary Statistics определим характеристики разброса оценок â1, â2 и â3 и выпишем их в таблицу. Видно, что разброс значений оценок уменьшился по сравнению с n = 10.

Повторим расчеты для n = 160.


Итоговое сравнение

Сравним характеристики точности Sa1, Sa2, Sa3 оценок â1, â2 и â3 при различных n. Для этого построим графики:

образуем, как и выше, новую переменную n; на запрос Enter assigment введем 10 40 160 через пробелы;

образуем переменную Sa1, введя 1.51 0.84 0.50 (из табл. 1);

образуем переменную Sa2, введя 0.53 0.14 0.05;

образуем переменную Sa3, введя 2.35 1.56 0.94;

построим графики процедурой E.2.Multiple X-Y Plots, введя в качестве Х переменную n, а в качестве трех Y - переменные Sa1, Sa2 и Sa3. После F6 на экране появится график с тремя кривыми линиями, из которого ясно, что в оценка â2 наиболее точна, а â3 - наименее. Выведем график на принтер: клавиша F4.

Другой способ получения графика: переменные n, Sa1, Sa2, Sa3 можно не образовывать: в графической процедуре E.2, при заполнении строк X и Y можно писать операторы или массивы чисел; в нашем случае, введем 10 40 160 через пробелы, а в 3 следующие строки - соответствующие значения для Sа.




3. Выполнение в пакете STATISTICA

Оценивание по выборкам объема n = 10

Сформируем k =20 выборок объема n =10 и определим значения оценок a1, a2, a3 на каждой выборке.

Запустим пакет Statistica for Windows, выбрав в меню Basic Statistic/Tables. Îòâåòèì Cancel на предлагаемые запросы (если они будут).


Создание таблицы требуемых размеров

Из пункта меню File выберем команду New Data; укажем имя файла для сохранения будущей информации, например ESTIM--ÎÊ. Теперь на экране таблица 1010, где каждый столбец представляет переменную (название ее вынесено в заголовок столбца). преобразуем эту таблицу к размерам 2010 (20 выборок по 10 наблюдений): кнопка Vars (переменные), или через меню Еditе-Variables, и во всплывшем меню выберем команду Add (добавить). На экране запрос о числе добавляемых переменных (столбцов) и о том, куда их поместить. добавим 10 переменных, проставив 10 в поле Number... to add (набором на клавиатуре или кнопками справа от поля; в поле Insert after укажем имя Var10, после которой будут вставлены в матрицу новые столбцы; затем ОК. Теперь можно убедиться (просмотром таблицы), что в ней 20 столбцов; кроме того, размеры таблицы (в данном случае, 20v*10c) всегда указаны и ее заголовке. Количество строк не изменяем: оно равно 10. Заметим, что если число строк (сase) или столбцов (variable) в таблице превышает необходимое, можно таблицу не уменьшать.


Генерация выборок

Последовательность действий:

клавиша Vars - All specs... (спецификация всех) - появляется окно-таблица, в первом столбце которой находятся названия переменных (var1, var2,..., var20), а в четвертом (Long Name) - функция расчета; выделим первую клетку этого столбца и введем

= rnd(10)

 генерация случайных чисел, равномерно распределенных на отрезке [ 0, 10 ]. Скопируем эту запись в буфер обмена:

Edit - Copy

(или кнопкой Copy), а затем перенесем ее в остальные клетки (со 2 по 20):

выделим очередную клетку - Edit - Past (или, короче, кнопкой Past) -...-закроем окно. Выполним сделанные назначения:

кнопка x = ? - All variables - OK.

Сохраним 2 - 3 первые выборки - столбца для того, чтобы в дальнейшем распечатать:

выделение 2 - 3 столбцов - File - Export Data - формат Text - File name: Samples (например).

Распечатать их можно и сразу:

File - Print - Variables (указать, какие именно). Заметим, однако, что сохранить эти выборки или распечатать было бы удобнее ниже, после транспонирования матрицы, чтобы иметь в распечатке горизонтальное расположение, а не вертикальное.


Определение значений оценок â1, â2 и â3 на 20 выборках..

Определим статистики, по которым вычисляются оценки:

выделим всю матрицу (щелчок мышью по клетке - пересечению заголовков строк и столбцов), затем трижды:

Edit - Block Stats/Columns- Sums (2 ðàç: Max’s, 3: Medians)

Можно иначе: правая клавиша мыши - Block Stats/Columns (блок статистик по колонкам) - Sums, (2 раз: Max’s, 3 - Medians).

В нижней части таблицы появляются 3 строки стребуемыми статистиками.

Для новых строк введем более удобные обозначения:

кнопка Cases-Names...-далее ясно.

Транспонируем нашу матрицу, которая теперь имеет размер 20v13с в матрицу 13v 20c (чтобы совершать действия со столбцами):

Edit - Transponse - Data File.

Добавим в матрицу 3 столбца (с 14 по 16 для значений оценок)

Vars - Add - Number of vars: 3 - after: 13

и определим значения оценки â1:

выделим 1-й новый столбец Newvar1 - кн. Vars - Current Specs... (спецификация) - Name: A1 - Long name, согласно (1):

= Z/10 SUM

Аналогично определим значения оценок â2 и â3 ; различными будут операторы; для â2 по (2):

= 11/10 MAX

для â3 по (3):

= 2 MEDIAN

Полученные результаты (столбцы a1, a2, a3) испытаний 3 оценок на 20 выборках сохраним, чтобы в дальнейшем распечатать:

выделим a1, a2, a3 - File - Export Data - формат Text - укажем, куда поместить и с каким именем (например, a1a2a3). Можно также сохранить или распечатать первые 2 - 3 выборки-строки.


характеристики разброса для оценок:

выделим столбцы a1, a2, a3 - Edit - Block Stats/Column - SD’s (стандартное отклонение),

затем аналогично: Min’s, Max’s. Выписываем результаты в табл.1, размах вычисляем.

Сравнение размахов w и стандартных отклонений Sа для 3 оценок показывает, что оценка â21, ... , хn) наиболее точна, а оценка â31, ... , хn) - наименее.


Сравнение оценок â2 и â3 графически:

Graphs - Stats 2D Graphs - Line Plots (Variables) - в окне 2D Line Plots: Variables: A2 - A3, Graphs Type : Multyple, F : t (подбор распределения) : off (выключить) - ОК.

Из графика (рис.1) видно, что значения оценок находятся в окрестности 10, и что оценка â2 имеет разброс меньше, чем â3 . Распечатаем этот график:

File - Print Graphs

Рис.1 Сравнение оценок â2 и â3.


Оценивание по выборкам объема n=40 и n=160

Повторим п. 3.1 для n = 40 и n = 160.


Итоговое сравнение

Сравнение Sa(n) трех оценок графически для значений n =10, 40, 160:

образуем 4 новых переменных длины 3:

n : со значениями 10, 40, 160 ,

Sa1, Sa2, Sa3: со значениями стандартного отклонения для трех оценок.

построим графики Sa(n):

âыделим переменные Sa1, Sa2, Sa3 - Graphs - Custom Graphs - 2D Graphs - введем для Plot1 X : N, Y : Sa1, для Plot2 X : N, Y : Sa2, для Plot3 X : N, Y : Sa3 - OK.

Наблюдаем три кривые Sa(n), как функции n (рис. 2); ясно, что оценка â2 наиболее точна, â3 - наименее. График выводим на печать:

File - Print Graphs.

Рис.2. Сравнение трех оценок по стандартному отклонению.


4. Выполнение в пакете SPSS


Оценивание по выборкам объема n = 10

Сформируем k = 20 выборок объема n = 10 и определим значения оценок â1 , â2 и â3 на каждой выборке.

Подготовка требуемого числа строк:

на экране таблица с пустыми клетками; прокрутим ее до 10 строки и выделим клетку в 1 столбце; введем любой символ, например, точку - Enter. Число строк задано. Первому столбцу присвоим имя х01:

Data - Define Variable... - Variable Name: x01 - OK.

Генерация выборок:

Transform - Compute...- в окне Compute Variable Target Variable (выходная переменная): x01, Numeric Expression:

UNIFORM (10) (9)

(равномерное распределение на отрезке [0, 10] ; эту запись берем из списка Function). Если теперь ОК, то последует выполнение команды.

Можно это повторить, начиная с Transform, 19 раз (изменяя только номер переменной). Однако, в пакете можно выполнять команды не только в диалоге, но и в окне Syntax на специальном языке. В каждом диалоге есть кнопка Paste, с помощью которой получают соответствующую команду в окне Syntax.Итак, после (9)

Paste - OK.

В окне Syntax имеем текст команды

COMPUTE x01 = UNIFORM (10).

EXECUTE.

Скопируем 1-ю строку 19 раз, затем изменим имена переменных (столбцов) на х02 ÷ х20. Выделим весь текст и затем кнопка Run (EXECUTE, запускает на выполнение выделенные команды). Сохраним таблицу в файле Estim. sav на диске D:

File - Save Data - ...

Распечатаем первые 3 выборки (столбца) :

выделим их - File - Print - Selection - OK.

Определим значения оценок.


Оценка â1

Определим суммы во всех 20 выборках (20 столбцах х02 ÷ х20):

Statistics (статистики) - Summarize (простейшие) - Descriptives (описательные) - все имена переменных переносим в правый список Variables - Options...- отметим только Sum и в поле Display Order (порядок показа): Name (по порядку номеров) - Continue - OK.

В окне результатов Output - столбец сумм длины 20. Выделяем его, и с помощью Copy и Paste переносим в первый справа свободный в таблице столбец, который получает имя Var 00002. Проверим, что его длина 20, если нет, то повторим запись.

Образуем новую переменную (столбец) a1 для значений оценки â1:

  1. Transform - Compute - Target Var: a1, Numeric Expression: 2 Var 00002/10 - OK.

  2. Распечатаем а1.

  3. Оценка â2

  4. Согласно (2), определим максимум в выборках: Statistics - Summarise - Descriptives...- в правом окне х01 ÷ х20; в окне Options... отмечаем Maximum - Continue - OK. Из окна Output столбец результатов переносим в таблицу Estim; новый столбец получает имя Var 00003. Определяем значения оценки â2 аналогично â1 , но Numeric Expression:

  5. Var 00002 11/10.

  6. Оценка â3

  7. В версии 5.0 ее вычислять неудобно из-за отсутствия операции определения медианы по нескольким переменным. Наблюдения в каждой выборке (столбце) упорядочим по возрастанию (т.е. в каждом столбце построим вариационный ряд):

  8. Statistics - Summarize - Frequencies...- все столбцы х01 – х20 перенесем в правый список Variables - OK. В окне Output для каждой переменной в столбце Value находятся упорядоченные значения. Выделим столбец Value для х01 и с помощью Copy и Paste перенесем его в столбец x01; аналогично поступим с остальными.

  9. Столбцы а1 и а2 выделим и скопируем в буфер.

  10. Транспонируем матрицу наблюдений (операции в пакете выполняются со столбцами, но не со строками):

  11. Data - Transpose - в правый список Variables переносим имена переменных х01 – х20 - ОК.

  12. При транспонировании невыделенные переменные теряются.

  13. Выделим 2 новых столбца и операцией Edit - Paste внесем туда содержание а1 и а2 из буфера. Присвоим этим столбцам имена а1 и а2.

  14. По каждой выборке-строке определим, согласно (3), удвоенную выборочную медиану:

  15. Transform - Compute...- Target Variable: a3, Numeric Expression: var 005 + var 006 -OK.

  16. В столбце а3 получаем значения оценки â3 по всем выборкам.

  17. Сравнение оценок графически

  18. Для сравнения создадим переменную-столбец а с истинным значением параметра, равным 10. Далее:

  19. Graphs - Line - Multiple, Values of individual cases - Define - в поле Lines Represent (показать линии): а, a1, a2, a3, Category Labels: Case number - OK.

  20. Из наблюдаемого графика видно, что оценка â2 наиболее точна, а â3 – наименее. Распечатаем график или сохраним его.

  21. Можно иначе графически наблюдать различное качество оценок: создадим три новые переменные, например, est1, est2 est3 (оценки 1, 2 и 3) , в которых запишем три различные константы, например, 1, 2 и 3. Затем

  22. Graphs - Seatter... - Overlay - Define - перенесем в поле Y - X Pairs: a1, est1; затем a2, est2; затем a3, est3.

  23. Наблюдаем по 20 значений трех различных оценок.

  24. Сравнение оценок по стандартному отклонению и размаху

  25. Statistics - Summarize - Descriptives...- в поле Variables: a1, a2, a3 (старые имена из списка убрать налево) - в Options отметить Std. Daviation, Range (размах), Minimum, Maximum - Continue - OK.

  26. Сравниваем стандартные отклонения и размахи; убеждаемся, что оценка â2 точнее других, â3 – наименее точна.

  27. Оценивание по выборкам объемов n = 40 и n = 160

  28. Все действия повторяются.

  29. Итоговое сравнение

  30. Сравним графически характеристики точности Sa1, Sa2, Sa3 оценок â1, â2 и â3 при различных n. Для этого образуем переменные:

  31. n, введя 10 40 160;

  32. Sa1, введя 1.51 0.84 0.50 (из таблицы 1);

  33. Sa2, введя 0.53 0.14 0.05;

  34. Sa3, введя 2.35 1.56 0.94

  35. и построим графики:

  36. Graphs - Scatter...- Overlay - Define - в поле Y - X Pairs: сначала sa1, n, затем sa2, n, затем sa3, n; если в обратном порядке, то Suap Pair - OK.

  37. Наблюдаем диаграмму, входим в редактор и включаем линии, имеем график зависимости S от n для трех оценок.


Случайные файлы

Файл
35823.rtf
101163.rtf
10.41.doc
lectures.doc
17966.rtf