Первичная статистическая обработка информации (84422)

Посмотреть архив целиком

14



ГОСУДАРСТВЕННАЯ СЛУЖБА ГРАЖДАНСКОЙ АВИАЦИИ РОССИИ

МИНИСТЕРСТВО ТРАНСПОРТА РОССИЙСКОЙ ФЕДЕРАЦИИ

МОСКОВСКИЙ ГОСУДАРСТВЕННЫЙ

ТЕХНИЧЕСКИЙ УНИВЕРСИТЕТ

ГРАЖДАНСКОЙ АВИАЦИИ


Кафедра Прикладной математики





Курсовая работа

защищена с оценкой


________________________


профессор Монсик В.Б.


_________________________

(подпись руководителя, дата)





Курсовая работа по дисциплине

“Теория вероятностей и математическая статистика”





Вариант №39


Тема: Первичная статистическая обработка информации.

Статистическая проверка гипотез



Выполнил студент группы ПМ 2-2

Митюшин М.С.


______________________________

(дата, подпись)











Москва - 2002

СОДЕРЖАНИЕ


Исходные данные 3

Задание 3

Выполнение первого задания 4

Выполнение второго задания 8

Литература 13













































1. Исходные данные: исследуются трудозатраты на выполнение комплекса доработок на объекте (в человеко-часах). Результаты независимых измерений трудозатрат на 100 объектах приведены в таблице 1.


Таблица 1


431

394

362

436

343

403

483

462

395

467

420

411

391

397

455

412

363

449

439

411

468

435

313

486

463

417

369

377

409

390

389

386

409

379

412

370

391

421

459

390

415

415

366

323

469

399

486

393

361

407

392

353

432

406

409

391

371

401

321

359

472

352

446

367

384

371

426

487

454

371

394

401

408

393

373

327

429

360

401

412

392

338

398

461

403

418

520

448

440

433

362

406

342

441

391

390

432

374

280

395


Путем статической обработки результатов измерений выполнить следующие пункты задания:


Задание 1. Первичная статистическая обработка информации.


  1. Построить вариационный статистический ряд.

  2. Определить размах колебаний вариант.

  3. Построить эмпирическую функцию распределения.

  4. Выбрать число и длины разрядов (интервалов) и построить сгруппированный статистический ряд.

  5. Построить статистический ряд распределения.

  6. Построить полигон частот.

  7. Построить гистограмму (эмпирическую плотность вероятности).


Задание 2. Статистическое оценивание параметров распределений. Статистическая проверка гипотез.


  1. Вычислить точечные и интервальные оценки математического ожидания и дисперсии (с.к.о.) по данным таблицы 1 при доверительной вероятности 0,95.

  2. Подобрать и построить на графике гистограммы сглаживающую кривую плотности вероятности, используя “метод моментов”.

  3. Проверить гипотезу о нормальном распределении генеральной совокупности по критерию Пирсона (хи-квадрат) при уровне значимости 0,10.

  4. Построить на графике эмпирической функции распределения сглаживающую кривую нормальной функции распределения, используя “метод моментов”.

  5. Проверить гипотезу о нормальном распределении генеральной совокупности по критерию Колмогорова (ламбда-критерий) при уровне значимости 0,10.

  6. Вычислить вероятность попадания случайной величины (трудозатраты на выполнение комплекса доработок на объекте) на интервал [МО - с.к.о.; МО + 2*с.к.о.].








2. Выполнение первого задания.


2.1. Для построения вариационного ряда необходимо результаты измерений трудозатрат расположить в порядке возрастания от до (по “ранжиру”). Этот ряд представлен в таблице 2.

Таблица 2


280

359

371

390

393

401

411

421

440

463

313

360

371

390

394

403

411

426

441

467

321

361

371

390

394

403

412

429

446

468

323

362

373

391

395

406

412

431

448

469

327

362

374

391

395

406

412

432

449

472

338

363

377

391

397

407

415

432

454

483

342

366

379

391

398

408

415

433

455

486

343

367

384

392

399

409

417

435

459

486

352

369

386

392

401

409

418

436

461

487

353

370

389

393

401

409

420

439

462

520


2.2. Размах колебаний вариант равен разности максимального и минимального значений трудозатрат:


= 520 – 280 = 240 (ч.час.)


2.3. Эмпирическая функция распределения F*(x) (рис.1) строится с использованием вариационного ряда на основании соотношения:


,


где – число точек, лежащих левее точки х.


2.4. Для построения сгруппированного статистического ряда размах J колебаний значений х делится на число разрядов – m, которое оценивается по формуле:


m = +1, где n – число измерений.


M = + 1 = 6


Сгруппированный статистический ряд приведен в таблице 3.


Таблица 3


Разряды

{

[280..320]

(320..360]

(360..400]

(400..440]

(440..480]

(480..520]

Числа попаданий с.в. в разряды

2

10

36

33

14

5




















































Рис.1.


2.5. Статистический ряд распределения строится на базе сгруппированного ряда. Для этого вычисляются частоты попадания значений x в соответствующие разряды по формуле:



Статистический ряд распределения представлен в таблице 4.


Таблица 4


Разряды

[280..320]

(320..360]

(360..400]

(400..440]

(440..480]

(480..520]

Частоты

0.02

0.10

0.36

0.33

0.14

0.05


2.6. Графической иллюстрацией статистического ряда распределения является “полигон частот”, представленный на рис.2.































Рис.2.



2.7. Статистический ряд распределения является основой для вычисления и построения эмпирической плотности вероятности (рис.3). Гистограмма строится в виде прямоугольников, основания которых равны длинам разрядов, а высоты определяются из соотношения:


где длина j-го разряда (j=1..m).


Результаты расчетов по оценке эмпирической плотности вероятности приведены в таблице 5, а гистограмма на рис.3. (dx = 40)


Таблица 5


Разряды

[280..320]

(320..360]

(360..400]

(400..440]

(440..480]

(480..520]

Значения

0.050

0.250

0.900

0.825

0.350

0.125




























Рис.3.


3. Выполнение второго задания.


3.1. Вычислим точечные и интервальные оценки математического ожидания (выборочного среднего значения) и дисперсии (выборочной исправленной дисперсии) по данным таблиц 1 и 2. сначала определим точечные оценки.





Интервальную оценку математического ожидания (доверительный интервал) при заданной доверительной вероятности (надежности) и числе наблюдений (объеме выборки) n =100 определим по формуле:


,


где - точность вычисления МО по результатам наблюдений при заданных значениях n и . , где определяется по таблицам Стьюдента:


==1,984



Интервальная оценка (доверительный интервал) для МО равна:



Этим отрезком с вероятностью 0,95 накрывается истинное (неизвестное) значение МО.

Интервальная оценка среднего квадратического отклонения (доверительный интервал) определяется по формуле:


,

где q определяется по таблице


q = q(100;0,95)=0,143


Доверительный интервал для оценки с.к.о. равен


42,493(1-0,143)< <42,493(1+0,143)


36,42<<48,57

Этим отрезком с вероятностью 0,95 накрывается истинное (неизвестное) значение с.к.о.


3.2. На основании изучения гистограммы (рис.3) выдвинем гипотезу о нормальном распределении генеральной совокупности случайных величин X - трудозатрат на доработки на объекте. Нулевую гипотезу подвергнем статистической проверке на противоречивость данным, полученным из опыта (табл.1) по критериям - Пирсона и - Колмогорова.

В соответствии с методом моментов положим параметры нормального распределения равным оценкам:







3.3. На графиках гистограммы и эмпирической функции распределения (рис.1,3) построим сглаживающие функции (теоретические кривые) плотности вероятности и функции распределения в соответствии с их выражениями: