Анализ данных в линейной регрессионной модели (180808)

Посмотреть архив целиком

Государственное образовательное учреждение высшего профессионального образования

«Московский государственный институт электронной технки

(технический универститет)»










Курсовая работа

по дисциплине

«Теория вероятности и математическая статистика»

Тема работы

«Анализ данных в линейной регрессионной модели»



Выполнил:

Студент группы ЭКТ-21

Рыжов С.А.

Проверил:

Преподаватель

Бардушкина И. В.



Москва - 2010


Вариант 20.


Задание 1


Выполнить предварительную обработку результатов наблюдений, включающую:

  1. построение диаграммы рассеивания (корреляционного поля);

  2. группировку данных и построение корреляционной таблицы;

  3. оценку числовых характеристик для негруппированных и группированных данных.


Оценка числовых характеристик для негруппированных данных:

X

Y

X

Y

4,19

9,19

4,44

9,13

3,04

11,94

11,31

4,58

4,6

8,09

7,57

3,14

9,83

10,33

1,62

14,61

8,66

7,15

5,71

6,48

1,3

12,34

11,06

6,78

4,22

16,35

10,35

2,15

5,11

7,7

2,46

9,66

9,85

5,64

1,02

11,19

8,8

4,52

5,77

7,77

12,17

4,52

8,63

4,05

11,25

2,06

6,91

4,76

5,73

7,41

3,56

8,54

4,05

10,51

9,47

2,22

5,41

9,97

6,16

3,72

1,28

14,68

8,26

3,57

1,67

9,67

6,7

14,32

11,99

3,31

4,95

10,64

7,66

5,93

3,37

10,73

5,17

9,87

1,53

10,13

3,26

11,52

9,54

4,95

12,58

2,88

3,11

5,38

8,34

3,57

5,09

5,79

5,79

4,39

11,08

3,87

3,42

9,71

8,74

-2,23

Сумма X

317.78



Сумма Y

369,18



MX

6,3556



MY

7,3836



s2X

11,02005



s2Y

15,31479



KXY

-9,1594



ρXY

-0,7194




Числовые характеристики для негруппированной выборки находятся по следующим формулам:


, ;

;

;

;

;



Построение корреляционного поля:


Построение корреляционной таблицы:

Таблица 1.1

Y

X

-1.5

1.5

4.5

7.5

10.5

13.5

16.5

ni.

2.5

0

0

1

1

8

3

0

13

5.5

0

0

4

5

6

1

1

17

8.5

1

1

8

1

1

0

0

12

11.5

0

3

4

1

0

0

0

8

nj.

1

4

17

8

15

4

1

50


Оценка числовых характеристик для группированных данных:


, ;

, ;

;

;

, ;

;

;


= - 0.87


Задание 2


Для негруппированных данных проверить гипотезу об отсуствии линейной статистической связи между компонентами X и Y при альтернативной гипотезе ( уровень значимости α = 0,05);

Выборочное значение статистики равно


,


Используя средства Matlab, найдем



Так как выборочное значение статистики больше квантили распределения Стьюдента, гипотеза H0 отклоняется в сторону гипотезы H1. Корреляция значима.


Задание 3


Для негруппированых данных получить интервальную оценку для истинного значения коэффициента корреляции ρX,Y, при уровне значимости α = 0,05.

Используя средства Matlab, найдем


,

,



Задание 4


Для негруппированных и группированных данных составить уравнения регрессии Y на x и X на Y.

Рассмотрим вначале случай негруппированных данных.

Этот интервал не содержит нуля, т.е. с доверительной вероятностью 1 – ЫВА = 0,95 существует корреляция между X и Y и имеет смысл построение уравнений регрессии.


,

y(x) = 12,77 – 0,848*x;

x(y) = 10,86 – 0,6*y;


Проверка.


, .

, ;

,

, ;


Случай группированных данных.

Подставим найденные значения в уравнеиня линейной регрессии Y на x и X на y. Получим:


y(x) = 17,14 – 1,4*x;

x(y) = 10,83 – 0,54*y;


Проверка:


Задание 5


Для негруппированных данных нанести графики выборочных регрессионных прямых на диаграмму рассеивания.



Задание 6


Для негруппированных данных по найденным оценкам параметров линейной регрессии Y на x получить оценку s2 для дисперсии ошибок наблюдений σ2, найти коэффициент детерминации R2, построить доверительные интервалы для параметров регрессии a и b, дисперсии ошибок наблюдений σ2 и среднего значения Y при x = x0 .

Для негруппированных данных были получены следующие оценки числовых характеристик и коэффициентов регрессии: , , , , , , , .

Используя соотношение , вычислим остаточную сумму


;

;

;

.

;


Тогда оценка дисперсии ошибок наблюдений равна


.


Коэффициент детерминации равен


.


Поскольку (знак ), то сделаем проверку правильности расчетов:

(верно).

Полученный результат для коэффициента детерминации означает, что уравнение регрессии на 49,7% объясняет общий разброс результатов наблюдений относительно горизонтальной прямой .

Построим доверительные интервалы для параметров линейной регрессии и дисперсии ошибок наблюдений.

С помощью Matlab найдем квантили распределений Стьюдента и :

, , ;

доверительный интервал для параметра :


;

;


доверительный интервал для параметра :


;

;


доверительный интервал для дисперсии ошибок наблюдений :


;

.


-Найдем границы доверительных интервалов для среднего значения при :


;

.







Чтобы не видеть здесь видео-рекламу достаточно стать зарегистрированным пользователем.
Чтобы не видеть никакую рекламу на сайте, нужно стать VIP-пользователем.
Это можно сделать совершенно бесплатно. Читайте подробности тут.