Расчет показателей корреляционного, дисперсионного анализа (178622)

Посмотреть архив целиком

Задача 1. Корреляционный анализ


Исследовано функционирование некоторого предприятия торговли в течение n месяцев. Необходимо проанализировать наличие предполагаемой зависимости между: расходами предприятия на рекламу и продвижение товаров на рынок , (в тыс. грн); расходами на обучение и повышение квалификации персонала Yi, (в тыс. грн.); объемом товарооборота предприятия торговли Ui, (в млн. грн.); прибылью предприятия Zi, (в тыс. грн.).


X

Y

U

Z

82

101

48

34

100

106

52

24

85

66

51

36

85

80

47

33

102

71

49

23

102

80

54

24

85

119

46

35

88

66

49

30

90

84

50

30

84

94

46

33

83

73

47

32

87

59

47

31

102

79

52

24

80

116

44

36

80

103

48

33

96

76

52

27

95

89

52

27

81

66

45

34


Провести предварительный анализ (описательную статистику) исследуемых компонентов многомерной случайной величины

Для всех пар случайных величин построить диаграммы рассеивания (корреляционные поля).

Рассчитать матрицу выборочных парных коэффициентов корреляции. Сделать выводы о степени тесноты и тенденции связи между парами компонентов исследуемого многомерного признака в терминах решаемой прикладной задачи.

Проверить гипотезу об отсутствии корреляционной связи между двумя компонентами случайной величины (X,Z).

Построить доверительные интервалы для двух парных коэффициентов корреляции при р=0.95 (X,Z;Y,Z).

Исключив из рассмотрения случайную величину, не зависящую от других, для оставшихся случайных величин рассчитать матрицу частных коэффициентов корреляции.

Рассчитать парные ранговые коэффициенты корреляции Спирмена и Кендалла для двух компонентов многомерной случайной величины (U,Y).

Рассчитать корреляционные отношения между случайными величинами, для которых можно предположить наличие нелинейной связи.

Рассчитать коэффициент конкордации для трех случайных величин, между которыми на основе проведенного анализа можно предположить наличие статистической связи.

Проверить гипотезу о статистической значимости исследуемой множественной связи.

В терминах решаемой прикладной задачи дать содержательную интерпретацию результатов для каждого из пунктов.

РЕШЕНИЕ

1. Построим диаграммы рассеивания




2. Рассчитаем матрицу выборочных парных коэффициентов корреляции при помощи пакета анализа программы Excel:


 

Δ U

Δ X

Δ Y

Δ U

1



Δ X

0,80766

1


Δ Y

-0,3689

-0,19614

1


Анализ полученных коэффициентов парной корреляции показывает, что зависимая переменная, т.е. объем товарооборота предприятия торговли имеет сильную прямую связь с расходами предприятия на рекламу и продвижение товаров на рынок (0,4≤0,81≤1) и слабую обратную связь с расходами на обучение и повышение квалификации персонала (0,37≤0,4). Мультиколлинеарность отсутствует, т.к. коэффициент парной корреляции равен -0,196, что не превышает значения 0,7-0,8.


 

Δ Z

Δ X

Δ Y

Δ Z

1



Δ X

-0,95998

1


Δ Y

0,215933

-0,19614

1


Анализ полученных коэффициентов парной корреляции показывает, что зависимая переменная, т.е. прибыль предприятия торговли имеет сильную обратную связь с расходами предприятия на рекламу и продвижение товаров на рынок (0,4≤0,96≤1) и слабую прямую связь с расходами на обучение и повышение квалификации персонала (0,22≤0,4). Мультиколлинеарность отсутствует, т.к. коэффициент парной корреляции равен -0,196, что не превышает значения 0,7-0,8.

3. Проверить гипотезу об отсутствии корреляционной связи между двумя компонентами случайной величины (X,Z):

В предыдущем пункте проверка гипотезы об отсутствии корреляционной связи между расходами предприятия на рекламу и продвижение товаров на рынок и прибылью предприятия была опровергнута, т.к. проверка коэффициентов парной корреляции показывает, что зависимая переменная, т.е. прибыль предприятия торговли имеет сильную обратную связь с расходами предприятия на рекламу и продвижение товаров на рынок (0,4≤0,96≤1).

4. Построить доверительные интервалы для двух парных коэффициентов корреляции при р=0.95 (X,Z;Y,Z)

Полагая доверительную вероятность р = 0,95 т. е. вероятность, с которой гарантируются результаты, равной 0,95, находим соответствующее ей значение критерия Стьюдента t, равное 2,1009. Воспользовавшись формулой средней квадратической ошибки, где вместо р возьмем рассчитанный выборочный коэффициент корреляции r, получим значение для средней квадратической ошибки X,Z: р = 0,95; r = - 0,96

Поскольку tσr= 2,1009 х 0,018 = 0,0388 верхняя и нижняя границы равны соответственно -0,9212 и -0,9988. Другими словами, с вероятностью 0,95 коэффициент корреляции данной совокупности находится в пределах от -0,9212 до -0,9988. Y,Z: р = 0,95; r = 0,216

Поскольку tσr= 2,1009 х 0,22 = 0,47 верхняя и нижняя границы равны соответственно 0,69 и -0,25. Другими словами, с вероятностью 0,95 коэффициент корреляции данной совокупности находится в пределах от -0,25 до 0,69.

6. Рассчитать парные ранговые коэффициенты корреляции Спирмена и Кендалла для двух компонентов многомерной случайной величины (U,Y).


Запишем ранги:

U

48

52

51

47

49

54

46

49

50

46

47

47

52

44

48

52

52

45

Z

11

5

6

14

9

1

16

8

7

15

13

12

4

18

10

3

2

17

X

15

4

12

11

3

2

10

8

7

13

14

9

1

18

17

5

6

16


-4

1

-6

3

6

-1

6

0

0

2

-1

3

3

0

-7

-2

-4

1

16

1

36

9

36

1

36

0

0

4

1

9

9

0

49

4

16

1


Σ= 228


Тогда критерий Спирмена равен:



r = 0,765, это больше табличного значения критерия, значит корреляция достоверно отличается от 0.

Критерий Кендалла:


r = 4*153/(18*17) – 1 = -0,5


Значит между объемом товарооборота предприятия торговли и расходами предприятия на рекламу и продвижение товаров на рынок существует обратная средней тесноты связь.


Y

101

106

66

80

71

80

119

66

84

94

73

59

79

116

103

76

89

66

Z

4

15

1

6

18

16

3

11

12

7

9

10

17

2

8

13

14

5

X

15

4

10

11

1

2

12

8

7

13

14

9

3

17

18

5

6

16


-11

11

-9

-5

17

14

-9

3

5

-6

-5

1

14

-15

-10

8

8

-11

121

121

81

25

289

196

81

9

25

36

25

1

196

225

100

64

64

121


Σ= 1780


Тогда критерий Спирмена равен:



r = -0,837, это значит корреляция недостоверна. Значит между объемом товарооборота предприятия торговли и расходами на обучение и повышение квалификации персонала не существует связи.

7. Рассчитаем корреляционные отношения между случайными величинами, для которых можно предположить наличие нелинейной связи: расходами предприятия на рекламу и продвижение товаров на рынок и объемом товарооборота предприятия торговли; расходами предприятия на рекламу и продвижение товаров на рынок и прибылью предприятия.

Коэффициенты корреляции:


Rxu = 0,8

Rxz = -0,96


8. Рассчитаем коэффициент конкордации для расходов предприятия на рекламу и продвижение товаров на рынок, объемом товарооборота предприятия торговли и продвижение товаров на рынок и прибылью предприятия, между которыми на основе проведенного анализа можно предположить наличие статистической связи



W = 0.88 – значит согласованность показателей стремиться к полной.

После проведении анализа можно сделать следующие выводы:

- объем товарооборота предприятия торговли имеет сильную прямую связь с расходами предприятия на рекламу и продвижение товаров на рынок (0,4≤0,81≤1) и слабую обратную связь с расходами на обучение и повышение квалификации персонала (0,37≤0,4);

- . прибыль предприятия торговли имеет сильную обратную связь с расходами предприятия на рекламу и продвижение товаров на рынок (0,4≤0,96≤1) и слабую прямую связь с расходами на обучение и повышение квалификации персонала (0,22≤0,4);

- между объемом товарооборота предприятия торговли и расходами предприятия на рекламу и продвижение товаров на рынок существует обратная средней тесноты связь;

- Rxu = 0,8 корреляция между расходами предприятия на рекламу и продвижение товаров на рынок и объемом товарооборота предприятия торговли;

Rxz = -0,96 корреляция расходами предприятия на рекламу и продвижение товаров на рынок и прибылью предприятия.



Задача 2. Однофакторный дисперсионный анализ


При уровне значимости =0.05 определите статистическую достоверность влияния фактора А на динамику величины Х.


испытания

A1

A2

A3

A4

1

2

2

6

7

2

0

13

8

11

3

14

13

10

2

4

11

5

9

5

5

1

12

4

6

6

7

4


8


РЕШЕНИЕ

Число выборок m=6, значения во всех выборках n=22


испытания

A1

A2

A3

A4

Σ

n

1

2

2

6

7

17

4

2

0

13

8

11

32

3

3

14

13

10

2

39

4

4

11

5

9

5

30

4

5

1

12

4

6

23

4

6

7

4

 

8

19

3


Выборочное среднее:



Сумма квадратов отклонений выборочных средних  от общего среднего  (сумма квадратов отклонений между группами):



Сумма квадратов отклонений наблюдаемых значений  от выборочной средней  (сумма квадратов отклонений внутри групп):



Общая сумма квадратов отклонений наблюдаемых значений от общего среднего



А ср.

А ср.2

А ср.2 * n

1

4,25

18,0625

72,25

2

10,66667

113,7778

341,3333

3

9,75

95,0625

380,25

4

7,5

56,25

225

5

5,75

33,0625

132,25

6

6,333333

40,11111

120,3333

Σ

7,272727


1271,417


Тогда Q = 330,36

Q1 = 107,18

Q2 = Q – Q1 = 222,58


В качестве критерия необходимо воспользоваться критерием Фишера:


Случайные файлы

Файл
60393.rtf
151073.rtf
115450.rtf
82440.rtf
162421.rtf




Чтобы не видеть здесь видео-рекламу достаточно стать зарегистрированным пользователем.
Чтобы не видеть никакую рекламу на сайте, нужно стать VIP-пользователем.
Это можно сделать совершенно бесплатно. Читайте подробности тут.