Математическая статистика (DOC) (Математическая статистика (DOC))

Посмотреть архив целиком


Математическая статистика.

Математическая статистика возникла и создавалась параллельно с теорией вероятностей в XVII веке. Дальнейшее развитие математической статистики (вторая половина XIX и начало XX веков) обязано, в первую очередь, П. Л. Чебышеву, А. А. Маркову, А. М. Ляпунову и др.

Вариационные ряды. Генеральная совокупность и выборка

Совокупность предметов или явлений, объединённых каким – либо общим признаком или свойством качественного или количественного характера, называется объектом наблюдения.

  • Количественным называется признак, значения которого выражаются числами.

  • Качественным называется признак, характеризующийся некоторым свойством или состоянием элементов совокупности.

Каждый объект статистического наблюдения состоит из отдельных элементов – единиц наблюдения. Результаты статистических наблюдений представляют собой числовую информацию – данные.

Статистические данныеэто сведения о том, какие значения принял интересующий исследователя признак в статистической совокупности.

Статистическая совокупность называется генеральной совокупностью, если исследованию подлежат все элементы совокупности.

Выборочной совокупностью, или просто выборкой, называют часть элементов генеральной совокупности подлежащих исследованию. Она извлекается из генеральной совокупности случайно, чтобы каждый объект имел равные шансы быть отобранным.

Значения признака, которые при переходе от одного элемента совокупности к другому изменяются, называются вариантами и обозначаются маленькими латинскими буквами. Порядковый номер варианта называется рангом.

Ряд значений признака, расположенный в порядке возрастания или убывания с соответствующими им весами, называется вариационным рядом.

В качестве весов выступают частоты или частости.

Частота (mi) показывает, сколько раз встречается тот или иной вариант в статистической совокупности.

Частость или относительная частота (wi) показывает, какая часть единиц совокупности имеет тот или иной вариант к сумме всех частот ряда. Частость рассчитывается как отношение частоты того или иного варианта к сумме всех частот ряда

Сумма всех частостей равна 1



Вариационные ряды бывают дискретными и интервальными.

Дискретные вариационные ряды строят обычно в том случае, если значения изучаемого признака могут отличаться друг от друга не менее чем на некоторую конечную величину. В дискретных вариационных рядах задаются точечные значения признака. Общий вид дискретного ряда показан в таблице.




Значения признака (хi)

х1

х2

хk

Частоты (mi)

m1

m2

mk



Интервальные вариационные ряды строят обычно в том случае, если значения изучаемого признака могут отличаться друг от друга на сколь угодно малую величину. Значения признаков в них задаются в виде интервалов. Общий вид интервального ряда имеет вид

Значения признака (хi)

a1 – a2

a2 – a3

ai-1 - ai

Частоты (mi)

m1


m2

mi


В интервальных вариационных рядах в каждом интервале выделяют верхнюю и нижнюю границы.

Разность между верхней и нижней границами интервала называется интервальной разностью или длиной интервала. В общем виде интервальную разность ki представим как

ki = xi (max) - xi (min)

Первый и последний интервалы могут быть открытыми, т.е. иметь только одну границу.

Если интервалы в вариационных рядах имеют одинаковую длину, их называют равновеликими, в противном случае неравновеликими.

При построении интервального ряда (если строится ряд с равными интервалами), для определения оптимальной величины интервалов применяют формулу Стэрджесса

,

где n число единиц совокупности; x max и x min – наибольшее и наименьшее значения вариационного ряда.

Дискретный вариационный ряд графически можно представить с помощью полигона распределения частот или частостей. рис.8











рис.8

Интервальные вариационные ряды графически можно представить в виде гистограмм, т. е. столбчатой диаграммы. рис.9







рис.9




Абсолютная плотность – это отношение частоты интервала к его величине:

,

где - абсолютная плотность i – го интервала; mi – его частота; ki – интервальная разность. Абсолютная плотность показывает, сколько единиц совокупности приходится на единицу интервала.

Относительная плотность – отношение частости интервала к его величине:

,

где -относительная плотность i – го интервала;

Относительная плотность показывает, какая часть единиц совокупности приходится на единицу интервала.


Числовые характеристики вариационного ряда

Одной из основных характеристик ряда распределения является средняя арифметическая. Существует две формулы для расчёта средней арифметической: простая и взвешенная. Простую среднюю арифметическую используют, когда данные наблюдений не сведены в вариационный ряд или все частоты равны единице (одинаковы).

,

где хii-е значение признака; n – объём ряда (число наблюдений).

Если частоты отличны друг от друга, расчёт производится по формуле средней арифметической взвешенной

где хii-е значение признака; mi – частота i-го значения признака; k – число его значений (вариантов).

При расчёте средней арифметической в качестве весов могут выступать и частости, тогда формула расчёта средней арифметической взвешенной примет следующий вид.

где wi – частость i-го значения признака;

Колеблемость изучаемого признака можно охарактеризовать с помощью различных показателей вариации. К числу основных показателей вариации относятся: математическое ожидание, дисперсия, среднее квадратическое отклонение, коэффициент вариации.

Математическое ожидание – это числовая характеристика случайной величины, со средним арифметическим её наблюдаемых значений, которое является статистической характеристикой вариационного ряда и рассчитывается по формуле:

где рi – вероятность i-го значения признака.




Дисперсию можно рассчитать по простой и взвешенной формулам имеющим вид

;

Среднее квадратическое отклонение рассчитывается по формуле


Коэффициент вариации определяется формулой

.


Задачи на составление вариационных рядов

1) При обследовании 50 членов семей рабочих и служащих установлено следующее количество членов семьи: 5; 3; 2; 1; 4; 6; 3; 7; 9; 1; 3; 2; 5; 6; 8; 2; 5; 2; 3; 6; 8; 3; 4; 4; 5; 6; 5; 4; 7; 5; 6; 4; 8; 7; 4; 5; 7; 8; 6; 5; 7; 5; 6; 6; 7; 3; 4; 6; 5; 4. Составьте вариационный ряд распределения частот. Постройте полигон распределения частот, кумуляту. Определите среднее число членов семьи Охарактеризуйте колеблемость размера семьи с помощью показателей вариации

Объясните полученные результаты, сделайте выводы.

2) Имеются данные о еженедельном количестве проданных компьютеров одной из фирм: 398, 412, 560, 474, 544, 690, 587, 600, 613, 457, 504, 477, 530, 641, 359, 566, 452, 633, 474, 499. 580, 606, 344, 455,505, 396, 347, 441, 390, 632, 400, 582. Составьте вариационный ряд. Найдите среднее количество проданных компьютеров. Рассчитайте показатели вариации

3) Администрацию магазина интересует частота покупок калькуляторов. Менеджер в течении января регистрировал данные о покупке МК и собрал следующие данные: 8, 4, 4, 9, 3, 3, 1, 2, 0, 4, 2, 3, 5, 7, 10, 6, 5, 7, 3, 2, 9, 8, 1, 4, 6, 5, 4, 2, 1, 0, 8. Постройте вариационный ряд, определите его числовые характеристики. Какие рекомендации вы дали бы администрации универсама?


4) Число пассажиров одного из рейсов за 30 дней составило: 128, 121, 134, 118, 123, 109, 120, 116, 125, 128, 121, 129, 130, 131, 127, 119, 114, 124, 110, 126, 134, 125, 128, 123, 128, 133, 132, 136, 134, 129. Составьте вариационный ряд. Найдите среднее число пассажиров в рейсе? Рассчитайте показатели вариации. Сделайте анализ полученных результатов.


5) Имеются данные о годовой мощности предприятий в 2003 году

Предприятия с годовой мощностью, тыс.т

Количество предприятий

До 500

27

500 – 1000

11

1000 – 2000

8

2000 – 3000

8

Свыше 3000

2


Постройте гистограмму, кумуляту. Рассчитайте среднюю мощность предприятий. Найдите дисперсию. среднее квадратическое отклонение, коэффициент вариации. Сделайте анализ полученных результатов.


6) По данным выборочного обследования получено следующее распределение по среднедушевому доходу

Среднедушевой доход семьи в месяц, у.е.

до

25

25 – 50

50 – 75

75 – 100

100 – 125

125 – 150

150 и выше

Количество обследованных семей

46

236

250

176

102

78

12

Постройте гистограмму, кумуляту. Рассчитайте среднюю мощность предприятий. Найдите дисперсию. среднее квадратическое отклонение, коэффициент вариации. Сделайте анализ полученных результатов.


7) Постройте гистограмму частот, найдите среднюю заработную плату работников одного из цехов «Азота»

Заработная плата, у.е

50 – 75

75 – 100

125 – 150

150 – 175

175 – 200

200 - 225

Число работников

12

23

37

19

15

9


Случайные файлы

Файл
136569.rtf
163522.rtf
54295.doc
19587.rtf
23579-1.rtf




Чтобы не видеть здесь видео-рекламу достаточно стать зарегистрированным пользователем.
Чтобы не видеть никакую рекламу на сайте, нужно стать VIP-пользователем.
Это можно сделать совершенно бесплатно. Читайте подробности тут.