Выполнение статистических расчетов с помощью ЭВМ в системе MINITAB и Exсel (183437)

Посмотреть архив целиком


Министерство образования и науки Украины

Севастопольский Национальный технический

Университет







Выполнение статистических расчетов с помощью ЭВМ в системе MINITAB и Exсel

Методические указания к выполнению лабораторной работы №1

по дисциплине “Прикладная статистика”













Севастополь

2008 г.


УДК 658.

Ознакомление со статистическим пакетом "Minitab". Методические указания по выполнению лабораторной работы по дисциплине "Прикладная статистика" / Сост. Букач Б.А., Погорелова М.В. - Севастополь: Изд-во СевГТУ, 2008. -20 с.

Целью методического указания является ознакомление с возможностями статистического пакета "Minitab". Методические указания предназначены для студентов экономических специальностей всех форм обучения.

Методические указания содержат описание способов анализа данных в статистическом пакете MINITAB.

Методические указания рассмотрены и утверждены на заседании кафедры МЭМ, (протокол № ____ от “___”____________2008 г.)


Допущено учебно-методическим центром СевГТУ в качестве методических указаний

Рецензент:

Жвава В.Н., к.э.н., доцент кафедры "Бухгалтерский учет"

  • нормоконтроль


Цель работы: получение практических навыков работы со статистическим пакетом MINITAB и проведения расчетов в программе MS Exel при расчете и анализе основных статистических показателей.


  1. Основные характеристики распределения экономических величин


Исходным материалом любого статистического исследования являются совокупность результатов наблюдений. В простейших случаях они представляют собой выборочные (полученные в результате наблюдений) значения некоторой случайной величины X. В задачах статистики распределение этой случайной величины зачастую неизвестно.

Пусть есть N наблюдений некоторой величины X ().Основными статистическими параметрами данной величины являются следующие.

  1. Среднее значение

Среднее показывает "центральное положение" (центр) переменной и рассматривается совместно с доверительным интервалом. Обычно интерес представляют статистики (например, среднее), дающие информацию о генеральной совокупности в целом. Чем больше размер выборки, тем более надежна оценка среднего. Чем больше изменчивость данных (больше разброс), тем оценка менее надежна.

  1. Среднеквадратическое (стандартное) отклонение:

Стандартное отклонение - это широко используемая мера разброса или вариабельности (изменчивости) данных. Среднеквадратическое отклонение показывает средний разброс данных относительно своего среднего значения.

  1. Медиана   - это значение, которое разбивает выборку на две равные части. Половина наблюдений лежит ниже медианы, и половина наблюдений лежит выше медианы. Медиана вычисляется следующим образом. Изучаемая выборка упорядочивается в порядке возрастания. Получаемая последовательность ak, где k=1,..., 2*m+1называется вариационным рядом или порядковыми статистиками. Если число наблюдений нечетно, то медиана оценивается как: am+1. Если число наблюдений четно, то медиана оценивается как:



m=

am+am+1

2

  1. Усеченное среднее. При расчете среднего значения возможно исключение крайних точек из распределения значений переменной. Например, можно исключить (удалить) 5% наименьших и 5% наибольших значений. Среднее значение, рассчитанное для усеченного таким образом распределения, будет называться "усеченным средним" (этот термин впервые был использован Тьюки в 1962г.).

  2. Квартили. Нижняя и верхняя квартили (термин был впервые использован Галтоном, 1882; также их называют квантилями 0.25 и 0.75) равны соответственно 25-й и 75-й процентилям распределения. 25-я процентиль переменной - это такое значение, ниже которого попадают 25% значений переменной. Аналогично, 75-я процентиль - это такое значение, ниже которого попадают 75% значений переменной.

  3. Доверительный интервал для среднего задает область вокруг среднего, в которой с заданным уровнем доверия (точностью) содержится "истинное" среднее генеральной совокупности. Например, если среднее в вашей выборке равно 23, а нижняя и верхняя границы для p=.05 равны 19 и 27 соответственно, то вы можете заключить, что с  95% вероятностью среднее выборки больше 19 и меньше 27. Если вы установите меньшее значение p-уровня, то интервал будет шире, и увеличится "уверенность" в оценке, и наоборот; как мы знаем из прогнозов погоды, чем "неопределеннее" прогноз (т.е. шире доверительный интервал), тем скорее он сбудется. Заметим, что ширина доверительного интервала зависит от размера выборки и дисперсии наблюдений. Вычисление доверительных интервалов основывается на предположении, что переменная в совокупности нормально распределена. Эта оценка может быть неверной, если это предположение не выполнено, и пока размер выборки мал, например, n меньше 100.

  4. Корреляция Пирсона. Наиболее часто используемый коэффициент корреляции Пирсона r называется также линейной корреляцией, т.к. измеряет степень линейных связей между переменными. Можно сказать, что корреляция определяет степень, с которой значения двух переменных пропорциональны друг другу. Важно, что значение коэффициента корреляции не зависит от масштаба измерения. Например, корреляция между ростом и весом будет одной и той же, независимо от того, проводились измерения в дюймах и фунтах или в сантиметрах и килограммах. Пропорциональность означает просто линейную зависимость. Корреляция высокая, если на графике зависимость можно представить прямой линией (с положительным или отрицательным углом наклона). Проведенная прямая называется прямой регрессии или прямой, построенной методом наименьших квадратов. Последний термин связан с тем, что сумма квадратов расстояний (вычисленная по оси Y) от наблюдаемых точек до прямой является минимальной из всех возможных. Заметим, что использование квадратов расстояний приводит к тому, что на оценки параметров сильно влияют выбросы. Корреляция Пирсона предполагает, что две рассматриваемые переменные измерены, по крайней мере, в интервальной шкале. Коэффициент корреляции Пирсона вычисляется следующим образом:

Коэффициент корреляции изменяется в диапазоне от -1 до +1. Чем больше по модулю коэффициент, тем сильнее связь между изучаемыми переменными. Например, между ценой и спросом на товар в случае высокой эластичности спроса будет наблюдаться сильная отрицательная корреляция:

Коэффициент корреляции -1

А между ценой на товар и предложением его на рынке будет наблюдаться сильная корреляция.

Коэффициент корреляции – 1

В случае, если связи между переменными нет, коэффициент корреляции будет стремиться к нулю.

Коэффициент корреляции – 0,22

  1. Таблица частот (Гистограмма). Гистограмма позволяет наглядно оценить частоты попадания случайной величины в определенные интервалы значений.


2. Общие сведения о пакете MINITAB. Расчет статистических характеристик величин с помощью MINITAB


Статистический пакет MINITAB был разработан в Пенсильванском государственном университете для облегчения изучения различных статистических дисциплин. Сейчас MINITAB используется более чем в 2000 учебных заведений во всем мире. Более 75 % компаний, входящих в, так называемые Top 50 (по данным журнала Fortune), используют данный пакет в своей работе.

В нашем университете при изучении дисциплин, связанных с обработкой статистической информации, используются несколько версий статистического пакета MINITAB:

- The Student Edition of MINITAB for Windows;

- Minitab Release 10;

- Minitab Release 12.

Первая из этих трех версий существенно отличается от двух других и имеет большое количество особенностей. Поэтому в дальнейшем при описании возможностей статистического пакета MINITAB эти особенности будут отдельно оговариваться. The Student Edition of MINITAB for Windows - это учебная версия статистического пакета MINITAB, разработанная для студентов, изучающих различные экономико-математические дисциплины.

2.1 Основные понятия

Рабочий лист – это первичный и основной документ для ввода, анализа и вычисления данных. Он содержит около 3500 ячеек и 1000 колонок.

Ячейка – единичный адресуемый элемент в рабочем листе, которая может содержать значение переменной. Ячейка определяется своим адресом, который состоит из имени столбца и номера строки.

Существует три типа ячеек в MINITAB:

- числовые;

- текстовые;

- ячейки даты/времени.

Числовые данные могут содержать следующие символы: любую последовательность цифр (0,1,2,3,4,5,6,7,8,9), которые могут быть положительными и отрицательными, содержать десятичную и экспоненциальную части. Экспоненциальная запись данных выглядит следующим образом: число 3200 в ячейке может быть представлено в виде 32Е2 или 3.2Е3, что означает - 32 x 102 или 3.2 x 103.

Числовые колонки могут содержать знак - "*". "Звездочка" означает, что при вводе было пропущено одно из значений, либо она возникла как результат неправильного выполненного или невозможного арифметического действия. При наличии "*" в колонках с данными некоторые виды расчетов (например, дисперсионный и регрессионный анализы, вычисление коэффициента корреляции и некоторые другие расчеты) MINITAB не производит.

Текстовые данные должны отвечать следующим требованиям:

- быть не длиннее 80 символов;

- могут содержать внутри себя любые символы (буквы, цифры, знаки пунктуации, пробелы);

- текстовые данные могут сохраняться в колонках, в строках, но не в матрицах.

Данные представлены в виде даты/времени могут быть нескольких форматов:

Формат

Описание

Пример

m/d/yy

Американский формат

1/5/96

m-d-yy

Месяц, день, год

1-5-96

d.m.yy

Европейский формат

5.1.96

d-mmm-yy

Интернацион. формат

5-Jan-96

mmm-yy

Месяц и год

Jan-96

h:mm:ss.ss

24 часовое время

23:10:14.22

h:mm:ss.ss AM/PM

12 часовое время

11:10:14.22 PM


В более поздних версиях MINITAB (Release 10, Release 12) имеется возможность перевода данных из одного формата в другой. В зависимости от того, в каком формате нужно представить данные, необходимо выполнить одну из следующих операций: Manip > Change Data Type > (Numeric to Text, Text to Numeric, Date/Time to Numeric…).

При необходимости имеется возможность наименования колонок. Это выполняется следующим образом: необходимо активизировать ячейку, расположенную ниже нумерации колонки и ввести в эту ячейку требуемое название. Название колонки может содержать как буквы, так и цифры. В версии "The Student Edition of MINITAB for Windows" название колонки должно быть только на английском языке и содержать не более 8 знаков.

На рисунке 1 показано, какими могут быть названия колонок и какие существуют форматы представления данных в статистическом пакете MINITAB. MINITAB автоматически распознает соответствующие форматы данных и добавляет к нумерации колонки буквы, обозначающие тот или иной формат. Например, колонка С1 на рисунке 1 содержит данные формата даты/времени и поэтому к названию колонки добавляется буква "D" (C1-D), аналогично колонка С2 обозначается (С2-Т), т.к. она содержит текстовые данные.

В версии "The Student Edition of MINITAB for Windows" появление в названии колонки буквы "T" означает, что все данные, которые в ней находятся, будут восприняты как текстовые.

Удаление данных в статистическом пакете MINITAB возможно следующими способами:

- если требуется удалить ячейки со сдвигом вверх, то нужно выполнить Edit > Cut Cells;

- если требуется очистить ячейки, то Edit > Clear Cells или нажать на кнопку "Backspace";

- если требуется удалить ячейки, то Edit > Delete Cells или нажать на кнопку "Delete".


Рисунок 1.1 - Возможности представления данных в MINITAB.


Имеется также возможность переставлять колонки местами и менять их ширину.

В более поздних версиях MINITAB (Release 10, Release 12) имеется возможность работы с матрицами, для этого необходимо выполнить следующую операцию: Calc > Matrices.

MINITAB включает в себя следующие блоки:

  1. всесторонние статистические возможности, включая описательную статистику, моделирование и вероятностные распределения, элементарную статистику, дисперсионный и регрессионный анализы, непараметрическую статистику и анализ временных рядов;

  2. легко доступный интерфейс, позволяющий осуществлять всевозможный анализ статистических данных;

  3. ячейки пакета MINITAB позволяют вводить, редактировать, просматривать данные на открытом рабочем листе;

  4. текущий (on-line) Help, который помогает студенту быстро решить возникающие проблемы;

  5. имеется возможность импорта и экспорта данных из других программных пакетов, включая Excel;

  6. совместимость с Lotus 1-2-3;

  7. профессиональную графику, которая дает возможность пользователю самостоятельно выбирать вид графика;

  8. похожий интерфейс, команды и устройства ввода-вывода, как и в DOS и Macintosh.


2.2 Структура окон в статистическом пакете MINITAB


Статистический пакет MINITAB состоит из следующих основных окон:

  1. окно данных (Data Window);

  2. окно результатов (Session Window);

  3. информационное окно (Info Window);

  4. окно записи использованных команд (History Window);

  5. графическое окно (Graph Window);

  6. окно для помощи (Help Window).


Рисунок 2.1 - Внешний вид основного окна MINITAB.


Окно данных (Data Window): автоматически появляется на экран при запуске MINITAB. Оно представляет собой крупноформатную таблицу, состоящую из ячеек, имеющих каждая свое имя. В ячейку можно вводить данные, а также просматривать и редактировать их.

окно результатов (Session Window):в данном окне выводятся результаты, полученные при расчетах или причины, по которым программа не может выполнить расчеты (ошибки).



Рисунок 2.2 – Внешний вид окна данных (Data Window).



Рисунок 2.3 – Внешний вид окна результатов (Session Window).


окно записи использованных команд (History Window): в данном окне автоматически записываются все команды, которые были использованы во время работы пользователя.

информационное окно (Info Window): в данном окне содержится суммарная информация о количестве используемых колонок и о количестве используемых в них данных, а также сообщает о наличии ошибок в данных.



Рисунок 2.4 – Внешний вид окна записи использованных команд (History Window).


Рисунок 2.5 – Внешний вид информационного окна (Info Window);


графическое окно (Graph Window): в этом окне строятся все графики. Оно выводится на экран автоматически при желании пользователя построить график. Графических окно может быть одновременно несколько штук. Пользователь может выбрать одно из графических окон, которое будет отображаться на весь дисплей или выбрать, чтобы все графические окна были выведены на дисплей одновременно.


Рисунок 2.6 – Внешний вид графического окна (Graph Window).

Рисунок 2.7 – Внешний вид окна для помощи (Help Window).

окно для помощи (Help Window): в этом окне можно узнать, как правильно пользоваться статистическим пакетом MINITAB, при возникновении различных затруднений у пользователя. В этом окне разрешает копировать и вырезать из текста фрагменты, а также непосредственно распечатывать их на принтере.

Для удобства пользования некоторыми из перечисленных выше окон, существует возможность быстрого переключения на них с помощью следующих комбинации клавиш:

Ctrl-D - окно данных (Data Window);

Ctrl-M - окно результатов (Session Window);

Ctrl-I - информационное окно (Info Window);

Ctrl-H - окно для записи использованных команд (History Window);

2.3. Структура меню в статистическом пакете MINITAB


Статистический пакет MINITAB (Здесь описывается структура меню наиболее простой версии - The Student Edition of MINITAB for Windows. Более поздние версии MINITAB содержат такое же меню, но имеют ещё некоторые дополнительные команды) имеет следующую структуру командного меню:

  1. файловое меню (File Menu);

  2. меню редактирования (Edit Menu);

  3. меню манипуляции (Manip Menu);

  4. меню для выполнения расчетов (Calc Menu);

  5. статистическое меню (Stat Menu);

  6. меню работы с окнами (Window Menu);

  7. графическое меню (Graph Menu);

  8. меню редактора (Editor Menu);

  9. вспомогательное меню (Help Menu).


Команды файлового меню (File Menu) позволяют осуществить следующие операции:

  1. создать, открыть, сохранить и вернуть рабочий файл;

  2. импортировать и экспортировать тексты;

  3. произвести запись содержания окна результатов (Session Window);

  4. вести работу с макро-файлами;

  5. сохранять содержимое рабочего файла в отдельный файл с новым именем;

  6. установить настройку принтера и осуществить формат документа;

  7. распечатать содержимое любого окна или текстового файла;

  8. перезапустить и выйти из MINITAB.


Команды меню редактирования (Edit Menu) позволяют осуществить следующие операции:

  1. отменить результат своего предыдущего действия;

  2. удалять, копировать, вырезать и выделять необходимые ячейки в рабочем окне;

  3. возвращать на дисплей последнее диалоговое меню, для его редактирования;

  4. установить и сохранить настройки размера окон, место и порядок их расположения.


Команды меню манипуляции (Manip Menu) позволяют осуществить следующие операции:

  1. сортировать и ранжировать ряды данных;

  2. удалять рядами данных;

  3. стирать данные из ряда;

  4. копировать колонки;

  5. кодировать числовые данные;

  6. объединять и преобразовывать данные в колонках.


Команды меню для выполнения расчетов (Calc Menu) позволяют осуществить следующие операции:

  1. генерировать и работать со случайными числами;

  2. рассчитывать статистику рядов и колонок данных;

  3. задавать автоматическое заполнение данными колонок (например, последовательностью чисел 1, 2, 3, 4...)

  4. создавать индикаторы или фиктивные переменные

  5. стандартизировать данные.

Команды статистического меню (Stat Menu) позволяют осуществить следующие операции:

  1. рассчитать описательную статистику, осуществить линейный регрессионный анализ и дисперсионный анализ;

  2. выполнить анализ временного ряда, перекрестный анализ и осуществить различные непараметрические тесты.

Команды меню работы с окнами (Window Menu) позволяют осуществить следующие операции:

  1. осуществлять замену активных окон и икон меню;

  2. работать с графическими окнами;

  3. переходить из одного окна в другое.

Команды графического меню (Graph Menu) позволяют осуществить следующие операции:

  1. выводить на дисплей различные графики, включая диаграммы, графики, гистограммы, точечные графики и графики анализа временных рядов;

  2. устанавливать и сохранять настройки графиков.

Команды меню редактора (Editor Menu) позволяют осуществить следующие операции:

  1. передвигаться по рабочему окну с данными в любую ячейку;

  2. форматировать колонки и устанавливать необходимую длину колонок;

  3. добавлять ряды и колонки;

  4. редактировать данные в ячейке.

Команды вспомогательного меню (Help Menu) позволяют осуществить следующие операции:

  1. выводить на экран систему помощи, состоящей из следующих разделов: содержание, начало работы с MINITAB, раздел «Как мне сделать...» и описание как пользоваться вспомогательным меню MINITAB;






Чтобы не видеть здесь видео-рекламу достаточно стать зарегистрированным пользователем.
Чтобы не видеть никакую рекламу на сайте, нужно стать VIP-пользователем.
Это можно сделать совершенно бесплатно. Читайте подробности тут.