Шпора по статистике (143728)

Посмотреть архив целиком

Сводка и группировка.

На основе собранных данных нельзя произвести расчет и сделать выводы, для начала их нужно обобщить и свести в единую таблицу. Для этих целей служат сводка и группировка.

Сводка – комплекс последовательных операций по обобщению конкретных единичных фактов, образующих совокупность и выявление типичных черт и закономерностей, присущих изучаемому явлению в целом.

Простая водка – подсчет общих итогов по совокупности.

Сложная сводка – комплекс операций по группировке единичных наблюдений, подсчет итогов по каждой группе и по всему объекту в целом и представлении результатов в виде статистических таблиц.

По форме обработки материала сводка бывает децентрализованная, централизованная – такая сводка проводится при единовременном статистическом наблюдении.

Группировка – расчленение множества единиц изучаемой совокупности на группы по определенным признакам.

Виды группировок.Интервалы.

Виды статистических группировок.

По содержанию:

  1. Типологическая – разделение совокупности на классы, социально-экономические типы (государственные предприятия, ОАО, ООО, ЗАО)

  2. Структурная – разделение совокупности по какому-либо одному признаку. (Возраст)

  3. Аналитическая группировка характеризует взаимосвязь между признаками один из которых является факторным другой результативным.

По структуре:

  1. Простая (монотетическая)

  2. Сложная (политическая)

  • Комбинационная

  • Многомерная

Многомерные группировки

Многомерные группировки используются в статистике, когда проводится группировка по нескольким признакам. Применяют на практике метод многомерной классификации с использованием вычислительных машин. Наиболее простым методом многомерной классификации является многомерная средняя, которой называется средняя величина нескольких признаков для одной единицы совокупности. Она определяется из относительных величин, как правило, из отношений абсолютных значений признаков для единицы к средним значениям этих признаков.

, где

- многомерное среднее для i-той единицы

-число признаков;

-абсолютное значение признака x для i-той единицы;

-среднее значение признака x

Абсолютные и относительные величины в статистик.

Результаты сводки и группировки должны быть представлены так, чтобы ими можно было пользоваться.

Существует 3 способа представления данных:

  1. данные могут быть включены в текст.

  2. представление в таблицах.

  3. графический способ

Обязательно, при группировке, используют характеристику, по которой будет проводиться эта группировка – группировочный признак. Для того чтобы отделить одну группу от другой применяют интервалы группировки. Расчленение совокупностей единиц по группам производятся:

  1. По одному признаку, т.е. простая группировка (монотетическая);

  2. По2-м или более признакам, т.е. сложная группировка (комбинационная, политетическая).

По сравнению с простыми комбинационные группировки обладают дополнительными аналитическими свойствами.

Признак, по которому производится образование групп, называется группировочным признаком или основанием группировки. Выбор ее зависит от решения конкретной задачи. Для многих признаков разрабатываются устойчивые номенклатуры групп и подгрупп, которые называются классификациями. Для образования групп обычно устанавливают интервалы. В статистике интервалы бывают 2-х видов:

  • Закрытые – это, когда указывается верхняя и нижняя границы интервала. Такая запись предполагает, что единица, у которой значение признака совпадает с верхней границей интервала, относится к следующей группе.

  • Открытые – имеют неопределенные границы, они сопровождаются словами «до», «свыше», «примерно».

По величине группировочного признака интервалы подразделяются на:

  1. Равные,

  2. Неравные интервалы.

Величину равных интервалов определяют путем деления разности максимального и минимального признака на число образующих групп.

Использование равных интервалов облегчает анализ материалов, полученных в результате группировки. Это позволяет предугадать, к каким изменениям приведет увеличение или уменьшение групировочного признака, положенного в основу группировки. Отсюда - следует прибегать к равным интервалам.

При образовании интервалов внимание надо обращать на обозначение границ. При выделении интервалов по дискретным прерывистым (количественным) признакам следует обозначать их границу так, чтобы верхние и нижние границы 2-х смежных интервалов отличались на единицу (101-200). Если интервалы образуются по непрерывному признаку, т.е. принимаются любые значения в определенных пределах, то в этом случае границы должны быть обозначены, чтобы все группы были строго ограничены одна от другой. Это достигается путем добавления к числовым границам интервалов указаний о том, в какую группу надо отнести ту или иную границу.


Статистическая таблица – система строк и столбцов, в которой в определенной последовательности излагается статистическая информация о социально-экономических явлениях.

Различают подлежащее и сказуемое таблицы.

Подлежащим называется объект, характеризующийся числами, обычно подлежащее дается в левой части таблицы.

Сказуемое – система показателей, с помощью которых характеризуется объект.

Статистическая таблица содержит 3 вида заголовков: общее, боковое, верхнее.

Общий заголовок должен отражать содержание всей таблицы, располагается над таблицей по центру.

Правило составления таблиц:

  1. обязательны все три вида заголовков без сокращений слов, общие единицы измерения можно вынести в заголовок.

  2. в таблице не должно быть лишних линий, вертикальная разметка может отсутствовать.

  3. Итоговая строка обязательна. Она может быть как в начале так и в конце документа. Если в начале докум то ИТОГО (в том числе), если в конце то ИТОГО;

  4. цифровые данные в пределах одной графы записываются с одной степенью точности. Разряды записываются строго под разрядами, целая часть отделяется запятой.

  5. в таблице не должно быть пустых клеток, если данные отсутствуют, то пишут «Сведений нет» или «…», если данные равны нулю, то «–». Если значение не равно нулю но первая значащая цифра появляется после заданной точности 0,010,0 – если принятая точность до десятых.

  6. если в таблице много граф, то графы подлежащего обозначаются заглавными буквами, а графы сказуемого цифрами.

  7. если таблица основана на заимствованных данных, то под таблицей указывается источник данных, в случае необходимости таблица может сопровождаться примечаниями.

Статистические графики – условные изображения числовых величин и их соотношений посредством линий, геометрических фигур, рисунков.

Плюсы графического изображения

  1. наглядно, обозримо, выразительно.

  2. сразу видны пределы изменения показателя, сравнительная скорость изменения и колеблемость

Минусы графического изображения

  1. Включают меньшее количество данных чем в таблице.

  2. на графике показываются округленные данные, общая ситуация, но не детали.

Статистические графики:

Диаграммы:

  1. Линейные:

  • Полигон

  • Кумулята

  • Огива

  1. Плоскостные:

  • Радиальные

  • Столбиковые

  • Ленточные

  • Треугольные

  • Фигурные

  1. Объемные

Картограммы:

1. Фоновые

2.Точечные

Картодиаграммы


Статистические показатели.


Статистический показатель – обобщающая характеристика какого-либо свойства совокупности.

Структура статистического показателя (его атрибуты):

Классиф статистических показателей:

По содержанию:

  1. Показатели свойств конкретных объектов

  2. Статистические показатели

  • Средние величины

  • Показатели вариации

  • Показатели связи признаков

  • Показатели структуры и характера распределения

  • Показатели динамики

  • Показатели колебаний

  • Показатели точности и надежности выборочных оценок

  • Показатели точности и надежности прогнозов

По виду:

  1. Абсолютные - суммарное количество единиц либо суммарное свойство объекта. Это сумма первичных признаков, измеряется в шт., кг, м, $, и т.д.

  2. Относительный показатель, – получаемый путем сопоставления абсолютных или относительных показателей в пространстве, во времени или в сравнении показателей разных свойств изучаемого объекта.

Относительный показатель 1го порядка получается путем сопоставления 2х абсолютных показателей. Относительный показатель 2го порядка получается путем сопоставления относительных показателей 1го порядка и т.д.

Относительный показатель 3го порядка и выше встречаются очень редко.

Сущность абсолютных величин.

Абсолютные статистические показатели – показатели, выражающие размеры конкретных общественных явлений (стоимость, вес, объем, площадь и т.д.). Абсолютные величины всегда числа именованные (м2, 10 тыс. руб.). Очень важен вопрос выбора единицы измерения в каждом конкретном случае. Это зависит от свойства признака, сущности его и задачи исследования. Все многообразие единиц в статистике сводят к трем типам:

  1. натуральные;

  2. стоимостные;

  3. трудовые.

Натуральными показателями пользуются для характеристики объема, величины, меры длины, веса и т.д. В некоторых случаях применяют условные натуральные показатели, когда разновидность одной и той же потребительской стоимости принимают за единицу, а другую пересчитывают на эту единицу.

Стоимостные показатели даются для характеристики процессов или явлений в стоимостном выражении.

Трудовые показатели применяют для определения затрат труда на производство конкретной продукции.

Все абсолютные статистические величины подразделяются:

  • индивидуальные – показатели, которые выражают размеры количественных признаков у отдельных единиц изучаемой совокупности (численность работников в фирме). Эти данные получаются в результате статистического и регистрируются в формулах наблюдения, и она используется для итоговых (общих) показателей.

  • итоговые (общие, суммарные) выражают размеры, величину того или иного признака у всех единиц данной совокупности (численность рабочих шах даст общую численность работающих в стране). Такие данные используются для проведения группировки показателей, для сводки и для проведения анализа.

Статистические относительные величины

Абсолютные величины сами по себе не дают достаточной характеристики оценки явления. Поэтому в статистике наряду с абсолютными величинами используются относительные, которые представляют собой показатели, характеризующие количественные соотношения, присущие конкретным экономическим явлениям (удельный вес городского и сельского населения в общей численности). Отличительной особенностью относительных величин является то, что они обычно в отвлеченной форме выражают соотношение либо индивидуальных, либо суммарных абсолютных величин. К относительным величинам в статистике относят некоторые именованные числа (потребление мяса на душу населения). Подобного рода относительные величины показывают, сколько единиц одной совокупности приходится на единицу другой.

При вычислении относительных величин производится сравнение одного или нескольких показателей с базой или основанием (базисной величиной). Специфической чертой является то, что они позволяют отвлечься от конкретных различий абсолютных величин, что дает возможность сравнивать такие явления, абсолютные значения которых не сопоставимы.

Формы и виды относительных величин.

В зависимости оттого, что именно сравнивать, какие соотношения надо получить, используют в статистике несколько видов относительных величин:

  1. относительные величины выполнения планового задания - такие величины, которые выражают соотношения между фактическими показателями и теми, которые планировались (обычно их выражают в процентах). Эти величины характеризуют ход работы и результат работы.

  2. относительные величины структуры. Величина структуры очень важна в статистике и представляет собой соотношение части и целого. При исчислении величины структуры в качестве базы берется общий итог совокупности (общие размеры), а в качестве сравнительных величин берутся значения показателей отдельных групп или отдельных частей (выражается в коэффициентах или процентах). Поэтому в статистике обычно называют отношение части к целому либо долей, либо удельным весом. Относительные величины структуры позволяют выяснять не только структуру, изучаемой совокупности, но и структурные сдвиги, т.е. изменение ее состава, строения, тенденцию, направление, которые произошли за определенный период времени. Для этого, обычно, вычисляют и анализируют показатели структуры за несколько периодов.

  3. Относительные величины координации – соотношение частей целого между собой. При расчете одну из составных частей этой совокупности принимают за базу сравнения и находят отношение к ней всех других частей. С их помощью определяют, сколько единиц данной части совокупности приходятся на другую ее часть, принятую за базу сравнения.

  4. Относительные величины динамики выражают степень изменения явления во времени, т.е. они измеряют скорость (темп) развития. Относительная величина динамики есть отношение значения (уровня) показателя за данный период (месяц, квартал, год) к его уровню за предыдущее время. Поэтому для исчисления относительных величин динамики необходимо располагать данными за несколько периодов.

В статистике различают два вида расчета относительных величин динамики:

  • цепные расчеты, – когда относительные величины динамики определяют с переменной базой сравнения. Показывают, как быстро изменяются величина показателя за год или иную единицу времени.

  • базисные расчеты, – когда относительные величины динамики рассчитывают с постоянной базой сравнения. Характеризуют изменение показателя за ряд последовательно возрастающих периодов.

Часто, при исчислении относительных величин динамики возникает вопрос о выборе базы сравнения. Обычно, при характеристике динамики за большие промежутки времени в качестве базы принимают период, имеющий большое значение в экономике. Так же часто используют в качестве базы первый член ряда динамики.

  1. Относительные величины сравнения представляют собой отношение одноименных величин, относящихся к разным объектам (численность населения в г. Твери и в г. Торжке). Особенно широко применяют его в международных сопоставлениях, причем для исчисления применяют как абсолютные значения, так и относительные.

  2. Относительные величины интенсивности – показатели, характеризующие распространение, развитие какого-либо явления в определенной среде. Они измеряют степень или интенсивность распространения показателей или явлений. Чаще всего они представляют собой соотношение разноименных, но связанных явлений, где в числители – величина явления, а в знаменатели – объем, той среды, в которой происходит развитие того явления. Чаще всего их рассчитывают на 100 или 1000 единиц.

Средние величины. (показатели). Сущность статистических средних.

Наиболее распространенной формой статистических показателей является средняя величина.

Важнейшее свойство средней заключается в том, что она отражает то общее, что присуще каждой единице изучаемой совокупности, хотя значение признака отдельных единиц совокупности могут колебаться в ту или иную сторону.

Типичность средней непосредственно связана с однородностью изучаемой совокупности. В случае не однородной совокупности необходимо провести разбивку ее на качественно однородные группы и рассчитать среднюю по каждой по каждой из однородных групп.

Определить среднюю можно через исходное соотношение средней (ИСС) ее логическую формулу.




От того в каком виде представлены данные для расчета средней, зависит каким именно будет ИСС.

виды средних величин

  1. Средняя арифметическая

  2. Средне гармоническая

  3. Средне квадратическая, кубическая

  4. Средне геометрическое

Правило мажерантности средних.

Способы расчета статистических средних

Другие виды средних

Вид сред

Простая средняя

Взвешенная средняя

гарм

геом

Квадратичная


Простая и взвешенная средняя.

Из приведенных выше формул, средней арифметической и средней гармонической следует, что величина средней зависит не только от размера усредняемого признака x, но и в большей мере от значений f и W. При этом, очевидно, что, при вполне определенных конкретных значениях x(x1, x2,…,xn) величина средней будет тем больше, чем больше удельный вес в сумме значений имеют численности тех вариантов, которые обладают наибольшими размерами.

На величину средней не будут оказывать влияния значения f и W в том случае, если они будут одинаковыми для всех вариантов усредненного признака x: f1=f2=…=fn и W1=W2=…=Wn.

Если такое условие имеется, то для исчисления средней арифметической применяют формулу:

  1. , где n число вариантов усредняемого признака x.

  2. Для средней гармонической:





Средние, рассчитанные по формулам №1, 2, 3, т.е. содержащие f и W, называются взвешенными, а значения f и W называются весами средней, а процесс расчета, в свою очередь, называется взвешиванием. Если же расчет производится по формулам №4, 5, средние, определенные таким образом называются простыми или невзвешенными.

При расчете средних чаще всего применяют формулы средних взвешенных. Формулы № 4, 5 употребляются в тех случаях, когда варианты усредняемого признака не повторяются или не произведена их группировка. Такое разграничение на простые средние и взвешенные очень важно в экономике, потом что применение только простых вместо средне взвешенных может привести к ошибочным результатам и выводам.

Вариация в рядах распределения.

Проведение вариационного анализа начинается с построения вариационного ряда – упорядоченное распределение единиц совокупности по возрастающим или по убывающим признакам и подсчет соответствующих частот.

Ряды распределения:

  1. Ранжированный вариационный ряд – перечень отдельных ед. совокупности в порядке возрастания убывания ранжированного признака

  2. Дискретный вариационный ряд – таблица, состоящая из 2х строк – полимерных значений варьирующего признака и кол-во единиц с данным значением признака.

  3. Интервальный вариационный ряд строится в случаях:

  • признак принимает дискретные значения, но кол-во их слишком велико

  • признака принимает любые значения в определенном диапазоне


При построении интервального вариационного ряда необходимо выбрать оптимальное количество групп, самый распространенный способ по формуле Стерджесса

k=1+3.32lgn

k – количество интервалов

n – объем совокупности

При расчетах почти всегда получают дробные значения, округления производить до целого числа.

Длина интервала – l

Виды интервалов

  1. Нижняя граница последующего интервала повторяет верхнюю границу последующего интервала

  2. С индивидуальными границами в интервал входят верхняя и нижняя границы

  3. Открытый интервал, интервал с одной границей

В случае открытого интервала l принимается равной длине смежного с ним интервала, либо исходя из логических соображений.

При расчетах по интервальному вариационному ряду за xi принимается середина интервала.

Интервалы могут быть как равные так и нет. При изучении вариационного ряда существенную помощь оказывает графическое изображение.

Дискретный вариационный ряд изображается с помощью полигона.(fi от xi)

Интервальный вариационный ряд изображается с помощью гистограммы. .(fi от xi)

Накопленная частота – каждая последующая частота прибавляется к следующей.

Кумулята – распределение ‘меньше чем’

Огива – распределение ‘больше чем’

Мода и медиана.

В некоторых случаях в статистике для определения типичных характеристик, особенно для отдельных размеров признака, применяют моду и медиану.

Мода

Мода обычно применяется тогда, когда сложно исчислить средние размеры признака. В статистике модой называется величина признака чаще всего встречающегося в данной совокупности.

, где

- мода,

- начальная граница модального признака, т.е. признака, обладающего наибольшей численностью в данном распределении,

- величина модального интервала,

- частота интервала, предшествующего модальному,

- частота интервала, следующего за модальным.

Медиана

Медианой называется вариант, делящий численность упорядоченного вариационного ряда, т.е. построенного в порядке возрастания или убывания варьирующего признака на две равные части. Для четного ряда следует принимать среднее значение из двух вариантов, находящихся в середине ряда.

Показатели вариации

Размах вариации

Все признаки, отмеченные в статистике, подвержены колебанию. Самым простым показателем такой колеблимости любого признака является размах вариации. В общем случае он представляет собой разность между наибольшим и наименьшим значением признака.

Размах вариации зависит от двух значений признака, что в экономике означает неточность определения.

Среднее линейное отклонение

Измерителем среднего линейного отклонения считается величина отклонений от средней, взятых без учета алгебраического знака. Исчисленная таким образом величина среднего отклонения называется средним линейным отклонением.

В практике следует иметь в виду, что величины линейного отклонения различных вариационных рядов можно сравнить лишь в том случае, если эти ряды характеризуются примерно одинаковыми средними. А т.к. это бывает в практике не всегда, то для сопоставления колеблимости исчисляются относительные показатели колеблимости, т.е. относят линейные отклонения к арифметической средней.

Используя ранее принятые обозначения варьирующего признака, веса и средней, можно порядок расчета среднего линейного отклонения записать в виде формулы

.

Но в случае, если варианты в распределении признака не повторяются, то среднее линейное отклонение рассчитывается по следующей формуле:

Дисперсия и среднее квадратичное отклонение

Средний показатель из отклонений от средней может быть так же получен, если сначала все отклонения возвести в квадрат, затем найти из квадратов среднеарифметическую, а затем из полученной величины извлечь квадратный корень. Полученный таким образом показатель называется среднем арифметическим отклонением (). Среднее арифметическое из квадрата отклонений называется дисперсией ().

- средний квадрат отклонения, взвешенный;

- средний квадрат отклонения, невзвешенный.

Коэффициент вариации.

Очень часто для сравнения степени колеблимости, особенно различных вариационных рядов, исчисляют коэффициент вариации. Для того чтобы его вычислить, надо среднее квадратичное отклонение отнести к средне арифметическому, и этот результат выражается в процентах.




- остаточная дисперсия по j группе

- сумма частот по j группе

n – общая сумма частот

Ряды динамики. Классификация и понятие динамических рядов.

Для лучшей характеристики экономической ситуации и процессов используют ряды динамики. Они дают более четкое, наглядное представление о явлении и совокупности.

Рядом динамики называется ряд статистических данных, характеризующий изменение явления во времени. Каждое значение в этом ряду называется уровнем, Цифры, образующие ряд динамики, могут характеризовать величину изучаемого явления двояко:

  1. за определенный период времени;

  2. состояние на определенный момент времени.

В связи с этим в статистике различают:

  1. интервальные ряды динамики – такие ряды, которые состоят из количественных значений показателя за какой-то период времени;

  2. моментальные ряды – такой ряд, который характеризует размеры какого-либо показателя по состоянию на определенную дату.

Уровни ряда динамики могут выражать как абсолютные размеры явления, так и относительные. Различают

  1. ряды динамики абсолютных величин – такие ряды, члены которых выражают абсолютные значения изучаемого показателя за ряд последовательных моментов;

  2. ряды динамики относительных величин – такие ряды, члены которых выражают относительные размеры изучаемого явления за ряд интервалов.

Виды дисперсии:

1. Общая дисперсия - измеряет вариацию признака во всей совокупности под влиянием все факторов обусловивших данную вариацию

Пример: потребление йогурта: при выборке 100 человек

2. Межгрупповая дисперсия - характеризует вариацию признака под влиянием признака фактора положенного в основу группировки.

- средняя по группе

  1. Внутригрупповая дисперсия (остаточная) характеризует вариацию признака под влиянием факторов, не включенных в группировку

xiji значение признака в j группе

- среднее значение признака в j группе

fij – частота i-го признака в j группе

Существует правило которое связывает 3 вида дисперсии, оно называется правило сложения дисперсии.



Есть еще в расчетах ряды динамики средних величин – такой ряд, члены которого выражают средний уровень изучаемого показателя за какие-то промежутки времени.

Для характеристики ряда динамических показателей применяют следующее:

  1. уровень,

  2. абсолютный прирост,

  3. темп роста,

  4. темп прироста,

  5. среднее значение показателей.

Уровень ряда динамики

Исходным, при построении любого динамического ряда, является уровень динамики, но для общей характеристики за весь охватываемый период рассчитывают средний уровень ряда, т.е. среднюю величину из всех совокупностей ряда. В рядах динамики средняя из уровней называется хронологической средней. Для интервального ряда с равным интервалом времени находится, как простая средняя арифметическая, т.е. сумма всех уровней отнесенное на число уровней.