Рефетека.ру / Эк.-мат. моделирование

Курсовая работа: Процесс анализа информационных массивов

СОДЕРЖАНИЕ


Введение

1. Априорный анализ исходных статистических данных

1.1 Обобщение исходных данных

1.2 Оценка однородности совокупности

1.3 Оценка характера распределения совокупности исходных данных

2. Моделирование связи социально-экономических явлений

2.1 Отбор факторных признаков

2.2 Построение модели связи и оценка ее существенности

2.3 Интерпретация модели связи (уравнения регрессии)

Заключение

Список использованных источников


ВВЕДЕНИЕ


В современном обществе важную роль в механизме управления экономикой выполняет статистика. Независимо от уровня и стадии экономического развития, характера политической системы, статистика на протяжении сотен лет своего существования всегда выступала как необходимый и эффективный инструмент государственного управления и одновременно как наука, исследующая количественную сторону массовых явлений. Выполняя самые разнообразные функции сбора, систематизации и анализа сведений, характеризующих экономическое и социальное развитие общества, она всегда играла роль главного поставщика факторов для управленческих, научно-исследовательских и прикладных практических нужд различного рода структур, организаций и населения.

В настоящее время под термином «статистика» чаще всего понимают следующее.

Статистика - одна из общественных наук, имеющая целью сбор, упорядочивание, анализ и сопоставление числового представления фактов, относящихся к самым разнообразным массовым явлениям. Это вместе с тем учение о системе показателей, т.е. количественных характеристик, дающих всестороннее представление об общественных явлениях, о национальном хозяйстве в целом и отдельных его отраслях.

Статистика - это эффективное орудие, инструмент познания, используемый в естественных и общественных науках для установления тех специфических закономерностей, которые действуют в конкретных массовых явлениях, изучаемых данной наукой.

Статистика - это также одна из форм практической деятельности людей, цель которой - сбор, обработка и анализ массовых данных о тех или иных явлениях.

Одной из основных задач статистики является оценка наиболее существенных причинно-следственных связей между различными процессами и явлениями, а также воздействия одних факторов на другие. Она осуществляется через моделирование взаимосвязей с помощью корреляционно–регрессионного анализа, который является одним из основных в широком спектре статистических методов первичной обработки, анализа и прогнозирования экономических данных.

Таким образом, целью данной курсовой работы является проведение комплексного анализа данных о предприятиях автомобильного транспорта Тюменской области и выявление причинно-следственных связей с помощью статистических методов.

Задачами курсовой работы являются:

проведение априорного анализа данных по предприятиям;

моделирование связи между показателями предприятий.

Объекты исследования – предприятия автомобильного транспорта Тюменской области.

В работе приведены теоретические данные о методике анализа статистических данных и выявления причинно-следственных связей, на основе которой был произведен анализ данных по предприятиям автомобильного транспорта по Тюменской области.


АПРИОРНЫЙ анализ исходных статистических данных


Анализ статистических данных начинается с априорного анализа. Априорным (от лат. a priori – из предшествующего) называется анализ, предшествующий непосредственному математико-статистическому анализу и проверяющий предпосылки его реализации.

Этапы априорного анализа включают:

обобщение исходных данных: построение вариационных рядов по каждому из исследуемых показателей. Графическое изображение построенных рядов распределения в виде гистограммы, полигона, кумуляты;

оценку однородности совокупности (на основе метода группировок, показателей вариации, анализа аномальных наблюдений на основе λ- и q-статистик);

оценку характера распределения совокупности исходных данных с помощью средней, моды, медианы, показателей вариации.


Обобщение исходных данных


В качестве объектов исследования были выбраны предприятия автомобильного транспорта Тюменской области (ОАО «ТюменьАвтоТранс», ЗАО "Автотранспортное предприятие", ООО "Автоуниверсал-Трак", ОАО "СПАТО", ООО "РБА-Тюмень", ООО «ГлавАвтоТранс», ООО «Тюмень ТрансКонтиненталь», ООО «АванТрансСервис», АК «Ространсавто», ТД «Русойл», ООО «Континент», ОАО «Тюменские моторостроители», ЗАО "Сибавтоспецтехника", ООО «Урал-Тюмень», ООО «Спецтехника-Тюмень», ООО «Тракт-Запчасть-Сервис», ООО «СпецАвто», ООО «Сибинтком», ОАО «Тюменнефтеспецтранс»). Основными видами деятельности предприятий являются производство, поставки и ремонт автобусов, автомобилей, авто и спецтехники.

Предприятия исследуются для выяснения и формирования практических выводов об эффективности их деятельности и предложений, направленных на улучшение деятельности предприятий, на ликвидацию имеющихся недостатков.

В качестве исходных данных были выбраны показатели доходов и расходов по обычным видам деятельности предприятий.

Задача данного исследования – сравнить показатели предприятий, для выяснения наличия и степени зависимости между ними.

Далее представлена таблица с исходными данными по 19 предприятиям (табл. 1.1).


Таблица 1.1

Показатели доходов и расходов по обычным видам деятельности предприятий, тыс. руб.

Номер предприятия Выручка от продажи товаров, продукции, работ, услуг Себестоимость проданных товаров, продукции, работ, услуг Коммерческие и управленческие расходы
1 21903 8109 13697
2 76581 46692 28889
3 116565 71378 43834
4 139317 83304 54508
5 35475 24126 11042
6 78417 50729 26413
7 149687 102338 44716
8 287056 218436 65048
9 82279 66579 20556
10 158161 108977 37419
11 225792 157775 56192
12 297921 222019 73114
13 33702 14860 19372
14 139722 90233 42770
15 221771 155565 60932
16 374199 284117 81486
17 176430 163552 11529
18 244843 223176 22200
19 395322 360237 32614
Итого 3255143 2452202 746331

Вначале необходимо построить ряды распределения предприятий по каждому из признаков.

Один из вариантов стандартной процедуры группировки по количественным признакам для определения числа групп является формула Г. Стерджесса (формула (1.1)):


Процесс анализа информационных массивов (1.1)


где N – число групп.

Из расчета по формуле (1.1) n = 5. Следовательно, предприятия делятся на 5 групп с интервалом группировки (шагом) h = 74684, вычисляемым по формуле (1.2):


Процесс анализа информационных массивов(1.2)


где xmax и xmin – максимальное и минимальное значения признака в совокупности.

Но с учетом округления h = 100000, и предприятия разбиваются на 4 группы. Ряд распределения предприятий по величине выручки от продажи товаров, продукции, работ, услуг представлен в таблице 1.2.


Таблица 1.2

Распределение предприятий по величине выручки

Группы предприятий по выручке от продажи товаров, продукции, работ, услуг, тыс. руб. Число предприятий Удельный вес, % к итогу
21903 – 121903 7 36,8
121903 – 221903 6 31,6
221903 – 321903 4 21,1
321903 – 421903 2 10,5
Итого 19 100,0

Из таблицы 1.2 видно, что большинство предприятий имеет выручку не более 221903 тыс. руб.

Для наглядного представления рядов распределения используют их графическое изображение в виде гистограммы, полигона и кумуляты.

Гистограмма – столбиковая диаграмма, для построения которой на оси абсцисс откладывают отрезки, равные величине интервалов вариационного ряда.

Полигон – это вид диаграммы в которой при помощи отрезков соединяются точки середин координат сторон прямоугольника.

Кумулята – это линейное построения диаграммы по накопленным частотам, которые определяются последовательным суммированием частот. Накопление частоты показывают сколько единиц совокупности имеют значения признака не больше чем рассматриваемое значение.

Ряд распределения по величине выручки от продаж представлен графически на рис.1.1, рис.1.2 и рис.1.3.


Процесс анализа информационных массивов

Рис.1.1 Гистограмма распределения предприятий по величине выручки

Гистограмма является изображением интервального ряда распределения. Для изображения дискретного ряда строится полигон.


Процесс анализа информационных массивов

Рис.1.2 Полигон распределения предприятий по величине выручки


По рис.1.1 и рис.1.2 видно, что распределение имеет ветвь, уходящую вправо. Нет ярко выраженной вершины.

Кумулята строится также для дискретного ряда. Она показывает, сколько единиц совокупности имеют значения признака не больше чем рассматриваемое значение.


Процесс анализа информационных массивовРис.1.3 Кумулята распределения предприятий по величине выручки

Затем строятся группировки предприятий по остальным признакам, с использованием формул (1.1) и (1.2), и изображаются графически.

Предприятия распределяются по величине себестоимости проданных товаров, продукции, работ, услуг на пять групп. Интервал группировки:

h = (360237 - 8109) / 5 = 70426 ≈ 100000.

Учитывая, что h округлили, предприятия следует разбить на 4 группы (табл. 1.3).


Таблица 1.3

Распределение предприятий по величине себестоимости проданных товаров, продукции, работ, услуг

Группы предприятий по себестоимости проданных товаров, продукции, работ, услуг, тыс. руб. Число предприятий Удельный вес, % к итогу
8109 – 108109 10 52,6
108109 – 208109 4 21,1
208109 – 308109 4 21,1
308109 – 408109 1 5,2
Итого 19 100,0

Себестоимости проданных товаров, продукции, работ, услуг у большинства предприятий не превышает 108109 тыс. руб. Предприятие с себестоимостью в пределах от 308109 до 408109 тыс. руб. выбивается из общего ряда, и является аномальным для этого распределения.


Процесс анализа информационных массивов

Рис.1.4 Гистограмма распределения предприятий по себестоимости проданных товаров, продукции, работ, услуг


Процесс анализа информационных массивов

Рис.1.5 Полигон распределения предприятий по себестоимости проданных товаров, продукции, работ, услуг


Графическое изображение ряда себестоимости (рис.1.4, рис.1.5.) показывает, что ряд имеет плоскую вершину и ветвь, уходящую вправо, как и ряд распределения выручки.


Процесс анализа информационных массивов

Рис.1.6 Кумулята распределения предприятий по себестоимости проданных товаров, продукции, работ, услуг


Предприятия распределяются по величине коммерческих и управленческих расходов на пять групп (табл. 1.4). Интервал группировки:

h = (81486 – 11042) / 5 = 14089 ≈ 15000.


Таблица 1.4

Распределение предприятий по величине коммерческих и управленческих расходов

Группы предприятий по величине коммерческих и управленческих расходов, тыс. руб. Число предприятий Удельный вес, % к итогу
11042 – 26042 6 31,6
26042 – 41042 4 21,1
41042 – 56042 3 15,8
56042 – 71042 4 21,1
71042 – 86042 2 10,5
Итого 19 100,0

Самая большая группа предприятий имеет меньшие расходы, в отличие от других групп.

В графическом изображении это выглядит следующим образом.


Процесс анализа информационных массивов

Рис.1.7 Гистограмма распределения предприятий по величине коммерческих и управленческих расходов

Процесс анализа информационных массивов

Рис.1.8 Полигон распределения предприятий по величине коммерческих и управленческих расходов

По графикам видно, что распределение предприятий по расходам имеет схожие характеристики с распределением предприятий по себестоимости, отличается только количеством групп.


Процесс анализа информационных массивов

Рис.1.9 Кумулята распределения предприятий по величине коммерческих и управленческих расходов


После сбора, группировки и поверхностного анализа данных следует провести более углубленный анализ.


Оценка однородности совокупности

априорный анализ статистический совокупность распределение

Для оценки однородности совокупности используют различные методы, такие как: группировка, расчет показателей вариации (дисперсия, коэффициент вариации), анализ аномальных наблюдений на основе l- и q-статистик.

На основе группировки и ее графического изображения (рис.1.1 – рис.1.9) можно предположить, что ряды распределения по трем признакам не являются однородными. Но вместе с тем, следует иметь виду, что при незначительном объеме выборки (n < 50) слишком углубленный анализ гистограммы может привести к неверным выводам, поскольку слабо выраженные «горбики и ямы» частот могут быть обусловлены не основными факторами, определяющими распределение единиц по группам, а просто случайными отклонениями вариантов от Процесс анализа информационных массивов.

После анализа аномальных наблюдений на основе l- статистики, выявляется аномальность значений, соответствующих 13 предприятию, а также аномальность показателей выручки и расходов 9 предприятия.

В данной работе последующий анализ будет проводится с учетом аномальности, вызванной объективно существующими причинами.

Причины появления в совокупности аномальных наблюдений могут быть:

внешние, возникающие в результате технических ошибок;

внутренние, объективно существующие.

Для дальнейшего анализа формы распределения используют показатели вариации. Показатели вариации делятся на абсолютные и относительные. К абсолютным относятся размах колебаний, среднее линейное отклонение, дисперсия, среднее квадратическое отклонение и квартильное отклонение. Коэффициент осцилляции, относительное линейное отклонение, коэффициент вариации и относительный показатель квартильной вариации – относительные показатели.

В данной курсовой работе для характеристики однородности совокупности рассчитывались такие показатели, как дисперсия, среднее квадратическое отклонение и коэффициент вариации.

Дисперсия – это средний квадрат отклонений индивидуальных значений признака от средней величины. Дисперсия не только является основной мерой колеблемости признака, но также используется для построения показателей тесноты корреляционной связи, при оценке результатов выборочных наблюдений и т.д.

Для сгруппированных данных она вычисляется по формуле (1.3):


Процесс анализа информационных массивов ,

(1.3)


где xi – i-ый вариант осредняемого признака;

Процесс анализа информационных массивов– выборочная средняя величина или средняя агрегатная;

ni – частота, то есть число, показывающее сколько раз встречаются варианты из данного интервала, или вес i-го варианта;

n – число объектов совокупности.

Для оценки влияния различных факторов, обуславливающих вариацию признака, рассчитывается дисперсия по каждому из показателей. Для этого строятся расчетные таблицы:


Таблица 1.5

Расчетная таблица для вычисления дисперсии по величине выручки от продажи товаров, продукции, работ, услуг

Группы предприятий по выручке от продажи, тыс. руб. Число предприятий ni Середина интервала xi xini

xi - Процесс анализа информационных массивов

(xi - Процесс анализа информационных массивов)2ni

21903 – 121903 7 71903 503321 -105263 29462326870
121903 – 221903 6 171903 1031418 -5263,2 126204986,1
221903 – 321903 4 271903 1087612 94736,8 9600277008
321903 – 421903 2 371903 743806 194736,8 26844875346
Итого 19
3366157
66033684211

Средняя выборочная вычисляется по формуле (1.4):


Процесс анализа информационных массивов= Процесс анализа информационных массивов (1.4)


Отсюда Процесс анализа информационных массивов = 177166,1.

По таблице 1.5 видно, что значения признака отклоняются от средней выборочной в основном в отрицательную сторону.

С помощью формулы (1.3) находится дисперсия, σ2 = 3422825485.


Таблица 1.6

Расчетная таблица для вычисления дисперсии по величине себестоимости проданных товаров, продукции, работ, услуг

Группы предприятий по себестоимости проданных товаров, продукции, работ, услуг, тыс. руб. Число предприятий ni Середина интервала xi xini

xi - Процесс анализа информационных массивов

(xi - Процесс анализа информационных массивов)2ni

8109 – 108109 10 58109 581090 -78947,4 16526869806
108109 – 208109 4 158109 632436 21052,6 1472853186
208109 – 308109 4 258109 1032436 121052,6 12354958449
308109 – 408109 1 358109 358109 221052,6 9471265928
Итого 19
2604071
39825947368

Процесс анализа информационных массивов= 137056,4

σ2 = 2096102493

Значения себестоимости в основном не превышают среднюю выборочную.


Таблица 1.7

Расчетная таблица для вычисления дисперсии по величине коммерческих и управленческих расходов

Группы предприятий по величине коммерческих и управленческих расходов, тыс. руб. Число предприятий ni Середина интервала xi xini

xi - Процесс анализа информационных массивов

(xi - Процесс анализа информационных массивов)2ni

11042 – 26042 6 18542 111252 -22894,7 13437138350
26042 – 41042 4 33542 134168 -7894,7 134307479,2
41042 – 56042 4 48542 194168 7105,26 81939058,2
56042 – 71042 3 63542 190626 22105,26 865927977,8
71042 – 86042 2 78542 157084 37105,26 1053601108
Итого 19
787298
3479489474

Процесс анализа информационных массивов= 41436,7

σ2 = 183131024,9

По таблице видно, что значения признака отклоняются от средней выборочной также в основном в отрицательную сторону.

Наиболее часто применяемый показатель относительной колеблемости – коэффициент вариации (формула (1.5)):


Процесс анализа информационных массивов (1.5)


Для того чтобы рассчитать коэффициент вариации для группы предприятий по величине выручки от продажи товаров, продукции, работ, услуг нужно рассчитать среднее квадратическое отклонение σ по формуле (1.6):


Процесс анализа информационных массивов(1.6)


Среднее квадратическое отклонение σ = 58504,92, то есть величина выручки в среднем отклоняется на 58504,92 тыс. руб.

Исходя из этого, коэффициент вариации равен:

Vв = (58504, 92 / 177166,1) * 100% = 33 %

Величина Vв оценивает интенсивность колебаний вариантов относительно их средней величины. Принята следующая оценочная шкала колеблемости признака:

– 0% < Vв ≤40% – колеблемость незначительная;

– 40% < Vв ≤ 60% – колеблемость средняя (умеренная);

– Vв > 60% – колеблемость значительная.

Для нормальных и близких к нормальному распределений показатель Vв служит индикатором однородности совокупности: принято считать, что при выполнимости неравенства

Vв ≤ 33%,

совокупность является количественно однородной по данному признаку. Так как коэффициент вариации не превышает 33%, то можно считать совокупность предприятий по выручке достаточно однородной.

Коэффициент вариации для остальных признаков равен:

Для группы предприятий по себестоимости проданных товаров, продукции, работ, услуг Vв = 33,4%. Колеблемость незначительная.

Для группы предприятий по величине коммерческих и управленческих расходов Vв = 32,7%. Колеблемость незначительная. Совокупность можно считать однородной.

Так как коэффициент вариации группировки предприятий по себестоимости незначительно превышает 33%, то можно сказать, что совокупность достаточно однородна, а превышение можно объяснить небольшим объемом выборки, аномальностью некоторых значений и влиянием внешних и внутренних факторов.


Оценка характера распределения совокупности исходных данных


Выявление общего характера распределения предполагает оценку не только степени его однородности, но и его симметричности, остро- или плосковершинности.

Простейшей мерой ассиметричности распределения является отклонение между характеристиками центра распределения. Поскольку в симметричном распределении Процесс анализа информационных массивов = Me = Mo, то чем заметнее ассиметрия, тем больше отклонение (Процесс анализа информационных массивов - Mo). В связи с этим простейший показатель ассиметрии, коэффициент К. Пирсона, рассчитывается так, формула (1.7):

Процесс анализа информационных массивов ,(1.7)

где Процесс анализа информационных массивов – средняя арифметическая ряда распределения;

Mo – мода (наиболее часто встречающееся значение признака у единиц данной совокупности).

При правосторонней асимметрии Asn > 0, при левосторонней Asn <0. Если Asn = 0, вариационный ряд симметричен.

Показатель ассиметрии также можно рассчитать с помощью центрального момента третьего порядка (формула (1.8)):


Процесс анализа информационных массивов ,(1.8)


где μ3 – центральный момент третьего порядка.

Центральный момент Процесс анализа информационных массивов рассчитывается по формуле (1.9):


Процесс анализа информационных массивов.(1.9)


Центральный момент первого порядка всегда равен нулю. Центральный момент второго порядка представляет собой дисперсию. Центральный момент третьего порядка равен нулю в симметричном распределении. Центральный момент четвертого порядка применяется при вычислении показателя эксцесса.

Если рассчитать показатель ассиметрии ряда распределения выручки через центральный момент третьего порядка, то получится такой результат:

As = (10005540,2*103) / (19*995847754,2) = 0,53;

As = 0,53 > 0, это значит, что в ряду распределения преобладают варианты, которые больше, чем средняя, то есть ряд положительно ассиметричен.

Для оценки существенности показателя ассиметрии находится средняя квадратическая ошибка, которая зависит от объема наблюдений, по формуле (1.10):


σAs = Процесс анализа информационных массивов= 0,495.

(1.10)


Так как отношение Процесс анализа информационных массивов = 1,2 < 3, ассиметрия несущественна, ее наличие может быть объяснено влиянием различных случайных обстоятельств.

Для оценки крутизны распределения вычисляется показатель эксцесса по формуле (1.11):


Процесс анализа информационных массивов ,

(1.11)


Показатель эксцесса ряда распределения выручки равен:

Ek = (4057850999*103) / (19*99446750716) = 2,248 – 3 = -0,85.

При симметричном распределении Ek = 0. Если Ek > 0, распределение является островершинным; если Ek < 0 – плосковершинным.

В частности, большая отрицательная величина Ek означает преобладание у признака крайних значений, причем одновременно и более низких, и более высоких. При этом в центральной части распределения может образоваться «впадина», превращающая распределение в двухвершинное (U-образной формы), что является индикатором неоднородности совокупности.

Исходя из этого, можно говорить о плосковершинности ряда распределения выручки.

Оценка существенности показателя эксцесса равна 0,85, это значит, что эксцесс несущественен.

Для ряда распределения предприятий по себестоимости проданных товаров, продукции, работ:

As = (13013850,4*103) / (19*858154723,4) = 0,8.

Для ряда распределения предприятий по величине коммерческих и управленческих расходов:

As = (62040,2*103) / (19*8343127,4) = 0,39.

Что означает, что ряды распределения этих признаков имеют правостороннюю скошенность.

Эксцесс для групп предприятий по себестоимости:

Ek = (3635894445*103) / (19*81549404931) – 3 = -0,65.

Эксцесс для групп предприятий по расходам:

Ek = (6181726,6*103) / (19*169214861,8) – 3 = -1,08.

Так как эксцессы этих рядов распределений меньше нуля, то ряды распределения являются плосковершинными (рис 1.5, рис.1.8).

Исходя из показателей ассиметрии и эксцесса, можно предположить, что распределение значений признаков не является нормальным.

Априорный анализ исходных данных показал, что совокупности предприятий по признакам являются достаточно однородными, но отклоняются от нормального распределения. Это может быть объяснено различными внешними факторами, как расположение предприятий, клиентура, конкуренты, экономическое и политическое устройство и др.

Моделирование связи социально-экономических явлений


После априорного анализа исходных статистических данных следует моделирование связи социально-экономических явлений.

Моделирование предполагает:

отбор факторных признаков

построение модели связи и оценка ее существенности

интерпретацию модели связи (уравнения регрессии)


Отбор факторных признаков


Признаки, обуславливающие изменение других, связанных с ними признаков, называют факторными, или просто факторами. Признаки, изменяющиеся под воздействием факторных признаков, называют результативными.

Для выявления наличия связи между признаками, ее характера и направления в статистике используются методы приведения параллельных данных, аналитических группировок, графический, корреляционный и регрессионный.

Метод приведения параллельных данных основан на сопоставлении двух или нескольких рядов статистических величин.

В таблице 2.1 предприятия ранжированы по величине себестоимости проданных товаров, продукции, работ, услуг.


Таблица 2.1

Показатели доходов и расходов по обычным видам деятельности предприятий, ранжированные по величине себестоимости, тыс. руб.

Номер предприятия Себестоимость проданных товаров, продукции, работ, услуг Выручка от продажи товаров, продукции, работ, услуг Коммерческие и управленческие расходы
1 2 3 4
1 8109 21903 13697
13 14860 33702 19372
5 24126 35475 11042
2 46692 76581 28889
6 50729 78417 26413
9 66579 82279 20556
3 71378 116565 43834
4 83304 139317 54508
14 90233 139722 42770
7 102338 149687 44716
10 108977 158161 37419
15 155565 221771 60932
11 157775 225792 56192
17 163552 176430 11529
8 218436 287056 65048
12 222019 297921 73114
18 223176 244843 22200
16 284117 374199 81486
19 360237 395322 32614
Итого 2452202 3255143 746331

Отсюда видно, что с увеличением себестоимости увеличивается и выручка от продаж, хотя в отдельных случаях такая зависимость не наблюдается. Это говорит о возможном наличии прямой корреляционной связи. Связь между величиной коммерческих и управленческих расходов и другими признаками не наблюдается.

Статистическую связь между двумя признаками можно изобразить графически. За x обозначается факторный признак, в данном случае себестоимость. За у обозначается результативный признак – выручка.


Процесс анализа информационных массивовРис. 2.1 Зависимость величины выручки от себестоимости


Линия, соединенная точками, называется «ломаная регрессии». Число точек ломаной регрессии соответствует числу предприятий.

Точнее определить наличие и тесноту связи можно с помощью различных показателей. Зная показатели, можно выявить те факторы, которые в данных конкретных условиях являются решающими и главным образом воздействуют на формирование величины результативного признака.

К показателям тесноты связи относится линейный коэффициент корреляции.

В статистической теории разработаны и на практике применяются различные модификации формул расчета данного коэффициента:

Процесс анализа информационных массивов ,(2.1)


где x – факторный признак;

y – результативный признак.

Выполнив несложные преобразования можно получить следующую формулу (2.2):


Процесс анализа информационных массивов.(2.2)


При пользовании этой формулой отпадает необходимость вычислять отклонения индивидуальных значений признаков от средней величины, что исключает ошибку в расчетах при округлении средних величин.

Линейный коэффициент корреляции может принимать любые значения в пределах от -1 до +1. Чем ближе коэффициент корреляции по абсолютной величине к 1, тем теснее связь между признаками. Знак при линейном коэффициенте корреляции указывает на направление связи - прямой зависимости соответствует знак плюс, обратной – знак минус.

На основе данных таблицы 1.1(2.1), с помощью формулы (2.2), было определено два коэффициента корреляции.

Во-первых, коэффициент корреляции, показывающий степень тесноты связи между себестоимостью и выручкой от продаж.

Пусть x1 – величина себестоимости проданных товаров, продукции, работ, услуг. Тогда, y – величина выручки от продажи товаров, продукции, работ, услуг.

Отсюда r = 0,98, связь является прямой и очень сильной. Что значит, с увеличением себестоимости увеличивается и выручка.

Во-вторых, рассчитан коэффициент корреляции, показывающий степень тесноты связи между расходами и выручкой от продаж. В данной ситуации x2 – величина коммерческих и управленческих расходов, а y – величина выручки от продажи товаров, продукции, работ, услуг.

Коэффициент корреляции равен 0,66, что говорит о прямой связи между признаками.

Тесноту связи между факторными признаками можно также рассчитать по формуле (2.1), заменяя результативный признак на факторный:


Процесс анализа информационных массивов.

(2.3)


Процесс анализа информационных массивов= 0,51.

Полученная величина свидетельствует о наличии прямой зависимости между значениями себестоимости и расходов.

Для наглядности была построена матрица парных коэффициентов корреляции:

y – величина выручки от продажи товаров, продукции, работ, услуг;

x1 – величина себестоимости проданных товаров, продукции, работ, услуг;

x2 – величина коммерческих и управленческих расходов.


Таблица 2.2

Матрица парных коэффициентов корреляции


y x1 x2
y 1,00 0,98 0,66
x1 0,98 1,00 0,51
x2 0,66 0,51 1,00

Матрица парных коэффициентов корреляции показывает, что результативный показатель наиболее тесно связан с показателем x1.

Так как существует линейная связь между результативным и двумя факторными признаками, а также между парой факторных признаков, то имеет смысл рассчитать множественный коэффициент корреляции.

В данной работе множественный коэффициент корреляции был вычислен по формуле (2.4):


Процесс анализа информационных массивов.(2.4)


Процесс анализа информационных массивов= 0,99.

Связь между показателями сильная, факторы x1 и x2 практически полностью обуславливают величину y.

При построении модели связи, или регрессии, может возникнуть проблема мультиколлинеарности (наличие сильной корреляции между независимыми переменными, входящими в уравнение регрессии). Мультиколлинеарность существенно искажает результаты исследования.

Наиболее распространенный метод выявления коллинеарности основан на анализе парных коэффициентов корреляции. Он состоит в том, что две или несколько переменных признаются коллинеарными (мультиколлинеарными), если парные коэффициенты корреляции больше определенной величины. На практике наиболее часто считают, что два аргумента коллинеарны, если парный коэффициент корреляции между ними по абсолютной величине больше 0,8.

В данном примере парный коэффициент корреляции не превышает величины 0,8 (Процесс анализа информационных массивов= 0,51), что говорит об отсутствии явления мультиколлинеарности.

2.2 Построение модели связи и оценка ее существенности


Как было выяснено в предыдущем пункте, зависимость результативного признака от факторных является прямолинейной. Факторные признаки не являются мультиколлинеарными и практически полностью обуславливают результативный признак, следовательно, все признаки необходимо включить в модель. Поэтому связь будет описываться такой моделью связи (2.5):


Процесс анализа информационных массивов,(2.5)


где Процесс анализа информационных массивов и Процесс анализа информационных массивов – коэффициенты регрессии.

Система нормальных уравнений:


Процесс анализа информационных массивов (2.6)


Подставив данные из таблицы 2.1 в эту систему, получается:


Процесс анализа информационных массивов


Отсюда: a0 = -2132,16; a1 = 1,005433; a2 = 1,080124;

Процесс анализа информационных массивов

Расчеты показали, что с увеличением себестоимости проданных товаров, продукции, работ, услуг на 1 тыс. руб. и коммерческих, управленческих расходов на 1 тыс. руб. величина выручки от продажи возрастает соответственно в среднем на 1,0054 и 1,0801 тыс. руб.

Далее необходимо проверить адекватность модели, построенной на основе уравнений регрессии.

Во-первых, нужно проверить значимость каждого коэффициента регрессии. Значимость коэффициента регрессии осуществляется с помощью t-критерия Стьюдента (2.7):


Процесс анализа информационных массивов,

(2.7)


где Процесс анализа информационных массивов-дисперсия коэффициента регрессии.

Параметр модели признается статистически значимым, если


tp > tkp(α; ν=n-k-1),


где α – уровень значимости;

ν – число степеней свободы.

Величина Процесс анализа информационных массивов может быть определена по формуле (2.8):


Процесс анализа информационных массивов,(2.8)


где R – множественный коэффициент корреляции по y;

Ri – множественный коэффициент корреляции по фактору xi с остальными факторами.

В данной работе Ri = Процесс анализа информационных массивов, так как рассматриваются всего два факторных признака.

По формуле (2.8):

Процесс анализа информационных массивов;

Процесс анализа информационных массивов.

Теперь по формуле (2.7) определяются значения t-критерия.

Процесс анализа информационных массивов;

Процесс анализа информационных массивов.

Оба рассчитанных критерия превышают табличное значение, tkp= 2,12 (0,05; ν=16). Параметры модели являются статистически значимыми.

Во-вторых, проверяется адекватность уравнения регрессии с помощью расчета F-критерия Фишера (2.9):


Процесс анализа информационных массивов.(2.9)


Гипотеза о незначимости коэффициента множественной корреляции (Процесс анализа информационных массивов= 0) отвергается, если Процесс анализа информационных массивов.

Процесс анализа информационных массивов;

Процесс анализа информационных массивов.

Гипотеза отклоняется, так как Процесс анализа информационных массивов. С вероятностью Процесс анализа информационных массивовможно сделать заключение о статистической значимости уравнения в целом и показателя тесноты связи Процесс анализа информационных массивов.


2.3 Интерпретация модели связи (уравнения регрессии)


Оценить долю каждого из факторов в изменении уровня результативного показателя можно по параметрам уравнения регрессии. Это может быть сделано путем прямой оценки по величине коэффициентов регрессии, а также по коэффициентам эластичности Процесс анализа информационных массивов, стандартизированным частным коэффициентам регрессии β–коэффициентам и Δ–коэффициентам.

Коэффициенты уравнения множественной регрессии показывают абсолютный размер влияния факторов на уровень результативного показателя и характеризуют степень влияния каждого фактора на анализируемый показатель при фиксированном (среднем) уровне других факторов, входящих в модель. Чем больше величина коэффициента регрессии, тем значительнее влияние данного признака на моделируемый. Как было выяснено в пункте 2.2, увеличение себестоимости проданных товаров, продукции, работ, услуг на 1 тыс. руб. приводит к увеличению выручки в среднем на 1,0054 тыс. руб. А с увеличением коммерческих, управленческих расходов на 1 тыс. руб. величина выручки от продажи возрастает соответственно в среднем на 1,0801 тыс. руб. a1< a2 , влияние x2 чуть более существенно, чем влияние x1 на y.

С целью расширения возможностей экономического анализа используются показатели относительных величин, например, частные коэффициенты эластичности, определяемые по формуле (2.10):


Процесс анализа информационных массивов,(2.10)


где Процесс анализа информационных массивов - среднее значение соответствующего факторного признака;

Процесс анализа информационных массивов - среднее значение результативного признака;

Процесс анализа информационных массивов - коэффициент регрессии при соответствующем факторном признаке.

Коэффициент эластичности показывает, на сколько процентов в среднем изменится значение результативного признака при изменении факторного признака на 1%.

Процесс анализа информационных массивов;

Процесс анализа информационных массивов.

Это означает, что при росте себестоимости проданных товаров, продукции, работ и услуг на 1%, величина выручки от продажи возрастет на 0,7574%. А при росте коммерческих и управленческих расходов на 1 %, выручка увеличится на 0,2476%. По значениям коэффициентов эластичности видно, что первый факторный признак x1 имеет большее влияние на результативный, чем второй факторный признак x2.

β – коэффициенты показывают, на какую часть среднего квадратического отклонения Процесс анализа информационных массивовизменится зависимая переменная y с изменением соответствующего фактора xi на величину среднеквадратического отклонения (Процесс анализа информационных массивов).

Этот коэффициент можно рассчитать по формуле (2.11):


Процесс анализа информационных массивов.(2.11)


Бета-коэффициенты, рассчитанные для данной модели, показывают, что при увеличении на одно среднее квадратическое отклонение величины себестоимости и расходов, величина выручки в среднем увеличивается на 0,8766 (β1=0,8766) и на 0,2076 (β2=0,2076) средних квадратических отклонений соответственно.

С помощью частных коэффициентов эластичности и с помощью бета – коэффициентов можно проранжировать факторы по степени их влияния на зависимую переменную, то есть сопоставить их между собой по величине этого влияния. Но с помощью бета – коэффициентов нельзя непосредственно оценить долю влияния каждого фактора в суммарном влиянии всех факторов. Для этой цели используются дельта – коэффициенты (2.12):


Процесс анализа информационных массивов(2.12)


Расчет дельта – коэффициентов привел к таким результатам:

Процесс анализа информационных массивов= 0,8623;

Процесс анализа информационных массивов= 0,1372.

Наибольшее влияние на выручку от продажи товаров, продукции, работ, услуг оказывает величина себестоимости – 86,23 %, а величина расходов оказывает влияние в размере 13,72%. Следовательно, себестоимость имеет намного более значительное влияние на выручку, нежели расходы.


ЗАКЛЮЧЕНИЕ


Комплексный анализ статистической информации и выявление причинно-следственных связей имеет большое значения для оценки деятельности предприятий, отраслей или экономики городов и стран. Такой анализ помогает выявить наиболее существенные факторы, которые оказывают влияние на деятельность, на основе их построить наиболее эффективную стратегию развития.

В данной курсовой работе был проведен анализ статистических данных по нескольким предприятиям автомобильного транспорта Тюменской области.

Был проведен первоначальный анализ по трем признакам: выручке от продажи товаров, продукции, работ, услуг, себестоимости и коммерческим, управленческим расходам. Были построены группировки по каждому из признаков. Были оценены однородность и характеристики распределений совокупностей. Результаты привели к выводам о том, что совокупности по признакам являются достаточно однородными, а отклонения признаков (островершинность, скошенность вправо) могут быть объяснены малым объемом выборки, возможными ошибками, допущенными в исследовании и различными внутренними и внешними обстоятельствами (структура предприятий, персонал, цели и задачи предприятий, уровень технологий, законодательство, потребители, конкуренты, и др.). Анализ связи между признаками привел к выводам, что связь существенная. Что можно было предположить на основе логики экономического анализа. Построенная модель связи является значимой, то есть довольно хорошо отражает зависимость признаков.

Общий анализ показал, что основную массу составляют мелкие и средние предприятия. Доходы и расходы от основных видов деятельности являются показателями успешности фирм. Выручка предприятий напрямую зависит от себестоимости и расходов. Чем больше себестоимость продукции и расходы, тем выручка значительнее. То есть при увеличении себестоимости и расходов на управление и коммерческих, поток клиентов, или цена продукции будет увеличиваться, что приведет к росту выручки. И если показатель себестоимости увеличится в большей степени, чем показатель коммерческих и управленческих расходов, то величина выручки вырастет значительнее, так как себестоимость имеет большее влияние на выручку. При этом и себестоимость, и расходы практически полностью обуславливают величину выручки.

Таким образом, по результатам данного исследования были выявлены наиболее значительные признаки, влияющие на прибыльность предприятий.

СПИСОК ИСПОЛЬЗОВАННЫХ ИСТОЧНИКОВ


Бакланов Г.И., Адамов В.Е., Устинов В.Е. Статистика промышленности. 4-е изд. перераб. и доп. – М.: Статистика, 1982.

Бакланов В.И. Как статистика изучает эффективность и качество продукции в промышленности. – М.: Статистика, 1978. – 119с.

Герасимович А.И. Математическая статистика: Учеб. пособие. – 2-е изд., перераб. и доп. – Мн.: Выш. шк., 1983. – 279с.

Еремина Н.М., Маршалова В. П. Статистика труда: Учебник. – 4-е изд., перераб. и доп. – М.: Финансы и статистика, 1988. – 248с.

Ефимова М.Р., Петрова Е. В., Румянцев В. Н. Общая теория статистики: Учебник. – М.: ИНФРА - М, 1998. – 416с.

Кремер Н.Ш., Теория вероятностей и математическая статистика: Учебник для вузов. – 2-е изд., перераб. и доп. – М.: ЮНИТИ-ДАНА, 2006. – 573с.

Основы экономической деятельности предприятия: Учебное пособие/ Под ред. Л.Н. Рудневой. – Тюмень: ТюмГНГУ, 1999. – 120с.

Практикум по общей теории статистики: Учеб. пособие / Н.Н. Ряузов, Н.С. Партешко, А.И. Харламов и др.: Под ред. Н. Н. Ряузова. – 2-е изд., перераб. и доп. – М.: Финансы и статистика, 1981. – 278с.

Практикум по теории статистики: Учеб. пособие / Р. А. Шмойлова, В.Г. Минашкин, Н.А. Садовникова.: под ред. Р. А. Шмойловой. – 3-е изд. – М.: Финансы и статистика, 2008. – 416с.

Статистика: Учеб. пособие / Л.П. Харченко, В.Г. Долженкова, В.Г. Ионин и др.: под ред. канд. экон. Наук В.Г. Ионин. – 2-е изд., перераб. и доп. – М.: ИНФРА - М, 2006. – 334с.


Похожие работы:

  1. • Информационные технологии при анализе бизнеса
  2. • Информационные системы
  3. • Формирование маркетинговой информационной системы организации
  4. • Концепция информатизации судов общей юрисдикции и судебного ...
  5. • Блочно-симметричные модели и методы проектирования ...
  6. • Автоматизированные системы защиты информации
  7. • Договор об уступке патента
  8. • Потребительский кредит
  9. • Информационные технологии управления страховой деятельностью
  10. • Чернобыльское эхо на Украине: 20 лет спустя
  11. • Система маркетинговой информации
  12. • Одномерные массивы
  13. • Массивы. Двумерные массивы
  14. • Совершенстование информационных потоков предприятия
  15. • Информационные процессы как ядро информационной теории
  16. • Перестановка строк и столбцов массива случайным ...
  17. • Анализ алгоритмов нечисленной обработки данных
  18. • Обработка массивов данных в среде Turbo Pascal
  19. • Работа с двумерными числовыми массивами
Рефетека ру refoteka@gmail.com