Рефетека.ру / Эк.-мат. моделирование

Курсовая работа: Основы практического использования прикладного регрессионного анализа

СОДЕРЖАНИЕ


Содержание

Введение

Теоретическая часть

Теоретические основы прикладного регрессионного анализа

Проверка предпосылок и предположений регрессионного анализа

Проверка случайности

Проверка стационарности

Обнаружение выбросов в выборке

Мультиколлинеарность переменных

Рекомендации по устранению мультиколлинеарности

Доверительные интервалы для уравнения регрессии

Определение доверительного интервала для истинного значения уравнения регрессии

Свойства доверительных интервалов

Адекватность модели

Практическая часть

Вывод

Список литературы


ВВЕДЕНИЕ


Общее назначение множественной регрессии (этот термин был впервые использован в работе Пирсона - Pearson, 1908) состоит в анализе связи между несколькими независимыми переменными (называемыми также регрессорами или предикторами) и зависимой переменной. Например, агент по продаже недвижимости мог бы вносить в каждый элемент реестра размер дома (в квадратных футах), число спален, средний доход населения в этом районе в соответствии с данными переписи и субъективную оценку привлекательности дома. Как только эта информация собрана для различных домов, было бы интересно посмотреть, связаны ли и каким образом эти характеристики дома с ценой, по которой он был продан. Например, могло бы оказаться, что число спальных комнат является лучшим предсказывающим фактором (предиктором) для цены продажи дома в некотором специфическом районе, чем "привлекательность" дома (субъективная оценка). Могли бы также обнаружиться и "выбросы", т.е. дома, которые могли бы быть проданы дороже, учитывая их расположение и характеристики.

Специалисты по кадрам обычно используют процедуры множественной регрессии для определения вознаграждения адекватного выполненной работе.

Как только эта так называемая линия регрессии определена, аналитик оказывается в состоянии построить график ожидаемой (предсказанной) оплаты труда и реальных обязательств компании по выплате жалования. Таким образом, аналитик может определить, какие позиции недооценены (лежат ниже линии регрессии), какие оплачиваются слишком высоко (лежат выше линии регрессии), а какие оплачены адекватно.


1. ТЕОРЕТИЧЕСКАЯ ЧАСТЬ


1.1 Теоретические основы прикладного регрессионного анализа


Регрессионный анализ применяется для построения математических зависимостей объектов, явлений по результатам экспериментальных данных, полученных на основе проведения активного или пассивного экспериментов.

Предполагается, что математическая зависимость относится к определенному классу функций с несколькими неизвестными параметрами. В общем виде эти функции представим в виде:


Основы практического использования прикладного регрессионного анализа,


где Основы практического использования прикладного регрессионного анализа - вектор зависимой (выходной) переменной размерностью Основы практического использования прикладного регрессионного анализа;

Основы практического использования прикладного регрессионного анализа - матрица независимых (входных) переменных размерностью Основы практического использования прикладного регрессионного анализа;

Основы практического использования прикладного регрессионного анализа - вектор неизвестных параметров размерностью Основы практического использования прикладного регрессионного анализа;

Основы практического использования прикладного регрессионного анализа - вектор возмущений размерностью Основы практического использования прикладного регрессионного анализа;

Основы практического использования прикладного регрессионного анализа - количество независимых переменных;

Основы практического использования прикладного регрессионного анализа - количество экспериментальных данных;

Основы практического использования прикладного регрессионного анализа - класс функциональных зависимостей.


В зависимостиОсновы практического использования прикладного регрессионного анализа Основы практического использования прикладного регрессионного анализа Основы практического использования прикладного регрессионного анализа – является случайной величиной, значения Основы практического использования прикладного регрессионного анализа могут рассматриваться либо как фиксированные, либо как случайные. При этом ожидаемое значение одной случайной переменной соотносится с наблюдаемыми значениями других случайных переменных в виде условной регрессии.

Рассмотрим зависимость между случайными величинами Основы практического использования прикладного регрессионного анализа и Основы практического использования прикладного регрессионного анализа, представленную в виде некоторой таблицы наблюдений значений Основы практического использования прикладного регрессионного анализа и Основы практического использования прикладного регрессионного анализа.

Перенося табличные значения Основы практического использования прикладного регрессионного анализа и Основы практического использования прикладного регрессионного анализа на плоскость Основы практического использования прикладного регрессионного анализа, получаем поле корреляции, приведенное на рисунке 3.1


Основы практического использования прикладного регрессионного анализа

Рисунок 1.1 — Экспериментальное уравнение регрессии


Разобьем диапазон изменения Основы практического использования прикладного регрессионного анализа на Основы практического использования прикладного регрессионного анализа-равных интервалах Основы практического использования прикладного регрессионного анализа. Все точки, попавшие в интервал Основы практического использования прикладного регрессионного анализа, отнесем к середине интервала Основы практического использования прикладного регрессионного анализа, в результате получаем трансформированное поле корреляции.

Определим частичные средние арифметические Основы практического использования прикладного регрессионного анализа для каждого значения Основы практического использования прикладного регрессионного анализа:


Основы практического использования прикладного регрессионного анализа,


где Основы практического использования прикладного регрессионного анализа - число точек, оказавшихся в интервалеОсновы практического использования прикладного регрессионного анализа, причем Основы практического использования прикладного регрессионного анализа, где

Основы практического использования прикладного регрессионного анализа - общее число наблюдений.


Соединим последовательно точки с координатами Основы практического использования прикладного регрессионного анализа и Основы практического использования прикладного регрессионного анализа отрезками прямых. Полученная ломаная линия называется эмпирической линией регрессии Основы практического использования прикладного регрессионного анализа по Основы практического использования прикладного регрессионного анализа; она показывает, как в среднем меняется Основы практического использования прикладного регрессионного анализа с изменением Основы практического использования прикладного регрессионного анализа. Предельное положение эмпирической линии регрессии, к которому она стремится при неограниченном увеличении числа наблюдений и одновременном уменьшении Основы практического использования прикладного регрессионного анализа, называется предельной теоретической линией регрессии. Ее нахождение и составляет основную задачу регрессионного анализа. Отметим, что по линии регрессии невозможно точно определить значение Основы практического использования прикладного регрессионного анализа по Основы практического использования прикладного регрессионного анализа в одном опыте. Однако зависимость Основы практического использования прикладного регрессионного анализа позволяет определить в среднем значение Основы практического использования прикладного регрессионного анализа при многократном повторении опыта при фиксированном значении Основы практического использования прикладного регрессионного анализа. В регрессионном анализе рассматривается связь между одной переменной, называемой зависимой, и несколькими другими, называемыми независимыми. Эта связь представляется в виде математической модели, т.е. в виде функции регрессии. Если функция линейна относительно параметров, но не обязательно линейна относительно независимых переменных, то говорят о линейной модели. В противном случае нелинейная. Статистическими проблемами обработки в регрессионном анализе являются:

а) Получение наилучших точечных и интервальных оценок неизвестных параметров регрессионного анализа;

б) Проверка гипотез относительно этих параметров;

в) Проверка адекватности;

г) Проверка множества предполагаемых предположений.

Исследуемый объект представлен на рисунке 3.2


Основы практического использования прикладного регрессионного анализа

Рисунок 1.2 — Вид исследуемого объекта


Для корректного использования регрессионного анализа существует следующие предпосылки и следующие допущения на свойства регрессионной ошибки Основы практического использования прикладного регрессионного анализа, Основы практического использования прикладного регрессионного анализа; Основы практического использования прикладного регрессионного анализа - значение зависимой переменной, полученное подстановкой Основы практического использования прикладного регрессионного анализа в уравнение Основы практического использования прикладного регрессионного анализа, Основы практического использования прикладного регрессионного анализа, Основы практического использования прикладного регрессионного анализа; Основы практического использования прикладного регрессионного анализа - количество экспериментальных данных, Основы практического использования прикладного регрессионного анализа - количество независимых переменных:

Приведем свойства и предпосылки регрессионной ошибки:

а) Свойства регрессионной ошибки:

1) В каждом опыте Основы практического использования прикладного регрессионного анализа имеет нормальный закон распределения;


Основы практического использования прикладного регрессионного анализа, Основы практического использования прикладного регрессионного анализа.


2) В каждом опыте математическое ожидание Основы практического использования прикладного регрессионного анализа равно нулю;


Основы практического использования прикладного регрессионного анализа, Основы практического использования прикладного регрессионного анализа.


3) Во всех опытах дисперсия Основы практического использования прикладного регрессионного анализа постоянна и одинакова;


Основы практического использования прикладного регрессионного анализа, Основы практического использования прикладного регрессионного анализа.


4) Во всех опытах ошибки Основы практического использования прикладного регрессионного анализа независимы.


Основы практического использования прикладного регрессионного анализа, Основы практического использования прикладного регрессионного анализа.


б) предпосылки регрессионной ошибки:

1). Матрица наблюдений Основы практического использования прикладного регрессионного анализа имеет полный ранг;


Основы практического использования прикладного регрессионного анализа.

2). Структура модели адекватна истинной зависимости;

3). Значения случайной ошибки Основы практического использования прикладного регрессионного анализа не зависят от значений регрессоров Основы практического использования прикладного регрессионного анализа;

4). Ошибки регистрации Основы практического использования прикладного регрессионного анализа регрессоров пренебрежимо малы по сравнению со случайной ошибкой Основы практического использования прикладного регрессионного анализа.


1.2 Проверка предпосылок и предположений регрессионного анализа


Регрессионный анализ является одним из самых распространённых методов обработки результатов наблюдений. Он служит основой для целого ряда разделов математической статистики и методов обработки данных. Регрессионный анализ базируется на ряде предположений и предпосылок, нарушение которых приводит к некорректному его использованию и ошибочной интерпретации результатов.

Если F-критерий и показал, что подгонка модели в целом является удовлетворительной; целесообразно провести анализ остатков для проверки соблюдений предпосылок и предположений.

В этом случае исследуется набор отклонений между экспериментальными и предсказанными значениями зависимой переменной,


Основы практического использования прикладного регрессионного анализа.


Проверка предпосылок и предположений регрессионного анализа включает в себя следующие задачи:

1) оценка случайности зависимой переменной;

2) оценка стационарности и эргодичности зависимых и независимых переменных;

3) Проверка гипотезы о нормальности распределения ошибок E;

4) Обнаружение выбросов;

5) Проверка постоянства математического ожидания и дисперсии ошибок;

6) Оценка коррелированности остатков;

7) Обнаружение мультиколлинеарности.


1.2.1 Проверка случайности

Построение моделей методом множественного регрессионного анализа требуется выполнение предположения случайности Основы практического использования прикладного регрессионного анализа и Основы практического использования прикладного регрессионного анализав нормальной линейной модели вида


Основы практического использования прикладного регрессионного анализа


где Основы практического использования прикладного регрессионного анализа – вектор наблюдений зависимой переменной;

Основы практического использования прикладного регрессионного анализа – матрица наблюдений независимых переменных;

Основы практического использования прикладного регрессионного анализа – вектор неизвестных коэффициентов;

Основы практического использования прикладного регрессионного анализа – вектор ошибок.


Задача проверки случайности может быть разбита на 2 подзадачи:

1) проверка случайности собственной величины Y;

2) проверка случайности выборки, то есть допущения об отсутствии существенного смещения средней величины во времени.

Первая подзадача решается с использованием критерия серий. Для этой цели последовательность наблюдений величины Y представляют последовательностью нулей и единиц, где единицей обозначают значение, превышающее среднее или медиану, и нулем, собственно, значение меньшее медианы. После обозначения вектор наблюдений преобразуется в последовательность серий Основы практического использования прикладного регрессионного анализа где Основы практического использования прикладного регрессионного анализа – количество подряд идущих элементов одного вида, i – номер серии.

Доказано, что при Основы практического использования прикладного регрессионного анализа распределение величины r близится к нормальному с характеристиками

Основы практического использования прикладного регрессионного анализа Основы практического использования прикладного регрессионного анализа


Тогда с вероятностью 0,954 теоретическое число серий r будет находиться в пределах


Основы практического использования прикладного регрессионного анализа


Если фактическое значение Основы практического использования прикладного регрессионного анализа попадает в указанные пределы, то Y можно считать случайной величиной.

Серией называется последовательность наблюдаемых значений, перед которыми и после которых расположены наблюдаемые значения другой категории. Если последовательность N наблюдений представляет собой независимые наблюденные значения одной и той же случайной величины, т.е. вероятность знаков (+) и (–) не меняется от одного наблюдения к другому, то выборочное распределение числа серий в последовательности есть случайная величина r со средним значением


Основы практического использования прикладного регрессионного анализа (3.1)


и дисперсией


Основы практического использования прикладного регрессионного анализа (3.2)


Здесь Основы практического использования прикладного регрессионного анализа – число наблюдений со знаком (+), Основы практического использования прикладного регрессионного анализа – число наблюдений со знаком (–).

Когда Основы практического использования прикладного регрессионного анализа соотношения (3.1) и (3.2) принимают вид

Основы практического использования прикладного регрессионного анализа


Для решения второй подзадачи используется метод последовательных разностей. Элементы исследуемой выборки Основы практического использования прикладного регрессионного анализа располагаются в порядке получения наблюдений и для них вычисляются выборочные среднее и дисперсия


Основы практического использования прикладного регрессионного анализа


Определяют разности Основы практического использования прикладного регрессионного анализа между соседними наблюдениями


Основы практического использования прикладного регрессионного анализа


и математическое ожидание квадрата разности


Основы практического использования прикладного регрессионного анализа


где Основы практического использования прикладного регрессионного анализа – оценка генеральной дисперсии.

Фактическая величина критерия случайности выборки


Основы практического использования прикладного регрессионного анализа.


Теоретическое значение критерия


Основы практического использования прикладного регрессионного анализа

При Основы практического использования прикладного регрессионного анализа для конкретного N гипотеза случайности отвергается.


1.2.2 Проверка стационарности

Анализ случайных процессов может производиться осреднением величин по ансамблю выборочных реализаций или по одной реализации.

Поскольку на практике проверка по ансамблю достаточно длинных выборочных реализаций неосуществима, то для использования тестов проверки стационарности процесса принимается ряд допущений:

а) проверка заключается в исследовании поведения не ансамбля, а его отдельных реализаций; это означает, что доказательство внутренней стационарности отдельных реализаций может служить доказательством стационарности случайного процесса, которому принадлежит эта реализация;

б) для большинства процессов достаточно проверить слабую стационарность, поскольку, во-первых, для эффективного использования спектрального и корреляционного анализа случайных процессов достаточно выполнения условия слабой стационарности, а во-вторых, для реальных процессов обычно слабая стационарность влечет за собой и строгую; если процесс определяется нормальной плотностью, то это доказательство осуществляется автоматически, поскольку все моменты высших порядков полностью определяются средним и автокорреляционной функцией;

в) на практике часто стационарность автокорреляционной функции обеспечивается стационарностью дисперсии.

Учитывая эти допущения, проверку стационарности осуществляют исследованием одной реализации Основы практического использования прикладного регрессионного анализа.

Для этого реализация делится на N равных интервалов таких, что её участки в пределах каждого интервала можно считать независимыми. Для всех интервалов вычисляются средние значения и средние значения квадратов, из которых составляются две последовательности и затем их проверяют на наличие тренда.

Основы практического использования прикладного регрессионного анализа


Если известно выборочное распределение, то для проверки можно использовать существующие непараметрические критерии (t-критерий Стьюдента, Основы практического использования прикладного регрессионного анализа-критерий Пирсона, F-критерий Фишера), однако в обычной ситуации проверка стационарности осуществляется при высокой неопределенности относительно исследуемого процесса. В этом случае целесообразно использовать непараметрические критерии, например, критерий серий и критерий тренда

Критерий тренда основан на подсчете числа случаев, когда Основы практического использования прикладного регрессионного анализа для Основы практического использования прикладного регрессионного анализа в последовательности N наблюденных значений величины x.

Такое неравенство называется инверсией, а их число k определяется из соотношения


Основы практического использования прикладного регрессионного анализа,


где


Основы практического использования прикладного регрессионного анализа

Основы практического использования прикладного регрессионного анализа


Число инверсий есть также случайная величина со средним


Основы практического использования прикладного регрессионного анализа


и дисперсией

Основы практического использования прикладного регрессионного анализа.


Область принятия гипотезы ограничена интервалом Основы практического использования прикладного регрессионного анализа.

Критерий тренда обладает большей мощностью при выявлении монотонного тренда, однако при выявлении колебательного тренда его мощность невелика, в этом случае целесообразнее использовать критерий серий.

Критерии проверки гипотезы стационарности обладают рядом особенностей:

1) Нет необходимости знать ширину полосы частот исследуемых процессов;

2) Не требуется точно знать время осреднения, использованное для вычисления средних и квадратов отклонений от средних;

3) Для проверки не обязательно, чтобы исследуемые процессы были полностью случайными. При изучении процессов может возникнуть случай, когда независимость от времени средних и квадратов не является достаточным условием для утверждения о независимости от времени автокорреляционной функции.


1.3 Обнаружение выбросов в выборке


Выбросом среди остатков представляет собой остаток, который значительно превосходит по абсолютной величине остальные и отличается от среднего по остаткам на три, четыре или даже более стандартных отклонений.

Для обнаружения выбросов необходимо построить график остатков, определённых по формуле

Основы практического использования прикладного регрессионного анализа


В случае если Основы практического использования прикладного регрессионного анализа, данная точка будет характеризовать выброс. Следует отметить, что иногда выброс может дать полезную информацию. В этом случае необходимо более тщательное исследование выбросов, а не механическое их отбрасывание. Выбросы должны быть исключены сразу если выясняется, что они вызваны такими причинами, как ошибки в регистрации данных, неудовлетворительная настройка аппаратуры и т.д. Если имеется не одно аномальное измерение, то критерий Основы практического использования прикладного регрессионного анализаих не обнаруживает, особенно если анализируется менее 30 измерений.


1.4 Мультиколлинеарность переменных


Одно из основных предположений регрессионного анализа относится к матрице исходных данных: среди независимых переменных не должно быть линейно зависимых. Это требование необходимо для вычисления оценки Основы практического использования прикладного регрессионного анализа методом наименьших квадратов.

Мультиколлинеарность приводит к:

1)снижению точности, дисперсия оценок увеличивается, параметры модели коррелированны, что приводит к трудностям в интерпретации модели;

2)оценки коэффициентов становятся чувствительны к особенностям множества выборочных данных.

Причиной мультиколлинеарности могут служить:

1) наличие автокорреляции в ряду наблюдений;

2) корреляция между переменными;

3) высокий уровень помех.

Под мультиколлинеарностью будем понимать сопряженность независимых переменных, это означает "почти линейную зависимость" векторов Основы практического использования прикладного регрессионного анализа, т.е. существование чисел Основы практического использования прикладного регрессионного анализа таких, что:


Основы практического использования прикладного регрессионного анализа (3.3)


Когда равенство (3.3) имеет место, говорят о строгой мультиколлинеарности.

При наличии мультиколлинеарности оценки МНК становятся положительными, т.е. дисперсия оценок будет весьма большой. При наличии (3.3) матрица Основы практического использования прикладного регрессионного анализа становится плохо обусловленной, в частности Основы практического использования прикладного регрессионного анализа, т.е. Основы практического использования прикладного регрессионного анализа.


1.4.1 Рекомендации по устранению мультиколлинеарности

Наиболее простой способ устранения мультиколлинеарности – исключение одной переменной из пары переменных, коэффициент корреляции между которыми больше 0,8.

Простейшие рекомендации по устранению мультиколлинеарности сводятся к сокращению рассматриваемого множества объясняющих переменных за счет тех из них, которые линейно связаны с уже включенными в модель. Выполнение этих рекомендаций ведет к построению сокращенной модели, которая не всегда соответствует требованию наблюдательности и управляемости. Чтобы избежать нежелательных эффектов мультиколлинеарности, сохранив при этом весь интересующий нас набор объясняющих переменных, предлагается увеличить размеры выборки путем получения дополнительной информации. Ясно, что не любое произвольное увеличение выборки ведет к ослаблению эффектов мультиколлинеарности.

Часто для устранения мультиколлинеарности используют приемы, основанные на предварительном преобразовании исходных данных путем получения отклонений от тренда. Однако, регрессионная модель, полученная благодаря таким преобразованиям, слабо поддается интерпретации. Иногда используют априорную информацию об имеющихся между параметрами связях в виде ограничений при вычислении оцениваемых параметров регрессии. За исключением простейших случаев, реализация этих подходов достигается существенным усложнением вычислительной процедуры нахождения оценок. Широкое распространение получили методы устранения мультиколлинеарности, основанные на замене исходного множества объясняющих переменных главными компонентами с последующим отбрасыванием тех из них, которые незначительны в уравнении регрессии. Близким к рассмотренному можно считать методы, основанные не на компонентном, а на факторном анализе, причем аналогия прослеживается как по достоинствам, так и по недостаткам.

В тех случаях, когда перечень объясняющих переменных регрессионной модели слишком велик, рекомендуется разделить их на группы высоко коррелированных и в каждой группе построить обобщающие факторы в виде главной компоненты, которые далее используются как новые переменные строящейся модели.


1.4.2 Доверительные интервалы для уравнения регрессии

Для проведения углубленного анализа уравнения регрессии прежде всего необходимо убедиться в том, что вектор ошибок Е распределен по нормальному закону. Для построения доверительных интервалов коэффициентов модели, предсказанных значений уравнения регрессии, среднего значения используются стандартные статистические распределения, требующие нормальности распределений.

1.4.3 Определение доверительного интервала для истинного значение уравнения регрессии

Определение доверительного интервала сводится к отысканию интервала, в котором с вероятностью Основы практического использования прикладного регрессионного анализа содержится истинное значение Основы практического использования прикладного регрессионного анализа, соответствующее некоторому опыту Основы практического использования прикладного регрессионного анализа из матрицы наблюдений Основы практического использования прикладного регрессионного анализа.

Другими словами, имеется интервал, в котором с заданной вероятностью находится линия регрессии.

Подставляя Основы практического использования прикладного регрессионного анализа в эмпирическое уравнение регрессии получим оценки Основы практического использования прикладного регрессионного анализа для каждого наблюдения Основы практического использования прикладного регрессионного анализа вида:


Основы практического использования прикладного регрессионного анализа


Различие между Основы практического использования прикладного регрессионного анализа и Основы практического использования прикладного регрессионного анализа объясняется действием различных ошибок.

Отметим, что Основы практического использования прикладного регрессионного анализа имеет случайный характер, оценки Основы практического использования прикладного регрессионного анализа и Основы практического использования прикладного регрессионного анализа распределены нормально с параметрами


Основы практического использования прикладного регрессионного анализа,

Основы практического использования прикладного регрессионного анализа.


Можно утверждать, что Основы практического использования прикладного регрессионного анализа. Другими словами y является состоятельной оценкой истинного значения Основы практического использования прикладного регрессионного анализа, соответствующего опыту Основы практического использования прикладного регрессионного анализа, т.е. при неограниченном числе опытов эмпирическая линия регрессии совпадает с действительной зависимостью


Основы практического использования прикладного регрессионного анализа

Составляя дробь Стьюдента, получаем:


Основы практического использования прикладного регрессионного анализа.


Задавшись уровнем значимости Основы практического использования прикладного регрессионного анализа и найдя табличное значение Основы практического использования прикладного регрессионного анализа можно построить достоверный интервал для Основы практического использования прикладного регрессионного анализа в виде

Основы практического использования прикладного регрессионного анализа.


1.4.4 Свойства доверительных интервалов

а) Доверительный интервал симметричен относительно выборочной оценки Основы практического использования прикладного регрессионного анализа;

б) Ширина доверительного интервала зависит от Основы практического использования прикладного регрессионного анализа и Основы практического использования прикладного регрессионного анализа;

в) Ширина доверительного интервала минимальна, если Основы практического использования прикладного регрессионного анализа, (ортогональны);

г) Ширина доверительного интервала равна бесконечности, если:

вектор-столбцы Основы практического использования прикладного регрессионного анализа и Основы практического использования прикладного регрессионного анализа в матрице наблюдений Основы практического использования прикладного регрессионного анализа коллинеарные, т.е.если:


Основы практического использования прикладного регрессионного анализа


д) В общем случае в регрессионных уравнениях доверительный интервал для отдельно взятого регрессионного коэффициента Основы практического использования прикладного регрессионного анализа определяется выражением


Основы практического использования прикладного регрессионного анализа

1.5 Адекватность модели


Существует соотношение, которое можно использовать для оценки адекватности модели, сравнивая Основы практического использования прикладного регрессионного анализаи Основы практического использования прикладного регрессионного анализа. Расчетное Основы практического использования прикладного регрессионного анализа определяется по формуле

Основы практического использования прикладного регрессионного анализа (3.4)


Табличное значение Основы практического использования прикладного регрессионного анализа берется с таблиц с определенным числом степенем свобода и для притятого уровня значимості Основы практического использования прикладного регрессионного анализа.Если расчетное значение Основы практического использования прикладного регрессионного анализа більше Основы практического использования прикладного регрессионного анализа, то это значит, что дисперсия MSR статистически меньше дисперсии MSD относительно Основы практического использования прикладного регрессионного анализа,в этом случае полученное уравнение регрессии можно считать дееспособным.

2. ПРАКТИЧЕСКАЯ ЧАСТЬ


Поставлена следующая задача: построить зависимость количества выигранных голов от характеристик сыгранных игр на основе модели множественной регрессии.

На основе имеющейся выборки сделаем следующие оценки:


Основы практического использования прикладного регрессионного анализа


параметры модели βi (для данной модели существенными являются переменные WIN и DP):

Основы практического использования прикладного регрессионного анализа


оценки: множественный коэффициент корреляции R, R2 ,F, p, и Std Error of estimate:

Основы практического использования прикладного регрессионного анализа

график для вычисленных значений и исходных:


Основы практического использования прикладного регрессионного анализа


К такому ряду можно применить модель линейной регрессии, так как он стационарный;

построение регрессии:


Основы практического использования прикладного регрессионного анализа

По графику видно, что в целом модель адекватна: практически все значения легли на линию регрессии;

гистограммы исходных и вычисленных значений имеют нормальное распределение:


Основы практического использования прикладного регрессионного анализа


Основы практического использования прикладного регрессионного анализа


ВЫВОД


Как показано выше, множественная регрессии применима в случае стационарности ряда и позволяет производить мониторинг результатов, основываясь на предикторах.

В общественных и естественных науках процедуры множественной регрессии чрезвычайно широко используются в исследованиях. В общем, множественная регрессия позволяет исследователю задать вопрос (и, вероятно, получить ответ) о том, "что является лучшим предиктором для...". Например, исследователь в области образования мог бы пожелать узнать, какие факторы являются лучшими предикторами успешной учебы в средней школе. А психолога мог быть заинтересовать вопрос, какие индивидуальные качества позволяют лучше предсказать степень социальной адаптации индивида. Социологи, вероятно, хотели бы найти те социальные индикаторы, которые лучше других предсказывают результат адаптации новой иммигрантской группы и степень ее слияния с обществом. Термин "множественная" указывает на наличие нескольких предикторов или регрессоров, которые используются в модели, следовательно такая модель увеличивает спектр анализа регрессоров, что позволит построить более точный прогноз.


ПЕРЕЧЕНЬ ССЫЛОК


Демиденко Е.З. Линейная и нелинейная регрессии. – М.: Финансы и статистика, 2010. – 302 с

Дрейпер Н., Смит Г. Прикладной регрессионный анализ. – М.: Статистика, 2009. - 437 с.

Афифи А., Эйзен С. Статистический анализ. Подход с использованием ЭВМ. Пер. с англ. – М.: Мир, 1982. – 488 с.

Тюрин Ю.Н.., Макаров А.А. Статистический анализ данных на компьютере.- М.:Инфра, 1997.-528с.

www.statsoft.ru

Ясницкий Л.Н. Введение в искусственный интеллект. М. Academia, 2005г.,176 стр.: ил.

Похожие работы:

  1. • Регрессионный анализ
  2. • Использование корреляционно-регрессионного анализа для ...
  3. • Многомерный регрессионный анализ
  4. • Линейный множественный регрессионный анализ
  5. •  ... управленческих задач в АПК: регрессионный анализ
  6. • Корреляционно-регрессионный анализ
  7. • Анализ предприятия с использованием регрессивного ...
  8. • Однофакторный регрессионный анализ при помощи ...
  9. • Корреляционно-регрессионный анализ в системе маркетинговых ...
  10. • Экономико-статистическое моделирование ...
  11. • Применение регрессионного анализа при оценке ...
  12. • Определение аналитической зависимости сопротивления ...
  13. • Регрессионный анализ в моделировании систем. Исследование ...
  14. • Экономическое планирование методами математической статистики
  15. • Парный регрессионный анализ
  16. • Корреляционно-регрессионный анализ
  17. • Статистический анализ производства зерна, сахарной ...
  18. • Анализ рентабельности с помощью программы Олимп
  19. • Прогнозирование развития технологий
Рефетека ру refoteka@gmail.com