§1.Понятия статистики, статистическая закономерность и совокупность. 2
§2. Признаки единиц статистической совокупности, их классификация. 2
§1. Понятие статистического наблюдения, его подготовка. 4
§2. Виды статистического наблюдения. 5
§3. Ошибки наблюдения 6
§4. Сводка и группировка 6
§5. Виды статистических группировок 6
§6. Статистические таблицы 7
§7. Статистические графики 8
§1. Фактическое и теоретическое распределение 21
§2. Кривая нормального распределения. 21
§3. Проверка гипотезы о нормальном распределении. 21
§4. Критерии согласия: Пирсона, Романовского, Колмогорова. 21
§5. Практическое значение моделирования рядов распределения. 22
§1. Понятие выборочного наблюдения. Причины его применения. 23
§3. Ошибки выборочного наблюдения. 24
§4. Задачи выборочного наблюдения 25
§5. Распространение данных выборочного наблюдения на генеральную
совокупность. 26
§6. Малая выборка. 26
§1. Понятие корреляционной связи и КРА. 27
§2. Условия применения и ограничения КРА. 27
§3. Парная регрессия на основе метода наименьших квадратов. 28
§4. Применение парного линейного уравнения регрессии. 29
§6. Множественная корреляция. 32
Тема 1.: Введение в статистику.
1. понятия статистики, статистическая закономерность и совокупность.
2. признаки единиц статистической совокупности, их классификация.
3. предмет и метод статистики.
§1.Понятия статистики, статистическая закономерность и совокупность.
Слово статистика происходит от латинского “status” в переводе – состояние,
положение вещей.
Термин статистика возник во 2ой половине 18 века. В связи с познанием
государств, изучением их особенности. К этому же времени относится начало
преподавания статистики в университете. В зависимости от отрасли
статистического исследования различают: статистику населения,
промышленности, с/х и т.д. - прикладная статистика.
Общая теория статистики – совокупность методов и приемов по сбору,
обработке, представлению и анализу числовых данных. Термин статистика в
наши дни употребляется в 3х значениях:
1. как синоним слова «данные»
2. отрасль значений объединяющая принципы и методы работы с числовыми данными характеризующими массовые явления (продолжительность жизни мужчин ниже чем женщин)
3. отрасль практической деятельности направленной на обработку и анализ числовых данных.
Статистика позволяет выявить и измерить закономерность развития социально-
экономических процессов и явлений, а также взаимосвязи между ними в
конкретных условиях места и времени.
Закономерность важнейшая категория статистики.
Под закономерностью понимается повторяемость, последовательность и порядок
изменений в явлениях.
Статистическая закономерность – закономерность в которой необходимость
неразрывно связанном в каждом отдельном явлении со случайностью и лишь во
множестве явлений проявляет себя как закон. Понятию статистической
закономерности противостоит понятие динамической закономерности
проявляющейся в каждом явлении. (пример: Sкруга=(r2 чем > r тем >
Sкруга). Объектом статистического исследования является статистическая
совокупность – множество единиц обладающих массовостью, однородностью,
определяемой целостностью и наличием вариации. Каждый отдельно взятый
элемент называется – единицей статистической совокупности (ЕСС)
§2. Признаки единиц статистической совокупности, их классификация.
ЕСС обладают определенными свойствами которые называются признаками.
Статистика изучает явления через их признаки, чем более однородна
совокупность тем больше общих признаков имеют ее единицы и тем меньше
варьируют значения этих признаков.
1. Описательный признак – признак, который может быть выражен только словесно.
2. Количественный признак – признак, который может быть выражен численно.
3. Прямой признак – свойство непосредственно присуще характерному объекту.
4. Косвенный признак – свойства не самого характеризуемого объекта, а объекта связанного с ним либо входящих в него.
5. первичный признак – абсолютная величина, может быть измерен.
6. вторичный признак – результат сопоставления первичных признаков, он измеряется непосредственно.
7. натуральный признак – измеряется в штуках, кг, тоннах, литрах и т.д.
8. трудовой признак – измеряется в человеко-днях, человеко-часах.
9. стоимостной признак - измеряется в рублях, $, €, ?.
10. безразмерный признак – измерение в долях, %
11. альтернативный признак – признак, который принимает только одно значение из нескольких возможных.
12. дискретный признак – принимает только целое значение, без промежуточного.
13. непрерывный признак – признак, принимающий любые значения в определенном диапазоне.
14. факторный признак – признак, под действием которого изменяется другой признак.
15. результативный признак – признак, который изменяется под признаком другого
16. моментный признак – признак, измеренный на определенный момент времени.
17. интервальный признак – признак за определенный интервал времени.
Один и тот же признак может быть классифицирован одновременно по разным
классификациям.
§3. Предмет и метод статистики.
Предметом статистического исследования являются статистические совокупности
– множество одно-качественных варьирующих предметов.
Специфика предмета статистики обуславливает специфику метода, они включают
в себя:
1. сбор данных (статистическое наблюдение, публикация)
2. обобщение данных (сводка, группировка)
3. представление данных (таблицы и графики)
4. анализ и интерпретация числовых данных (расчет средних, вариационных анализ, КРА, ряды динамики, индексы)
тема 2: Организация статистического наблюдения.
Сводка и группировка данных.
§1. Понятие статистического наблюдения, его подготовка.
§2. Виды статистического наблюдения.
§3 Ошибки наблюдения.
§4 Сводка и группировка
§5 Виды статистических группировок.
§6 Статистические таблицы.
§7 Статистические графики.
§1. Понятие статистического наблюдения, его подготовка.
Любое статистическое исследование начинается со сбора данных.
Источники информации:
1. различные публикации (газеты, журналы, и т.д.)
2. главный источник опубликованной статистической информации – издания органов государственной статистики («РФ в 2001 году» издательство
ГОСКОМСТАТ).
3. проведение статистического наблюдения, т.е. научно организованного сбора данных.
Статистическое наблюдение – массовое, плановое , научно организованное
наблюдение за явлением социальной и экономической жизни, которая
заключается в регистрации признаков у каждой единицы изучаемой
совокупности.
Процесс проведения наблюдения:
1. Подготовка к наблюдению
2. Проведение массового сбора данных
3. Подготовка данных к обработке
4. Разработка предложений по совершенствованию статистического наблюдения.
Подготовка наблюдения:
1. Определение цели и объекта наблюдения
2. Определение состава признаков подлежащих регистрации
3. Разработка документов для сбора данных
4. Выбор отчетной единицы и единицы относительно которой будет проводится наблюдение.
5. Необходимо определить методы и средства получения данных.
Необходимо решить организационные проблемы:
1. необходимо определить состав служб проводящих исследование
2. проинструктировать персонал
3. составить календарный план работы
4. провести тиражирование документов для сбора данных
Объектом наблюдения являются социально-экономические явления и процессы.
Необходимо четко выделить признаки для регистрации.
Программа наблюдения – перечень признаков подлежащих регистрации признаков
в процессе наблюдения.
Требования к программе наблюдения:
1. Программа должна содержать существенные признаки, непосредственно характеризующие изучаемое явление, не следует включать в программу признаки, имеющие второстепенные явления или признаки, значения которых будут заведомо недостоверны или будут вообще отсутствовать.
2. Вопросы программы наблюдения должны быть точными и не двусмысленными, а также легкими для понимания во избежании трудностей при получении ответов.
3. Следует определить последовательность вопросов.
4. В программу наблюдения следует включать вопросы непосредственного характера для проведения и уточнения собираемых данных.
5. для обеспечения единообразия получаемых сведений программа оформляется в виде документа – называемый статистическим формуляром.
Статистический формуляр - это документ единого образца содержащий программу и результаты наблюдений.
Различают индивидуальный формуляр (ответы на вопросы по одной единице наблюдения) и списанный (сведения по нескольким единицам статистической совокупности).
Формуляр и инструкция по его заполнению являются инструментарием статистического наблюдения.
Выбор времени наблюдения заключается в решении 2х вопросов: установлении критической даты либо интервала, определением периода наблюдения.
Критическая дата – конкретный день года, час дня по состоянию на который должны быть зарегистрированы признаки по каждой единице изучаемой совокупности.
Период наблюдения – время в течении которого происходит заполнение статистических формуляров т.е. время необходимое для сбора данных.
Следует учитывать, что отдаление периода наблюдения от критической даты или интервала может привести к снижению достоверности получаемых сведений.
§2. Виды статистического наблюдения.
В отечественной статистике используются три формы статистических наблюдений.
1. статистическая отчетность предприятий, организаций, учреждений.
2. специально организованное статистическое наблюдение (перепись и т.д.)
3. регистр – форма непрерывного статистического наблюдения за долговременными процессами
Статистическое наблюдение классифицируется :
По времени наблюдения:
. текущее наблюдение – производится непрерывная регистрация признаков
(загс, преступление, и т.д.).
. периодическое наблюдение – производится через определенные интервалы времени (уровень жизни в городе Челябинске, стоимость потребительской корзины, перепись населения).
. Единовременный – наблюдение, производимое один раз под конкретную цель.
По охвату единиц совокупности:
. Сплошное наблюдение – должна быть получена информация обо всех ЕСС
. Не сплошное наблюдение: o Способ основного массива – обследованию подвергаются самые существенные единицы изучаемой совокупности (изучить предприятие машиностроения Челябинской области). o Выборочное наблюдение – случайный отбор ЕСС подлежащих наблюдению. o Монографическое наблюдение – когда наблюдению подвергается одна
ЕСС, часто используются для составления программы массового наблюдения.
По способу сбора данных:
. Непосредственное наблюдение – сами регистраторы путем непосредственного замера, взвешивания устанавливают факт подлежащей регистрации (ребенок в возрасте до 1 года в поликлинике).
. Документальное наблюдение – используются различные документы
(составление декларации)
Опрос – необходимые сведения получают со слов респондента.
. Экспедиционный опрос – осуществляется специально подготовленными работниками которые получают необходимую информацию на основе опроса соответствующих лиц и сами фиксируют ответы в формуляре.
Экспедиционный опрос может быть прямым (лицом к лицу) и опосредованным
(опрос по телефону)
. Корреспондентский опрос – сведения сообщает штат добровольных корреспондентов, данный способ требует малых финансовых затрат, но не дает точного значения проводимого наблюдения.
. Саморегистрация – формуляры заполняются самими респондентами, а регистраторы лишь раздают им бланки опросных листов и объясняют заполнение их.
§3. Ошибки наблюдения
Основное требование, применяемое к статистическому наблюдению - это точность.
Точность – степень соответствия какого-либо показателя признака определенным по материалам статистического наблюдения действительной величине.
Расхождение между расчетным и действительным значением называется ошибкой наблюдения в зависимости от причин возникновения различают: ошибки регистрации и ошибки репрезентативности. Ошибки регистрации делятся на случайные и систематические.
Случайные ошибки – результат действий случайных факторов (перепутаны строки, столбцы)
Систематические ошибки – всегда имеют тенденцию либо к завышению либо к занижению показателя. (возраст)
Ошибки репрезентативности – характер для не сплошного наблюдения и возникают в результате неточного воспроизведения выборной всей исходной совокупности.
После получения статистических формуляров необходимо:
1. провести проверку полноты собранных данных.
2. провести арифметический контроль, основанный на связи различных признаков между собой.
3. провести логический контроль основанный на знании логических связей между признаками.
§4. Сводка и группировка
На основе собранных данных нельзя произвести расчет и сделать выводы, для начала их нужно обобщить и свести в единую таблицу. Для этих целей служат сводка и группировка.
Сводка – комплекс последовательных операций по обобщению конкретных единичных фактов, образующих совокупность и выявление типичных черт и закономерностей присущих изучаемому явлению в целом.
Простая водка – подсчет общих итогов по совокупности.
Сложная сводка – комплекс операций по группировке единичных наблюдений, подсчет итогов по каждой группе и по всему объекту в целом и представлении результатов в виде статистических таблиц.
По форме обработки материала сводка бывает децентрализованная , централизованная – такая сводка проводится при единовременном статистическом наблюдении.
Группировка – расчленение множества единиц изучаемой совокупности на группы по определенным признакам.
§5. Виды статистических группировок
Группировки могут быть классифицированы по структуре и по содержанию.
Типологическая – разделение совокупности на классы, социально- экономические типы (государственные предприятия, ОАО, ООО, ЗАО)
Структурная – разделение совокупности по какому-либо одному признаку.
Возраст
Аналитическая группировка характеризует взаимосвязь между признаками
один из которых является факторным другой результативным.
| |0-5000|5000-10000 |От 10000|
|образование | | | |
|Среднее |2 |1 |- |
|Незаконченное |10 |20 |5 |
|высшее | | | |
|Высшее |7 |15 |25 |
§6. Статистические таблицы
Результаты сводки и группировки должны быть представлены так, чтобы ими можно было пользоваться.
Существует 3 способа представления данных:
1. данные могут быть включены в текст.
2. представление в таблицах.
3. графический способ
Статистическая таблица – система строк и столбцов, в которой в определенной последовательности излагается статистическая информация о социально-экономических явлениях.
Различают подлежащее и сказуемое таблицы.
Подлежащим называется объект характеризующийся числами, обычно подлежащее дается в левой части таблицы.
Сказуемое – система показателей с помощью которых характеризуется объект.
|Город |Численность |Плотность |Площадь города|
| | |населения чел/км2|км2 |
|Москва | | | |
|Челябинск | | | |
Статистическая таблица содержит 3 вида заголовков: общее, боковое
Общий заголовок должен отражать содержание всей таблицы, располагается над таблицей по центру.
Правило составления таблиц.
1. обязательны все три вида заголовков без сокращений слов, общие единицы измерения можно вынести в заголовок.
2. в таблице не должно быть лишних линий, вертикальная разметка может отсутствовать.
3. Итоговая строка обязательна. Она может быть как в начале так и в конце документа. Если в начале документа то если в конце то
ИТОГО:
4. цифровые данные в пределах одной графы записываются с одной степенью точности. Разряды записываются строго под разрядами, целая часть отделяется запятой.
5. в таблице не должно быть пустых клеток, если данные отсутствуют, то пишут «Сведений нет» или «…», если данные равны нулю, то «–». Если значение не равно нулю но первая значащая цифра появляется после заданной точности 0,01(0,0 – если принятая точность до десятых.
6. если в таблице много граф, то графы подлежащего обозначаются заглавными буквами, а графы сказуемого цифрами.
7. если таблица основана на заимствованных данных, то под таблицей указывается источник данных, в случае необходимости таблица может сопровождаться примечаниями.
§7. Статистические графики
Статистические таблицы могут дополняться графиками.
Статистические графики – условные изображения числовых величин и их
соотношений посредством линий, геометрических фигур, рисунков.
Плюсы графического изображения
1. наглядно, обозримо, выразительно.
2. сразу видны пределы изменения показателя, сравнительная скорость изменения и колеблемость
Минусы графического изображения
1. Включают меньшее количество данных чем в таблице.
2. на графике показываются округленные данные, общая ситуация, но не детали.
Тема 3: Статистические показатели.
§1. Сущность и значение статистического показателя, его атрибуты.
§2. Классификация статистических показателей.
§3. Виды относительных показателей. Принципы построения.
§4. Системы статистических показателей.
§1.
Статистический признак – свойство присущее ЕСС, он существует объективно от
того изучает его как наука или нет
Статистический показатель – обобщающая характеристика какого-либо свойства
совокупности.
Структура статистического показателя (его атрибуты):
|Качественная |Количественная |Территориальные, |Интервал или |
|сторона : объект |сторона: число и |отраслевые, либо |момент времени |
|и его свойства |ед. измерения |др. границы | |
|Ввод в действие |40800,5 млн./м2 |РФ |1993 год |
|жилых домов | | | |
§2.
. Средние величины
. Показатели вариации
. Показатели связи признаков
. Показатели структуры и характера распределения
. Показатели динамики
. Показатели колебимости
. Показатели точности и надежности выборочных оценок
. Показатели точности и надежности прогнозов
По виду: суммарное количество единиц либо суммарное свойство объекта. Это
сумма первичных признаков, измеряется в шт., кг, м, $, и т.д.
Относительный показатель – получаемый путем сопоставления абсолютных или
относительных показателей в пространстве, во времени или в сравнении
показателей разных свойств изучаемого объекта.
Относительный показатель 1го порядка получается путем сопоставления 2х
абсолютных показателей. Относительный показатель 2го порядка получается
путем сопоставления относительных показателей 1го порядка и т.д.
Относительный показатель 3го порядка и выше встречаются очень редко.
Прямые показатели – такие показатели величина которых увеличивается с
увеличением исследуемого явления .
Обратные показатели – показатели величина которых уменьшается с увеличением
исследуемого явления.
Пример:
§3. Относительные показатели
Показатели структуры получаются путем отношения части к целому.
Относительные показатели динамики
V Показатели динамики (темпы роста, прироста)
V Индексы
Показатели взаимосвязи характеризуют связи между признаками:
V Коэффициент корреляции
V Аналитические индексы
Показатели интенсивности характеризуют отношение двух объектов по разным
признакам.
V Трудоемкость – количество времени используемое для изготовления одной единицы изделия
V Выработка – количество продукции произведенное в единицу времени
ВЫРАБОТКА = 1/трудоемкость
Показатели отношения к нормативу – соотношение фактических величин признака
показателя к нормативным, плановым, оптимальным.
Показатели сравнения – сравнение разных объектов по одному признаку.
Общие принципы построения статистических показателей:
1. статистические показатели объективно связаны.
2. сравниваемые показатели могут отличаться только одни атрибутом, нельзя сопоставлять показатель по двум и более атрибутам.
3. необходимо знать и учитывать границы показателя.
§4.
Для каждой характеристики объекта необходима система статистических
показателей.
1. функция позновательская – основывается на анализе данных
2. пропагандистская
3. стимулирующая функция
тема 4: Средние величины
§1. понятие средней величины
§2. виды средних величин
§3. средняя арифметическая и ее свойства
§4. среднее гармоническое, геометрическое, квадратическое.
§5. многомерная средняя
§1.
Наиболее распространенной формой статистических показателей является средняя величина.
Важнейшее свойство средней заключается в том, что она отражает то общее, что присуще каждой единице изучаемой совокупности, хотя значение признака отдельных единиц совокупности могут колебаться в ту или иную сторону.
Типичность средней непосредственно связана с однородностью изучаемой совокупности. В случае не однородной совокупности необходимо провести разбивку ее на качественно однородные группы и рассчитать среднюю по каждой по каждой из однородных групп.
Определить среднюю можно через исходное соотношение средней (ИСС) ее логическую формулу.
От того в каком виде представлены данные для расчета средней, зависит каким именно будет ИСС.
§2.
1. Средняя арифметическая
2. Средне гармоническая
3. Средне квадратическая, кубическая
4. Средне геометрическое
Правило мажерантности средних.
[pic]
Структурные средние
Мода – Мо
Медиана – Ме
В рядах динамики рассчитывается средняя арифметическая, средняя
хронологическая.
Средней арифметической называется такое среднее значение признака при
вычислении которого общий объем признака не изменяется.
Пример: вес.
[pic]
[pic] - ср. арифметическое простое
xi – индивидуальное значение признака
n – общее число изучаемой совокупности
[pic] ср. арифметическое взвешенное
Свойства ср. арифметической.
1. Сумма отклонений индивидуальных значений признака от его средней величины равно нулю
[pic]
2. если каждое индивидуальное значение признака умножить или разделить на одно и тоже постоянное число, то среднее увеличится или уменьшится во столько же раз.
[pic]
3. если к каждому индивидуальному значению признака прибавить одно и тоже постоянное число, то средняя величина изменится соответственно на тоже самое число.
Доказательство
[pic]
4. если веса f средней взвешенной умножить или разделить на одно и тоже число, то средняя не изменится.
[pic]
5. сумма квадратов отклонений признака меньше чем от любого другого числа.
Другие виды средних
|Вид средней |Простая средняя |Взвешенная средняя |
|гармоническая |[pic] |[pic] |
|геометрическое|[pic] |[pic] |
|Квадратическая|[pic] |[pic] |
§5.
Очень трудно охарактеризовать группировку по одному признаку и мало остается информации в памяти.
Сохранить сложность описания групп и одновременно преодолеть
недостатки комбинированной группировки позволяют многомерные группировки.
Простейшим вариантом многомерной группировки является многомерная средняя.
Многомерная средняя – средняя величина для нескольких признаков Е.С.С.
Т.к. нельзя рассчитать ср. величину абсолютных значений разных признаков выраженных в разных единицах измерения, то многомерная средняя вычисляется из относительных величин.
Из отношений значений признака для Е.С. к средним значениям этих признаков.
[pic]
[pic] - многомерная средняя для i единицы xij – значение признака j для i единицы
[pic] - среднее значение признака j k – число признаков j – номер признака и номер его совокупности
тема 5: Вариационный анализ
§1. Вариация признаков и ее причины
§2. Ряды распределения
§3. Структурные характеристики вариационного ряда.
§4. Показатели силы вариации.
§5. Показатели интенсивности вариации
§6. виды дисперсии. Правило сложения дисперсии.
§1.
Вариацией значения какого-либо признака в совокупности называется различие его значений у разных единиц данной совокупности в один и тот же период или момент времени.
Причина вариации: разные условия существования ЕСС именно вариация порождает необходимость в такой науке как статистика.
§2.
Проведение вариационного анализа начинается с построения вариационного ряда – упорядоченное распределение единиц совокупности по возрастающим или по убывающим признакам и подсчет соответствующих частот.
Ряды распределения
V ранжированные
V дискретные
V интервальные
Ранжированный вариационный ряд – перечень отдельных ед. совокупности в
порядке возрастания убывания ранжированного признака
|БАНК |Капитал тыс. |
| |руб. |
|СБ РФ |96007237 |
|Внешторгбанк|47991724 |
Дискретный вариационный ряд – таблица состоящая из 2х строк –
полимерных значений варьирующего признака и кол-во единиц с данным
значением признака.
|Кол-во |0 |1 |2 |3 |4|
|детей в | | | | | |
|семье | | | | | |
|Кол-во |20|40|45|10|5|
|семей | | | | | |
Интервальный вариационный ряд строится в случаях:
1. признак принимает дискретные значения , но кол-во их слишком велико
2. признака принимает любые значения в определенном диапазоне
|Размер |0 - 10000 |10000-50000 |Свыше 50000 |
|собственного | | | |
|капитала тыс. | | | |
|руб. | | | |
|Количество банков|20 |40 |10 |
При построении интервального вариационного ряда необходимо выбрать
оптимальное количество групп, самый распространенный способ по формуле
Стерджесса
k=1+3.32lgn
k – количество интервалов
n – объем совокупности
При расчетах почти всегда получают дробные значения, округления производить до целого числа.
Длина интервала – l
[pic]
Виды интервалов
1. нижняя граница последующего интервала повторяет верхнюю границу последующего интервала
|0 - |10 - |20 - 30|
|10 |20 | |
| | | |
2. С индивидуальными границами в интервал входят верхняя и нижняя границы
|0 - 9|10 - |20 - 29|
| |19 | |
| | | |
3. открытый интервал, интервал с одной границей
|До 5 |5 - 10|10 – 15|
| | | |
В случае открытого интервала l принимается равной длине смежного с ним
интервала, либо исходя из логических соображений.
|Стаж |До 5 |5-7|7-9|
|Кол-во | | | |
|рабочих| | | |
При расчетах по интервальному вариационному ряду за xi принимается середина интервала.
Интервалы могут быть как равные так и нет. При изучении вариационного ряда существенную помощь оказывает графическое изображение. Дискретный вариационный ряд изображается с помощью полигона.
Интервальный вариационный ряд изображается с помощью гистограммы.
Накопленная частота
|xi |0 |1 |2 |3 |4|
|fi |20 |40 |45|10|5|
NME=60 медиана = 1
Кумулята – распределение меньше чем
Огива – распределение больше чем
§3.
Медиана – значение признака делящее всю совокупность на две равные части.
Для дискретного вариационного ряда расчет медианы: если n-четное, то №Ме
медианой единицы
[pic]
[pic]
Интервальный вариационный ряд:
[pic]
k – количество интервалов
х0 – нижняя граница медианного интервала
l – длина медианного интервала
[pic] - сумма частот
[pic] - накопленная частота интервала предшествующая медианному.
[pic] - частота медианного интервала
Медианный интервал – первый интервал накопленная частота которого превышает
половину от общей суммы частот.
|0-5 |5-10 |10-15|15-20|
|15 |20 |40 |25 |
Графически медиана находится по кумуляте.
2. Квартили – значение признака делящее совокупность на 4 равные части.
1ый квартиль [pic]
3ий квартиль [pic]
2ой квартиль – медиана.
xQ1 xQ3 – нижняя граница интервала содержащего 1го и 3го квартили.
l – длина интервала
[pic] и [pic] - накопленные частоты интервалов предшествующих интервалов
содержащих 1 и 3 квартили.
[pic] - частоты квартильных интервалов.
Для характеристики вариационного ряда используются:
Децили – делят совокупность на 10 равных частей, Перцитили – делят
совокупность на 100 равных частей.
3. Мода – часто встречающаяся характеристика признака. Для дискретного вариационного ряда – наибольшая частота. Для интервального вариационного ряда мода рассчитывается по следующей формуле:
[pic]
[pic] - нижняя граница модального интервала l – длина модального интервала fMo – частота модального интервала fMo+1 – частота интервала следующего за модальным
Модальный интервал – интервал с наибольшей частотой. Графически мода находится по гистограмме.
§4.
1. Размах вариации [pic]
2. Среднее линейное отклонение
[pic]
[pic] - взвешенная
3. Дисперсия:
[pic]
[pic] - взвешенная
4. Средне квадратическое отклонение
[pic]
Свойство дисперсии.
1. [pic]
[pic]
1. уменьшение всех значений признака на одну и ту же величину не меняет величину дисперсии.
[pic]
2. Уменьшение всех значений признаков в к раз уменьшает величину дисперсии в к2 раз, а СКО в к раз
3. если исчислить средний квадрат отклонений от любой величины А отличающийся от средней арифметической, то он всегда будет больше среднего квадрата отклонений исчисленного из средней арифметической.
Таким образом [pic] от средней всегда меньше [pic] исчисленной от любой другой величины т.е. она имеет свойство минимальности. СКО=1,25[pic]
-при распределениях близких к нормальному.
В условиях нормального распределения существует следующая зависимость между [pic] и количеством наблюдений в пределах [pic]находится 68,3% наблюдений.
В пределах [pic] находится 95,4% наблюдений
В пределах [pic] находится 99,7% наблюдений
§5.
Для сравнения вариации признаков в разных совокупностях или для сравнения
вариации разных признаков в одной совокупности используются относительные
показатели, базой служит средняя арифметическая.
1. Относительный размах вариации.
[pic]
2. Относительное линейное отклонение
[pic]
3. Коэффициент вариации
[pic]
данные показатели дают не только сравнительную оценку но и образуют
однородность совокупности. Совокупность считается однородной если
коэффициент вариации не превышает 33%.
§6
На ряду с изучением вариации признака по всей совокупности в целом, часто бывает необходимо проследить количественные изменения признака, но группам, на которые делится совокупность и между ними. Эта достигается путем вычисления [pic]разных видов.
Виды дисперсии:
1. Общая дисперсия [pic]
2. Межгрупповая дисперсия [pic]
3. Внутригрупповая дисперсия (остаточная) [pic]
1. измеряет вариацию признака во всей совокупности под влиянием все факторов обусловивших данную вариацию
Пример: потребление йогурта: при выборке 100 человек
Возраст
Доход
Социальное положение
[pic]
xi –индивидуальное значение признака
[pic] - среднее значение признака по всей совокупности
[pic] - частота этого признака.
2. характеризует вариацию признака под влиянием признака фактора положенного в основу группировки.
[pic]
[pic] - средняя по группе
[pic] - общая средняя по группе
[pic] - частота по группе
3. [pic] характеризует вариацию признака под влиянием факторов не включенных в группировку
[pic]
xij – i значение признака в j группе
[pic] - среднее значение признака в j группе
fij – частота i-го признака в j группе
Существует правило которое связывает 3 вида дисперсии, оно называется
правило сложения дисперсии.
[pic]
[pic]
[pic] - остаточная дисперсия по j группе
[pic] - сумма частот по j группе
n – общая сумма частот
§7
основная задача анализа вариационных рядов – выявление закономерности
распределения частот.
Кривая распределения – графическое изображение в виде непрерывной линии
изменения частот в вариационном ряду в функционально связанным изменением
значения признака.
Кривую распределения можно построить с помощью полигона и гистограммы.
Целесообразно свести эмпирическое распределение к теоретическому, к одному
из хорошо изученных виду.
Кривая нормального распределения.
1. одновершинные
2. много вершинные
Для однородных совокупностей характерны одновершинные кривые, много вершинная кривая говорит о неоднородности совокупности и необходимости перегруппировки.
Выяснение общего характера распределения предполагает оценку его
однородности, и расчет асимметрии и эксцесса. Для симметричных
распределений [pic]
Для сравнительного изучения асимметрии различных распределений вычисляется
коэффициент асимметрии As.
[pic] где [pic]
[pic] - центральный момент третьего порядка; [pic] - СКО в кубе;
Если [pic], то асимметрия значительная
Если As0, то As – правосторонняя.
Если [pic], то As незначительная. Для симметричных и умеренно асимметричных
рассчитывается показатель эксцесса: [pic], если Ек>0, то распределение
островершинное, если Ek[pic], то распределение не является нормальным, т.е. гипотеза о нормальном распределении отменяется. Если [pic]