Экономика Ковалева Т.Ю. Практикум по теории статистики. Учебно-практическое пособие

Практикум по теории статистики. Учебно-практическое пособие

Возрастное ограничение: 12+
Жанр: Экономика
Издательство: Проспект
Дата размещения: 02.10.2013
ISBN: 9785392133055
Язык:
Объем текста: 515 стр.
Формат:
epub

Оглавление

Предисловие

Модуль 1. Основы методологии статистического исследования

Модуль 2. Характеристика множества

Модуль 3. Статистическое изучение взаимосвязей социально-экономических явлений и процессов

Модуль 4. Статистическое изучение динамики социально-экономических явлений и процессов. Временные ряды: оценка изменений во времени



Для бесплатного чтения доступна только часть главы! Для чтения полной версии необходимо приобрести книгу



МОДУЛЬ 2. ХАРАКТЕРИСТИКА МНОЖЕСТВА


2.1. Вариация: изучение изменчивости


Методические указания


Вариацией какого-либо признака в совокупности называется различие его значений у разных единиц совокупности в один и тот же период времени. Она является следствием того, что индивидуальное значение формируется в результате совместного действия множества факторов (условий), которые по-разному сочетаются в каждом конкретном случае.


Средняя величина дает обобщающую характеристику признака в изучаемой совокупности, но не показывает, как расположены варианты, сосредоточены ли они вблизи средней или значительно отклоняются от нее. Средняя величина двух совокупностей может быть одинаковой, но в одном случае все индивидуальные значения отличаются от нее мало, а в другом — эти отличия велики, т.е. во втором случае вариация признака значительна, и это необходимо учитывать при оценке надежности средней величины.


Вариация присуща практически всем без исключения явлениям природы и общества. Не варьирующие признаки не представляют интереса для статистики. Изучение изменчивости является одной из составляющих предмета, а большинство методов статистики направлены либо на измерение вариации, либо ее исключения.


«Как измерить разнообразие?» — главный вопрос этой темы.


Показатели размера и интенсивности вариации


1. Размах вариации R (диапазон колебаний признака) — представляет собой разность между максимальным и минимальным значениями признака:



Размах вариации учитывает только крайние отклонения значений признака в совокупности и не отражает отклонений всех вариантов. Для анализа вариации необходим показатель, который отражает все колебания и дает обобщенную характеристику изменчивости всех значений признака.


Среднее линейное отклонение — средняя арифметическая абсолютных значений отклонений отдельных вариантов от их средней арифметической (при этом предполагают, что среднее значение вычитается из варианта).


Для несгруппированных данных:



где n — число членов ряда.


Для сгруппированных данных:



где ∑f — сумма частот вариационного ряда.


В этих формулах разности в числителе всегда берутся по модулю, так как сумма линейных отклонений от средней равна нулю (свойство средней арифметической). Поэтому среднее линейное отклонение как меру вариации признака применяют в статистической практике редко, только в том случае, когда суммирование величин без учета знаков имеет экономический смысл.


3. Дисперсия признака представляет собой средний квадрат отклонений вариантов от их средней величины. В зависимости от исходных данных используют формулы:


— простая дисперсия для несгруппированных данных —


— взвешенная дисперсия для вариационного ряда — эта формула используется при наличии у вариантов своих весов (или частот вариационного ряда). Рассчитать дисперсию можно также по преобразованной формуле:



где — квадрат среднего значения признака в совокупности;


— средний квадрат значений признака в совокупности


При расчете дисперсии по этой формуле исключается дополнительная процедура по учету отклонений индивидуальных значений признака от его средней величины; за счет этого уменьшается ошибка, связанная с округлением значений промежуточных вычислений. Показатель дисперсии часто используется в экономических расчетах.


Среднее квадратическое отклонение (СКО) — корень квадратный из дисперсии,


Это обобщающая характеристика размеров вариации признака в совокупности. Среднее квадратическое отклонение показывает, насколько в среднем отклоняются конкретные варианты от среднего значения, является абсолютной мерой изменчивости признака и выражается в тех же единицах, что и варианты, поэтому экономически хорошо интерпретируется.


Размах вариации, среднее линейное отклонение и среднее квадратическое отклонение являются именованными величинами, т.е. имеют ту же единицу измерения, что и изучаемый признак. Дисперсия единицы измерения не имеет.


Для оценки интенсивности вариации, а также для сравнения ее величины в разных совокупностях или по разным признакам используют относительные показатели вариации, которые рассчитываются как отношение абсолютных показателей вариации к средней величине признака (или медиане) и выражаются в процентах:



По величине коэффициента вариации принято судить не только об интенсивности вариации признака, но и об однородности состава изучаемой совокупности. Чем больше значение коэффициента вариации, тем больше разброс значений признака вокруг средней, тем больше неоднородность совокупности. При этом вопрос о степени интенсивности вариации должен решаться для каждого изучаемого признака индивидуально, исходя из сравнения наблюдаемой вариации с некоторой ее обычной интенсивностью, принимаемой за норму. Общепринятым является следующее: совокупность считается однородной, если коэффициент вариации не превышает 33%.


Виды дисперсий. Правило сложения дисперсий


Вариация результативного признака обусловлена действием различных факторов, оценить влияние некоторых из них можно, разбив статистическую совокупность на группы по факторному признаку. Тогда вместе с изучением общей вариации признака в совокупности становится возможным изучить вариацию признака в каждой из составляющих ее групп, а также между этими группами. В простейшем случае, когда совокупность расчленена на группы по одному фактору, изучение вариации осуществляется с использованием трех видов дисперсий.


1. Общая дисперсия — характеризует вариацию результативного признака по всей совокупности в результате действия всех факторов, обусловивших эту вариацию. Она равна среднему квадрату отклонений отдельных значений признака от общей средней и может быть вычислена по формулам:


простая дисперсия для несгруппированных данных —


взвешенная дисперсия для вариационного ряда —


2. Межгрупповая дисперсия характеризует систематическую вариацию результативного признака, обусловленную влиянием признака-фактора, положенного в основание группировки. Она равна среднему квадрату отклонений групповых (частных) средних i от общей средней :



где f — численность единиц в группе.


3. Внутригрупповая частная дисперсия отражает случайную вариацию, т.е. часть общей вариации, обусловленную влиянием неучтенных факторов и не зависящую от признака-фактора, положенного в основание группировки. Она равна среднему квадрату отклонений отдельных значений признака внутри группы х от средней арифметической этой группы х{ (групповой средней) и может быть исчислена как простая дисперсия или как взвешенная по соответствующим формулам:


простая дисперсия —


взвешенная дисперсия для вариационного ряда —


На основании внутригрупповой дисперсии по каждой группе, т.е. на основании можно определить среднюю из внутригрупповых дисперсий:



Между всеми указанными дисперсиями существует взаимосвязь, которая называется правилом сложения дисперсий, — общая дисперсия равна сумме средней из внутригрупповых дисперсий и межгрупповой дисперсии.



Другими словами, общая вариация признака в совокупности складывается из вариации признака внутри отдельных групп, вызванной действием всех неучтенных факторов, и вариации между группами, являющейся результатом действия только одного группировочного признака.


Для количественной оценки силы влияния признака, положенного в основание группировки, на образование общей вариации результативного признака в статистике широко используется эмпирический коэффициент детерминации:



Очевидно, что чем больше доля межгрупповой дисперсии в общей дисперсии, тем сильнее влияние признака, положенного в основание группировки, на изменчивость (вариацию) результативного (изучаемого) признака. При отсутствии связи между признаками эмпирический коэффициент детерминации равен нулю, при функциональной зависимости равен 1.


Эмпирическое корреляционное отношение — это корень квадратный из эмпирического коэффициента детерминации:



Этот показатель используется для оценки тесноты связи между группировочным и результативным признаками. Принимает значение от 0 до 1. Если связь отсутствует, то эмпирическое корреляционное значение равно 0, т.е. все групповые средние равны между собой и межгрупповая вариация отсутствует. Значит, факторный признак, положенный в основание группировки, никак не влияет на образование общей вариации.


Если связь функциональная, то корреляционное отношение равно 1. В этом случае дисперсия групповых средних равна общей дисперсии, т.е. внутригрупповая дисперсия отсутствует. Это означает, что группировочный признак целиком определяет вариацию изучаемого результативного признака. Чем ближе значение корреляционного отношения к единице, тем теснее и ближе к функциональной связь между признаками.


Для качественной оценки тесноты связи на основе показателя эмпирического корреляционного отношения можно воспользоваться соотношениями Чэддока:


Вариация альтернативного признака


В случае качественных альтернативных признаков, имеющих только два взаимоисключающих варианта значений: да и нет, качественные изделия и бракованные и т.д., дисперсия альтернативного признака:



где р — удельный вес единиц, обладающих некоторым значением признака;


q — удельный вес единиц, не обладающих некоторым значением признака.


Очевидно, что p + q = 1.


Предельное значение вариации доли альтернативного признака равно 0,25 (p х q = 0,5 х 0,5 = 0,25).


Контрольные вопросы


1. Что такое вариация признака?


2. Почему необходимо изучать вариацию?


3. Какие абсолютные показатели можно использовать для характеристики вариации в совокупности?


4. Какие относительные показатели используются для оценки вариации?


5. В чем сущность однородности? Как производится оценка однородности совокупности?


6. Как рассчитать общую, межгрупповую и внутригрупповую дисперсии?


7. Для каких целей используется правило сложения дисперсий?


8. Что характеризует эмпирический коэффициент детерминации?


9. Как оценить связь между признаками на основе эмпирического корреляционного отношения?


10. Как рассчитать дисперсию доли альтернативного признака?


Решение типовых задач


Пример 1


Заработная плата 12 рабочих бригады характеризуется следующими данными:


Используя правило сложения дисперсий, оцените, как велико влияние профессии на различия в уровне заработной платы.


Решение


В этой задаче необходимо разложить общую вариацию заработной платы (общая дисперсия) на систематическую, связанную с профессией (межгрупповая дисперсия), и случайную: все прочие факторы, кроме профессии (внутригрупповая дисперсия).


1. Определим средний уровень заработной платы в каждой группе и по бригаде в целом:




2. Определим внутригрупповые и среднюю из внутригрупповых дисперсий:


из внутригрупповых дисперсия характеризует вариацию признака в результате действия случайных, не учтенных факторов.


3. Определим межгрупповую дисперсию:


Межгрупповая дисперсия характеризует систематическую вариацию признака (заработной платы) в результате действия признака-фактора, положенного в основание группировки (профессии).


4. Общая дисперсия:


Общая дисперсия характеризует общую вариацию признака, сложившуюся в результате действия как систематического фактора (профессии), так и всех прочих неучтенных факторов (стаж работы на предприятии, квалификация и т.д.).


5. Правило сложения дисперсий:


6. Среднее квадратическое отклонение:



7. Коэффициент вариации:



Эта бригада достаточно однородна по уровню заработной платы, так как значение коэффициента вариации меньше 33%.


8. Чем больше доля межгрупповой дисперсии в общей дисперсии, тем сильнее влияние группировочного признака (профессии) на изучаемый признак (уровень заработной платы). Для характеристики этого соотношения используется эмпирический коэффициент детерминации:


или 4,7% — это означает, что только на 4,7% вариация заработной платы рабочих за сентябрь обусловлена различиями в их профессии и на 95,3% — влиянием прочих факторов.


Эмпирическое корреляционное отношение оценивает тесноту связи между группировочным и результативным признаком.



В соответствии с соотношениями Чэддока можно сказать, что в бригаде связь между профессией и уровнем заработной платы слабая.


Пример 2


Оцените степень тесноты связи между сортом свеклы и ее урожайностью.


Решение


Результативным признаком является вес отдельной свеклы, который зависит от систематического фактора — сорта свеклы и действия прочих неучтенных факторов (полив, освещенность, состояние почвы, глубина посадки и т.д.). Для оценки тесноты связи в случае группировки данных по факторному признаку используется правило сложения дисперсий:


1. Найдем среднюю урожайность в целом по совокупности:



2. Средняя из внутригрупповых дисперсий характеризует часть вариации веса отдельных клубней, обусловленную действием всех факторов, кроме сорта, так как внутри группы вся свекла одного сорта:



3. Межгрупповая дисперсия характеризует вариацию веса отдельных клубней свеклы, вызванную только различием в сорте:



4. Общая дисперсия характеризует вариацию веса отдельных клубней в результате действия всех факторов:



5. Коэффициент детерминации показывает, насколько вариация результативного признака обусловлена действием признака, положенного в основание группировки.


— это означает, что на 61,1% вариация веса клубня свеклы, а значит, и ее урожайность в целом зависят от сорта, и на 38,9% — от действия прочих неучтенных факторов.


6. Эмпирическое корреляционное отношение оценивает тесноту связи между исследуемыми признаками.



Таким образом, воспользовавшись соотношениями Чэддока, можно сделать вывод, что связь между сортом и урожайностью (весом одного клубня) свеклы тесная.


Пример 3


Дисперсия признака в совокупности равна 121. Объем совокупности равен 20, а сумма квадратов индивидуальных значений признака — 44 372,8. Оцените однородность совокупности.


Решение


Анализ имеющихся данных позволяет сделать вывод о необходимости использования преобразованной формулы для расчета дисперсии:



Оценка однородности совокупности производится на основе коэффициента вариации:



Таким образом, совокупность однородна, так как значение коэффициента вариации меньше 33%.


Пример 4


В трех партиях мясных консервов, представленных на контроль качества, бракованными оказались 1,5% в первой партии, состоящей из 1000 банок; 2,5% — во второй партии (1200 банок); 3,5% — в третьей партии (1500 банок). Определить в целом за день средний процент бракованной и годной продукции, дисперсию, среднее квадратическое отклонение, коэффициент вариации всей партии по качеству. Сделайте вывод.


Решение


Средняя величина альтернативного признака равна удельному весу единиц, обладающих данным значением признака во всей совокупности:



или 2,65% — удельный вес бракованной продукции в сутки.


q = 1 - p = 1 - 0,0265 = 0,9735, или 97,35% — удельный вес годной продукции.


Дисперсия удельного веса бракованной продукции:


Среднее квадратическое отклонение:


Коэффициент вариации удельного веса годной продукции:


Так как значение коэффициента вариации меньше 33%, можно утверждать, что совокупность партии мясных консервов является однородной по качеству.


Задачи для самостоятельной работы


2.1.1. Известны следующие данные о величине валового регионального продукта на душу населения в субъектах РФ, расположенных в Центральном федеральном округе (тыс. руб.).


Рассчитайте абсолютные и относительные показатели вариации за каждый год и сделайте вывод об изменении однородности этой совокупности. Проведите оценку повторно, исключив из совокупности субъектов РФ Москву. Сделайте вывод.


2.1.2. Для проверки соответствия требованиям качества замороженных креветок в пачках была сделана контрольная закупка. В результате были получены следующие результаты:


1-я пачка, 80 креветок — 14 не соответствуют требованиям стандарта по размеру и весу;


2-я пачка, 84 креветки — 10 не соответствуют требованиям стандарта;


3-я пачка, 78 креветок — 14 не соответствуют требованиям стандарта.


Определите в целом по контрольной закупке средний процент нестандартной продукции, дисперсию, коэффициент вариации креветок, соответствующих стандарту по весу и размеру.


2.1.3. Оцените степень тесноты связи между продолжительностью работы малых предприятий, производящих аналогичную продукцию, на рынке и себестоимостью единицы этой продукции:


2.1.4. Коэффициент вариации равен 12%, а среднее значение признака в совокупности — 18 тыс. руб. Рассчитайте среднее квадратическое отклонение величины признака в совокупности.


2.1.5. Средний квадрат индивидуальных значений признака равен 483,25, а среднее значение — 21. Оцените однородность совокупности.


2.1.6. Оцените тесноту связи между ценой бензина на заправочных станциях и их принадлежностью разным топливно-заправочным компаниям (ТЗК):


2.1.7. Оцените тесноту связи между стоимостью за проезд в общественном транспорте и принадлежностью автобусов частной компании или муниципальному автотранспортному предприятию:


2.1.8. По туристической фирме известны следующие данные:


Оцените степень тесноты связи между туристическим направление и стоимостью тура.


2.1.9. Оцените степень тесноты связи между сроком службы оборудования и продолжительностью его ремонта:


2.1.10. Заработная плата 12 рабочих бригады характеризуется следующими данными:


Используя правило сложения дисперсий, оцените, как велико влияние производительности труда на различия в уровне заработной платы.


Ответы к задачам для самостоятельной работы


2.1.1. Коэффициент вариации величины валового регионального продукта на душу населения по субъектам РФ, входящим с состав Центрального федерального округа, в 1998 г. составлял 48,7%; в 2002 г. — 68,5%; в 2006 г. — 85,54%. Таким образом, очевидно, что совокупность является неоднородной и эта неоднородность увеличивается. Если исключить из совокупности Москву, то значение коэффициента вариации в 1998 г. составит 18,1%, в 2002 г. — 21,9%, в 2006 г. — 31%. В этом случае совокупность на протяжении исследуемого периода может рассматриваться как однородная.


2.1.2. 15,7% — доля креветок, не соответствующих требованиям стандарта по размеру и весу;


2.1.3.


2.1.4. 2,16 тыс. руб.


2.1.5. Совокупность однородна, коэффициент вариации 31%.


2.1.6. Связь между ценой бензина и принадлежностью заправочной станции определенной ТЗК отсутствует; η2 = 0 , так как групповые средние равны между собой, т.е. признак, положенный в основание группировки, не оказывает никакого влияния на вариацию результативного признака, и вариация цены бензина обусловлена действием всех прочих неучтенных факторов, кроме принадлежности определенной ТЗК.


2.1.7. Связь между признаками является функциональной, η2 = 1, так как внутригрупповые дисперсии равны между собой, т.е. вариация результативного признака (стоимости проезда) полностью зависит от вариации признака-фактора (принадлежности автобуса), положенного в основание группировки.



Тестовые задания


1. Систематическую вариацию величины изучаемого показателя в результате действия признака-фактора, положенного в основание группировки, характеризует дисперсия:


1) общая;


2) внутригрупповая;


3) межгрупповая;


4) средняя из внутригрупповых.


2. Вариация — это изменение:


1) структуры совокупности;


2) величины признака у единиц совокупности;


3) границ совокупности;


4) среднего значения признака.


3. Не имеет единиц измерения:


1) коэффициент вариации;


2) дисперсия;


3) среднее квадратическое отклонение;


4) размах вариации.


4. Показатель, не только используемый для сравнительной оценки вариации единиц совокупности, но и характеризующий однородность совокупности, — это коэффициент:


1) вариации;


2) детерминации;


3) осцилляции;


4) корреляции.


5. Дисперсия, характеризующая часть вариации, сложившуюся под влиянием неучтенных факторов и не зависящую от признака-фактора, положенного в основание группировки, называется:


1) общей;


2) внутригрупповой;


3) межгрупповой;


4) средней из внутригрупповых.


6. Силу влияния группировочного признака на образование общей вариации показывает коэффициент:


1) вариации;


2) детерминации;


3) осцилляции;


4) корреляции.


7. Правило сложения дисперсий говорит, что общая дисперсия равна:


1) сумме внутригрупповых и межгрупповой дисперсии;


2) сумме средней из межгрупповых и внутригрупповой дисперсии;


3) разности средней из внутригрупповых и межгрупповой дисперсии;


4) средней из внутригрупповых и межгрупповой дисперсии.


8. Средний квадрат отклонений индивидуальных значений признака от их средней величины называется:


1) средним линейным отклонением;


2) средним квадратическим отклонением;


3) дисперсией;


4) средней из внутригрупповых дисперсий.


9. Если признак-фактор, положенный в основание группировки, не оказывает никакого влияния на образование общей вариации, то эмпирический коэффициент детерминации равен:


1) 0; 2) 1;


3) 0,5;


4) -1.


10. Вариация признака во всей совокупности под влиянием всех факторов, обусловивших эту вариацию, определяется с помощью:


1) средней из внутригрупповых дисперсий;


2) межгрупповой дисперсии;


3) общей дисперсии;


4) правила сложения дисперсий.


11. Если между признаком-фактором и результативным показателем связь функциональная, то эмпирическое корреляционное отношение равно:


1) 0; 2) 1;


3) 0,5;


4) -1.


12. Среднее квадратическое отклонение — это корень:


1) квадратный из линейного отклонения;


2) квадратный из доли межгрупповой дисперсии к общей дисперсии;


3) квадратный из дисперсии;


4) n-степени из дисперсии.


13. Дисперсия альтернативного признака — это:



14. Определите значение дисперсии признака, если средняя величина признака в совокупности признака — 10 тыс. руб., а коэффициент вариации — 30%.


15. Определите стандартное значение (среднее квадратическое отклонение), если средняя величина признака в совокупности — 15 тыс. руб., а коэффициент вариации — 46,2% (с точностью до 0,1).


16. Коэффициент вариации = ...% (с точностью до 0,01%) при условии, что средняя величина признака в совокупности — 3400 штук, а дисперсия признака в совокупности — 225.


17. Рассчитайте среднюю величину признака в совокупности, если известно, что дисперсия признака равна 400, а средний квадрат индивидуальных значений — 625.


18. Дисперсия альтернативного признака:


1) может принимать любое значение;



19. При контроле качества партии деталей 5% оказались бракованными. Определите дисперсию (с точностью до 0,01).


20. Какова дисперсия доли альтернативного признака, если при контроле качества партии деталей из 100 штук 12 оказались не высшего сорта?


2.2. Характеристика изменения частот: статистические распределения


Методические указания


Вторым элементом вариационного ряда (первый — значение признака) является частота, показывающая, сколько единиц совокупности обладают определенным значением признака, другими словами, как часто такой вариант встречается в совокупности. Обратите внимание на то, что сложившаяся комбинация частот называется статистическим распределением и оказывает существенное влияние на характеристику совокупности в целом.


Изучение вариационных рядов начинается с графического изображения, которое облегчает их анализ и позволяет судить о форме распределения. Для графического изображения вариационного ряда строят гистограмму, полигон частот, кумуляту распределения.


«В чем значение распределения частот для характеристики множества?» — ключевой вопрос этой темы.


Для количественной характеристики статистических распределений используются:


1) показатели центра распределения;


2) показатели формы распределения;


3) кривые распределения.


Показатели центра распределения и структурные средние характеристики вариационного ряда




Практикум по теории статистики. Учебно-практическое пособие

Содержит обзор основных понятий теории статистики. Представлены основы методологии статистического исследования, рассматриваются характеристики множества: вариация, статистические распределения, выборочный метод; раскрываются вопросы, связанные со статистическим изучением взаимосвязей социально-экономических явлений и процессов, а также вопросы оценки изменения во времени различных социально-экономических явлений и процессов.<br />             Для преподавателей, аспирантов, студентов экономических вузов, экономистов, менеджеров, а также для всех, изучающих статистику самостоятельно.

199
 Ковалева Т.Ю. Практикум по теории статистики. Учебно-практическое пособие

Ковалева Т.Ю. Практикум по теории статистики. Учебно-практическое пособие

Ковалева Т.Ю. Практикум по теории статистики. Учебно-практическое пособие

Содержит обзор основных понятий теории статистики. Представлены основы методологии статистического исследования, рассматриваются характеристики множества: вариация, статистические распределения, выборочный метод; раскрываются вопросы, связанные со статистическим изучением взаимосвязей социально-экономических явлений и процессов, а также вопросы оценки изменения во времени различных социально-экономических явлений и процессов.<br />             Для преподавателей, аспирантов, студентов экономических вузов, экономистов, менеджеров, а также для всех, изучающих статистику самостоятельно.

Внимание! Авторские права на книгу "Практикум по теории статистики. Учебно-практическое пособие" (Ковалева Т.Ю.) охраняются законодательством!