Пример выполнения расчетного задания по статистике |
Пример выполнения расчетного задания по статистике Имеются следующие выборочные данные службы занятости о времени поиска работы 30 безработными одного из районов города (выборка 1%-ная, механическая):
Задание 1 По исходным данным: 1) постройте Статистический ряд распределения по признаку возраст безработного, образовав 4 группы с равными интервалами; 2) графическим методом и путем расчетов определите значения Моды и Медианы полученного ряда распределения; 3) рассчитайте характеристики интервального ряда распределения: Среднюю арифметическую, Среднее квадратическое отклонение, Коэффициент вариации. Сделайте выводы по результатам выполнения пунктов 1, 2, 3 задания; 4) вычислите Среднюю арифметическую по исходным данным, сравните ее с аналогичным показателем, рассчитанным в п. 3 для интервального ряда распределения. Объясните причину их расхождения. Задание 2 По результатам выполнения задания 1 с вероятностью 0,683 определите: 1) ошибку выборки среднего возраста безработных в районе и границы, в которых будет находиться средний возраст безработных в целом по району; 2) ошибку выборки доли безработных в районе в возрасте до 50 лет и границы, в которых будет находиться генеральная доля. Выполнение задания 1 1.1. Построение интервального ряда распределения безработных по возрасту Для построения интервального вариационного ряда, характеризующего распределение безработных по возрасту, необходимо вычислить Величину и границы интервалов ряда. При построении ряда с равными интервалами величина интервала H определяется по формуле
Где Число групп K задается в условии задания или рассчитывается по формуле Г. Стерджесса K=1+3,322 Lg N, (2) Где N – число единиц совокупности. По условиям задания k=4. Определение величины интервала по формуле (1) при заданных K = 4: XmaX = 61 год, Xmin = 17 лет
При H = 11 границы интервалов ряда распределения имеют следующий вид (табл. 2): Таблица 2
Для построения интервального ряда необходимо подсчитать число безработных, входящих в каждую группу (Частоты групп). При этом возникает вопрос, в какую группу включать единицы совокупности, у которых значения признака выступают одновременно и верхней, и нижней границами смежных интервалов. Отнесение таких единиц к одной из двух смежных групп рекомендуется осуществлять По принципу полуоткрытого интервала. Т. к. при этом верхние границы интервалов не принадлежат данным интервалам, то соответствующие им единицы совокупности включаются не в данную группу, а в следующую. В последний интервал включаются и Нижняя, и Верхняя границы. Процесс группировки единиц совокупности по признаку Возраст безработного представлен во вспомогательной (разработочной) таблице 3 (графа 4 этой таблицы необходима для построения аналитической группировки в Задании 2). Таблица 3Разработочная таблица для построения интервального ряда распределения и аналитической группировки
На основе групповых итоговых строк «Всего» табл. 3 формируется итоговая табл. 4, представляющая Интервальный ряд распределения безработных по возрасту. Таблица 4 Распределение безработных по возрасту
Помимо частот групп в абсолютном выражении в анализе интервальных рядов используются ещё три характеристики ряда, приведенные в графах 4 – 6 табл. 1.4. Это Частоты групп в относительном выражении, Накопленные (кумулятивные) частоты Sj, Получаемые путем последовательного суммирования частот всех предшествующих (j-1) интервалов, и Накопленные частости, рассчитываемые по формуле Вывод. Анализ интервального ряда распределения изучаемой совокупности безработных показывает, что распределение безработных по возрасту не является равномерным: преобладают безработные в возрасте от 28 до 39 лет (это 10 безработных, доля которых составляет 33%), почти в два раза меньше (17%) старшая возрастная группа (от 50 лет до 61 года); группы от 17 до 28 лет и от 39 до 50 лет отличаются не так заметно (23% и 27% соответственно). 1.2. Нахождение моды и медианы полученного интервального ряда распределения графическим методом и путем расчетов Мода и медиана являются Структурными средними величинами, характеризующими (наряду со средней арифметической) центр распределения единиц совокупности по изучаемому признаку. Мода Мо для дискретного ряда – это значение признака, наиболее часто встречающееся у единиц исследуемой совокупности[1]. В интервальном вариационном ряду модой приближенно считается Центральное значение модального интервала (имеющего наибольшую частоту). Более точно моду можно определить графическим методом по гистограмме ряда (рис.1). Рис. 1 Определение моды графическим методом Конкретное значение моды для интервального ряда рассчитывается по формуле:
Где ХМo – нижняя граница модального интервала, H –величина модального интервала, FMo – частота модального интервала, FMo-1 – частота интервала, предшествующего модальному, FMo+1 – частота интервала, следующего за модальным. Согласно табл.1.3 модальным интервалом построенного ряда является интервал 28 – 39 лет, так как его частота максимальна (f2 = 10). Расчет моды по формуле (3): Вывод. Для рассматриваемой совокупности безработных наиболее распространенный возраст характеризуется средней величиной 34,4 года. Медиана Ме – это значение признака, приходящееся на середину ранжированного ряда. По обе стороны от медианы находится одинаковое количество единиц совокупности. Медиану можно определить графическим методом по кумулятивной кривой (рис. 2). Кумулята строится по накопленным частотам (табл. 5, графа 5). Рис. 2. Определение медианы графическим методом Конкретное значение медианы для интервального ряда рассчитывается по формуле:
Где ХМе– нижняя граница медианного интервала, H – величина медианного интервала,
FМе – частота медианного интервала, SMе-1 – кумулятивная (накопленная) частота интервала, предшествующего медианному. Для расчета медианы необходимо, прежде всего, определить медианный интервал, для чего используются накопленные частоты (или частости) из табл. 5 (графа 5). Так как медиана делит численность ряда пополам, она будет располагаться в том интервале, где накопленная частота Впервые равна полусумме всех частот В демонстрационном примере медианным интервалом является интервал 28 – 39 лет, так как именно в этом интервале накопленная частота Sj = 17 впервые превышает величину, равную половине численности единиц совокупности ( Расчет значения медианы по формуле (4):
Вывод. В рассматриваемой совокупности, половина безработных имеют возраст в среднем не более 33,5 лет, а другая половина – не менее 33,5 лет. 1.3. Расчет характеристик ряда распределения Для расчета характеристик ряда распределения Таблица 6 Расчетная таблица для нахождения характеристик ряда распределения
Расчет средней арифметической взвешенной:
Расчет дисперсии:
Расчет среднего квадратического отклонения: Расчет коэффициента вариации:
Вывод. Анализ полученных значений показателей Значение Vσ = 29,78% не превышает 33%, следовательно, вариация возраста в исследуемой совокупности безработных незначительна и совокупность по данному признаку качественно однородна. Расхождение между значениями 1.4. Вычисление средней арифметической по исходным данным Для расчета применяется формула средней арифметической простой:
Причина расхождения средних величин, рассчитанных по формулам (8) и (5), заключается в том, что по формуле (8) средняя определяется по фактическим значениям исследуемого признака для всех 30-ти безработных, а по формуле (5) средняя вычисляется для интервального ряда, когда в качестве значений признака берутся середины интервалов Задание 2 По результатам выполнения задания 1 с вероятностью 0,683 определите: 1) ошибку выборки среднего возраста безработных в районе и границы, в которых будет находиться средний возраст безработных в целом по району; 2) ошибку выборки доли безработных в районе в возрасте до 50 лет и границы, в которых будет находиться генеральная доля. Выполнение Задания 3 1. Определение ошибки выборки для Среднего возраста безработных в районе и границы, в которых будет находиться генеральная средняя Применение выборочного метода наблюдения всегда связано с Установлением степени достоверности оценок показателей генеральной совокупности, полученных на основе значений показателей выборочной совокупности. Достоверность этих оценок зависит от репрезентативности выборки, т. е. от того, насколько полно и адекватно представлены в выборке статистические свойства генеральной совокупности. Как правило, генеральные и выборочные характеристики не совпадают, а отклоняются на некоторую величину ε, которую называют Ошибкой выборки (ошибкой репрезентативности). Значения признаков единиц, отобранных из генеральной совокупности в выборочную, всегда случайны, поэтому и статистические характеристики выборки случайны, следовательно, и ошибки выборки также случайны. Ввиду этого принято вычислять два вида ошибок - среднюю Средняя ошибка выборки Величина средней ошибки выборки рассчитывается Дифференцированно (по различным формулам) в зависимости от Вида и способа отбора единиц из генеральной совокупности в выборочную. Для собственно-случайной и механической выборки с бесповторным способом отбора средняя ошибка
Где N – число единиц в генеральной совокупности, N – число единиц в выборочной совокупности. Предельная ошибка выборки
Где
Границы В экономических исследованиях чаще всего используются доверительные вероятности Р= 0,954, Р= 0,997, Реже Р= 0,683. В математической статистике доказано, что предельная ошибка выборки
Значения T вычислены заранее для различных доверительных вероятностей Р и Протабулированы (таблицы функции Лапласа Ф). Для наиболее часто используемых уровней надежности Р Значения T задаются следующим образом (табл. 15): Таблица 15
По условию демонстрационного примера выборочная совокупность насчитывает 30 безработных, выборка 1% механическая, следовательно, Генеральная совокупность включает 3000 безработных. Выборочная средняя Таблица 16
Расчет средней ошибки выборки по формуле (15): Расчет предельной ошибки выборки по формуле (17): Определение по формуле (16) доверительного интервала для генеральной средней: 36,8-2,07 34,73 лет Вывод. На основании проведенного выборочного обследования среднего возраста безработных в районе с вероятностью 0,683 можно утверждать, что для генеральной совокупности безработных средний возраст находится в пределах от 34,73 лет до 38,87 лет. 2. Определение ошибки выборки для Доли безработных в районе в возрасте до 50 лет и границы, в которых будет находиться генеральная доля Доля единиц выборочной совокупности, обладающих тем или иным заданным свойством, выражается формулой
Где M – число единиц совокупности, обладающих заданным свойством; N – общее число единиц в совокупности. Для собственно-случайной и механической выборки с бесповторным способом отбора предельная ошибка выборки
Где W – доля единиц совокупности, обладающих заданным свойством; (1-W) – доля единиц совокупности, не обладающих заданным свойством, N – число единиц в генеральной совокупности, N– число единиц в выборочной совокупности. Предельная ошибка выборки
По условию Задания 3 исследуемым свойством является не Превышение среднего возраста безработных 50 лет. Число безработных с заданным свойством определяется из табл. 3 (графа 3): M=25 Расчет выборочной доли по формуле (18): Расчет по формуле (19) предельной ошибки выборки для доли: Определение по формуле (20) доверительного интервала генеральной доли: 0,8333-0,0677<=p<=0,8333+0,0677 Или 76,56% <= p<=90,10% Вывод. С вероятностью 0,683 можно утверждать, что в генеральной совокупности безработных доля безработных в возрасте до 50 лет будет находиться в пределах от 77% до 90%. [1] Если в дискретном ряду все варианты встречаются одинаково часто, то в этом случае мода отсутствует. Могут быть распределения, где не один, а два (или более) варианта имеют наибольшие частоты. Тогда ряд имеет две (или более) моды, распределение является бимодальным (или многомодальным), что указывает на качественную неоднородность совокупности по изучаемому признаку.
|