Пример выполнения расчетного задания по статистике

Пример выполнения расчетного задания по статистике

Имеются следующие выборочные данные службы занятости о времени поиска работы 30 безработными одного из районов города (выборка 1%-ная, механическая):

№ п/п

Возраст безработного,

Лет

Время поиска работы,

Мес.

№ п/п

Возраст безработного,

Лет

Время поиска работы,

Мес.

1

37

8,7

16

60

11,3

2

53

9,4

17

21

5,6

3

18

5,1

18

33

7,5

4

25

6,9

19

29

7,2

5

33

7,9

20

42

8,3

6

32

7,8

21

17

5,3

7

48

8,5

22

44

8,4

8

61

10,4

23

41

7,9

9

29

7,8

24

26

7,4

10

39

8,4

25

30

7,9

11

28

7,9

26

41

8,1

12

35

8,5

27

47

8,7

13

52

9,4

28

27

7,5

14

36

8,7

29

23

6,7

15

48

8,9

30

57

10,0

Задание 1

По исходным данным:

1) постройте Статистический ряд распределения по признаку возраст безработного, образовав 4 группы с равными интервалами;

2) графическим методом и путем расчетов определите значения Моды и Медианы полученного ряда распределения;

3) рассчитайте характеристики интервального ряда распределения: Среднюю арифметическую, Среднее квадратическое отклонение, Коэффициент вариации.

Сделайте выводы по результатам выполнения пунктов 1, 2, 3 задания;

4) вычислите Среднюю арифметическую по исходным данным, сравните ее с аналогичным показателем, рассчитанным в п. 3 для интервального ряда распределения. Объясните причину их расхождения.

Задание 2

По результатам выполнения задания 1 с вероятностью 0,683 опре­делите:

1) ошибку выборки среднего возраста безработных в районе и гра­ницы, в которых будет находиться средний возраст безработных в целом по району;

2) ошибку выборки доли безработных в районе в возрасте до 50 лет и границы, в которых будет находиться генеральная доля.

Выполнение задания 1

1.1.  Построение интервального ряда распределения безработных по возрасту

Для построения интервального вариационного ряда, характеризующего распределение безработных по возрасту, необходимо вычислить Величину и границы интервалов ряда.

При построении ряда с равными интервалами величина интервала H определяется по формуле

, (1)

Где – наибольшее и наименьшее значения признака в исследуемой совокупности, K число групп интервального ряда.

Число групп K задается в условии задания или рассчитывается по формуле Г. Стерджесса

K=1+3,322 Lg N, (2)

Где N – число единиц совокупности. По условиям задания k=4.

Определение величины интервала по формуле (1) при заданных K = 4:

XmaX = 61 год, Xmin = 17 лет

Лет.

При H = 11 границы интервалов ряда распределения имеют следующий вид (табл. 2):

Таблица 2

Номер группы

Возраст безработного, лет

1

17 – 28

2

28 – 39

3

39 – 50

4

50 – 61

Для построения интервального ряда необходимо подсчитать число безработных, входящих в каждую группу (Частоты групп). При этом возникает вопрос, в какую группу включать единицы совокупности, у которых значения признака выступают одновременно и верхней, и нижней границами смежных интервалов. Отнесение таких единиц к одной из двух смежных групп рекомендуется осуществлять По принципу полуоткрытого интервала. Т. к. при этом верхние границы интервалов не принадлежат данным интервалам, то соответствующие им единицы совокупности включаются не в данную группу, а в следующую. В последний интервал включаются и Нижняя, и Верхняя границы.

Процесс группировки единиц совокупности по признаку Возраст безработного представлен во вспомогательной (разработочной) таблице 3 (графа 4 этой таблицы необходима для построения аналитической группировки в Задании 2).

Таблица 3

Разработочная таблица для построения интервального ряда распределения и аналитической группировки

Возраст безработного, лет

Середина интервала

Частота

17 – 28

22,5

7

28 – 39

33,5

10

39 – 50

44,5

8

50 – 61

55,5

5

Всего

30

На основе групповых итоговых строк «Всего» табл. 3 формируется итоговая табл. 4, представляющая Интервальный ряд распределения безработных по возрасту.

Таблица 4

Распределение безработных по возрасту

I

Возраст безработного, лет

Середины интервалов

Частота (nI)

Частость (доля), ni/n

Накопленная частота (Sj)

Накопленная частость

1

17-28

22,5

7

0,2333

7

23%

2

28-39

33,5

10

0,3333

17

57%

3

39-50

44,5

8

0,2667

25

83%

4

50-61

55,5

5

0,1667

30

100%

Всего (n)

30

Помимо частот групп в абсолютном выражении в анализе интервальных рядов используются ещё три характеристики ряда, приведенные в графах 4 – 6 табл. 1.4. Это Частоты групп в относительном выражении, Накопленные (кумулятивные) частоты Sj, Получаемые путем последовательного суммирования частот всех предшествующих (j-1) интервалов, и Накопленные частости, рассчитываемые по формуле .

Вывод. Анализ интервального ряда распределения изучаемой совокупности безработных показывает, что распределение безработных по возрасту не является равномерным: преобладают безработные в возрасте от 28 до 39 лет (это 10 безработных, доля которых составляет 33%), почти в два раза меньше (17%) старшая возрастная группа (от 50 лет до 61 года); группы от 17 до 28 лет и от 39 до 50 лет отличаются не так заметно (23% и 27% соответственно).

1.2. Нахождение моды и медианы полученного интервального ряда распределения графическим методом и путем расчетов

Мода и медиана являются Структурными средними величинами, характеризующими (наряду со средней арифметической) центр распределения единиц совокупности по изучаемому признаку.

Мода Мо для дискретного ряда – это значение признака, наиболее часто встречающееся у единиц исследуемой совокупности[1]. В интервальном вариационном ряду модой приближенно считается Центральное значение модального интервала (имеющего наибольшую частоту). Более точно моду можно определить графическим методом по гистограмме ряда (рис.1).

Рис. 1 Определение моды графическим методом

Конкретное значение моды для интервального ряда рассчитывается по формуле:

(3)

Где ХМo – нижняя граница модального интервала,

H –величина модального интервала,

FMo – частота модального интервала,

FMo-1 – частота интервала, предшествующего модальному,

FMo+1 – частота интервала, следующего за модальным.

Согласно табл.1.3 модальным интервалом построенного ряда является интервал 28 – 39 лет, так как его частота максимальна (f2 = 10).

Расчет моды по формуле (3):

Вывод. Для рассматриваемой совокупности безработных наиболее распространенный возраст характеризуется средней величиной 34,4 года.

Медиана Ме – это значение признака, приходящееся на середину ранжированного ряда. По обе стороны от медианы находится одинаковое количество единиц совокупности.

Медиану можно определить графическим методом по кумулятивной кривой (рис. 2). Кумулята строится по накопленным частотам (табл. 5, графа 5).

Рис. 2. Определение медианы графическим методом

Конкретное значение медианы для интервального ряда рассчитывается по формуле:

, (4)

Где ХМе– нижняя граница медианного интервала,

H – величина медианного интервала,

– сумма всех частот,

FМе – частота медианного интервала,

SMе-1 – кумулятивная (накопленная) частота интервала, предшествующего медианному.

Для расчета медианы необходимо, прежде всего, определить медианный интервал, для чего используются накопленные частоты (или частости) из табл. 5 (графа 5). Так как медиана делит численность ряда пополам, она будет располагаться в том интервале, где накопленная частота Впервые равна полусумме всех частот или превышает ее (т. е. все предшествующие накопленные частоты меньше этой величины).

В демонстрационном примере медианным интервалом является интервал 28 – 39 лет, так как именно в этом интервале накопленная частота Sj = 17 впервые превышает величину, равную половине численности единиц совокупности (=).

Расчет значения медианы по формуле (4):

33,5 года

Вывод. В рассматриваемой совокупности, половина безработных имеют возраст в среднем не более 33,5 лет, а другая половина – не менее 33,5 лет.

1.3. Расчет характеристик ряда распределения

Для расчета характеристик ряда распределения , σ, σ2, Vσ на основе табл. 5 строится вспомогательная табл. 6 ( – середина j-го интервала).

Таблица 6

Расчетная таблица для нахождения характеристик ряда распределения

Возраст безработного, лет

Середина интервала,

Частота.

Fj

1

2

3

4

5

6

7

17-28

22,5

7

157,5

-15,033

226,001

1582,01

28-39

33,5

10

335

-4,0333

16,2678

162,678

39-50

44,5

8

356

6,96667

48,5344

388,276

50-61

55,5

5

277,5

17,9667

322,801

1614,01

Итого

30

1126

3746,97

Расчет средней арифметической взвешенной:

лет (5)

Расчет дисперсии:

(6)

Расчет среднего квадратического отклонения:

Расчет коэффициента вариации:

(7)

Вывод. Анализ полученных значений показателей и σ говорит о том, что средний возраст безработных составляет 37,5333 лет, отклонение от среднего возраста в ту или иную сторону составляет в среднем 11,1758 лет (или 29,78%), наиболее характерные значения среднего возраста безработных находятся в пределах от 26,3575 до 48,7092 (диапазон ).

Значение Vσ = 29,78% не превышает 33%, следовательно, вариация возраста в исследуемой совокупности безработных незначительна и совокупность по данному признаку качественно однородна. Расхождение между значениями , Мо и Ме незначительно (=37,5333 лет, Мо=34,4 года, Ме=33,5 лет), что подтверждает вывод об однородности по возрасту совокупности безработных. Таким образом, найденное среднее значение возраста безработных (37,5333 лет) является типичной, надежной характеристикой исследуемой совокупности безработных.

1.4. Вычисление средней арифметической по исходным данным

Для расчета применяется формула средней арифметической простой:

(8)

Причина расхождения средних величин, рассчитанных по формулам (8) и (5), заключается в том, что по формуле (8) средняя определяется по фактическим значениям исследуемого признака для всех 30-ти безработных, а по формуле (5) средняя вычисляется для интервального ряда, когда в качестве значений признака берутся середины интервалов и, следовательно, значение средней будет менее точным (за исключением случая равномерного распределения значений признака внутри каждой группы).

Задание 2

По результатам выполнения задания 1 с вероятностью 0,683 опре­делите:

1) ошибку выборки среднего возраста безработных в районе и гра­ницы, в которых будет находиться средний возраст безработных в целом по району;

2) ошибку выборки доли безработных в районе в возрасте до 50 лет и границы, в которых будет находиться генеральная доля.

Выполнение Задания 3

1. Определение ошибки выборки для Среднего возраста безработных в районе и гра­ницы, в которых будет находиться генеральная средняя

Применение выборочного метода наблюдения всегда связано с Установлением степени достоверности оценок показателей генеральной совокупности, полученных на основе значений показателей выборочной совокупности. Достоверность этих оценок зависит от репрезентативности выборки, т. е. от того, насколько полно и адекватно представлены в выборке статистические свойства генеральной совокупности. Как правило, генеральные и выборочные характеристики не совпадают, а отклоняются на некоторую величину ε, которую называют Ошибкой выборки (ошибкой репрезентативности).

Значения признаков единиц, отобранных из генеральной совокупности в выборочную, всегда случайны, поэтому и статистические характеристики выборки случайны, следовательно, и ошибки выборки также случайны. Ввиду этого принято вычислять два вида ошибок - среднюю и предельную .

Средняя ошибка выборки – это среднее квадратическое отклонение всех возможных значений выборочной средней от генеральной средней, т. е. от своего математического ожидания M[].

Величина средней ошибки выборки рассчитывается Дифференцированно (по различным формулам) в зависимости от Вида и способа отбора единиц из генеральной совокупности в выборочную.

Для собственно-случайной и механической выборки с бесповторным способом отбора средняя ошибка выборочной средней определяется по формуле

, (15)

Где – общая дисперсия выборочных значений признаков,

N – число единиц в генеральной совокупности,

N – число единиц в выборочной совокупности.

Предельная ошибка выборки определяет границы, в пределах которых будет находиться генеральная средняя:

,

, (16)

Где – выборочная средняя,

– генеральная средняя.

Границы задают Доверительный интервал генеральной средней, т. е. случайную область значений, которая с вероятностью Р гарантированно содержит значение генеральной средней. Эту вероятность Р называют Доверительной вероятностью Или Уровнем надёжности.

В экономических исследованиях чаще всего используются доверительные вероятности Р= 0,954, Р= 0,997, Реже Р= 0,683.

В математической статистике доказано, что предельная ошибка выборки кратна средней ошибке µ с Коэффициентом кратности T (Называемым также Коэффициентом доверия), который зависит от значения доверительной вероятности Р. Для предельной ошибки выборочной средней это теоретическое положение выражается формулой

(17)

Значения T вычислены заранее для различных доверительных вероятностей Р и Протабулированы (таблицы функции Лапласа Ф). Для наиболее часто используемых уровней надежности Р Значения T задаются следующим образом (табл. 15):

Таблица 15

Доверительная вероятность P

0,683

0,866

0,954

0,988

0,997

0,999

Значение T

1,0

1,5

2,0

2,5

3,0

3,5

По условию демонстрационного примера выборочная совокупность насчитывает 30 безработных, выборка 1% механическая, следовательно, Генеральная совокупность включает 3000 безработных. Выборочная средняя , дисперсия определены в Задании 1 (п. 3). Значения параметров, необходимых для решения задачи, представлены в табл. 16:

Таблица 16

Р

T

N

N

0,683

1

30

3000

36,8

130,2767

Расчет средней ошибки выборки по формуле (15):

Расчет предельной ошибки выборки по формуле (17):

Определение по формуле (16) доверительного интервала для генеральной средней:

36,8-2,0736,8+2,07,

34,73 лет 38,87 лет.

Вывод. На основании проведенного выборочного обследования среднего возраста безработных в районе с вероятностью 0,683 можно утверждать, что для генеральной совокупности безработных средний возраст находится в пределах от 34,73 лет до 38,87 лет.

2. Определение ошибки выборки для Доли безработных в районе в возрасте до 50 лет и границы, в которых будет находиться генеральная доля

Доля единиц выборочной совокупности, обладающих тем или иным заданным свойством, выражается формулой

, (18)

Где M – число единиц совокупности, обладающих заданным свойством;

N – общее число единиц в совокупности.

Для собственно-случайной и механической выборки с бесповторным способом отбора предельная ошибка выборки доли единиц, обладающих заданным свойством, рассчитывается по формуле

, (19)

Где W – доля единиц совокупности, обладающих заданным свойством;

(1-W) – доля единиц совокупности, не обладающих заданным свойством,

N – число единиц в генеральной совокупности,

N– число единиц в выборочной совокупности.

Предельная ошибка выборки определяет границы, в пределах которых будет находиться генеральная доля Р единиц, обладающих заданным свойством:

(20)

По условию Задания 3 исследуемым свойством является не Превышение среднего возраста безработных 50 лет.

Число безработных с заданным свойством определяется из табл. 3 (графа 3):

M=25

Расчет выборочной доли по формуле (18):

Расчет по формуле (19) предельной ошибки выборки для доли:

Определение по формуле (20) доверительного интервала генеральной доли:

0,8333-0,0677<=p<=0,8333+0,0677

Или

76,56% <= p<=90,10%

Вывод. С вероятностью 0,683 можно утверждать, что в генеральной совокупности безработных доля безработных в возрасте до 50 лет будет находиться в пределах от 77% до 90%.

[1] Если в дискретном ряду все варианты встречаются одинаково часто, то в этом случае мода отсутствует. Могут быть распределения, где не один, а два (или более) варианта имеют наибольшие частоты. Тогда ряд имеет две (или более) моды, распределение является бимодальным (или многомодальным), что указывает на качественную неоднородность совокупности по изучаемому признаку.

© 2011-2024 Контрольные работы по математике и другим предметам!