Математическая статистика (3 варианта)

Вариант 10.

Имеются следующие выборочные данные о валовом доходе по домашним хозяйствам населения региона за год, тыс. руб. (выборка 5%-ная, механическая).

№ домохозяйства

Валовой доход

№ домохозяйства

Валовой доход

1

223

16

224

2

211

17

199

3

230

18

224

4

237

19

240

5

232

20

254

6

216

21

200

7

240

22

226

8

255

23

219

9

225

24

235

10

221

25

258

11

198

26

245

12

227

27

253

13

233

28

231

14

213

29

243

15

229

30

232

Задание 1.

Признак – валовой доход в среднем на одного члена домохозяйства в год.

По исходным данным:

1) постройте статистический ряд распределения по указанному признаку, образовав пять групп с равными интервалами;

2) графическим методом и путем расчетов определите значения моды и медианы полученного ряда распределения;

3) рассчитайте характеристики интервального ряда распределения: среднюю арифметическую, среднее квадратическое отклонение, коэффициент вариации.

4) вычислите среднюю арифметическую по исходным данным, сравните её с аналогичным показателем, рассчитанным в п.3. для интервального ряда распределения. Объясните причину их расхождения.

Решение. 1) Для построения интервального вариационного ряда распределения, характеризующего распределение валового дохода в среднем на одного члена домохозяйства в год, необходимо вычислить величину и границы интервального ряда.

При построении ряда с равными интервалами величина интервала H определяется по формуле:

Xmax – максимальное значение признака;

Xmin – минимальное значение признака;

K – число групп интервального ряда.

Число групп K Задается в условии задания или рассчитывается по формуле Г. Стерджесса

K=1+3,322 lg n,

Где N – число единиц совокупности.

Получаем величину интервала при заданных K = 5, xMax = 258 тыс. руб.,

XMin = 198 тыс. руб.:

тыс. руб.

При H = 12 тыс. руб. границы интервалов ряда распределения имеют следующий вид (табл. 2).

Таблица 2

Границы интервалов ряда распределения

Номер группы

Нижняя граница,

Тыс. руб.

Верхняя граница,

Тыс. руб.

1

198

210

2

210

222

3

222

234

4

234

246

5

246

258

Для построения интервального ряда необходимо посчитать количество домохозяйств, входящих в каждую группу (частота групп).

Процесс группировки совокупности по признаку валовой доход в среднем на одного члена домохозяйства в год представлен во вспомогательной табл. 3.

Таблица 3

Разработочная таблица для построения ряда распределения

Группы домохозяйств по валовому

Доходу в год, тыс. руб.

№ домохозяйства

Валовой доход, тыс. руб.

1

2

3

198 – 210

11

198

17

199

21

200

Всего

3

597

210 – 222

2

211

14

213

6

216

23

219

10

221

Всего

5

1080

222 – 234

1

223

16

224

18

224

9

225

22

226

12

227

15

229

3

230

28

231

5

232

30

232

13

233

Всего

12

2736

234 – 246

24

235

4

237

7

240

19

240

29

243

26

245

Всего

6

1440

246 – 258

27

253

20

254

8

255

25

258

Всего

4

1020

ИТОГО

30

6873

На основе групповых итоговых строк формируется итоговая таблица 4, представляющая интервальный ряд распределения домохозяйств по валовому доходу в год.

Таблица 4

Распределение домохозяйств по валовому доходу в год, тыс. руб.

Номер группы

Группы домохозяйств по валовому

Доходу в год, тыс. руб.

Х

Число Домохозяйств

F

1

198 – 210

3

2

210 – 222

5

3

222 – 234

12

4

234 – 246

6

5

246 – 258

4

Итого

30

Частоты групп в относительном выражении, накопленные (кумулятивные) частоты Sj, получаемые путем последовательного суммирования частот всех предшествующих (J-1) интервалов, и накопленные частости, рассчитываемые по формуле запишем в таблице5.

Таблица 5

Структура домохозяйств по валовому доходу в год

№ группы

Группы домохозяйств по валовому

Доходу в год, тыс. руб.

Число Домохозяйств, Fj

Накопленная

Частота,

Sj

Накопленная

Частоcть, %

В абсолютном выражении

В % к итогу

1

198 – 210

3

10,0

3

10,0

2

210 – 222

5

16,7

8

26,7

3

222 – 234

12

40,0

20

66,7

4

234 – 246

6

20,0

26

86,7

5

246 – 258

4

13,3

30

100,0

Итого

30

100,0

Вывод: Анализ интервального ряда распределения изучаемой совокупности домохозяйств показывает, что распределение домохозяйств по валовому доходу не является равномерным: преобладают домохозяйства с валовым доходом от 222 до 234 тыс. руб. в год (это 12 домохозяйств, доля которых составляет 40%).

2) Нахождение моды и медианы получаемого интервального ряда распределения графическим методом и путем расчётов.

Мода и медиана являются структурными средними величинами, характеризующими центр распределения единиц совокупности по распределяемому признаку.

Мода Мо для дискретного ряда – это значение признака, наиболее часто встречающееся у единиц исследуемой совокупности. В интервальном вариационном ряду модой приближённо считается центральное значение модального интервала.

Для определения моды графическим методом строим по данным табл. 4 гистограмму распределения домохозяйств по валовому доходу в год.

Рис. 1 Определение моды графическим методом

Конкретное значение моды определяется по формуле:

,

Где – начало интервала, содержащего моду;

– величина интервала, содержащего моду;

– частота того интервала, в котором расположена мода;

– частота интервала, предшествующего модальному;

– частота интервала, следующего за модальным.

Согласно табл. 3 модальным интервалом построенного ряда является интервал 222 до 234 тыс. руб., так как его частота максимальна (F3 = 12).

Получаем:

тыс. руб.

Вывод: для рассматриваемой совокупности домохозяйств наиболее распространённый валовой доход составляет 228,462 тыс. руб.

Медиана Ме – это значение признака, приходящееся на середину ранжированного ряда. По обе стороны от медианы находится одинаковое количество единиц совокупности.

Для определения медианы графическим методом строим по данным табл.5 кумуляту распределения домохозяйств по изучаемому признаку.

Рис. 2 Определение медианы графическим методом

Конкретное значение медианы для интервального ряда рассчитывается по формуле:

Где – начало интервала, содержащего медиану;

– величина интервала, содержащего медиану;

– сумма всех частот;

– накопленная частота на начало интервала, предшествующего медианному;

– частота того интервала, в котором расположена медиана.

Определяем медианный интервал, используя табл.5. Медианным интервалом является интервал 222 – 234 тыс. руб., т. к. именно в этом интервале накопленная частота Sj = 20 впервые превышает полусумму всех частот равную

.

Имеем:

тыс. руб.

Вывод: в рассматриваемой совокупности домохозяйств одна половина домохозяйств имеет валовой доход не более 229 тыс. руб., а другая – более 229 тыс. руб.

3) Для расчета средней арифметической, среднего квадратического отклонения и коэффициента вариации на основе таблицы 5 строим вспомогательную таблицу 6 ( – середина J-го интервала).

Таблица 6

Расчетная таблица для нахождения характеристик ряда распределения

Группы домохозяйств по валовому доходу в год, тыс. руб.

198 – 210

204

3

612

-25,20

635,04

1905,12

210 – 222

216

5

1080

-13,20

174,24

871,20

222 – 234

228

12

2736

-1,20

1,44

17,28

234 – 246

240

6

1440

10,80

116,64

699,84

246 – 258

252

4

1008

22,80

519,84

2079,36

Итого

30

6876

5572,80

Расчет средней арифметической взвешенной:

тыс. руб.

Расчет дисперсии:

Расчет среднего квадратического отклонения:

тыс. руб.

Расчет коэффициента вариации:

Вывод: Анализ полученных значений показателей и говорит о том, что средняя величина валового дохода на одного члена домохозяйства в год составляет 229,2 тыс. руб., отклонение от этой величины в ту или иную сторону составляет в среднем 13,629 тыс. руб. (или 5,95%).

Значение не превышает 33%, следовательно, вариация валового дохода на одного члена домохозяйства в год и совокупность по данному признаку однородна. Расхождение между значениями , Мо и Ме незначительно (, ), что подтверждает вывод об однородности совокупности. Таким образом, найденное среднее значение – 229,2 тыс. руб. валового дохода на одного члена домохозяйства в год является типичной, надежной характеристикой исследуемой совокупности домохозяйств.

4) Вычислим среднюю арифметическую по исходным данным. Для расчета применим формулу средней арифметической простой:

тыс. руб.

Причина расхождения средних величин, рассчитанных по исходным данным – 229,1 тыс. руб. и по интервальному ряду распределения – 229,1 тыс. руб., заключается в том, что в первом случае средняя определяется по фактическим значениям исследуемого признака для всех 30-ти домохозяйств, а во втором случае в качестве значений признака берутся середины интервалов и, следовательно, значение средней будет менее точным. Вместе с тем, при округлении обеих рассматриваемых величин их значения совпадают (229 тыс. руб.), что говорит о достаточно равномерном распределении домохозяйств внутри каждой группы интервального ряда.

Задание 2.

По результатам выполнения задания 1 с вероятностью 0,954 определите:

1) ошибку выборки среднего валового дохода на одного члена домохозяйства в год и границы, в которых он будет находиться домохозяйств генеральной совокупности.

2) ошибку выборки доли домохозяйств с уровнем валового дохода не менее 52 тыс. руб. и границы, в которых будет находиться генеральная доля.

Решение. 1) По условию выборочная совокупность насчитывает 30 домохозяйств, выборка 5%-ная механическая, следовательно, генеральная совокупность включает 600 домохозяйств. Выборочная средняя и дисперсия определены в Задании 1 (п. 3). Значения параметров, необходимых для решения задачи, представлены в табл. 7:

Таблица 7


Р

T

N

N

0,954

2

30

600

229,2

185,76

Рассчитаем среднюю ошибку выборки:

тыс. руб.

Рассчитаем предельную ошибку выборки:

тыс. руб.

Определим доверительный интервал для генеральной средней:

Вывод: На основании проведенного выборочного обследования с вероятностью 0,954 можно утверждать, что для генеральной совокупности домохозяйств средний валовый доход на одного члена домохозяйства в год находится в пределах от 224,35 тыс. руб. до 234,05 тыс. руб.

2) Доля единиц выборочной совокупности, обладающих тем или иным заданным свойством, выражается формулой

,

Где M – число единиц совокупности, обладающих заданным свойством;

N – общее число единиц в совокупности.

Для собственно-случайной и механической выборки с бесповторным способом отбора предельная ошибка выборки доли единиц, обладающих заданным свойством, рассчитывается по формуле

Где W – доля единиц совокупности, обладающих заданным свойством;

(1 – W) – доля единиц совокупности, не обладающих заданным свойством,

N – число единиц в генеральной совокупности,

N – число единиц в выборочной совокупности.

По условию задания исследуемым свойством домохозяйств является равенство или превышение валового дохода уровня в 52 тыс. руб.

Число домохозяйств с данным свойством определяется из табл. 3:

M = 30.

Рассчитаем выборочную долю:

Рассчитаем ошибку выборки для доли:

тыс. чел.

Рассчитаем предельную ошибку выборки для доли:

Определим доверительный интервал генеральной доли:

Или

Р = 100%.

Вывод: С вероятностью 0,954 можно утверждать, что в генеральной совокупности домохозяйств доля домохозяйств с уровнем валового дохода не менее 52 тыс. руб. составит 100%.

Вариант 4.

С целью изучения расходов населения на платные услуги в отчетном периоде по региону была произведена 25%-ная механическая выборка, в результате которой получены следующие данные:

№ района

Численность населения, тыс. чел.

Объем платных услуг, млн. руб.

№ района

Численность населения, тыс. чел.

Объем платных услуг, млн. руб.

1

31,9

11,95

16

25,

93,3

2

25,7

95,7

17

34,4

129,4

3

19,4

71,4

18

25,9

95,8

4

27,2

94,0

19

14,7

51,0

5

23,5

86,8

20

26,6

98,5

6

23,2

85,7

21

25,5

94,2

7

13,4

56,3

22

24,7

90,5

8

26,0

96,1

23

19,5

70,1

9

25,0

92,8

24

27,9

103,6

10

20,8

75,2

25

24,8

91,4

11

24,3

89,3

26

26,1

96,0

12

28,9

107,8

27

22,3

84,3

13

29,0

77,3

28

13,8

47,6

14

30,0

112,2

29

33,8

101,1

15

21,4

77,7

30

22,6

81,4

Задание 1. Признак – численность населения. По исходным данным:

1) постройте статистический ряд распределения по указанному признаку, образовав пять групп с равными интервалами;

2) графическим методом и путем расчетов определите значения моды и медианы полученного ряда распределения;

3) рассчитайте характеристики интервального ряда распределения: среднюю арифметическую, среднее квадратическое отклонение, коэффициент вариации.

4) вычислите среднюю арифметическую по исходным данным, сравните её с аналогичным показателем, рассчитанным в п.3. для интервального ряда распределения. Объясните причину их расхождения.

Решение. 1) Для построения интервального вариационного ряда распределения, характеризующего распределение численность населения по районам региона, необходимо вычислить величину и границы интервального ряда.

При построении ряда с равными интервалами величина интервала H определяется по формуле:

Xmax – максимальное значение признака;

Xmin – минимальное значение признака;

K – число групп интервального ряда.

Число групп K Задается в условии задания или рассчитывается по формуле Стерджесса

K=1+3,322 lg n,

Где N – число единиц совокупности.

Получаем величину интервала при заданных K = 5, xMax = 33,4 тыс. чел.,

XMin = 13,4 тыс. чел.:

тыс. чел.

При H = 4 тыс. чел. границы интервалов ряда распределения имеют следующий вид (табл. 2).

Таблица 2

Границы интервалов ряда распределения

Номер группы

Нижняя граница, тыс. чел.

Верхняя граница, тыс. чел.

1

13,4

17,4

2

17,4

21,4

3

21,4

25,4

4

25,4

29,4

5

29,4

33,4

Для построения интервального ряда необходимо посчитать количество районов, входящих в каждую группу (частота групп).

Процесс группировки совокупности по признаку численность населения представлен во вспомогательной табл. 3.

Таблица 3

Разработочная таблица для построения ряда распределения

Группы по численности населения, тыс. чел.

№ района

Численность населения, тыс. чел.

1

2

3

13,4 – 17,4

7

13,4

28

13,8

19

14,7

Всего

3

41,9

17,4 – 21,4

3

19,4

23

19,5

10

20,8

15

21,4

Всего

4

81,1

21,4 – 25,4

27

22,3

30

22,6

6

23,2

5

23,5

11

24,3

22

24,7

25

24,8

9

25

16

25

Всего

9

215,4

25,4 – 29,4

21

25,5

2

25,7

18

25,9

8

26

26

26,1

20

26,6

4

27,2

24

27,9

12

28,9

13

29

Всего

10

268,8

29,4 – 33,4

14

30

1

31,9

29

33,8

17

34,4

Всего

4

130,1

ИТОГО

30

737,3

На основе групповых итоговых строк формируется итоговая таблица 4, представляющая интервальный ряд распределения районов по численности населения.

Таблица 4

Распределение районов по численности населения, тыс. чел.

Номер

Группы

Группы районов по численности населения,

Тыс. чел.

Х

Число

рАйонов

F

1

13,4 – 17,4

3

2

17,4 – 21,4

4

3

21,4 – 25,4

9

4

25,4 – 29,4

10

5

29,4 – 33,4

4

Итого

30

Частоты групп в относительном выражении, накопленные (кумулятивные) частоты Sj, получаемые путем последовательного суммирования частот всех предшествующих (J-1) интервалов, и накопленные частости, рассчитываемые по формуле запишем в таблице5.

Таблица 5

Структура районов по численности населения

№ группы

Группы районов по численности населения,

Тыс. чел.

Число Районов, Fj

Накопленная

Частота,

Sj

Накопленная

Частоcть, %

В абсолютном выражении

В % к итогу

1

13,4 – 17,4

3

10,0

3

10,0

2

17,4 – 21,4

4

13,3

7

23,3

3

21,4 – 25,4

9

30,0

16

53,3

4

25,4 – 29,4

10

33,3

26

86,6

5

29,4 – 33,4

4

13,3

30

100,0

Итого

30

100,0

Вывод: Анализ интервального ряда распределения изучаемой совокупности районов показывает, что распределение районов по численности населения не является равномерным: преобладают районы с численностью населения от 21,4 до 25,4 тыс. чел. и от 25,4 до 29,4 тыс. чел. (это 9 и 10 районов соответственно, доля которых составляет 30 и 33,3%).

2) Мода и медиана являются структурными средними величинами, характеризующими центр распределения единиц совокупности по распределяемому признаку.

Мода Мо для дискретного ряда – это значение признака, наиболее часто встречающееся у единиц исследуемой совокупности. В интервальном вариационном ряду модой приближённо считается центральное значение модального интервала.

Для определения моды графическим методом строим по данным табл. 4 гистограмму распределения районов по численности населения.

Рис. 1 Определение моды графическим методом

Конкретное значение моды определяется по формуле:

,

Где – начало интервала, содержащего моду;

– величина интервала, содержащего моду;

– частота того интервала, в котором расположена мода;

– частота интервала, предшествующего модальному;

– частота интервала, следующего за модальным.

Согласно табл. 3 модальным интервалом построенного ряда является интервал 25,4 – 29,4тыс. руб., так как его частота максимальна (F4 = 10).

Получаем:

тыс. чел.

Вывод: для рассматриваемой совокупности районов наиболее часто встречается численность населения в 25,971 тыс. чел.

Медиана Ме – это значение признака, приходящееся на середину ранжированного ряда. По обе стороны от медианы находится одинаковое количество единиц совокупности.

Для определения медианы графическим методом строим по данным табл.5 кумуляту распределения районов по изучаемому признаку.

Рис. 2 Определение медианы графическим методом.

Конкретное значение медианы для интервального ряда рассчитывается по формуле:

Где – начало интервала, содержащего медиану;

– величина интервала, содержащего медиану;

– сумма всех частот;

– накопленная частота на начало интервала, предшествующего медианному;

– частота того интервала, в котором расположена медиана.

Определяем медианный интервал, используя табл.5. Медианным интервалом является интервал 21,4 – 25,4 тыс. чел., т. к. именно в этом интервале накопленная частота Sj = 16 впервые превышает полусумму всех частот равную

.

Имеем:

тыс. чел.

Вывод: в рассматриваемой совокупности районов одна половина районов имеет численность населения не более 29,4 тыс. чел., а другая – более 29,4 тыс. чел.

3) Для расчета средней арифметической, среднего квадратического отклонения и коэффициента вариации на основе таблицы 5 строим вспомогательную таблицу 6 ( – середина J-го интервала).

Таблица 6

Расчетная таблица для нахождения характеристик ряда распределения

Группы районов по численность населения, тыс. чел.

13,4 – 17,4

15,4

3

46,2

-9,067

82,204

246,613

17,4 – 21,4

19,4

4

77,6

-5,067

25,671

102,684

21,4 – 25,4

23,4

9

210,6

-1,067

1,138

10,240

25,4 – 29,4

27,4

10

274

2,933

8,604

86,044

29,4 – 33,4

31,4

4

125,6

6,933

48,071

192,284

Итого

30

734

637,867

Расчет средней арифметической взвешенной:

тыс. чел.

Расчет дисперсии:

Расчет среднего квадратического отклонения:

тыс. чел.

Расчет коэффициента вариации:

Вывод: Анализ полученных значений показателей и говорит о том, что средняя численность населения составляет 24,467 тыс. чел., отклонение от этой величины в ту или иную сторону составляет в среднем 4,611 тыс. чел. (или 18,85%).

Значение не превышает 33%, следовательно, вариация численности населения и совокупность по данному признаку однородна. Расхождение между значениями , Мо и Ме незначительно (, ), что подтверждает вывод об однородности совокупности. Таким образом, найденное среднее значение численности населения – 24,467 тыс. чел. является типичной, надежной характеристикой исследуемой совокупности районов.

4) Вычислим среднюю арифметическую по исходным данным. Для расчета применим формулу средней арифметической простой:

тыс. чел.

Причина расхождения средних величин, рассчитанных по исходным данным – 24,577 тыс. чел. и по интервальному ряду распределения – 24,467 тыс. чел., заключается в том, что в первом случае средняя определяется по фактическим значениям исследуемого признака для всех 30-ти районов, а во втором случае в качестве значений признака берутся середины интервалов и, следовательно, значение средней будет менее точным.

Задание 2. По результатам выполнения задания 1 с вероятностью 0,954 определите:

1) ошибку выборки средней численности населения района и границы, в которых он будет находиться средняя численность населения для районов генеральной совокупности.

2) ошибку выборки доли районов с численностью населения 26 тыс. чел. и более и границы, в которых будет находиться генеральная доля.

Решение. 1) По условию выборочная совокупность насчитывает 30 районов, выборка 25%-ная механическая, следовательно, генеральная совокупность включает 120 районов. Выборочная средняя и дисперсия определены в Задании 1 (п. 3). Значения параметров, необходимых для решения задачи, представлены в табл. 7:

Таблица 7


Р

T

N

N

0,954

2

30

120

24,467

21,262

Рассчитаем среднюю ошибку выборки:

тыс. чел.

Рассчитаем предельную ошибку выборки:

тыс. чел.

Определим доверительный интервал для генеральной средней:

Вывод: На основании проведенного выборочного обследования с вероятностью 0,954 можно утверждать, что для генеральной совокупности районов средняя численности населения района находится в пределах от 23,009 тыс. чел. до 25,925 тыс. чел.

2) Доля единиц выборочной совокупности, обладающих тем или иным заданным свойством, выражается формулой

,

Где M – число единиц совокупности, обладающих заданным свойством;

N – общее число единиц в совокупности.

Для собственно-случайной и механической выборки с бесповторным способом отбора предельная ошибка выборки доли единиц, обладающих заданным свойством, рассчитывается по формуле

Где W – доля единиц совокупности, обладающих заданным свойством;

(1 – W) – доля единиц совокупности, не обладающих заданным свойством,

N – число единиц в генеральной совокупности,

N – число единиц в выборочной совокупности.

По условию задания исследуемым свойством районов является равенство или превышение численности населения уровня в 26 тыс. чел.

Число районов с данным свойством определяется из табл. 3:

M = 30.

Рассчитаем выборочную долю:

Рассчитаем ошибку выборки для доли:

Рассчитаем предельную ошибку выборки для доли:

тыс. чел.

Определим доверительный интервал генеральной доли:

Или

21,5% ≤ Р ≤ 51,9%.

Вывод: С вероятностью 0,954 можно утверждать, что в генеральной совокупности районов региона доля районов с численностью населения 26 тыс. чел. и более будет находиться в пределах от 21,5% до 51,9%.

Вариант 15.

Для анализа валового дохода домохозяйств населения региона произведена 1%-я механическая выборка, результаты которой представлены в таблице:

№ домохозяйства

Валовой доход

№ домохозяйства

Валовой доход

1

179,0

16

269,0

2

325,5

17

339,0

3

110,5

18

272,5

4

131,5

19

189,5

5

195,0

20

241,5

6

200,0

21

149,5

7

231,0

22

280,0

8

210,0

23

253,0

9

410,5

24

240,0

10

375,0

25

172,5

11

344,0

26

225,0

12

335,0

27

292,0

13

205,0

28

243,0

14

285,0

29

234,0

15

233,5

30

132,5

Задание 1.

Признак – валовой доход в среднем на одного члена домохозяйства в год.

По исходным данным:

1) постройте статистический ряд распределения по указанному признаку, образовав пять групп с равными интервалами;

2) графическим методом и путем расчетов определите значения моды и медианы полученного ряда распределения;

3) рассчитайте характеристики интервального ряда распределения: среднюю арифметическую, среднее квадратическое отклонение, коэффициент вариации.

4) вычислите среднюю арифметическую по исходным данным, сравните её с аналогичным показателем, рассчитанным в п.3. для интервального ряда распределения. Объясните причину их расхождения.

Решение. 1) Для построения интервального вариационного ряда распределения, характеризующего распределение валового дохода в среднем на одного члена домохозяйства в год, необходимо вычислить величину и границы интервального ряда.

При построении ряда с равными интервалами величина интервала H определяется по формуле:

Xmax – максимальное значение признака;

Xmin – минимальное значение признака;

K – число групп интервального ряда.

Число групп K Задается в условии задания или рассчитывается по формуле Г. Стерджесса

K=1+3,322 lg n,

Где N – число единиц совокупности.

Получаем величину интервала при заданных K = 5, xMax = 410,5 тыс. руб.,

XMin = 110,5 тыс. руб.:

тыс. руб.

При H = 60 тыс. руб. границы интервалов ряда распределения имеют следующий вид (табл. 2).

Таблица 2

Границы интервалов ряда распределения

Номер группы

Нижняя граница,

Тыс. руб.

Верхняя граница,

Тыс. руб.

1

110,5

170,5

2

170,5

230,5

3

230,5

290,5

4

290,5

350,5

5

350,5

410,5

Для построения интервального ряда необходимо посчитать количество домохозяйств, входящих в каждую группу (частота групп).

Процесс группировки совокупности по признаку валовой доход в среднем на одного члена домохозяйства в год представлен во вспомогательной табл. 3.

Таблица 3

Разработочная таблица для построения ряда распределения и аналитической группировки

Группы домохозяйств по валовому

Доходу в год, тыс. руб.

№ домохозяйства

Валовой доход, тыс. руб.

1

2

3

110,5 – 170,5

3

110,5

4

131,5

30

132,5

21

149,5

Всего

4

524

170,5 – 230,5

25

172,5

1

179

19

189,5

5

195

6

200

13

205

8

210

26

225

Всего

8

1576

230,5 – 290,5

7

231

15

233,5

29

234

24

240

20

241,5

28

243

23

253

16

269

18

272,5

22

280

14

285

Всего

11

2782,5

290,5 – 350,5

27

292

2

325,5

12

335

17

339

11

344

Всего

5

1635,5

350,5 – 410,5

10

375

9

410,5

Всего

2

785,5

ИТОГО

30

7303,5

На основе групповых итоговых строк формируется итоговая таблица 4, представляющая интервальный ряд распределения домохозяйств по валовому доходу в год.

Таблица 4

Распределение домохозяйств по валовому доходу в год, тыс. руб.

Номер группы

Группы домохозяйств по валовому

Доходу в год, тыс. руб.

Х

Число Домохозяйств

F

1

110,5 – 170,5

4

2

170,5 – 230,5

8

3

230,5 – 290,5

11

4

290,5 – 350,5

5

5

350,5 – 410,5

2

Итого

30

Частоты групп в относительном выражении, накопленные (кумулятивные) частоты Sj, получаемые путем последовательного суммирования частот всех предшествующих (J-1) интервалов, и накопленные частости, рассчитываемые по формуле запишем в таблице5.

Таблица 5

Структура домохозяйств по валовому доходу в год

№ группы

Группы домохозяйств по валовому

Доходу в год, тыс. руб.

Число Домохозяйств, Fj

Накопленная

Частота,

Sj

Накопленная

Частоcть, %

В абсолютном выражении

В % к итогу

1

110,5 – 170,5

4

13,3

4

13,3

2

170,5 – 230,5

8

26,7

12

40,0

3

230,5 – 290,5

11

36,7

23

76,7

4

290,5 – 350,5

5

16,7

28

93,3

5

350,5 – 410,5

2

6,7

30

100,0

Итого

30

100,0

Вывод: Анализ интервального ряда распределения изучаемой совокупности домохозяйств показывает, что распределение домохозяйств по валовому доходу не является равномерным: преобладают домохозяйства с валовым доходом 230,5 – 290,5 тыс. руб. в год (это 11 домохозяйств, доля которых составляет 36,7%).

2) Нахождение моды и медианы получаемого интервального ряда распределения графическим методом и путем расчётов.

Мода и медиана являются структурными средними величинами, характеризующими центр распределения единиц совокупности по распределяемому признаку.

Мода Мо для дискретного ряда – это значение признака, наиболее часто встречающееся у единиц исследуемой совокупности. В интервальном вариационном ряду модой приближённо считается центральное значение модального интервала.

Для определения моды графическим методом строим по данным табл. 4 гистограмму распределения домохозяйств по валовому доходу в год.

Рис. 1 Определение моды графическим методом

Конкретное значение моды определяется по формуле:

,

Где – начало интервала, содержащего моду;

– величина интервала, содержащего моду;

– частота того интервала, в котором расположена мода;

– частота интервала, предшествующего модальному;

– частота интервала, следующего за модальным.

Согласно табл. 3 модальным интервалом построенного ряда является интервал 230,5 – 290,5 тыс. руб., так как его частота максимальна (F3 = 11).

Получаем:

тыс. руб.

Вывод: для рассматриваемой совокупности домохозяйств наиболее распространённый валовой доход составляет 250,5 тыс. руб.

Медиана Ме – это значение признака, приходящееся на середину ранжированного ряда. По обе стороны от медианы находится одинаковое количество единиц совокупности.

Для определения медианы графическим методом строим по данным табл.5 кумуляту распределения домохозяйств по изучаемому признаку.

Рис. 2 Определение медианы графическим методом

Конкретное значение медианы для интервального ряда рассчитывается по формуле:

Где – начало интервала, содержащего медиану;

– величина интервала, содержащего медиану;

– сумма всех частот;

– накопленная частота на начало интервала, предшествующего медианному;

– частота того интервала, в котором расположена медиана.

Определяем медианный интервал, используя табл.5. Медианным интервалом является интервал 230,5 – 290,5 тыс. руб., т. к. именно в этом интервале накопленная частота Sj = 23 впервые превышает полусумму всех частот равную

.

Имеем:

тыс. руб.

Вывод: в рассматриваемой совокупности домохозяйств одна половина домохозяйств имеет валовой доход не более 246,864 тыс. руб., а другая – более 246,864 тыс. руб.

3) Для расчета средней арифметической, среднего квадратического отклонения и коэффициента вариации на основе таблицы 5 строим вспомогательную таблицу 6 ( – середина J-го интервала).

Таблица 6

Расчетная таблица для нахождения характеристик ряда распределения

Группы домохозяйств по валовому доходу в год, тыс. руб.

110,5 – 170,5

140,5

4

562

-106

11236

44944

170,5 – 230,5

200,5

8

1604

-46

2116

16928

230,5 – 290,5

260,5

11

2865,5

14

196

2156

290,5 – 350,5

320,5

5

1602,5

74

5476

27380

350,5 – 410,5

380,5

2

761

134

17956

35912

Итого

30

7395

127320

Расчет средней арифметической взвешенной:

тыс. руб.

Расчет дисперсии:

Расчет среднего квадратического отклонения:

тыс. руб.

Расчет коэффициента вариации:

Вывод: Анализ полученных значений показателей и говорит о том, что средняя величина валового дохода на одного члена домохозяйства в год составляет 246,5 тыс. руб., отклонение от этой величины в ту или иную сторону составляет в среднем 65,146 тыс. руб. (или 26,43%).

Значение не превышает 33%, следовательно, вариация валового дохода на одного члена домохозяйства в год и совокупность по данному признаку однородна. Расхождение между значениями , Мо и Ме незначительно (, ), что подтверждает вывод об однородности совокупности. Таким образом, найденное среднее значение – 246,5 тыс. руб. валового дохода на одного члена домохозяйства в год является типичной, надежной характеристикой исследуемой совокупности домохозяйств.

4) Вычислим среднюю арифметическую по исходным данным. Для расчета применим формулу средней арифметической простой:

тыс. руб.

Причина расхождения средних величин, рассчитанных по исходным данным – 243,45 тыс. руб. и по интервальному ряду распределения – 246,5 тыс. руб., заключается в том, что в первом случае средняя определяется по фактическим значениям исследуемого признака для всех 30-ти домохозяйств, а во втором случае в качестве значений признака берутся середины интервалов и, следовательно, значение средней будет менее точным.

Задание 2.

По результатам выполнения задания 1 с вероятностью 0,683 определите:

1) ошибку выборки среднего валового дохода на одного члена домохозяйства в год и границы, в которых он будет находиться домохозяйств генеральной совокупности.

2) ошибку выборки доли домохозяйств со средней величиной валового дохода на одного члена домохозяйства в год 290,5 тыс. руб. и более и границы, в которых будет находиться генеральная доля.

Решение. 1) По условию выборочная совокупность насчитывает 30 домохозяйств, выборка 1%-ная механическая, следовательно, генеральная совокупность включает 3000 домохозяйств. Выборочная средняя и дисперсия определены в Задании 1 (п. 3). Значения параметров, необходимых для решения задачи, представлены в табл. 7:

Таблица 7


Р

T

N

N

0,683

1

30

3000

246,5

4244

Рассчитаем среднюю ошибку выборки:

тыс. руб.

Рассчитаем предельную ошибку выборки:

тыс. руб.

Определим доверительный интервал для генеральной средней:

Вывод: На основании проведенного выборочного обследования с вероятностью 0,683 можно утверждать, что для генеральной совокупности домохозяйств средний валовый доход на одного члена домохозяйства в год находится в пределах от 234,666 тыс. руб. до 258,334 тыс. руб.

2) Доля единиц выборочной совокупности, обладающих тем или иным заданным свойством, выражается формулой

,

Где M – число единиц совокупности, обладающих заданным свойством;

N – общее число единиц в совокупности.

Для собственно-случайной и механической выборки с бесповторным способом отбора предельная ошибка выборки доли единиц, обладающих заданным свойством, рассчитывается по формуле

Где W – доля единиц совокупности, обладающих заданным свойством;

(1 – W) – доля единиц совокупности, не обладающих заданным свойством,

N – число единиц в генеральной совокупности,

N – число единиц в выборочной совокупности.

По условию задания исследуемым свойством домохозяйств является равенство или превышение валового дохода уровня в 290,5 тыс. руб.

Число домохозяйств с данным свойством определяется из табл. 3:

M = 30.

Рассчитаем выборочную долю:

Рассчитаем ошибку выборки для доли:

Рассчитаем предельную ошибку выборки для доли:

тыс. руб.

Определим доверительный интервал генеральной доли:

Или

15,6% ≤ Р ≤ 31%.

Вывод: С вероятностью 0,683 можно утверждать, что в генеральной совокупности домохозяйств района доля домохозяйств со средней величиной валового дохода на одного члена домохозяйства в год 290,5 тыс. руб. и более будет находиться в пределах от 15,6% до 31%.

© 2011-2024 Контрольные работы по математике и другим предметам!