В нашей библиотеке: 321 книг 226 авторов 0 статей За всё время нас посетило 859179 человек которые просмотрели 17084851 страниц.
Читатели оставили 10 отзывов о писателях, 68 отзывов о книгах и 6 о сайте


Название: Основы статистики с элементами теории вероятностей для экономистов

Автор: Ниворожкина Людмила Ивановна

Жанр: Учебники, лекции и словари

Рейтинг:

Просмотров: 2342

Страница: | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 11 | 12 | 13 | 14 | 15 | 16 | 17 | 18 | 19 |




6. вариационные ряды и их характеристики

 

6.1. Понятие вариационного ряда. Виды вариационных рядов

 

Прежде чем приступить к рассмотрению вариационных рядов дадим определение другим понятиям, используемым в статистике. Так, совокупность предметов или явлений, объединенных каким-либо общим признаком или свойством качественного или количественного характера, называется объектом наблюдения.

Всякий объект статистического наблюдения состоит из отдельных элементов — единиц наблюдения.

Результаты статистического наблюдения представляют собой числовую информацию —  данные.

Статистические данные — это сведения о том, какие значения принял интересующий исследователя

признак в статистической совокупности. Признаки бывают количественными и качественными.

Количественным называется признак, значения которого выражаются числами.

Качественным  называется  признак,  характеризующийся  некоторым  свойством  или состоянием элементов совокупности.

Статистическая совокупность называется генеральной, если исследованию подлежат все элементы совокупности (сплошное наблюдение).

Часть элементов генеральной совокупности, подлежащая исследованию, называется выборочной совокупностью (выборкой). Она извлекается из генеральной совокупности случайно, так чтобы каждый из п элементов выборки имел равные шансы быть отобранным.

Значения признака, которые при переходе от одного элемента совокупности к другому изменяются (варьируют), называются вариантами и обычно обозначаются малыми латинскими буквами х, у,z.

Порядковый номер варианта (значения признака) называется рангом: х1 — 1-й вариант (1-е значение признака), х2 — 2-й вариант (2-е значение признака), хi— i-й вариант (i-e значение признака).

Ряд значений признака (вариантов), расположенных в порядке возрастания или убывания с соответствующими им весами, называется вариационным рядом (рядом распределения).

В качестве весов выступают частоты или частости.

Частота (т) показывает, сколько раз встречается тот или иной вариант (значение признака) в статистической совокупности.

 

 
Частость или относительная частота (ωi) показывает, какая часть единиц совокупности имеет тот или иной вариант. Частость рассчитывается как отношение частоты того или иного варианта к сумме всех частот ряда

 

Сумма всех частостей равна 1

Вариационные ряды бывают дискретными и интервальными.

Дискретные вариационные ряды строят обычно в том случае, .если значения изучаемого признака могут отличаться друг от друга не менее чем на некоторую конечную величину. В дискретных вариационных рядах задаются точечные значения признака. Общий вид дискретного вариационного ряда показан в табл. 6.1, где i = 1, 2, ..., k.

Таблица 6.1

Значения признака (xi)

x1

x2

 

xk

Частоты (тi)

т1

m2

 

mk

 

 

Интервальные вариационные ряды строят обычно в том случае, если значения изучаемого признака могут отличаться друг от друга на сколь угодно малую величину. Значения признака в них задаются в виде интервалов. Общий вид интервального вариационного ряда показан в табл. 6.2, где i= 1, 2, ..., l.

Таблица 6.2

 

Значения признака (xi)

а1-а2

a2-a3

...

ai-1-ai

Частоты (тi)

m1

т2

...

ml

 

В интервальных вариационных рядах в каждом интервале выделяют верхнюю и нижнюю границы. Разность между верхней и нижней границами интервала называется интервальной разностью или длиной (величиной) интервала.

Величина 1-го интервала k1 определяется по формуле k1 = a2 - а1; 2-го — k2= а3- a2 последнего:

k1=ai-ai-1

В общем виде интервальную разность ki представим как

ki=xi(max)-xi(min)        (6.3)

 

Если интервал имеет обе границы, то его называют закрытым.

Первый и последний интервалы могут быть открытыми, т. е. иметь только одну границу. Например,

1-й интервал может быть задан как «до 100», 2-й — «100-110», .... предпоследний — «190-200», последний — «200 и более». Очевидно, что 1-й интервал не имеет нижней границы, а последний — верхней, оба они — открытые.

Часто  открытые  интервалы  приходится  условно  закрывать.  Обычно  для  этого  величину  1-го интервала принимают равной величине 2-го, а величину последнего — величине предпоследнего. В нашем примере величина 2-го интервала равна 110 - 100 = 10, следовательно, нижняя граница 1-го условно составит 100 - 10 = 90; величина предпоследнего равна 200 - 190 = 10, значит, верхняя граница последнего условно составит 200 + 10 = 210.

Кроме этого в интервальном вариационном ряде могут встречаться интервалы разной длины. Если интервалы  в   вариационном   ряде  имеют  одинаковую  длину  (интервальную  разность),  их называют равновеликими, в противном случае — неравновеликими.

 

 
При построении интервального вариационного ряда часто встает проблема выбора величины интервалов (интервальной разности). Для определения оптимальной величины интервалов (в том случае,если строится ряд с равными интервалами) применяют формулу Стэрджесса

 

где п — число единиц совокупности; хmax  и xmin наибольшее и наименьшее значения вариантов ряда.

Для      характеристики          вариационного          ряда     наряду с          частотами       и          частостями            используются

накопленные частоты и частости. Накопленные частоты (частости) показывают, сколько единиц совокупности (какая их часть) не превышают заданного значения (варианта) х.

Их можно рассчитать по данным дискретного ряда, пользуясь формулой

 

vi = тi + тi-1 +...+ т1.  (6.5)

Для интервального вариационного ряда — это сумма частот (частостей) всех интервалов, не превышающих данный.

 

 
Дискретный вариационный ряд графически можно представить с помощью полигона распределения частот или частостей (рис.6.1).

 

Интервальные вариационные ряды графически можно представить с помощью гистограммы, т. е,

столбчатой диаграммы (рис. 6.2).

 

При ее построении по оси абсцисс откладываются значения изучаемого признака (границы интервалов). В том случае, если интервалы одинаковой величины, по оси ординат можно откладывать частоты или частости. Если же интервалы имеют разную величину, по оси ординат необходимо откладывать значения абсолютной или относительной плотности распределения. Абсолютная плотность — отношение частости интервала к его величине:

 

где f(a)i — абсолютная плотность i-го интервала;

mi — его частота;

ki— величина (интервальная разность).

Абсолютная плотность показывает, сколько единиц совокупности приходится на единицу интервала.

Относительная плотность — отношение частости интервала к его величине:

 

где f(0). — относительная плотность i-го интервала;

wi — его частость.

Относительная плотность показывает, какая часть единиц совокупности приходится на единицу ин-

тервала.

И дискретные, и интервальные вариационные ряды графически можно представить в виде кумуляты и огивы. При построении первой по данным дискретного ряда по оси абсцисс откладываются значения признака (варианты), а по оси ординат — накопленные частоты или частости. На пересечении значений признака (вариантов) и соответствующих им накопленных частот (частостей) строятся точки, которые в свою очередь соединяются отрезками или кривой. Получающаяся таким образом ломаная (кривая) называется кумулятой (кумулятивной кривой). Абсциссами ее точек являются верхние границы интервалов. Ординаты образуют накопленные частоты (частости) соответствующих интервалов. Часто добавляют еще одну точку, абсциссой которой является нижняя граница первого интервала, а ордината равна нулю. Соединяя точки отрезками или кривой, получаем кумуляту.

Огива строится аналогично кумуляте с той лишь разницей, что на оси абсцисс наносятся точки, соответствующие накопленным частотам (частостям), а по оси ординат — значения признака (варианты).

 

6.2. Числовые характеристики вариационного ряда

 

Одной из  основных числовых характеристик ряда распределения (вариационного ряда) является

средняя арифметическая.

Существует две формулы расчета средней арифметической: простая и взвешенная. Простую среднюю арифметическую обычно используют, когда данные наблюдения не сведены в вариационный ряд либо все частоты равны единице или одинаковы

где хi — i-e значение признака; п — объем ряда (число наблюдений; число значений признака).

Если частоты отличны друг от друга, расчет производится по формуле средней арифметической

взвешенной

где  хi   —  i-e  значение  признака;  тi   —  частота  i-го  значения  признака;  k  —  число  его  значений

(вариантов).

 

 
При расчете средней арифметической в качестве весов могут выступать и частости, тогда формула расчета средней арифметической взвешенной примет следующий вид:

 

где хi  — i-e значение признака; ωi  — частость i-го значения признака; k — число его значений (вари-

антов).

Колеблемость изучаемого признака можно охарактеризовать с помощью различных показателей вариации. К числу основных показателей вариации относятся: дисперсия, среднее квадратическое отклонение, коэффициент вариации.

 

 
Дисперсию можно рассчитать по простой и взвешенной формулам, имеющим вид

 

Среднее квадратическое отклонение рассчитывается по формуле

Коэффициент вариации определяется формулой

Пример 1. При обследовании 50 членов семей рабочих и служащих установлено следующее количество членов семьи: 5;3;2;1;4;6;3;7;9;1;3;2;5; 6; 8; 2; 5; 2; 3; 6; 8; 3; 4; 4; 5; 6; 5; 4; 7; 5; 6; 4; 8; 7;

4; 5; 7; 8; 6; 5; 7; 5; 6; 6; 7; 3; 4; 6; 5; 4.

1)  Составьте вариационный ряд распределения частот.

2) Постройте полигон распределения частот, кумуляту.

3) Определите средний размер (среднее число членов) семьи.

4)  Охарактеризуйте колеблемость размера  семьи  с  помощью  показателей вариации  (дисперсии,

среднего квадратического отклонения, коэффициента вариации).

Объясните полученные результаты, сделайте выводы.

Решение. 1) В данной задаче изучаемый признак является дискретно варьирующим, так как размер семей не может отличаться друг от друга менее чем на одного человека. Следовательно, необходимо построить дискретный вариационный ряд. Чтобы сделать это, необходимо подсчитать, сколько раз встречаются те или иные значения признака, и расположить их в порядке возрастания или убывания. Значения изучаемого признака — размер семьи — обозначим xi, частоты — тi.

Произведем упомянутые расчеты и запишем их результаты в табл. 6.3.

Таблица 6.3

 

хi

1

2

3

4

5

6

7

8

9

mi

2

4

6

8

10

9

6

4

1

 

 

2) Дискретный вариационный ряд можно представить графически, построив полигон распределения частот или частостей (рис. 6.3).

 

 
Для того чтобы построить кумуляту, необходимо рассчитать накопленные частоты или частости. Накопленная  частота  1-го  варианта  (х1   =  1)  равна  самой  частоте  этого  варианта,  т.  е.  v1   =  2. Накопленная частота 2-го варианта (х2 = 2) равна сумме частот 1-го и 2-го вариантов, т.е. v2 = 2 + 4 = 6. Далее, аналогично v3 = 12; v4 = 20; v5 = 30; v6 = 39; v7= 45; v8 = 49;  v9 =50.

 

 

 
Построим кумуляту (рис. 6.4).

 

3) Рассчитаем средний размер (среднее число членов) семьи. Так как частоты отличны друг от друга,

расчет средней арифметической произведем по формуле (6.9)

Средний размер семьи — 5,06 чел.

 

4) Так как частоты неодинаковы, для расчета дисперсии размера семьи используем формулу (6.12)

 

 
Дисперсия размера семьи — 3,6964 чел2. Найдем среднее квадратическое отклонение размера семьи по формуле (6.13)

 

Среднее квадратическое отклонение размера семьи — 1,9226 чел.

 

 
Найдем коэффициент вариации размера семьи по формуле (6.14)

 

Коэффициент вариации составляет 38%. Так как коэффициент вариации больше 35%, можно сделать вывод о том, что изучаемая совокупность семей является неоднородной, чем и объясняется высокая колеблемость размера семьи в данной совокупности.

Ввиду неоднородности семей, попавших в выборку, использование средней арифметической для характеристики наиболее типичного уровня размера семьи не вполне оправданно — средняя арифметическая   нетипична   для   изучаемой   совокупности,   в   качестве   характеристики   наиболее типичного уровня размера семьи в данной совокупности лучше использовать моду или медиану.

 

Пример 2. Имеются данные о годовой мощности предприятий цементной промышленности в 1996 г.

 

Предприятия с годовой мощностью, тыс. т

Количество предприятий

До 500

27

500 - 1 000

11

1 000 - 2 000

8

2 000 - 3 000

8

Свыше 3 000

2

 

 

1) Постройте гистограмму, кумуляту.

2) Рассчитайте среднюю мощность предприятий.

3) Найдите дисперсию, среднее квадратическое отклонение, коэффициент вариации.

Объясните полученные результаты, сделайте выводы.

Решение. 1) Данные о годовой мощности предприятий цементной промышленности представлены в виде интервального вариационного ряда — значения признака заданы в виде интервалов. При этом первый и  последний интервалы —  открытые: оба интервала не имеют одной из  границ. Наконец, данный интервальный вариационный ряд — с неравными интервалами: интервальные разности (раз- ность между верхней и нижней границами) интервалов неодинаковы. Условно закроем границы от- крытых интервалов.

Интервальная разность 2-го интервала

1 000 - 500 = 500.

Следовательно, нижняя граница 1-го интервала

500 - 500 = 0.

Интервальная разность предпоследнего интервала

3 000 - 2 000 = 1 000.

Следовательно, верхняя граница последнего интервала

3 000 + 1 000 = 4 000.

В результате, получим следующий вариационный ряд (табл. 6.4):

Таблица 6.4

 

xi

mi

0-500

27

500 - 1 000

11

1 000 - 2 000

8

2 000 - 3 000

8

3 000 - 4 000

2

 

 

Учитывая неодинаковую величину интервалов, для построения гистограммы рассчитаем абсолютные плотности распределения по формуле (6.6)

 

 

 

Построим гистограмму (рис. 6.5).

 

Для того чтобы построить кумуляту, необходимо рассчитать накопленные частоты или частости.

Накопленная частота нижней границы 1-го варианта х = 0 равна нулю. Накопленная частота верхней границы 1-го интервала равна его частоте, т. е. 27.

Накопленная частота верхней границы 2-го интервала равна сумме частот 1-го и 2-го интервалов,

т.е.27 + 11 = 38.

Далее, аналогично 38 + 8 =46; 46 + 8 = 54; 54 + 2 = 56.

Построим кумуляту (рис. 6.6).

 

2)  Рассчитаем  среднюю  мощность  предприятий цементной  промышленности в  1996  г.  Так  как частоты интервалов разные, используем для расчета средней арифметической формулу (6.9). При расчете числовых характеристик интервального вариационного ряда в качестве значений признака принимаются середины интервалов, найдем их.

 

 

Теперь расчет средней арифметической примет вид

 

 

Средняя мощность предприятий цементной промышленности в 1996 г. составляла 964,29 тыс. т.

 

Следует отметить, что использование с той или иной целью средней арифметической, рассчитанной по данным интервального ряда с открытыми интервалами, может привести к серьезным ошибкам. Это связано с тем, что открытые интервалы закрываются условно, в действительности значения признака у объектов, попадающих в открытые интервалы, могут выходить далеко за их условные границы.

 

В связи с этим для оценки наиболее типичного уровня изучаемого признака по данным интервального ряда с открытыми интервалами лучше использовать моду или медиану.

 

3) Оценим колеблемость мощности предприятий цементной промышленности в 1996 г.

 

Так как частоты неодинаковы, для расчета дисперсии используем формулу (6.12)

 

Дисперсия мощности предприятий — 862 563,78 (тыс. т)2.

Haii,lleM cpe,11Hee I<Ba,llpaTH'iecKoe oTKnoHeHHe MOillHOCTH npe,11npHHTHH no ,P opMYne (6.13)

 

=   862 563,78 "'928,74.

 

Cpe,IIHee I<Ba,llpaTH'iecKoe oTKnoHeHHe MOillHOCTH npe,11npHHTHH-928,74 Th!C. T.

 

Найдем коэффициент вариации по формуле (6.14)

 

Коэффициент вариации  годовой  мощности предприятий цементной промышленности составляет

96,31%. Поскольку он больше 35%, можно сделать вывод о том, что изучаемая совокупность предприятий является неоднородной, в ее состав вошли и крупные и мелкие предприятия, что и обусловило высокую колеблемость годовой мощности.

 

Следовательно, использование средней арифметической для характеристики наиболее типичного уровня годовой мощности предприятий цементной промышленности неверно — средняя арифметическая нетипична для изучаемой совокупности. Это еще раз подтверждает необходимость использования моды или медианы для характеристики наиболее типичного уровня годовой мощности данной совокупности предприятий цементной промышленности.

 

Задачи к теме 6

1. По данным выборочного обследования получено следующее распределение семей по среднедушевому доходу

 

Среднедушевой доход семьи в месяц, у. е.

 

до 25

 

25-50

 

50-75

 

75-100

 

100-125

 

125-150

 

150 и выше

Количество обследованных семей

 

 

46

 

 

236

 

 

250

 

 

176

 

 

102

 

 

78

 

 

12

 

 

Постройте гистограмму распределения частот. Найдите cреднедушевой доход семьи в выборке, дисперсию, среднее квадратическое отклонение, коэффициент вариации. Объясните полученные результаты.

 

2. Постройте гистограмму частот, найдите среднюю заработную работников одного из цехов промышленного предприятия.

 

Заработная плата, у. е.

 

50-75

 

75-100

 

125-150

 

150-175

 

175-200

 

200-225

Число работников

 

12

 

23

 

37

 

19

 

15

 

9

 

 

Рассчитайте среднюю арифметическую, среднее квадратическое отклонение, коэффициент вариации заработной платы.

 

3. Ниже представлена группировка отраслей и подотраслей промышленности по темпам роста цен на изготавливаемую продукцию за период с начала года.

 

Сентябрь 1996

г., % к декабрю

1995 г.

 

92,1-100,0

 

100,1-108,0

 

108,1-116,0

 

116,1-124,0

 

124,1-132,0

 

132,1-140,0

Число отраслей и подотраслей, единиц

 

 

4

 

 

15

 

 

21

 

 

31

 

 

19

 

 

18

 

 

Найдите среднюю арифметическую, дисперсию, среднее квадратическое отклонение, коэффициент вариации. Постройте гистограмму. Сделайте выводы.

 

4. По результатам выборочного обследования торговых киосков города получены следующие данные о дневной выручке частного бизнеса.

 

Выручка от продажи товара, тыс. у. е.

до 1

1-1,2

1,2-1,4

1,4-1,6

1,6-1,8

1,8-2,0

2,0 и выше

Число торговых киосков

10

12

22

26

18

7

5

 

 

Постройте гистограмму распределения частот. Найдите среднедневную выручку от продажи товаров, дисперсию, среднее квадратическое отклонение, коэффициент вариации. Объясните полученные результаты.

 

5. Имеются данные о денежной эмиссии, осуществлявшейся ЦБ РФ в период 1991-1994 гг.

 

Годы

1991

1992

1993

1994

Размер эмиссии,

млрд руб.

 

89,3

 

1 513,0

 

10 904,8

 

23169,9

 

 

Найдите  среднегодовой  размер  эмиссии  за  указанный  период.  Охарактеризуйте  колеблемость размера эмиссии с помощью различных показателей вариации.

 

6.  Для  оценки  состояния  деловой  активности  промышленных  предприятий  различных  форм собственности были проведены выборочные бизнес-обследования и получены следующие результаты:

 

Интервалы значений показателя деловой активности, бал.

 

 

0-8

 

 

8-16

 

 

16-24

 

 

24-32

Число предприятий (акционерные общества открытого типа)

 

 

10

 

 

15




Страница: | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 11 | 12 | 13 | 14 | 15 | 16 | 17 | 18 | 19 |

Оцените книгу: 1 2 3 4 5

Добавление комментария:






Информацию в электронную библиотеку yourforexschool.com добавляют исключительно для ознакомления. Если вы являетесь автором книги или компанией которая имеет права распространения и вы хотите чтоб на сайте не было вашей книги, то напишите в обратную связь и мы незамедлительно удалим её.

Копирование материалов сайта разрешено только с использованием активной ссылки на yourforexschool.com Copyright © 2010