В нашей библиотеке: 321 книг 226 авторов 0 статей За всё время нас посетило 888161 человек которые просмотрели 17512935 страниц.
Читатели оставили 10 отзывов о писателях, 69 отзывов о книгах и 6 о сайте


Название: Основы статистики с элементами теории вероятностей для экономистов

Автор: Ниворожкина Людмила Ивановна

Жанр: Учебники, лекции и словари

Рейтинг:

Просмотров: 2400

Страница: | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 11 | 12 | 13 | 14 | 15 | 16 | 17 | 18 | 19 |




8. проверка статистических гипотез

В процессе статистического анализа иногда бывает необходимо сформулировать и проверить предположения (гипотезы) относительно величины независимых параметров или закона распределения изучаемой генеральной совокупности (совокупностей). Например, исследователь выдвигает гипотезу о том, что «выборка извлечена из нормальной генеральной совокупности» или «генеральные средние двух  анализируемых  совокупностей  равны».  Такие  предположения  называются  статистическими

гипотезами.

Сопоставление высказанной гипотезы относительно генеральной совокупности с имеющимися выборочными данными, сопровождаемое количественной оценкой степени достоверности получаемого вывода и осуществляемое с помощью того или иного статистического критерия, называется проверкой статистических гипотез.

Выдвинутая гипотеза называется нулевой (основной). Ее принято обозначать Н0.

По отношению к высказанной (основной) гипотезе всегда можно сформулировать альтернативную

(конкурирующую), противоречащую ей. Альтернативную (конкурирующую) гипотезу принято обозначать Н1 .

Цель статистической проверки гипотез состоит в том, чтобы на основании выборочных данных

принять решение о справедливости основной гипотезы Н0

Если  выдвигаемая  гипотеза  сводится  к  утверждению  о  том,  что  значение  некоторого

неизвестного параметра генеральной совокупности в точности равно заданной величине, то эта гипотеза называется простой, например: «Среднедушевой совокупный доход населения России составляет 650 руб. в месяц»; «Уровень безработицы (доля безработных в численности экономически активного населения) в России равен 9%». В других случаях гипотеза называется сложной.

В  качестве нулевой  гипотезы Н0   принято выдвигать простую гипотезу, так  как  обычно бывает удобнее проверять более строгое утверждение.

По  своему  содержанию  статистические  гипотезы  можно  подразделить  на  несколько  основных типов*:

— гипотезы о виде закона распределения исследуемой случайной величины;

— гипотезы о числовых значениях параметров исследуемой генеральной совокупности**;

—  гипотезы об  однородности двух  или  нескольких выборок или  некоторых характеристик анализируемых совокупностей;

—        гипотезы об общем виде модели, описывающей статистическую зависимость между признака-

ми; и др.

* В этой работе рассматриваются первые два типа гипотез.

** Эти гипотезы часто называют параметрическими, тогда как все остальные — непараметрическими.

 

Так как проверка статистических гипотез осуществляется на основании выборочных данных, т. е. ограниченного ряда наблюдений, решения относительно нулевой гипотезы Н0  имеют вероятностный характер. Другими словами, такое решение неизбежно сопровождается некоторой, хотя возможно и очень малой, вероятностью ошибочного заключения как в ту, так и в другую сторону.

Так, в какой-то небольшой доле случаев α нулевая гипотеза Н0  может оказаться отвергнутой, в то время как в действительности в генеральной совокупности она является справедливой. Такую ошибку называют ошибкой 1-го рода, а ее вероятность — 1 уровнем значимости и обозначают α.

Наоборот, в какой-то небольшой доле случаев β нулевая гипотеза Н0 принимается, в то время как на

самом деле в генеральной совокупности она ошибочна, а справедлива альтернативная гипотеза Н1.

Такую  ошибку  называют  ошибкой  2-го  рода.  Вероятность  ошибки  2-го  рода  обозначается  как  β.

Вероятность 1 - β называют мощностью критерия.

При фиксированном объеме выборки можно выбрать по своему усмотрению величину вероятности

только одной из ошибок α или β. Увеличение вероятности одной из них приводит к снижению другой. Принято задавать вероятность ошибки 1-го рода α  — уровень значимости. Как правило, пользуются некоторыми стандартными значениями уровня значимости α: 0,1; 0,05; 0,025; 0,01; 0,005; 0,001. Тогда, очевидно,  из  двух  критериев,  характеризующихся  одной  и  той  же  вероятностью  α   (отклонить

правильную в действительности гипотезу Н0), следует принять тот, которому соответствует меньшая

ошибка 2-го  рода β, т.е. большая мощность. Снижения вероятностей обеих ошибок α  и  β  можно

добиться путем увеличения объема выборки.

Правильное решение относительно нулевой гипотезы Н0 также может быть двух видов:

— будет принята нулевая гипотеза Н0, когда в генеральной совокупности верна нулевая гипотеза Н0 ;

вероятность такого решения 1 - α;

—  нулевая  гипотеза  Н0    будет  отклонена  в  пользу  альтернативной  Н1,  когда  в  генеральной

совокупности  нулевая  гипотеза  Н0   отклоняется  в  пользу  альтернативной  Н1,  вероятность  такого

решения 1 - β — мощность критерия.

Результаты решения относительно нулевой гипотезы можно проиллюстрировать с помощью табл.

8.1.

 

Таблица 8.1

 

Нулевая гипотеза Н0

Результаты решения относительно нулевой гипотезы Н0

Отклонена

Принята

 

 

Верна

 

Ошибка 1-го рода,

ее вероятность

Р(Н1/Н0) = α

Правильное решение, его вероятность

Р(Н0/Н0) = 1 - α

 

 

Неверна

Правильное решение, его вероятность

Р(Н1/Н1) = 1 -  β

 

Ошибка 2-го рода,

ее вероятность

Р(Н0/Н0) = β

 

 

Проверка статистических гипотез осуществляется с помощью статистического критерия (назовем его в общем виде К), являющего функцией от результатов наблюдения.

Статистический критерий — это правило (формула), по которому определяется мера расхожде-

ния результатов выборочного наблюдения с высказанной гипотезой Н0.

Статистический критерий, как и всякая функция от результатов наблюдения, является случайной

величиной и в предположении справедливости нулевой гипотезы Н0  подчинен некоторому хорошо изученному (и затабулированному) теоретическому закону распределения с плотностью распределения f(k).

Выбор критерия для проверки статистических гипотез может быть осуществлен на основании различных  принципов.  Чаще  всего  для  этого  пользуются  принципом  отношения  правдоподобия, который позволяет построить критерий, наиболее мощный среди всех возможных критериев. Суть его сводится к выбору такого критерия К с известной функцией плотности f(k) при условии справедливости гипотезы Н0, чтобы при заданном уровне значимости α можно было бы найти критическую точку К распределения f(k), которая разделила бы область значений критерия на две части: область допустимых значений, в которой результаты выборочного наблюдения выглядят наиболее правдоподобными, и критическую  область,  в  которой  результаты  выборочного  наблюдения  выглядят  менее правдоподобными в отношении нулевой гипотезы Н0.

Если такой критерий К выбран, и известна плотность его распределения, то задача проверки статистической гипотезы сводится к тому, чтобы при заданном уровне значимости α рассчитать по выборочным данным наблюдаемое значение критерия Kнабл определить, является ли оно наиболее или наименее правдоподобным в отношении нулевой гипотезы Н0.

Проверка каждого типа статистических гипотез осуществляется с помощью соответствующего критерия, являющегося наиболее мощным в каждом конкретном случае. Например, проверка гипотезы о виде закона распределения случайной величины может быть осуществлена с помощью критерия согласия   Пирсона   x2;   проверка   гипотезы   о   равенстве   неизвестных   значений   дисперсий   двух генеральных совокупностей — с помощью критерия Фишера F; ряд гипотез о неизвестных значениях

параметров    генеральных   совокупностей           проверяется   с          помощью        критерия         Z          —            нормальной распределенной случайной величины и критерия t-Стьюдента и т. д.

Значение критерия, рассчитываемое по специальным правилам на основании выборочных данных, называется наблюдаемым значением критерия(Kнабл).

Значения критерия, разделяющие совокупность значений критерия на область допустимых

значений (наиболее правдоподобных в отношении нулевой гипотезы Н0) и критическую область (область значений, менее правдоподобных в отношении нулевой гипотезы Н0), определяемые на заданном уровне значимости α  по таблицам распределения случайной величины К, выбранной в качестве критерия, называются критическими точками (Ккр ).

Областью допустимых значений (областью принятия нулевой гипотезы Н0) называют совокуп-

ность значений критерия К, при которых нулевая гипотеза Н0 не отклоняется.

Критической областью называют совокупность значений критерия К, при которых нулевая

гипотеза Н0 отклоняется в пользу конкурирующей Н1.

Различают одностороннюю (правостороннюю или левостороннюю) и двустороннюю критические

области.

Если конкурирующая гипотеза — правосторонняя, например, Н1: а > a0, то и критическая область — правосторонняя (рис. 8.1). При правосторонней конкурирующей гипотезе критическая точка (Ккр.п) принимает положительные значения.

 

 

Если конкурирующая гипотеза — левосторонняя, например, Н1 : а < а0, то и критическая область — левосторонняя (рис. 8.2). При левосторонней конкурирующей гипотезе критическая точка принимает отрицательные значения (Ккр.л).

 

Если конкурирующая гипотеза — двусторонняя, например. Н1: а ≠  а0 , то и критическая область —

двусторонняя (рис.  8.3).  При  двусторонней конкурирующей гипотезе определяются 2  критические

 

 
точки (Ккр.л  и K кр..п)

 

Основной принцип проверки статистических гипотез состоит в следующем:

— если наблюдаемое значение критерия (Кнабл) принадлежит критической области, то нулевая ги-

потеза Н0 отклоняется в пользу конкурирующей H1;

—  если  наблюдаемое значение критерия (Кнабл)  принадлежит области допустимых значений, то

нулевую гипотезу Н0 нельзя отклонить.

Можно принять решение относительно нулевой гипотезы Н0 путем сравнения наблюдаемого (Кнабл) и

критического значений критерия (Ккр. ).

При правосторонней конкурирующей гипотезе:

— если Кнабл≤Ккр. , то нулевую гипотезу Н0нельзя отклонить;

— если Кнабл > Kкр , то нулевая гипотеза Н0 отклоняется в пользу конкурирующей Н1.

При левосторонней конкурирующей гипотезе:

— если Кнабл≥-Ккр, то нулевую гипотезу Н0  нельзя отклонить;

— если Кнабл < -Ккр , то нулевая гипотеза Н0 отклоняется в пользу конкурирующей Н1.

При двусторонней конкурирующей гипотезе:

—  если -Ккр ≤ Кнабл≤ Ккр, то нулевую гипотезу Н0 нельзя отклонить;

— если Кнабл > Ккр или Кнабл < -Ккр, то нулевая гипотеза Н0  отклоняется в пользу конкурирующей Н1.

 

Алгоритм проверки статистических гипотез сводится к следующему:

1) сформулировать нулевую Н0  и альтернативную Н1 гипотезы;

2) выбрать уровень значимости α;

3) в соответствии с видом выдвигаемой нулевой гипотезы Н0 выбрать статистический критерий для ее проверки, т.е. — специально подобранную случайную величину К, точное или приближенное распределение которой заранее известно;

4) по таблицам распределения случайной величины К, выбранной в качестве статистического критерия, найти критическое значение Ккр (критическую точку или точки);

5) на основании выборочных данных по специальному алгоритму вычислить наблюдаемое значение критерия Кнабл;

6) по виду конкурирующей гипотезы Н1 определить тип критической области;

7) определить, в какую область (допустимых значений или критическую) попадает наблюдаемое

значение критерия Кнабл ,  и в зависимости от этого — принять решение относительно нулевой гипотезы

Н0

Следует заметить, что даже в том случае, если нулевую гипотезу Н0  , нельзя отклонить, это не

означает,  что  высказанное  предположение  о  генеральной  совокупности  является  единственно подходящим: просто ему не противоречат имеющиеся выборочные данные, однако таким же свойством наряду с высказанной могут обладать и другие гипотезы.

Можно интерпретировать результаты проверки нулевой гипотезы следующим образом:

—  если  в  результате  проверки  нулевую  гипотезу  Н0   нельзя  отклонить,  то  это  означает,  что имеющиеся  выборочные  данные  не  позволяют  с  достаточной  уверенностью  отклонить  нулевую

гипотезу Н0, вероятность нулевой гипотезы Н0 больше α, а конкурирующей Н1 — меньше 1 - α;

— если в результате проверки нулевая гипотеза Н0  отклоняется в пользу конкурирующей Н1, то

имеющиеся выборочные данные не позволяют с достаточной уверенностью принять нулевую гипотезу

Н0, вероятность нулевой гипотезы Н0 меньше α, а конкурирующей Н1 — больше 1 - α.

Пример 1. В 7 случаях из 10 фирма-конкурент компании «А» действовала на рынке так, как будто ей

заранее были известны решения, принимаемые фирмой «А». На уровне значимости 0,05 определите,

случайно ли это, или в фирме «А» работает осведомитель фирмы-конкурента?

Решение. Для того чтобы ответить на поставленный вопрос, необходимо проверить статистическую гипотезу о том, совпадает ли данное эмпирическое распределение числа действий фирмы-конкурента с равномерным теоретическим распределением?

Если ходы, предпринимаемые конкурентом, выбираются случайно, т. е. в фирме «А» — нет осведомителя (инсайдера), то число «правильных» и «неправильных» ее действий должно распределиться поровну, т. е. по 5 (10/2), а это и есть отличительная особенность равномерного распределения.

Этот вид статистических гипотез относится к гипотезам о виде закона распределения генеральной совокупности.

 

Сформулируем нулевую и конкурирующую гипотезы согласно условию задачи.

Н0 : Х ~ R(a; b) — случайная величина Х подчиняется равномерному распределению с параметрами (a; b) (в контексте задачи — «В фирме «А» — нет осведомителя (инсайдера)»; «Распределение числа удачных ходов фирмы-конкурента — случайно»);

Н1 : случайная величина Х не подчиняется равномерному распределению (в контексте задачи — «В

фирме «А» — есть осведомитель (инсайдер)»;

«Распределение числа удачных ходов фирмы-конкурента — неслучайно»).

В  качестве критерия для  проверки статистических гипотез о  неизвестном законе распределения

генеральной совокупности используется случайная величина χ2  . Этот критерий называют критерием

Пирсона.

 

 
Его наблюдаемое значение (χ2набл) рассчитывается по формуле

 

где m(эмп)i — эмпирическая частота i-й группы выборки; т(теор)i,  — теоретическая частота i-й группы выборки.

 

Составим таблицу распределения эмпирических и теоретических частот (табл. 8.2).

 

Таблица 8.2

 

m(эмп)i

7

3

т(тeop)i

5

5

 

 

 

 
Найдем наблюдаемое значение χ2набл

Критическое  значение  (χ2кр.)   следует  определять  с  помощью  таблиц  распределения  χ2

(приложение 4) по уровню значимости α и числу степеней свободы k.

По условию α = 0,05, а число степеней свободы рассчитывается по формуле

k = п - l - 1,

где k — число степеней свободы; п — число групп выборки; l — число неизвестных параметров предполагаемой  модели,  оцениваемых  по  данным  выборки  (если  все  параметры  предполагаемого закона известны точно, то l = 0).

По условию задачи, число групп выборки (п) равно 2, так как могут быть только 2 варианта действий фирмы-конкурента: «удачные» и «неудачные», а число неизвестных параметров равномерного распределения (l) равно 0.

Отсюда k=2-0-l=l.

кр.

 
Найдем χ2

кр

 
χ2набл.   <  χ2

по уровню значимости α = 0,05 и числу степеней свободы k = 1:

χ2кр(α =0,05 ;k=1). =3.8

.следовательно,  на  данном  уровне  значимости  нулевую  гипотезу  нельзя  отклонить,

расхождения эмпирических и теоретических частот — незначимые. Данные наблюдений согласуются с

гипотезой о равномерном распределении генеральной совокупности.

Это означает, что для утверждения о том, что действия фирмы-конкурента на рынке неслучайны, нет

оснований  и  на  уровне  значимости  α  =  0,05  можно  утверждать, что  в  фирме  «А»  нет  платного

осведомителя фирмы-конкурента.

Ответ.  На  уровне  значимости  α   =  0,05  можно  утверждать,  что  в  фирме  «А»  нет  платного

осведомителя фирмы-конкурента.

Пример  2.  На  уровне  значимости  α  =  0,025  проверить  гипотезу  о  нормальном  распределении

генеральной совокупности, если известны эмпирические и теоретические частоты (табл. 8.3):

 

Таблица 8.3

 

m(эмп)i

5

10

20

25

14

3

т(теор)i

6

14

28

18

8

3

 

 

Решение. Сформулируем нулевую и конкурирующую гипотезы согласно условию задачи.

Нγ:  Х  ~  N(a;  σ2)  —  случайная  величина  Х  подчиняется  нормальному  закону  распределения  с параметрами а и σ2.

Н1. случайная величина Х не подчиняется нормальному закону распределения с параметрами а и σ2.

В качестве критерия для проверки нулевой гипотезы используем критерий Пирсона χ2 .

 

 
Найдем наблюдаемое значение (χ2 набл):

 

Найдем критическое значение критерия (χ2кр   )  по  таблице распределения χ2   (приложение 4) по уровню значимости α и числу степеней свободы k.

По условию α = 0,025; число степеней свободы найдем по формуле

k = п — I - 1,

где k — число степеней свободы;

п — число групп выборки;

I — число неизвестных параметров предполагаемой модели, оцениваемых по данным выборки.

По условию задачи число групп выборки (п) равно 6, а число параметров нормального неизвестных распределения (I) равно 2.

Отсюда k=6-2-1=3.

кр

 
Найдем χ2

по уровню значимости α = 0,025 и числу степеней свободы k = 3:

χ2кр(α=0,025;k=3) =9,4

χ2набл   > χ2кр           следовательно, на данном уровне значимости нулевая гипотеза отклоняется в пользу

конкурирующей, расхождения эмпирических и теоретических частот — значимые. Данные наблюдений

не согласуются с гипотезой о нормальном распределении генеральной совокупности.

Ответ.  На  уровне  значимости  α   =  0,025  данные  наблюдений  не  согласуются  с  гипотезой  о

нормальном распределении генеральной совокупности.

Пример 3. Техническая норма предусматривает в среднем 40 с на выполнение определенной технологической операции на конвейере по производству часов. От работающих на этой операции поступили жалобы, что они в действительности затрачивают на нее больше времени. Для проверки данной жалобы произведены хронометрические измерения времени выполнения этой технологической

операции у 16 работниц, занятых на ней, и получено среднее время выполнения операции ⎯X = 42 с.

Можно  ли  по  имеющимся  хронометрическим данным  на  уровне  значимости  α  =  0,01  отклонить

гипотезу  о  том,  что  среднее  время  выполнения  этой  операции  соответствует  норме,  если:  а)

исправленное  выборочное  среднее  квадратическое  отклонение  s  —3,5  с;  б)  выборочное  среднее

квадратическое отклонение σ— 3,5 с?

Решение. а) Для решения данной задачи необходимо проверить гипотезу о том, что неизвестная

генеральная средняя нормальной совокупности точно равна определенному числу, когда дисперсия генеральной совокупности неизвестна (выборка мала, так как n = 16 меньше 30).

Сформулируем нулевую и конкурирующую гипотезы согласно условию задачи.

H0: а = a0 = 40 — неизвестное математическое ожидание а (нормально распределенной генеральной совокупности с неизвестной дисперсией) равно гипотетически предполагаемому числовому значению a0 (применительно к условию данной задачи — время выполнения технологической операции соответствует норме).

H1: а > 40 — неизвестное математическое ожидание а (нормально распределенной генеральной совокупности с неизвестной дисперсией) больше числового значения a0 (применительно к условию данной задачи — время выполнения технологической операции больше установленной нормы).

Так как конкурирующая гипотеза — правосторонняя, то и критическая область — правосторонняя.

В качестве критерия для сравнения неизвестного математического ожидания а (нормально распределенной генеральной совокупности с неизвестной дисперсией) с гипотетическим числовым значением a0 используется случайная величина t-критерий Стьюдента.

Его наблюдаемое значение (tнабл) рассчитывается по формуле

 

 

 
где X — выборочная средняя; a0 — числовое значение генеральной средней; s — исправленное среднее квадратическое отклонение; п — объем выборки. Найдем наблюдаемое значение tнабл

 

Критическое  значение  (tкр)   следует  находить  с   помощью  таблиц   распределения  Стьюдента

(приложение 5) по уровню значимости α и числу степеней свободы k.

По условию α = 0,01; число степеней свободы найдем по формуле k = п - 1,

где k — число степеней свободы; п — объем выборки.

k = 16 - 1 = 15.

Найдем tкр   по  уровню  значимости α  =  0,01  (для  односторонней критической области) и  числу

степеней свободы k = 15:

tкр(α=0,01;k=1)=2,6

Заметим, что при  левосторонней конкурирующей гипотезе Н1   :  а  <  40  tкр  следует находить по

таблицам  распределения Стьюдента  (приложение 5)  по  уровню  значимости α  (для  односторонней

критической области) и числу степеней свободы k = п - 1 и присваивать ему знак «минус».

При  двусторонней  конкурирующей  гипотезе  Н1    :  а  ≠    40  tкр   следует  находить  по  таблицам

распределения           Стьюдента     (приложение  5)   по   уровню   значимости           α   (для   двусторонней

критической области) и числу степеней свободы k = п - 1.

 

tнабл < tкр , следовательно, на данном уровне значимости нет оснований отклонить нулевую гипотезу.

 

Ответ. По имеющимся хронометрическим данным на уровне значимости α = 0,01 нельзя отклонить гипотезу о том, что среднее время выполнения этой операции соответствует норме. Следовательно, жалобы работниц — необоснованны.

 

Наблюдаемое значение критерия попадает в область допустимых значений (рис. 8.4), следовательно,

 

 
нет оснований отклонить нулевую гипотезу.

 

б) Для решения данной задачи необходимо проверить гипотезу о том, что неизвестная генеральная средняя нормальной совокупности точно равна определенному числу, когда дисперсия генеральной совокупности неизвестна.

Алгоритм решения задачи будет тот же, что и в первом случае. Однако наблюдаемое значение tнабл

рассчитывается по формуле

 

где X— выборочная средняя; а0 — числовое значение генеральной средней; σВЫБ   — выборочное среднее квадратическое отклонение; л — объем выборки. Найдем наблюдаемое значение (tнабл)

 

 

Критическое значение (tкр) следует находить по таблице распределения Стьюдента (приложение 5)

по уровню значимости α и числу степеней свободы k.

 

tнабл         <  tкр   ,  следовательно, на  данном уровне  значимости нет  оснований отвергнуть нулевую гипотезу, жалобы работниц — необоснованны.

Ответ. По имеющимся хронометрическим данным на уровне значимости  α = 0,01 нельзя отклонить

гипотезу о том, что среднее время выполнения этой операции соответствует норме, жалобы работниц —

необоснованны.

 

Пример 4. Изменим условие предыдущей задачи. Техническая норма предусматривает в среднем 40 с на выполнение определенной технологической операции на конвейере по производству часов. От работающих поступили жалобы, что они в действительности затрачивают на эту операцию больше времени. Для проверки данной жалобы произведены хронометрические измерения времени ее выполнения у 36 работниц, занятых на этой операции, и получено среднее время выполнения операции X = 42 с. Можно ли (предполагая время выполнения технологической операции случайной величиной, подчиняющейся нормальному закону) по имеющимся хронометрическим данным на уровне значимости

α = 0,01 отклонить гипотезу о том, что среднее время выполнения этой операции соответствует норме,

если известно, что среднее квадратическое отклонение генеральной совокупности σ составляет 3,5 с?

Решение.  Для  решения  данной  задачи  необходимо  проверить  гипотезу  о  том,  что  неизвестная

генеральная средняя нормальной совокупности точно  равна  числовому значению, когда  дисперсия генеральной совокупности известна (большая выборка, так как п = 36 больше 30).

Сформулируем нулевую и конкурирующую гипотезы согласно условию задачи.

Н0 : а = a0 = 40 — неизвестная генеральная средняя нормально распределенной совокупности с известной дисперсией равна числовому значению (применительно к условию данной задачи — время выполнения технологической операции соответствует норме).

Н1: а > 40 — неизвестная генеральная средняя нормально распределенной совокупности с известной дисперсией больше числового значения (применительно к условию данной задачи — время выполнения технологической операции больше установленной нормы).

Так как конкурирующая гипотеза — правосторонняя, то и критическая область — правосторонняя.

В качестве критерия для сравнения выборочной бедней с гипотетической генеральной средней нормальной   совокупности,   когда   дисперсия   генеральной   совокупности   известна,   используется случайная величина U.

Его наблюдаемое значение (uнабл) рассчитывается по формуле

 

где X— выборочная средняя; а0 — числовое значение генеральной средней; σген — выборочное среднее квадратическое отклонение; п — объем выборки. Найдем наблюдаемое значение (инабл):

 

Так как конкурирующая гипотеза — правосторонняя, критическое значение и следует находить по таблице функции Лапласа (приложение 2) из равенства

Ф0(икр) = (1 - 2α)/2.

По условию α = 0,01.

Отсюда

 

Ф0(икр) = (1 - 2·0,01)/2 = 0,49.

По таблице функции Лапласа (приложение 2) найдем, при каком икр  Ф0(икр) = 0,49.

 

Ф0(2,33) = 0,49.

 

Следовательно, икр = 2,33.

 

Заметим, что при левосторонней конкурирующей гипотезе Н1  : а < 40 uкр  следует находить по

таблице функции Лапласа (приложение 2) из равенства Ф0(uкр  ) = (1 - 2α)/2 и присваивать ему знак

«минус».

При двусторонней конкурирующей гипотезе Н1 : а ≠  40 икр  следует находить по таблице функции

Лапласа (приложение 2) из равенства

 

инабл    >uкр , следовательно, на данном уровне значимости нулевая гипотеза отвергается в пользу конкурирующей. По имеющимся хронометрическим данным с более чем 99%-й надежностью можно утверждать, что среднее время выполнения этой операции превышает норму. Следовательно, жалобы работниц — обоснованны.

Наблюдаемое значение критерия попадает в критическую область (рис. 8.5), следовательно, нулевая гипотеза отвергается в пользу конкурирующей.

Ответ. По имеющимся хронометрическим данным на уровне значимости α = 0,01 можно утверждать,

что среднее время выполнения этой операции превышает норму, жалобы работниц — обоснованны.

Пример 5. Экономический анализ производительности труда предприятий отрасли позволил выдвинуть гипотезу о наличии 2 типов предприятий с различной средней величиной показателя производительности труда. Выборочное обследование 42 предприятий 1-й группы дало следующие результаты: средняя производительность труда    X— 119 деталей. По данным выборочного обследования, на 35 предприятиях 2-й группы средняя производительность труда Ỹ — 107 деталей. Генеральные дисперсии известны: D(X) = 126,91 (дет.2); D(Y) = 136,1 (дет.2). Считая, что выборки извлечены из нормально распределенных генеральных совокупностей Х и Y, на уровне значимости

0,05, проверьте, случайно ли полученное различие средних показателей производительности труда в группах или же имеются 2 типа предприятий с различной средней величиной производительности труда.

Решение. Для решения данной задачи необходимо сравнить 2 средние нормально распределенных генеральных совокупностей, генеральные дисперсии которых известны (большие независимые выбор- ки). В данной задаче речь идет о больших выборках, так как пx  = 42 и пy  =35 больше 30. Выборки — независимые, так как из контекста задачи видно, что они извлечены из непересекающихся генеральных совокупностей.

Сформулируем нулевую и конкурирующую гипотезы согласно условию задачи.

Н0: ⎯X = ⎯Y — генеральные средние 2 нормально распределенных совокупностей с известными

дисперсиями равны (применительно к условию данной задачи — предприятия 2 групп относятся к

одному типу предприятий: средняя производительность труда в 2 группах — одинакова).

Н1:  ⎯X ≠⎯Y  —  генеральные средние 2  нормально распределенных совокупностей с  известными

дисперсиями неравны (применительно к условию данной задачи — предприятия 2 групп относятся к

разному типу предприятий: средняя производительность труда в 2 группах — неодинакова).

Выдвигаем двустороннюю конкурирующую гипотезу, так как из условия задачи не следует, что необходимо выяснить больше или меньше производительность труда в одной из групп предприятий по сравнению с другой.

Поскольку конкурирующая гипотеза — двусторонняя, то и критическая область — двусторонняя.

В качестве критерия для сравнения 2 средних генеральных совокупностей, дисперсии которых известны (большие независимые выборки), используется случайная величина Z.

Его наблюдаемое значение (zнабл) рассчитывается по формуле

 

где X— выборочная средняя для X; Ỹ— выборочная средняя для Y; D(X) — генеральная дисперсия для X; D(Y) — генеральная дисперсия для Y; пx — объем выборки для X; пy — объем выборки для Y. Найдем наблюдаемое значение (zнабл):

Так как конкурирующая гипотеза — двусторонняя, критическое значение (zкр  ) следует находить по таблице функции Лапласа (приложение 2) из равенства

Ф0(zкр) = (1 - α)/2.

По условию α= 0,05.

 

Отсюда

 

 

Ф0(zкр)=(1-0,05)/2=0,475.

 

По таблице функции Лапласа (приложение 2) найдем, при каком zкрФ0(zкр) = 0,475.

 

Ф0(1,96) = 0,475.

Учитывая, что конкурирующая гипотеза — двусторонняя, находим две критические точки:

Заметим, что при левосторонней конкурирующей гипотезе Н1:⎯X < ⎯Y zкр   следует находить по таблице функции Лапласа (приложение 2) из равенства Ф0(zкр  ) = (1 - 2α)/2 и присваивать ему знак

«минус».

При правосторонней конкурирующей гипотезе Н1: ⎯X > ⎯Y zкр находим по таблице функции Лапласа

(приложение 2) из равенства Ф0(zкр)= (1- 2α)/2.

zнабл>  zкрследовательно,  на  данном  уровне  значимости  нулевая  гипотеза  отвергается  в  пользу

конкурирующей. На уровне значимости α= 0,05 можно утверждать, что полученное различие средних

показателей производительности труда в группах неслучайно, имеются 2 типа предприятий с различной

средней величиной производительности труда.

Наблюдаемое значение критерия попадает в критическую область (рис. 8.6), следовательно, нулевая гипотеза отклоняется в пользу конкурирующей.

Ответ.  На  уровне  значимости  α  =  0,05  можно  утверждать,  что  полученное  различие  средних

показателей производительности труда в группах не случайно, имеются 2 типа предприятий с различ-

ной средней величиной производительности труда.

 

Пример 6. Предполагается, что применение нового типа резца сократит время обработки некоторой детали.  Хронометраж  времени  обработки  9  деталей,  обработанных  старым  типом  резцов,  дал следующие результаты: среднее время обработки детали X— 57 мин, исправленная выборочная дисперсия s2x   = 186,2 (мин2). Среднее время обработки 15 деталей, обработанных новым типом резцов,

- Ỹ по данным хронометражных измерений — 52 мин, а исправленная выборочная дисперсия s2y = 166,4 (мин2). На уровне значимости α = 0,01 ответьте на вопрос, позволило ли использование нового типа резцов сократить время обработки детали?

Решение. Для решения данной задачи необходимо сравнить 2 средние нормально распределенных генеральных совокупностей, генеральные дисперсии которых неизвестны, но предполагаются одинаковыми (малые независимые выборки). В этой задаче речь идет о малых выборках, так как пx = 9 и ny = 15 меньше 30. Выборки — независимые, поскольку из контекста задачи видно, что они извлечены из непересекающихся генеральных совокупностей.

Сформулируем нулевую и конкурирующую гипотезы, согласно условию задачи.

Н0: ⎯X = ⎯Y — генеральные средние 2 нормально распределенных совокупностей с неизвестными

дисперсиями (но предполагаемыми одинаковыми) равны (применительно к условию данной задачи —

среднее время, затрачиваемое на обработку детали резцами нового и старого типа, — одинаково, т. е.

использование нового типа резца не позволяет снизить время на обработку детали).

Н1:  ⎯X > ⎯Y — генеральная средняя для Х больше, чем генеральная средняя для Y (применительно к

условию данной задачи — среднее время, затрачиваемое на обработку детали резцами старого типа,

больше, чем — нового, т. е. использование нового типа резца позволяет снизить время на обработку

детали).

Так как конкурирующая гипотеза — правосторонняя, то и критическая область — правосторонняя.

Приступать к проверке гипотезы о равенстве генеральных средних 2 нормально распределенных совокупностей с неизвестными дисперсиями можно лишь в том случае, если генеральные дисперсии равны. В противном случае, данная задача в теории неразрешима.

Поэтому, прежде чем проверять эту гипотезу, проверим гипотезу о равенстве генеральных дисперсий нормальных совокупностей.

Сформулируем нулевую и конкурирующую гипотезы, согласно условию задачи.

Н0: D(X) = D(Y) — генеральные дисперсии 2 нормально распределенных совокупностей равны.

Н1: D(X) > D(Y) — генеральная дисперсия для Х больше генеральной дисперсии для Y. Выдвигаем

правостороннюю  конкурирующую  гипотезу,  так  как  исправленная  выборочная  дисперсия  для  Х

значительно больше, чем исправленная выборочная дисперсия для Y.

Так как конкурирующая гипотеза — правосторонняя, то и критическая область — правосторонняя.

В   качестве   критерия   для   сравнения   2   дисперсий   нормальных   генеральных   совокупностей используется случайная величина F — критерий Фишера-Снедекора (приложение 6).

 

 
Его наблюдаемое значение (fнабл) рассчитывается по формуле

 

где s2б  — большая (по величине) исправленная выборочная дисперсия; s2м  — меньшая (по величине)

исправленная выборочная дисперсия.

Найдем fнабл

Критическое значение (fкр)следует находить с помощью таблицы распределения Фишера-Снедекора

(приложение 6) по уровню значимости α и числу степеней свободы k1 и k2.

По условию α = 0,01; число степеней свободы найдем по формуле

k1= n1 - 1; k2 = n2 - 1,

где k1 — число степеней свободы большей (по величине) исправленной дисперсии; k2 — число степеней свободы меньшей (по величине) исправленной дисперсии; п1 — объем выборки большей (по величине) исправленной  дисперсии;  n2   —  объем  выборки  меньшей  (по  величине)  исправленной  дисперсии. Найдем k1 и k2

 

k1 = 10 - 1 = 9;

k2=15 - 1 = 14.

 

 
Определяем fкр по уровню значимости α = 0,01 и числу степеней свободы k1 =9 и k2=14 :

fнабл< fкр следовательно, на данном уровне значимости нет оснований отвергнуть нулевую гипотезу о равенстве генеральных дисперсий нормальных совокупностей.

Следовательно, можно  приступить  к  проверке гипотезы о  равенстве генеральных средних двух нормально распределенных совокупностей.

В  качестве  критерия  для  проверки  этой  гипотезы  используется случайная  величина  t-критерий

Стьюдента.

Его наблюдаемое значение (tнабл ) рассчитывается по формуле

 

 
где X— выборочная средняя для X;Ỹ— выборочная средняя для Y; s2x  — «неправленная» выборочная дисперсия для X; s2y — «неправленная» выборочная дисперсия для Y; пx — объем выборки, извлеченной из генеральной совокупности X; пy — объем выборки, извлеченной из генеральной совокупностиY. Найдем tнабл,

 

Критическое значение (tкр  ) следует находить по таблице распределения Стьюдента (приложение 5)

по уровню значимости α и числу степеней свободы k.

По условию α = 0,01; число степеней свободы найдем по формуле

k = пx + ny - 2,

где k — число степеней свободы; пx — объем выборки для X; пy — объем выборки для Y.

k = 9 + 15 - 2 = 22.

Найдем t кр  по уровню значимости α  = 0,01 (для односторонней критической области) и числу

 

 
степеней свободы k = 22

 

Заметим, что при левосторонней конкурирующей гипотезе ⎯X < ⎯Y tкр следует находить по таблицам распределения Стьюдента (приложение 5) по уровню значимости α  (для односторонней критической

области) и числу степеней свободы k = пx + пy — 2 и присваивать ему знак «минус».

При  двусторонней  конкурирующей  гипотезе  ⎯X  ≠⎯Y   tкр   находим  по  таблицам  распределения

Стьюдента приложение 5) по уровню значимости α (для двусторонней критической области) и числу

степеней свободы k= пx+ пy - 2.

tнабл < tкр , следовательно, на этом уровне значимости нет оснований отвергнуть нулевую гипотезу. По

имеющимся хронометрическим данным на уровне значимости α  = 0,01 нельзя отклонить гипотезу о

том, что генеральные средние равны, т. е. среднее время, затрачиваемое на обработку детали старым и

новым типом резцов, отличается незначимо, расхождения между средними — случайны, использование нового типа резцов не позволяет снизить время обработки детали.

Наблюдаемое значение критерия попадает в область допустимых значений (рис. 8.7), следовательно,

 

 
нулевую гипотезу нельзя отклонить.

 

Ответ. На уровне значимости α  = 0,01 нельзя утверждать, что использование нового типа резцов позволило сократить время обработки детали.

Пример 7. Партия изделий принимается в том случае, если вероятность того, что изделие окажется соответствующим стандарту, составляет не менее 0,97. Среди случайно отобранных 200 изделий проверяемой партии  оказалось  193  соответствующих стандарту.  Можно  ли  на  уровне  значимости

α = 0,02 принять партию?

Решение. Для решения данной задачи необходимо проверить гипотезу о том, что неизвестная генеральная доля точно равна определенному числу.

Сформулируем нулевую и конкурирующую гипотезы согласно условию задачи.

Н1: р =р0 = 0,97 — неизвестная генеральная доля р равна р0 (применительно к условию этой задачи — вероятность того, что деталь из проверяемой партии окажется соответствующей стандарту, равна 0,97, т. е. партию изделий можно принять).

Н1: р < 0,97 — неизвестная вероятность р меньше гипотетической вероятности p0 (применительно к условию данной задачи — вероятность того, что деталь из проверяемой партии окажется соответствующей стандарту, меньше 0,97, т. е. партию изделий нельзя принять).

Так как конкурирующая гипотеза — левосторонняя, то и критическая область — левосторонняя.

В качестве критерия для сравнения наблюдаемой относительной частоты с гипотетической вероятностью появления события используется случайная величина U.

 

 
Его наблюдаемое значение (uнабл) рассчитывается по формуле

 

где  т/п  —  относительная частота  (частость)  появления  события;p0   —  гипотетическая вероятность появления события; q0 — гипотетическая вероятность непоявления события; п — объем выборки.

По условию т = 193; п = 200; р0 = 0,97; q0 = 1 - р0= 0,03; α = 0,02.

Найдем наблюдаемое значение (uнабл )

 

Так как конкурирующая гипотеза — левосторонняя, то критическое значение (икр ) следует находить по таблице функции Лапласа (приложение 2) из равенства

 

Ф0(икр)= (1 - 2а)/2.

По условию α= 0,02.

Отсюда

 

Ф0(икр)=(1-2·0,02)/2=0,48.

 

По таблице функции Лапласа (приложение 2) найдем, при каком икрФ0(икр ) = 0,48.

 

Ф0(2,05)= 0,48.

Учитывая, что  конкурирующая  гипотеза  —  левосторонняя, критическому значению  необходимо

присвоить знак «минус».

Следовательно, -икр= -2,05.

Заметим, что при правосторонней конкурирующей гипотезе Н1: р > 0,97 икр  следует находить по




Страница: | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 11 | 12 | 13 | 14 | 15 | 16 | 17 | 18 | 19 |

Оцените книгу: 1 2 3 4 5

Добавление комментария:






Информацию в электронную библиотеку yourforexschool.com добавляют исключительно для ознакомления. Если вы являетесь автором книги или компанией которая имеет права распространения и вы хотите чтоб на сайте не было вашей книги, то напишите в обратную связь и мы незамедлительно удалим её.

Копирование материалов сайта разрешено только с использованием активной ссылки на yourforexschool.com Copyright © 2010