Определяне на минималния размер на извадката
Интервал оценката на вероятността на събитията. Формулата за изчисляване на броя на пробите с самостоятелно произволен метод на подбор.
За да се определи вероятността за събитие от интерес за нас, ние използваме метода на вземане на проби. изпълнява п независими експеримента, всеки от които може да възникнат (или не възникнат) събитие А (вероятност р на настъпване на събитие А е постоянна във всеки експеримент). След това относителните честота р * събития на събитие в поредица от опити п е взето като оценката на точка за вероятност р на настъпване на събитие в отделен съд. В този случай, стойността на р * се нарича фракция вземане на проби от поява на събитието A и Р - Общи акция.
Чрез изследване на централната лимит теорема (теоремата на Лаплас-DeMoivre) относителната честота на събитията, когато голям обем проба може да се счита като нормално разпределена с параметрите М (р *) = р и
Следователно, когато п> 30 доверителен интервал за общото съотношение може да се конструира като се използва формулата:
В малък обем проба n≤30 граница грешка ε се определя от таблица т разпределение на Student.
където TCR = т (к; # 945) и броят на степените на свобода к = N-1, вероятността # 945 = 1- # 947; (Площ Duplex).
Формулите са валидни, ако избора е случаен повтарящи начин (общото население е безкрайна), в противен случай е необходимо да се направи корекция за повторение без селекция (маса).
Средната грешка за вземане на проби за широката дял
Крайният обем на N
Средната грешка за вземане на проби
Формулата за изчисляване на броя на пробите с самостоятелно произволен метод на селекция
Формула за определяне на броя на пробите
дял от общите задачи
На въпроса "Смятате доверителния интервал обхваща предварително зададена стойност p0» - може да се отговори чрез проверка на статистически хипотези H0: р = p0. Предполага се, че експериментите проведени от схемата на Бернули тест (независим вероятност р на настъпване на събитие А е константа). Проба обем п р се определя относителната честота на поява на събитието * A: където m - брой случаи на А в серия от п проучвания. За да се тества статистика хипотеза H0 използвани с достатъчно голям размер на пробата е стандартното нормално разпределение (таблица. 1).
Таблица 1 - хипотези за общия дял
Схема на Бернули проучвания
Схема на Бернули проучвания
Оценките въз основа на извадка
Статистика Разпределение на K
Стандартната нормална N (0,1)
Стандартната нормална N (0,1)
Пример №1. С помощта на случаен повторно вземане на проби за управление на дружеството, което се проведе на извадково изследване на 900 от своите служители. Сред анкетираните, 270 жени се обърнаха. Изграждане на доверителен интервал. 0.95 вероятност покриваща вярно делът на жените по целия екип на компанията.
Решение. От състоянието на жените е селективен (относителната честота на жените сред всички анкетирани). Тъй като изборът се повтаря и голям размер на пробата (п = 900) ограничаване на грешката за вземане на проби се определя по формулата
UCR стойност находка в таблицата на съотношение Лаплас 2F (UCR) = функция # 947;, т.е. Лаплас функция (Приложение 1) има стойност 0,475 в UCR = 1.96. Следователно, максималната грешка и желания доверителен интервал
(Р - # 949;, р + # 949) = (0,3 - 0,18, 0,3 + 0,18) = (0,12; 0,48)
Така че, с вероятност 0.95 може да се гарантира, че делът на жените в целия екип на компанията е в диапазона от 0,12 до 0,48.
Пример №2. Собственикът на паркинга е денят, "добра", ако паркинга е изпълнен с повече от 80%. 40 В паркинга на проверките на са били извършени през годината, 24 от тях са "успешни". С вероятност от 0.98 получи доверителен интервал за оценка на истинския дял на "успешни" дни през цялата година.
Решение. Вземане на проби фракция "успешни" дни
Чрез Лаплас функция маса намираме стойността на дадено UCR
ниво на доверие
F (2,23) = 0,49, UCR = 2.33.
Като се има предвид избора на повторение без (т.е. две проверки не са извършени в един ден), ние откриваме крайната грешката:
където п = 40. N = 365 (дни). тук
и доверителния интервал за съотношението на общото: (р - # 949;, р + # 949) = (0,6 - 0,17, 0,6 + 0,17) = (0,43; 0,77)
С може да се очаква вероятност от 0,98, че делът на "успешни" дни през годината в диапазона от 0,43 до 0,77.
Пример №3. 2500 за проверка на елементите в партидата, установи, че 400 първокласни продукти, както и п-м - не. Колко трябва да проверите продукти, за да уверено да определи дела на премията 95% до 0.01.
Ние се търси решение на формулата за определяне на броя на пробите за повторна селекция.
F (т) = # 947; / 2 = 0,95 / 2 = 0.475 и стойността на таблицата съответства на Лаплас Т = 1.96
Селективно част от w = 0.16; вземане на проби грешка # 949; = 0,01
Пример №4. продукти партия се приемат, ако вероятността, че продуктът ще отговаря на стандартите, не е по-малко от 0,97. Сред случайна извадка от 200 одитирани продукти на други производители се оказа 193 съвместими. Независимо дали сте на нивото на значимост # 945 = 0,02, за да партито?
Решение. Ние формулираме основните и алтернативната хипотеза.
H0: р = p0 = 0,97 - обща част неизвестен р е равно на предварително определена стойност p0 = 0,97. По отношение на състоянието - вероятността част на одитираната страна ще бъде в съответствие със стандарта, равен на 0,97; т.е. Продуктите на други производители могат да бъдат приети.
H1: р<0,97 - вероятность того, что деталь из проверяемой партии окажется соответствующей стандарту, меньше 0.97; т.е. партию изделий нельзя принять. При такой альтернативной гипотезе критическая область будет левосторонней.
К (маса) изчисляване на статистическа значимост се наблюдава в даден стойности p0 = 0,97, п = 200, m = 193
Намираме критичната стойност на функция маса Лаплас от уравнението
при условие, # 945 = 0.02 следователно F (KCR) = 0.48 и р = 2.05. Левостранен критична област, т.е. Това е интервалът (-∞; -Kkp) = (-∞; -2,05). Наблюдаваното = -0.415 Коба не принадлежи на критичната област, следователно, на това ниво на значимост не е причина за отхвърляне на нулевата хипотеза. продукти от страните може да поеме.
Пример №5. Две растения от същия вид, направени части. За да се оцени качеството на продуктите, произведени чрез вземане на проби от тези растения, и са получени следните резултати. Сред избраните продукти 200 на първия завод 20 оказа дефектен, сред продуктите на втория завод 300-15 дефектни.
По степен на значимост на 0,025 за да се определи дали е налице значителна разлика в качеството на произвежданите части на тези растения.
Решение. Това е задачата на сравняване на общия дял на двете групи. Ние формулираме основните и алтернативната хипотеза.
Н0: p1 = p2 - общ дял са равни. По отношение на състоянието - вероятността от възникване на дефектни продукти в производството на първото растение е равна на вероятността за поява на дефектни продукти във втората завода (качеството на производството на същото).
Н0: p1 p2 ≠ - заводът произвежда части с различно качество.
За да се изчисли статистическата значимост на наблюдавания K (таблицата) за изчисляване на оценки на извадката.
Наблюдаваната стойност е
Тъй като двустранен алтернативна хипотеза, критичната статистика K≈ N (0,1) намираме във функцията на таблица на уравнението на Лаплас
при условие, # 945 = 0.025 следователно F (KCR) = 0.4875 и р = 2.24. Като алтернатива, двустранно обхват на допустимите стойности е (-2.24; 2,24). Наблюдаваната стойност Knabl = 2.15 попада в този диапазон, т.е. на това ниво на значимост няма причина за отхвърляне на нулевата хипотеза. Заводът произвежда продукти със същото качество.