Оценките за очакването и дисперсията
Най-важните характеристики на произволни числени стойности са му X очаквания х = М [х] и вариацията # 963; 2 х = D [X] = М [(X - х) 2] = М [х 2] -. MX Броят е средната стойност на случайната променлива, които са разпръснати около мярката за стойности X. на този вариант е дисперсията на D [х] и стандартното отклонение:
Ние в бъдеще ще concider важна задача за изучаване на наблюдаемата случайна променлива. Нека да има някаква проба (ще означаваме това) на случайна променлива X отвежда на съществуващата проба за оценка на неизвестен стойност и MX.
Теорията на различните оценки на параметрите е важно в математическата статистика. Ето защо, нека първо разгледаме общия проблем. Да предположим, че искаме да се изчисли параметър на проба S. Всяка такава оценка на * е функция на * = а * (S) от стойностите на пробата. вземане на проби ценности е случаен, а следователно и себе си * Прогнозата е случайна променлива. Можете да създадете много различни оценки (т.е., функции) на *. но е желателно да има "добро" или дори "най-доброто" в известен смисъл, оценка. По оценки обикновено отговарят на следните три физически изисквания.
1. безпристрастен. Очакванията оценява с * трябва да бъде равна на точната стойност на параметъра: М [а *] = а. С други думи, оценката на * не трябва да има пристрастия.
2. Съвместимост. В безкраен оценка увеличаване проба обем * трябва да се доближи до точна стойност, т.е., когато броя на наблюденията оценка на грешката клони към нула.
3. ефективност. Квалификация на *, се нарича ефективен, ако не се измества, и има възможно най-малко грешки вариацията. В този случай, минималната оценка вариант на * стойности и относително точна оценка в известен смисъл е "най-точен".
За съжаление, не винаги е възможно да се изгради една оценка, която отговаря на всички изисквания на три едновременно.
За да се оцени очакване най-често се използва оценката на.
което означава, че средната аритметична стойност на извадката. Ако случайна променлива X има краен MX и SX. след това (1.12) не се измества и е в съответствие. Тази оценка е ефективно, например, ако X е нормално разпределение (ris.p.1.4, Приложение 1). може да не е в сила за други дистрибуции. Например, в случай на равномерно разпределение (ris.p.1.1, Приложение 1) безпристрастен, последователна оценка ще
В същото време, оценката (1.13) за нормалното разпределение не би било нито последователен и ефективен, и ще бъде още по-зле с увеличаване на размера на извадката.
По този начин, за всеки тип разпределение на случайна променлива X трябва да използват своята оценка на очакването. Въпреки това, в нашия случай, типа на разпределение може да бъде известен само колебливо. Ето защо, ние ще използваме оценка (1,12), което е съвсем проста и има най-важните свойства на безпристрастен и последователност.
За оценка на очаквания групирани пробата се използва следната формула:
което може да бъде получено от предходния, приемайки всички MI примерни стойности, принадлежащи към I-ти интервал равна на интервал представител ZI. Тази прогноза естествено по-груба, но изисква много по-малък обем на изчисление, особено когато голям обем проба.
За да се оцени дисперсията на най-често използваните Оценката:
Тази оценка не е предубеден и е в съответствие за всяка случайна променлива X има крайни точки до четвъртия ред включително.
В случай на използване на групирани честота на дискретизация:
Оценките (1.14) и (1.16), тъй като техните очаквания обикновено са повлияни и неоснователни, и ограниченията, към който те се събират, различни от х и поради заместването на всички примерни стойности, които попадат в I-ти интервал на интервал представител зи.
Имайте предвид, че за голям п фактор п / (п - 1) в изразите (1,15) и (1,16) е близо до единица, като по този начин може да се пропусне.
Нека точната стойност на параметър е и е установено, цената му е * (на S) в пробата С. Оценка на * отговаря на точка върху реалната ос (фигура 1.5), така че тази оценка се нарича точка. Всички оценки, обсъждани в предходния параграф, точка. Почти винаги, по силата на късмета
а * ¹ а. и можем само да се надяваме, че на мястото на * е някъде близо до. Но колко близо? Всяка друга точка приблизителна стойност ще има същия недостатък - липсата на надеждност мерки резултат.
Фигура 1.5. Точковата оценка параметър.
По-специфичен в това отношение са оценките на интервал. Интервал оценка е интервал Ib = (а. В). където текущата стойност на очакваната параметър е предварително определена вероятност б. Интервал Ib нарича доверителен интервал. и вероятността от б се нарича нивото на доверие на, и може да се разглежда като надеждна оценка.
Доверителен интервал проведе от наличната пробата S. Той се среща в смисъл, че нейните граници са случайни на (S) и В (S). който се изчислява от (случайно) проба. Следователно б е вероятността, че произволен интервал Ib ще обхваща не-случайни точка. Фиг. 1.6. Ib точка интервал обхваща. и Иб * - не. Поради това не е съвсем правилно да се каже, че «пада» в интервала.
В Ако нивото на доверие е висока (например, б = 0999), е почти винаги текущата стойност съхраняват във вградената интервал.
Фигура 1.6. Доверителни интервали параметър за различните проби.
Нека разгледаме един метод за построяване на доверителен интервал за очакването на случайна променлива X, въз основа на централната лимит теорема.
Нека случайна променлива X е математическото очакване MX неизвестен и известен разрез. След това, от централната лимит теорема, средната аритметична:
Резултатите от теста п независима променлива X е случайна променлива чието разпределение за голям п. Близо до нормално разпределение със средна стойност и стандартно отклонение х. Ето защо, случайна променлива
Той има разпределение на вероятностите, които могат да се разглеждат като стандарт нормалната й разпространение плътност (т). чиято графика е показана на Фигура 1.7 (а ris.p.1.4 също Приложение 1).
Фигура 1.7. случайна променлива вероятност плътност функция т.
Като се има предвид нивото на доверие б, и ТБ - номер отговаря на уравнението
където - функция на Лаплас. След това вероятността от изпадане в интервала (-tb. Tb) ще бъде равна на защрихованата на Фигура 1.7. област, и по силата на (1.19) е равна на б. следователно
По този начин, като на доверителния интервал може да се вземат интервал
тъй като експресията (1.20) означава, че неизвестен текущата стойност Ib х е в предварително определено ниво на доверие б. За да се конструира Ib необходимо за даден naytitb б от уравнение (1.19). Ето няколко стойности на туберкулозата. необходима допълнителна [3. 5]:
В получаването на (1.21) се предполага, че ние знаем точната стойност на стандартното отклонение SX. Въпреки това, е известно, че не винаги. Ние използваме толкова нейната оценка (1.15) и получаваме:
Съответно, оценка и. получен чрез групирани пробата, дава следната формула за доверителния интервал:
Имайте предвид, че уравнение (1.22) има две грешки. Първият се отнася до факта, че стойностите на разпределението на само приблизително равна на Т й (т). но с увеличаване на проба размер точност п приближение се подобрява. Втората грешка се дължи на използване, вместо неизвестен точна стойност SX. С голям обем на пробата, и тази грешка не е съществен. Формула (1.23) употреби групирани, т.е. проба загрубяла и следователно дава останалите грубост и в безкраен растеж на обема на пробата в резултат.
Трябва също да се отбележи, че е възможно да се изгради произволен брой доверителни интервали за дадена б. Наистина, нека t'b IT "б удовлетворява условие B = $ 0 (т" б) - $ 0 (t'b). след интервала
и с вероятност б съдържа х (фигура 1.7.). Например, може да се вземе t'0,9 = - 4 и т "0,9 = 1,282. Но в този случай полученият дължината на интервала ще се увеличи с около 1,6 пъти. Формула (1.21) се използва, тъй като осигурява най-краткия доверителен интервал.
По същия интервал оценки на други параметри, такива дисперсии могат да бъдат намерени [1, 5].