Kognitívne fakty o všetkom / tvorenie / Interval spoľahlivosti. Čo je to a ako sa dá použiť?

Interval spoľahlivosti. Čo je to a ako sa dá použiť?

Interval dôvery k nám prišiel z oblastištatistika. Toto je určitý rozsah, ktorý slúži na vyhodnotenie neznámeho parametra s vysokou mierou spoľahlivosti. Toto bude najľahšie ilustrované príkladom.

Predpokladajme, že budete potrebovať nejaký výskumnáhodná premenná, napríklad rýchlosť odozvy servera na žiadosť klienta. Vždy, keď užívateľ zadá adresu konkrétneho webu, server na to odpovie inou rýchlosťou. Skúmaný čas odozvy je teda náhodný. Interval spoľahlivosti vám teda umožňuje určiť hranice tohto parametra a potom možno tvrdiť, že s pravdepodobnosťou 95% bude rýchlosť reakcie servera v rozsahu, ktorý sme vypočítali.

Alebo musíte zistiť, koľko ľudío ochrannej známke spoločnosti. Pri výpočte intervalu spoľahlivosti bude napríklad možné povedať, že s pravdepodobnosťou 95% je podiel spotrebiteľov, ktorí o tejto značke vedia, v rozsahu od 27% do 34%.

Tento výraz úzko súvisí s takým množstvom, ako jepravdepodobnosť dôvery. Predstavuje pravdepodobnosť, že požadovaný parameter spadá do intervalu spoľahlivosti. Z tejto hodnoty závisí, aký veľký bude náš požadovaný rozsah. Čím dôležitejšie to je, tým je interval spoľahlivosti užší a naopak. Zvyčajne sa rovná 90%, 95% alebo 99%. Najobľúbenejšia je hodnota 95%.

Tento ukazovateľ je tiež ovplyvnenýrozptyl pozorovaní a veľkosť vzorky. Jeho definícia je založená na predpoklade, že skúmaná črta sa riadi normálnym distribučným zákonom. Toto vyhlásenie sa nazýva aj Gaussov zákon. Podľa neho sa distribúcia všetkých pravdepodobností spojitej náhodnej premennej, ktorú možno opísať hustotou pravdepodobnosti, nazýva normálna. Ak sa ukáže, že predpoklad normálneho rozdelenia je chybný, odhad sa môže ukázať ako nesprávny.

Najprv si predstavme, ako počítaťinterval spoľahlivosti pre matematické očakávania. Tu sú možné dva prípady. Disperzia (stupeň variácie náhodnej premennej) môže byť známa alebo nie. Ak je známy, náš interval spoľahlivosti sa vypočíta pomocou tohto vzorca:

хср - t * σ / (sqrt (n)) <= a <= хср + t * σ / (sqrt (n)), kde

α je znamenie

t je parameter z Laplaceovej distribučnej tabuľky,

sqrt (n) je druhá odmocnina celkovej veľkosti vzorky,

σ je druhá odmocnina rozptylu.

Ak rozptyl nie je známy, možno ho vypočítať, ak poznáme všetky hodnoty požadovaného atribútu. Použite nasledujúci vzorec:

σ2 = х2ср - (хср) 2, kde

x2av - priemerná hodnota štvorcov vyšetrovanej vlastnosti,

(hsr) 2 - druhú mocninu priemernej hodnoty tohto atribútu.

Vzorec na výpočet intervalu spoľahlivosti sa v tomto prípade mierne líši:

xsr - t * s / (sqrt (n)) <= a <= xsr + t * s / (sqrt (n)), kde

hsr - priemer vzorky,

α je znamenie

t je parameter, ktorý sa zistí pomocou študentskej distribučnej tabuľky t = t (ɣ; n-1),

sqrt (n) je druhá odmocnina celkovej veľkosti vzorky,

s je druhá odmocnina rozptylu.

Рассмотри такой пример.Predpokladajme, že na základe výsledkov siedmich meraní bola stanovená stredná hodnota skúmaného atribútu rovná 30 a rozptyl vzorky rovný 36. Potrebujeme nájsť interval spoľahlivosti s pravdepodobnosťou 99%, ktorý obsahuje skutočnú hodnotu nameraného parametra.

Najprv určíme, čo sa rovná t: t = t (0,99; 7-1) = 3,71. Používame vyššie uvedený vzorec, dostaneme:

xsr - t * s / (sqrt (n)) <= a <= xsr + t * s / (sqrt (n))

30 - 3,71 * 36 / (sqrt (7)) <= a <= 30 + 3,71 * 36 / (sqrt (7))

21,587 <= a <= 38,413

Interval spoľahlivosti pre odchýlkyVypočíta sa tak v prípade známeho priemeru, ako aj v prípade, že neexistujú žiadne údaje o matematických očakávaniach, a je známa iba hodnota bodového nestranného odhadu rozptylu. Nebudeme tu uvádzať vzorce na jej výpočet, pretože sú dosť zložité a ak je to potrebné, vždy ich možno nájsť v sieti.

Upozorňujeme iba na to, že interval spoľahlivosti sa bežne určuje pomocou Excelu alebo sieťovej služby, ktorá sa nazýva.