Kognitivní fakta o všem / Vzdělání: / Interval spolehlivosti. Co je to a jak je možné ho použít?

Interval spolehlivosti. Co je to a jak je možné ho použít?

Доверительный интервал пришел к нам из области statistiky. Jedná se o specifický rozsah, který slouží k odhadu neznámého parametru s vysokou spolehlivostí. Nejjednodušší způsob, jak to vysvětlit, je příkladem.

Předpokládejme, že potřebujete vyšetřit všechnynáhodnou hodnotu, například rychlost odpovědi serveru na žádost klienta. Pokaždé, když uživatel zadá adresu konkrétní stránky, server na ni reaguje různými rychlostmi. Zkoumaná doba odezvy je tedy náhodná. Takže interval spolehlivosti umožňuje definovat hranice tohoto parametru a pak můžete tvrdit, že s pravděpodobností 95% bude odpověď serveru v rozsahu, který jsme vypočítali.

Nebo potřebujete vědět, kolik lidívědomi si ochranné známky společnosti. Při výpočtu intervalu spolehlivosti, pak to bude možné, například, říkat, že s 95% pravděpodobností podíl spotřebitelů, kteří jsou si vědomi této značky, se pohybuje v rozmezí od 27% do 34%.

Úzce souvisí s tímto pojmemúroveň důvěryhodnosti Představuje pravděpodobnost, že požadovaný parametr je zahrnut v intervalu spolehlivosti. Z této hodnoty závisí na tom, jak velký je požadovaný rozsah. Čím větší je hodnota, tím se stává interval spolehlivosti a naopak. Obvykle je nastavena na 90%, 95% nebo 99%. Hodnota 95% je nejoblíbenější.

На данный показатель также оказывает влияние odchylka pozorování a velikost vzorku. Jeho definice je založena na předpokladu, že vyšetřovaný rys se řídí normálním zákonem o distribuci. Toto prohlášení je také známé jako Gaussův zákon. Podle něj je normální rozdělení všech pravděpodobností kontinuální náhodné proměnné, které lze popsat hustotou pravděpodobnosti. Pokud se předpokládá, že se normální distribuce ukázala být špatná, odhad se může ukázat jako nesprávný.

Za prvé, pojďme zjistit, jak vypočítatinterval spolehlivosti pro matematické očekávání. Existují dva možné případy. Disperze (stupeň změny náhodné veličiny) může nebo nemusí být známa. Je-li známo, pak se náš interval spolehlivosti vypočítá podle následujícího vzorce:

xsr - t * σ / (sqrt (n)) <= α <= xsr + t * σ / (sqrt (n)

α je znamení

t je parametr z distribuční tabulky Laplace,

sqrt (n) je druhá odmocnina celkové velikosti vzorku,

σ je druhá odmocnina rozptylu.

Pokud je rozptyl neznámý, pak jej lze vypočítat, pokud známe všechny hodnoty požadované charakteristiky. Chcete-li to provést, použijte následující vzorec:

σ2 = x2sr - (xsr) 2, kde

x2sr - průměrná hodnota čtverců prozkoumaného znaku,

(xsr) 2 - čtverec průměrné hodnoty této charakteristiky.

Vzorec, kterým se v tomto případě vypočte interval spolehlivosti, se mírně liší:

xsr - t * s / (sqrt (n)) <= α <= xsr + t * s / (sqrt (n)

xsr - střední hodnota vzorku,

α je znamení

t je parametr, který je nalezen pomocí distribuční tabulky Student t t = t (ɣ; n-1),

sqrt (n) je druhá odmocnina celkové velikosti vzorku,

s je druhá odmocnina rozptylu.

Zvažte tento příklad.Předpokládejme, že na základě výsledků 7 měření byla průměrná hodnota testovacího prvku určena jako 30 a rozptyl vzorku 36. Je třeba najít interval spolehlivosti s pravděpodobností 99%, který obsahuje skutečnou hodnotu měřeného parametru.

Nejprve definujeme, co je t: t = t (0.99; 7-1) = 3.71. Pomocí výše uvedeného vzorce získáme:

xsr - t * s / (sqrt (n)) <= α <= xsr + t * s / (sqrt (n)

30 - 3,71 * 36 / (sqrt (7)) <= α <= 30 + 3,71 * 36 / (sqrt (7))

21,587 <= α <= 38,413

Rozptýlení intervalu důvěryje vypočítán jak v případě známého průměru, tak i když neexistují žádné údaje o očekávání a je známa pouze hodnota bodového objektivního odhadu rozptylu. Zde nedáme vzorce pro jeho výpočet, protože jsou poměrně složité a pokud je to žádoucí, mohou být vždy nalezeny na síti.

Zaznamenáváme pouze, že je vhodné určit interval spolehlivosti pomocí aplikace Excel nebo síťové služby, která se nazývá tak.