Förtroendeintervallet kom till oss från områdetstatistik. Detta är ett specifikt intervall som används för att uppskatta en okänd parameter med hög grad av tillförlitlighet. Det enklaste sättet att förklara detta är med ett exempel.
Anta att du måste undersöka någraen slumpmässig variabel, till exempel serverns svarfrekvens på en klientbegäran. Varje gång en användare skriver adressen på en specifik webbplats reagerar servern på den med en annan hastighet. Således är den studerade responstiden slumpmässig. Så, konfidensintervallet tillåter oss att bestämma gränserna för denna parameter, och sedan kommer det att vara möjligt att hävda att med en sannolikhet på 95% kommer serverens svarsfrekvens att ligga inom det intervall vi beräknade.
Eller så måste du ta reda på hur många människorär medveten om företagets varumärke. När konfidensintervallet beräknas är det till exempel möjligt att säga att med 95% sannolikhet ligger andelen konsumenter som känner till detta varumärke i intervallet 27% till 34%.
Denna term är nära besläktad med en sådan mängd somförtroende sannolikhet. Det representerar sannolikheten att den önskade parametern ingår i konfidensintervallet. Hur stort vårt önskade intervall kommer att bero på detta värde. Ju mer värde det tar desto smalare blir konfidensintervallet och vice versa. Vanligtvis är den inställd på 90%, 95% eller 99%. 95% -värdet är det mest populära.
Denna indikator påverkas också avvarians av observationer och urvalsstorlek. Definitionen baseras på antagandet att egenskapen som studeras följer normaldistributionslagen. Detta uttalande är också känt som Gauss lag. Enligt honom kallas en sådan fördelning av alla sannolikheter för en kontinuerlig slumpmässig variabel normal, vilket kan beskrivas av sannolikhetstätheten. Om antagandet om normal distribution är fel kan uppskattningen vara fel.
Låt oss först ta reda på hur man beräknarkonfidensintervall för det förväntade värdet. Två fall är möjliga här. Dispersion (spridningsgraden för en slumpmässig variabel) kan vara känd eller inte. Om det är känt beräknas vårt konfidensintervall med följande formel:
хср - t * σ / (sqrt (n)) <= α <= хср + t * σ / (sqrt (n)), där
α är en funktion
t är en parameter från Laplace-distributionstabellen,
sqrt (n) - kvadratrot av den totala provstorleken,
σ är kvadratroten av variansen.
Om variansen är okänd kan den beräknas om vi känner till alla värden för den önskade funktionen. För detta används följande formel:
σ2 = х2ср - (хср) 2, där
х2ср - det genomsnittliga värdet av rutorna för den undersökta funktionen,
(хср) 2 - kvadraten för medelvärdet för denna funktion.
Formeln enligt vilken konfidensintervallet beräknas i detta fall ändras något:
хср - t * s / (sqrt (n)) <= α <= хср + t * s / (sqrt (n)), där
хср - provmedelvärde,
α är en funktion
t är en parameter som hittas med hjälp av studentens distributionstabell t = t (ɣ; n-1),
sqrt (n) - kvadratrot av den totala provstorleken,
s är kvadratroten av variansen.
Tänk på detta exempel.Antag att baserat på resultaten av 7 mätningar bestämdes genomsnittsvärdet för den undersökta funktionen, lika med 30, och provvariansen lika med 36. Det är nödvändigt att hitta en sannolikhet på 99% konfidensintervallet som innehåller det verkliga värdet för den uppmätta parametern.
Först definierar vi vad som är t: t = t (0,99; 7-1) = 3,71. Med hjälp av ovanstående formel får vi:
хср - t * s / (sqrt (n)) <= α <= хср + t * s / (sqrt (n))
30 - 3,71 * 36 / (sqrt (7)) <= α <= 30 + 3,71 * 36 / (sqrt (7))
21,587 <= α <= 38,413
Konfidensintervall för variansberäknas både i fallet med ett känt medelvärde och när det inte finns några data om den matematiska förväntningen, men endast värdet av den punktobjektiva variansberäkningen är känd. Vi ger inte här formlerna för att beräkna den, eftersom de är ganska komplexa och om så önskas kan de alltid hittas på nätet.
Vi noterar bara att det är bekvämt att bestämma konfidensintervallet med hjälp av Excel eller en nättjänst, som kallas så.
p>