/ Konfidenzintervall. Was ist es und wie kann es verwendet werden?

Konfidenzintervall. Was ist es und wie kann es verwendet werden?

Konfidenzintervalle kamen aus der Region zu unsStatistiken. Dies ist ein bestimmter Bereich, der dazu dient, einen unbekannten Parameter mit einem hohen Grad an Zuverlässigkeit auszuwerten. Der einfachste Weg, dies zu erklären, ist ein Beispiel.

Angenommen, wir müssen einige untersuchenEin zufälliger Wert, z. B. die Antwortrate des Servers auf die Anfrage des Clients. Jedes Mal, wenn ein Benutzer die Adresse einer bestimmten Site wählt, reagiert der Server darauf mit unterschiedlichen Geschwindigkeiten. Die zu untersuchende Antwortzeit ist daher zufällig. Das Konfidenzintervall erlaubt uns also, die Grenzen dieses Parameters zu bestimmen, und dann wird es möglich sein zu behaupten, dass die Reaktionsgeschwindigkeit des Servers mit einer Wahrscheinlichkeit von 95% in dem Bereich liegt, den wir berechnet haben.

Oder Sie müssen wissen, wie viele Leutebekannt über die Marke des Unternehmens. Wenn das Konfidenzintervall berechnet wird, dann wird es möglich sein, zum Beispiel, zu sagen, dass eine Wahrscheinlichkeit von 95% Anteil der Verbraucher, das von dieser Marke bewusst sind, im Bereich von bis zu 34% von 27% ist.

Dieser Begriff steht in engem Zusammenhang mit einem solchen Wert wieVertrauenswahrscheinlichkeit. Es ist die Wahrscheinlichkeit, dass der gewünschte Parameter in das Konfidenzintervall eintritt. Von diesem Wert hängt ab, wie groß unser gewünschter Bereich sein wird. Je wichtiger es wird, desto enger wird das Konfidenzintervall und umgekehrt. Normalerweise ist es auf 90%, 95% oder 99% eingestellt. Der Wert von 95% ist am beliebtesten.

Dieser Indikator wird auch beeinflusst vonVarianz der Beobachtungen und Stichprobenumfang. Seine Definition beruht auf der Annahme, dass das untersuchte Merkmal dem normalen Verteilungsgesetz gehorcht. Diese Aussage wird auch als Gaußsches Gesetz bezeichnet. Nach ihm wird die Verteilung aller Wahrscheinlichkeiten einer kontinuierlichen Zufallsvariablen als normal bezeichnet, was durch die Wahrscheinlichkeitsdichte beschrieben werden kann. Wenn sich die Annahme einer Normalverteilung als falsch herausstellte, kann die Schätzung falsch sein.

Zuerst werden wir herausfinden, wie man berechnetKonfidenzintervall für mathematische Erwartung. Es gibt zwei mögliche Fälle. Die Varianz (der Grad der Ausbreitung einer Zufallsvariablen) kann bekannt sein oder nicht. Wenn es bekannt ist, dann wird unser Konfidenzintervall unter Verwendung der folgenden Formel berechnet:

xsr - t * σ / (sqrt (n)) <= α <= xcp + t * σ / (sqrt (n)), wobei

α ist ein Zeichen,

t ist ein Parameter aus der Laplace-Verteilungstabelle,

sqrt (n) ist die Quadratwurzel der gesamten Stichprobengröße,

σ ist die Quadratwurzel der Varianz.

Wenn die Varianz unbekannt ist, kann sie berechnet werden, wenn wir alle Werte des gewünschten Merkmals kennen. Die folgende Formel wird dafür verwendet:

σ2 = x2cp - (xcp) 2, wobei

x2cp ist der Durchschnittswert der Quadrate des Test-Features,

(xcp) 2 ist das Quadrat des Mittelwerts dieser Eigenschaft.

Die Formel zur Berechnung des Konfidenzintervalls variiert in diesem Fall geringfügig:

xsp - t * s / (sqrt (n)) <= α <= xcp + t * s / (sqrt (n)), wobei

xsr ist das Stichprobenmittel,

α ist ein Zeichen,

t ist ein Parameter, der unter Verwendung der Student-Verteilungstabelle t = t (ɣ; n-1) gefunden wird,

sqrt (n) ist die Quadratwurzel der gesamten Stichprobengröße,

s ist die Quadratwurzel der Varianz.

Betrachten Sie dieses Beispiel.Angenommen, basierend auf den Ergebnissen von 7 Messungen wurde der Durchschnittswert des Testmerkmals gleich 30 und die Stichprobenvarianz gleich 36 bestimmt. Es ist notwendig, mit einer Wahrscheinlichkeit von 99% ein Konfidenzintervall zu finden, das den wahren Wert des gemessenen Parameters enthält.

Zuerst definieren wir, was gleich t ist: t = t (0,99; 7-1) = 3,71. Wir verwenden die obige Formel, wir erhalten:

xsr - t * s / (sqrt (n)) <= α <= xcp + t * s / (sqrt (n))

30 - 3,71 * 36 / (sqrt (7)) <= α <= 30 + 3,71 * 36 / (sqrt (7))

21.587 <= α <= 38.413

Konfidenzintervall für Abweichungwird sowohl im Falle des bekannten Mittelwerts als auch dann berechnet, wenn keine Daten über die mathematische Erwartung vorliegen, und nur der Wert der punktfreien Verzerrungsabschätzung bekannt ist. Wir geben hier nicht die Formeln für ihre Berechnung an, da sie ziemlich komplex sind und auf Wunsch immer im Netz gefunden werden können.

Wir bemerken nur, dass es bequem ist, das Konfidenzintervall mithilfe eines Excel-Programms oder eines Netzwerkdienstes zu ermitteln, der so heißt.