/ Intervalo de confiança. O que é e como pode ser usado?

Intervalo de confiança. O que é e como pode ser usado?

Intervalo de confiança chegou até nós da áreaestatísticas. Esse é um determinado intervalo que serve para avaliar um parâmetro desconhecido com um alto grau de confiabilidade. Isso será mais facilmente ilustrado por um exemplo.

Suponha que você precise pesquisar qualquervariável aleatória, por exemplo, velocidade de resposta do servidor à solicitação do cliente. Cada vez que um usuário digita o endereço de um site específico, o servidor responde a isso em uma velocidade diferente. Assim, o tempo de resposta investigado é aleatório. Portanto, o intervalo de confiança permite determinar os limites desse parâmetro e, em seguida, pode-se argumentar que, com uma probabilidade de 95%, a velocidade de reação do servidor estará no intervalo calculado.

Ou você precisa descobrir quantas pessoasconhecido sobre a marca comercial da empresa. Quando o intervalo de confiança é calculado, é possível, por exemplo, dizer que, com uma probabilidade de 95%, a proporção de consumidores que conhecem essa marca está na faixa de 27% a 34%.

Este termo está intimamente relacionado a uma quantidade queprobabilidade de confiança. Representa a probabilidade de o parâmetro desejado estar dentro do intervalo de confiança. A partir desse valor depende de quão grande será o intervalo desejado. Quanto mais importante, mais estreito é o intervalo de confiança e vice-versa. Geralmente é definido como 90%, 95% ou 99%. O valor de 95% é o mais popular.

Este indicador também é influenciado porvariação das observações e tamanho da amostra. Sua definição é baseada no pressuposto de que a característica sob investigação obedece à lei de distribuição normal. Essa afirmação também é conhecida como Lei de Gauss. Segundo ele, a distribuição de todas as probabilidades de uma variável aleatória contínua que pode ser descrita pela densidade de probabilidades é chamada normal. Se a suposição de uma distribuição normal for errônea, a estimativa poderá ser incorreta.

Primeiro, vamos descobrir como calcularintervalo de confiança para expectativa matemática. Dois casos são possíveis aqui. A dispersão (o grau de variação de uma variável aleatória) pode ser conhecida ou não. Se for conhecido, nosso intervalo de confiança é calculado usando a seguinte fórmula:

хср - t * σ / (sqrt (n)) <= α <= хср + t * σ / (sqrt (n)), em que

α é um sinal

t é um parâmetro da tabela de distribuição Laplace,

sqrt (n) é a raiz quadrada do tamanho total da amostra,

σ é a raiz quadrada da variância.

Se a variação for desconhecida, poderá ser calculada se conhecermos todos os valores do atributo desejado. Para fazer isso, use a seguinte fórmula:

σ2 = х2ср - (хср) 2, em que

x2av - o valor médio dos quadrados da característica investigada,

(hsr) 2 - o quadrado do valor médio desse atributo.

A fórmula pela qual o intervalo de confiança é calculado neste caso varia ligeiramente:

xsr - t * s / (sqrt (n)) <= α <= xsr + t * s / (sqrt (n)), em que

hsr - média da amostra,

α é um sinal

t é um parâmetro encontrado na tabela de distribuição dos alunos t = t (ɣ; n-1),

sqrt (n) é a raiz quadrada do tamanho total da amostra,

s é a raiz quadrada da variação.

Considere esse exemplo.Suponha que, com base nos resultados de 7 medições, o valor médio do atributo estudado tenha sido determinado igual a 30 e a variação da amostra igual a 36. Precisamos encontrar um intervalo de confiança com probabilidade de 99% que contenha o valor real do parâmetro medido.

Primeiro, determinamos o que t é igual a: t = t (0,99; 7-1) = 3,71. Usamos a fórmula acima, obtemos:

xsr - t * s / (sqrt (n)) <= α <= xsr + t * s / (sqrt (n))

30 - 3,71 * 36 / (sqrt (7)) <= α <= 30 + 3,71 * 36 / (sqrt (7))

21,587 <= α <= 38,413

Intervalo de confiança para variaçãoé calculado no caso da média conhecida e quando não há dados de expectativa matemática, e apenas o valor da estimativa de variância imparcial do ponto é conhecido. Não forneceremos aqui as fórmulas para seu cálculo, pois são bastante complexas e, se desejado, sempre podem ser encontradas na rede.

Observamos apenas que o intervalo de confiança é convenientemente determinado usando o Excel ou um serviço de rede, chamado assim.