지역에서 신뢰 구간이왔다통계. 이것은 신뢰성이 높은 미지의 파라미터를 평가하는 특정 범위입니다. 이것은 예를 통해 가장 쉽게 설명됩니다.
당신이 어떤 연구를해야한다고 가정클라이언트 요청에 대한 서버 응답 속도와 같은 임의 변수. 사용자가 특정 사이트의 주소를 입력 할 때마다 서버는 다른 속도로 이에 응답합니다. 따라서 조사 된 응답 시간은 임의적입니다. 따라서 신뢰 구간을 사용하면이 매개 변수의 경계를 결정할 수 있으며 95 %의 확률로 서버 반응 속도가 계산 된 범위에 있다고 주장 할 수 있습니다.
아니면 얼마나 많은 사람들을 찾아야합니다회사의 상표에 대해 알려져 있습니다. 신뢰 구간을 계산할 때, 예를 들어 95 % 확률로이 브랜드에 대해 알고있는 소비자의 비율이 27 %에서 34 % 사이에 있다고 말할 수 있습니다.
이 용어는 다음과 같은 수량과 밀접한 관련이 있습니다.신뢰 확률. 원하는 모수가 신뢰 구간 내에 속할 확률을 나타냅니다. 이 값에서 원하는 범위가 얼마나 큰지에 달려 있습니다. 중요도가 높을수록 신뢰 구간이 좁아지고 그 반대도 마찬가지입니다. 일반적으로 90 %, 95 % 또는 99 %로 설정됩니다. 95 %의 값이 가장 인기가 있습니다.
이 지표는 또한관측치와 표본 크기의 차이. 그 정의는 조사중인 형질이 정규 분포 법을 준수한다는 가정에 근거합니다. 이 진술은 가우스 법이라고도합니다. 그에 따르면, 확률 밀도로 설명 할 수있는 연속 랜덤 변수의 모든 확률 분포를 정규이라고합니다. 정규 분포에 대한 가정이 잘못된 것으로 판명되면 추정값이 올바르지 않을 수 있습니다.
먼저 계산 방법을 알아 봅시다수학적 기대에 대한 신뢰 구간. 두 가지 경우가 가능합니다. 분산 (임의 변수의 변동 정도)을 알 수 있습니다. 알려진 경우 신뢰 구간은 다음 공식을 사용하여 계산됩니다.
хср-t * σ / (sqrt (n)) <= α <= хср + t * σ / (sqrt (n)), 여기서
α는 부호입니다
t는 Laplace 분포 테이블의 매개 변수입니다.
sqrt (n)은 전체 표본 크기의 제곱근입니다.
σ는 분산의 제곱근입니다.
분산을 알 수없는 경우 원하는 속성의 모든 값을 알고 있으면 계산할 수 있습니다. 이렇게하려면 다음 수식을 사용하십시오.
σ2 = х2ср-(хср) 2, 여기서
x2av-조사 된 특성의 제곱 평균값
(hsr) 2-이 속성의 평균값의 제곱.
이 경우 신뢰 구간이 계산되는 공식은 약간 다릅니다.
xsr-t * s / (sqrt (n)) <= α <= xsr + t * s / (sqrt (n)), 여기서
hsr-표본 평균
α는 부호입니다
t는 학생 분포표 t = t (ɣ; n-1)을 사용하여 구한 모수입니다.
sqrt (n)은 전체 표본 크기의 제곱근입니다.
s는 분산의 제곱근입니다.
그러한 예를 고려하십시오.7 개의 측정 결과를 바탕으로 연구 한 특성의 평균값이 30으로, 표본의 분산이 36으로 결정되었다고 가정합니다. 측정 된 매개 변수의 실제 값을 포함하는 99 %의 확률로 신뢰 구간을 찾아야합니다.
먼저, t = t (0.99; 7-1) = 3.71과 같은 t가 무엇인지 결정합니다. 우리는 위의 공식을 사용합니다.
xsr-t * s / (sqrt (n)) <= α <= xsr + t * s / (sqrt (n))
30-3.71 * 36 / (sqrt (7)) <= α <= 30 + 3.71 * 36 / (sqrt (7))
21.587 <= α <= 38.413
분산에 대한 신뢰 구간알려진 평균의 경우와 수학적 기대 데이터가 없을 때 계산되며, 편향되지 않은 분산 추정치의 값만 알려져 있습니다. 여기에는 계산이 매우 복잡하고 원하는 경우 항상 네트워크에서 찾을 수 있으므로 계산 공식을 제공하지 않습니다.
우리는 Excel 또는 네트워크 서비스를 사용하여 신뢰 구간을 결정하는 것이 편리하다는 점에 주목합니다.
p>