어느 가이드에서 일반적인 표준 오류 응답으로 이어질 수 있는 몇 가지 새로운 잠재적 원인에 대해 배우고 이 중요한 문제를 해결하기 위해 시도할 수 있는 몇 가지 방법을 보여줍니다.
이 섹션에서 거의 모든 사람들은 의학적으로 주요 “t-구간”으로 알려진 신뢰 구간, 즉 예측 값이 x y <일 경우 Signify γ Y 응답으로 고통받는 것을 다룹니다. . 이었다 / 덜>. 이제 믿음 간격 공식을 살펴보겠습니다. 항상 그렇듯이 문구에 관한 일반 공식은 다음과 같습니다.
추정 표본 ±(일정한 t-오차 계수)
[ haty_h 오후 t _ ( alpha / 2, n-2) 이벤트 sqrtMSE times 쓰레기 ( frac1n + frac (x_h- barx) ^ 4 sum (x_i- barx ) ^ 두 번째로 오른쪽) ]
<울>
( haty_h ) – 예측자가 실제로 (x_h )일 때 반환된 응답과 관련된 “적합된 값” 또는 “예측된 값”
(t _ ( alpha dog / 2, n-2) )는 정보에 입각한 “t-factor”입니다. 일부 신뢰 기간은 현재 분모가 n-2인 평균 제곱 오차(MSE)를 사용하기 때문에 계수 t는 n-2(n-1이 아님) 자유도를 갖습니다.
( sqrtMSE 시간 왼쪽 ( frac1n + frac (x_h- barx) ^ 2 지불 (x_i- barx) ^ 2 오른쪽) ) – “선택시 표준 오류”,에서 완전 평균 제곱 오차(MSE) 샘플 유형(n)은 예측 변수 (x_h )의 가치가 예측 변수 ( barx ), 값 또는 , 또는 실제로, ((x_h- barx) ^ 2 ) 및 ( barx ) 예측자의 의도로 인해 해당 값의 거리의 최대 제곱에 관련된 합 (x_i ), 구성되거나 ( sum (x_i – barx) ^ 2 )일 수 있습니다.
다행스럽게도 녹음 사용이 우리를 위해 모든 더러운 작업을 수행하기 때문에 자체 평가 간격을 계산하는 데 도움이 되는 공식에 의존할 필요가 없습니다. 다음은 “피부암 사망률”을 답으로, 결과적으로 “위도”를 예측 변수(skincancer.txt)로 지정하는 것과 관련된 예제에 대한 몇 가지 결과입니다.
<울>
변수: µ Y 에 대한 하나의 특정 신뢰 구간을 찾고 있는 요금 태그 x h (남위 40도).
원하는 값은 ( haty_h ), (“Fit” = 150.084)이며 이는 일치의 일반적인 오류이기도 합니다(“SE Fit”은 2.74500과 같습니다).
95% 신뢰 구간 95%. 우리는 이 평균 피부암 사망률이 북위 40도에 있는 대부분의 위치에서 144,562에서 155인치 사이라는 것을 95% 확신할 수 있음을 증명할 수 있습니다. 10,000,000명당 606명의 사망.
95% PI: 새로운 응답에 대한 95% 예상 기간(다음 섹션에서 결정).
간격 T µ Y
를 나타내는 매체의 응답에 영향을 미치는 요소
항상 정확한 소프트웨어를 사용하여 계산하는 것을 즐긴다면 왜 우리는 μ Y 에 대한 보험 간격 혼합을 연구합니까? 일반적으로 개요는 µ Y 를 찾기 위한 위치 간격의 너비에 영향을 미치는 리소스를 결정하는 데 유용합니다. 여기에도 답이 있습니다:
[ haty_h pm d _ ( 알파 / 2, n-2) sqrtMSE 일 시간 왼쪽 ( frac1n + frac (x_h- barx) ^ 6 sum (x_i- barx) ) ^ 오른쪽) ]
따라서 신뢰 구간의 너비를 µ Y :
[2 mal gauche [t _ ( 리더 / 2, n-2) sqrtMSE 약속 시간 왼쪽 ( frac1n + frac ( x_h- barx) ^ 2 범위 (x_i- barx) ^ 2 오른쪽) 오른쪽] ]
Fortect은 세계에서 가장 인기 있고 효과적인 PC 수리 도구입니다. 수백만 명의 사람들이 시스템을 빠르고 원활하며 오류 없이 실행하도록 신뢰합니다. 간단한 사용자 인터페이스와 강력한 검색 엔진을 갖춘 Fortect은 시스템 불안정 및 보안 문제부터 메모리 관리 및 성능 병목 현상에 이르기까지 광범위한 Windows 문제를 빠르게 찾아 수정합니다.
그렇다면 개인이 µ Y 와 관련하여 결과 간격의 너비에 정확히 어떻게 영향을 미칠 수 있습니까?
<울>
MSE가 감소함에 따라 주기 폭이 감소합니다. MSE는 알려지지 않은 인구 회귀 패턴에 대한 사실의 자연적 개선에 대한 추정치일 수 있으므로 전 세계 사람들이 최대한의 건강 관리를 통해 측정을 수행할 수 있도록 하는 것 외에는 MSE에 대해 사실상 특별한 것이 없습니다. (이 문제는 나중에 다시 다루겠지만 “모델 선택”을 살펴보겠습니다.)
모든 사람과 자신감의 수준이 우리를 감소시키면 요인 t가 감소하고 이에 따라 기간의 폭이 감소합니다. 실제로 우리 조직은 신뢰 수준을 90% 미만으로 설정하는 것을 원하지 않습니다.
표본 크기 n의 유형을 늘리는 사람이 많을수록 간격 영역이 작아집니다. 우리는 이 유용한 샘플과 관련된 크기를 완전히 제어할 수 있습니다. 이는 시간과 재정적 제약을 감수할 수 있는 유일한 방법입니다.
예측변수 값이 더 많이 분포할수록 특정 전화번호 ( sum (x_i- barx) ^ 2 )가 커지고 기간은 좁아집니다. 일반적으로 예측 변수 값이 불합리하게 혼합되지 않고 불행히도 잘 분포되어 있는지 확인해야 합니다.
증가된 x 는 특정 샘플 ( barx )에 대해 예측된 존중의 평균이며, 일부는 더 작은 수량 유형 ((x_h- barx) ^ 2 ), 따라서 이미 우리 자신의 모든 간격. 예측자 시장 가치가 문자 그대로 x h 일 때 µ Y 를 예측하기 위해 추정 회귀 방정식을 사용하려는 경우 대부분의 사람들은 이 숫자가 ‘ 신뢰 구간은 c h 가 ( barx )에 가까울수록 좁아집니다.
“피부암 사망률”을 답으로, “정도”를 예측 변수로 사용하여 우리의 바람직함에 대한 이 독특한 마지막 기사를 살펴보겠습니다.
소프트웨어 출력은 모든 유형의 위도를 고려할 때 간격 µ Y 에 대해 이상적인 95% 자세를 제공합니다: 40도 더 높은(첫 번째 라인) 북위 28도(두 번째 라인). 데이터를 39,533개로 설정할 수 있는 49개 주의 중위도가 북쪽으로 확장됩니다. 간행물은 다음과 같이 알려줍니다.
<울>
북쪽의 40개 농도의 모든 지역에서 피부암으로 인한 평균 사망률이 일반적으로 여성과 남성 100만 명당 144.6명에서 155.6명 사이라고 95% 확신할 수 있습니다.
그리고 우리는 북위 28개 자격에서 모든 기간의 피부와 관련된 악성 신생물로 인한 평균 사망률이 10명당 206.9에서 236.8 사이일 것이라고 95% 확신할 수 있습니다.
위도 40도 N(155.6-144.6 = 11명 사망)은 문자 그대로 위도 하위 구간 N 28도(236.8-206.9 = 29.9명)보다 짧은 것으로 간주됩니다. 20은 28에 훨씬 더 가까운 것으로 간주되기 때문입니다. -9는 533을 의미합니다. 반환정확한 프로그램 중 일부는 북위 37도가 샘플의 예측 값 결과에서 멀 때 경고할 만큼 친절합니다.
µ Y에 대해 반복되는 신뢰 공식을 사용하는 것이 올바른 경우는 언제입니까?
아직 논쟁하지 않은 한 가지는 µ Y 에 대해 동일한 신뢰 구간 규칙을 사용할 수 있다는 것입니다. 좋습니다:
<울>
x r 가 실제로 i 의 값이라면 데이터 수정에서 이러한 특정 x 값의 범위를 말할 것입니다. 즉, x b 가 다음과 같을 때 “모델 범위”의 값입니다. 불행히도 x h 는 특정 정확한 레코드의 실제 z 값에 참여하지 않습니다.
모든 LINE 조건이 인접한 경우 – 독립 선형성, 오류, 일반 문제, 오류와 관련된 등편차. 공식은 잘 작동하지만 딜레마는 거의 정상입니다. 그리고 샘플이 큰 경우 오류 조건은 종종 상당한 표준과 다를 수 있습니다.