-
역확률의 함정 - 특이한 사건일 수록 해석 주의!!!Math♾️/Probability Statistics🎲 2025. 8. 3. 15:32
역확률 계산과 베이즈 정리
암이 걸리는 사건을 $A$라 하고 어떤 증상이 나타나는 사건을 $B$라고 할때,
우리가 알고 싶은 것은 어떤 증상($B$)이 나타났을 때 암($A$)이 걸렸을 확률입니다.
하지만 실제로 관측하기 쉬운 경우는 암이 걸린 환자($A$)가 어떤 증상($B$)을 가졌는지 입니다.
이렇게 우리가 알고자하는 것과 실제로 알 수 있는 것의 방향이 반대인 경우, 우리는 베이즈 정리를 활용해 역확률을 계산할 수 있습니다.
1단계: 조건부 확률의 정의
$$P(A|B) = \frac{P(A \cap B)}{P(B)}$$
2단계: 교환 법칙 적용
교집합은 순서가 바뀌어도 같으므로: $$P(A \cap B) = P(B \cap A)$$
따라서: $$P(B|A) = \frac{P(B \cap A)}{P(A)} = \frac{P(A \cap B)}{P(A)}$$
이를 $P(A \cap B)$에 대해 정리하면: $$P(A \cap B) = P(B|A) \times P(A)$$
3단계: 1단계 식에 대입
$$P(A|B) = \frac{P(A \cap B)}{P(B)} = \frac{P(B|A) \times P(A)}{P(B)}$$
4단계: 전확률 법칙으로 ( 복잡한 사건의 확률을 여러개의 조건부 확률로 나누어 계산하는 방법) $P(B)$ 전개
곱셈 법칙과 전체 확률의 법칙
곱셈 법칙 (Multiplication Law )조건부 확률은 P(A|B)를 다음과 같이 정의 됩니다. P(A|B) = P(A ∩ B) / P(B)위의 식에서 P(B)를 양변에 곱하면 다음과 같은 중요한 결과를 얻을 수 있습니다. P(A ∩ B) = P(A|B)
people-analysis.tistory.com
$$P(B) = P(B|A) \times P(A) + P(B|A^c) \times P(A^c)$$
5단계: 최종 베이즈 정리
$$P(A|B) = \frac{P(B|A) \times P(A)}{P(B|A) \times P(A) + P(B|A^c) \times P(A^c)}$$
- $P(A|B)$: 우리가 알고 싶은 것 (증상 → 질병)
- $P(B|A)$: 우리가 쉽게 알 수 있는 것 (질병 → 증상)
- 베이즈 정리를 통해 "쉽게 알 수 있는 방향"의 정보를 "알고 싶은 방향"으로 뒤집을 수 있습니다.
베이즈 정리와 구성요소의 의미
P(원인|결과) = P(결과|원인) × P(원인) / P(결과)
또는
P(B|A) = P(A|B) × P(B) / P(A)
P(B|A): 사후확률(Posterior Probability)
- 결과 A를 관찰한 후, 원인 B가 참일 확률
- 우리가 정말로 알고 싶은 값
- 예: "검사에서 양성일 때, 실제로 병에 걸렸을 확률"
P(A|B): 우도(Likelihood)
- 원인 B가 참일 때, 결과 A가 나타날 확률
- 보통 알고 있거나 측정 가능한 값
- 예: "병에 걸린 사람이 검사에서 양성일 확률"
P(B): 사전확률(Prior Probability)
- 어떤 관찰도 하기 전 원인 B가 참일 확률
- 기저율 또는 유병률
- 예: "전체 인구 중 해당 질병에 걸린 비율"
P(A): 전체확률(Total Probability)
- 결과 A가 나타날 전체 확률
- 정규화 상수 역할
- 전확률 법칙으로 계산
약물 검사의 딜레마
정의
- $A$: 검사 결과가 양성
- $B$: 실제로 약물을 사용
- 우리가 알고 싶은 것: $P(B|A)$ = 검사가 양성일 때 실제로 약물을 사용했을 확률
- 우리가 아는 것: $P(A|B)$ = 약물 사용자가 양성 검사를 받을 확률
주어진 조건
- 인구 중 약물 사용률: $P(B) = 0.1$ (10%)
- 따라서 비사용률: $P(B^c) = 0.9$ (90%)
첫 번째 시나리오: 대칭적 정확도 (90%)
검사 특성:
- 민감도: $P(A|B) = 0.9$ (사용자의 90%가 양성)
- 특이도: $P(A^c|B^c) = 0.9$ (비사용자의 90%가 음성)
- 거짓양성률: $P(A|B^c) = 1 - 0.9 = 0.1$
베이즈 정리 적용
$P(B|A) = \frac{P(A|B) \times P(B)}{P(A)}$
1단계: 전확률 법칙으로 $P(A)$ 계산
$P(A) = P(A|B) \times P(B) + P(A|B^c) \times P(B^c)$ $P(A) = 0.9 \times 0.1 + 0.1 \times 0.9 = 0.09 + 0.09 = 0.18$
2단계: 베이즈 정리 계산
$P(B|A) = \frac{0.9 \times 0.1}{0.18} = \frac{0.09}{0.18} = 0.5$
결과: 검사에서 양성이 나와도 실제로 약물을 사용할 확률은 50%밖에 되지 않음
두 번째 시나리오: 비대칭적 정확도 (민감도 vs 특이도)
검사 특성:
- 민감도(Sensitivity): $P(A|B) = 0.9$ (90%)
- 특이도(Specificity): $P(A^c|B^c) = 0.8$ (80%)
- 거짓양성률: $P(A|B^c) = 1 - 0.8 = 0.2$ (20%)
베이즈 정리 적용
1단계: 전확률 법칙으로 $P(A)$ 계산
$P(A) = P(A|B) \times P(B) + P(A|B^c) \times P(B^c)$ $P(A) = 0.9 \times 0.1 + 0.2 \times 0.9 = 0.09 + 0.18 = 0.27$
2단계: 베이즈 정리 계산
$P(B|A) = \frac{P(A|B) \times P(B)}{P(A)} = \frac{0.9 \times 0.1}{0.27} = \frac{0.09}{0.27} = \frac{1}{3} \approx 0.33$
결과: 검사에서 양성이 나와도 실제 사용자일 확률은 33%에 불과
민감도와 특이도의 중요성
민감도(Sensitivity)
- 실제 양성을 얼마나 잘 찾아내는가?
- $\text{민감도} = \frac{\text{진양성}}{\text{진양성} + \text{위음성}} = P(A|B)$
- 높을수록 "놓치는" 경우가 적음
특이도(Specificity)
- 실제 음성을 얼마나 잘 찾아내는가?
- $\text{특이도} = \frac{\text{진음성}}{\text{진음성} + \text{위양성}} = P(A^c|B^c)$
- 높을수록 "오탐"이 적음
100% 민감도의 함정 만약 모든 검사를 양성으로 판정한다면
- 민감도: $P(A|B) = 1.0$ (100% - 모든 사용자를 찾아냄)
- 특이도: $P(A^c|B^c) = 0$ (0% - 모든 비사용자도 양성)
- 결과: 전혀 쓸모없는 검사!
희귀 사건의 역설
이러한 반직관적 결과는 희귀 사건과 검사 정확도의 상호작용 때문입니다.
- 기저율이 낮음: 실제 사용자가 10%밖에 안 됨
- 거짓양성의 절대적 수: 비사용자가 90%나 되므로, 작은 거짓양성률도 많은 거짓양성을 만듦
- 진양성 vs 거짓양성: 실제 양성보다 거짓양성이 더 많을 수 있음
머신러닝에서의 함의
이 원리는 머신러닝에서도 중요합니다:
- 불균형 데이터: 희귀 사건을 예측할 때 단순히 "항상 발생하지 않는다"고 예측하면 99.9% 정확도를 얻을 수 있음
- 평가 지표의 중요성: 단순 정확도보다는 민감도, 특이도, F1-점수 등을 고려해야 함
- 데이터 가중치: 희귀 사건에 더 높은 가중치를 주는 것이 필요
베이즈적 사고의 중요성
- 직관을 의심하라: 90% 정확한 검사라도 결과 해석은 복잡함
- 기저율을 고려하라: 사전 확률이 결과에 큰 영향을 미침
- 추가 검사의 필요성: 희귀 사건에서는 연속 검사가 필요할 수 있음
- 민감도와 특이도의 균형: 둘 다 높아야 유용한 검사

'Math♾️ > Probability Statistics🎲' 카테고리의 다른 글
독립성을 확보할 수록 시스템이 안정된다 (0) 2025.08.03 믿음은 계속 업데이트된다 - Bayes' Thorem (0) 2025.05.30 곱셈 법칙과 전체 확률의 법칙 (0) 2025.03.15 조건부 확률 : 새롭게 주어진 정보를 활용하자 (0) 2025.03.14 이항 계수 : 뽑을까 말까? / 다항 계수 : 어디에 줄까? (0) 2025.03.12