-/통계 기초
[통계] 베이즈 정리
염두리안
2022. 7. 25. 03:33
728x90
반응형
예제를 이용해 베이즈 정리가 만들어지는 과정 알아보기
어떤 반에서 가정용 게임기와 PC 보유율을 조사했다.
- X 학생에 따르면 가정용 게임기와 PC 모두 있는 사람은 30%
- Y 학생에 따르면 가정용 게임기가 있는 사람은 50%, 그중에 PC가 있는 사람은 60%
- Z 학생에 따르면 PC가 있는 사람은 60%, 그중에 가정용 게임기가 있는 사람은 50%
사건 A) 가정용 게임기가 있는 사람
사건 B) PC가 있는 사람
이라고 할 때, 다음을 구하여라.
- X 학생의 말을 이용해 P(A∩B)
- P(A∩B) = 가정용 게임기와 PC 둘 다 있는 사람 => 30% = 3/10
- Y 학생의 말을 이용해 P(A), P(B|A), P(A∩B)
- P(A) = 가정용 게임기가 있는 사람 = 50% / P(B|A) = 그중에 PC가 있는 사람(조건부 확률) = 60%
- 따라서 P(A)*P(B|A) = P(A∩B)가 됨 ··· ①
- Z 학생의 말을 이용해 P(B), P(A|B), P(A∩B)
- P(B) = PC가 있는 사람 = 60% / P(A|B) = 그중에 가정용 게임기가 있는 사람(조건부 확률) = 50%
- 따라서 P(B)*P(A|B) = P(A∩B) ··· ②
이때, ①과 ②를 연결하면
- P(A∩B) = P(A)*P(B|A) = P(B)*P(A|B)
이 식을 P(B)로 나눈 후, P(A|B)를 좌변으로 옮기면 조건부 확률 공식과 베이즈 정리가 됨.
- P(A|B) = P(A∩B)/P(B) = P(B|A)*P(A)/P(B)
- P(A∩B)/P(B) : 조건부 확률 공식
- P(B|A)*P(A)/P(B) : 베이즈 정리
*** 여기서 중요한 점
- P(B|A)는 A일 때(원인), B의 확률(결과)
- P(A|B)는 B일 때(결과), A의 확률(원인)
- 즉, 베이즈 정리는 시간의 흐름이 거꾸로 일 때 힘을 발휘함.
베이즈 정리에서의 용어정리
- P(A) : 사전 확률(A가 될 확률)
- P(A|B) : 사후 확률(B일 때 A가 될 확률)
- P(A∩B) : 동시확률
- P(B|A) : 가능도
- P(B) : 주변 가능도
Do it 첫 통계 with 베이즈 3.6 (p. 113 ~ 117)
민감도와 특이도
- 민감도(sensitivity) : 올바르게 양성으로 판정할 확률
- 민감도 = 양성 / (양성+거짓음성)
- 거짓 음성(false negative) : 잘못 판정한 음성
- 특이도(specificity) : 올바르게 음성으로 판정할 확률
- 특이도 = 음성 / (음성+거짓양성)
- 거짓 양성(false positive) : 잘못 판정한 양성
- 민감도와 특이도가 낮은 검사에서 이환율이 낮을 땐, 조사 대상을 한정할 필요가 있음.
Do it 첫 통계 with 베이즈 4.2 (p. 142 ~ 152)
Do it 첫 통계 with 베이즈는 대충 여기서 끝 ~,~
728x90
반응형