-/통계 기초

[통계] 베이즈 정리

염두리안 2022. 7. 25. 03:33
728x90
반응형

 

예제를 이용해 베이즈 정리가 만들어지는 과정 알아보기

어떤 반에서 가정용 게임기와 PC 보유율을 조사했다.

  • X 학생에 따르면 가정용 게임기와 PC 모두 있는 사람은 30%
  • Y 학생에 따르면 가정용 게임기가 있는 사람은 50%, 그중에 PC가 있는 사람은 60%
  • Z 학생에 따르면 PC가 있는 사람은 60%, 그중에 가정용 게임기가 있는 사람은 50%

사건 A) 가정용 게임기가 있는 사람

사건 B) PC가 있는 사람

이라고 할 때, 다음을 구하여라.

  1. X 학생의 말을 이용해 P(A∩B)
    • P(A∩B) = 가정용 게임기와 PC 둘 다 있는 사람 => 30% = 3/10
  2. Y 학생의 말을 이용해 P(A), P(B|A), P(A∩B)
    • P(A) = 가정용 게임기가 있는 사람 = 50% / P(B|A) = 그중에 PC가 있는 사람(조건부 확률) = 60%
    • 따라서 P(A)*P(B|A) = P(A∩B)가 됨 ··· ①
  3. Z 학생의 말을 이용해 P(B), P(A|B), P(A∩B)
    • P(B) = PC가 있는 사람 = 60% / P(A|B) = 그중에 가정용 게임기가 있는 사람(조건부 확률) = 50%
    • 따라서  P(B)*P(A|B) = P(A∩B) ··· ②

이때, ①과 ②를 연결하면

  • P(A∩B) = P(A)*P(B|A) = P(B)*P(A|B)

이 식을 P(B)로 나눈 후, P(A|B)를 좌변으로 옮기면 조건부 확률 공식과 베이즈 정리가 됨.

  • P(A|B) = P(A∩B)/P(B) = P(B|A)*P(A)/P(B)
    • P(A∩B)/P(B) : 조건부 확률 공식
    • P(B|A)*P(A)/P(B) : 베이즈 정리

*** 여기서 중요한 점

  • P(B|A)는 A일 때(원인), B의 확률(결과)
  • P(A|B)는 B일 때(결과), A의 확률(원인)
  • 즉, 베이즈 정리는 시간의 흐름이 거꾸로 일 때 힘을 발휘함.

 

베이즈 정리에서의 용어정리

  • P(A) : 사전 확률(A가 될 확률)
  • P(A|B) : 사후 확률(B일 때 A가 될 확률)
  • P(A∩B) : 동시확률
  • P(B|A) : 가능도
  • P(B) : 주변 가능도

 

 

Do it 첫 통계 with 베이즈 3.6 (p. 113 ~ 117)


 

민감도와 특이도

  • 민감도(sensitivity) : 올바르게 양성으로 판정할 확률
    • 민감도 = 양성 / (양성+거짓음성) 
    • 거짓 음성(false negative) : 잘못 판정한 음성
  • 특이도(specificity) : 올바르게 음성으로 판정할 확률
    • 특이도 = 음성 / (음성+거짓양성) 
    • 거짓 양성(false positive) : 잘못 판정한 양성
  • 민감도와 특이도가 낮은 검사에서 이환율이 낮을 땐, 조사 대상을 한정할 필요가 있음.

 

 

Do it 첫 통계 with 베이즈 4.2 (p. 142 ~ 152)

 

 


 

Do it 첫 통계 with 베이즈는 대충 여기서 끝 ~,~

728x90
반응형