Luật Bayes

Luật Bayes là cơ sở của hệ thống loại trừmạng Bayes mà mình sẽ đề cập đên đến sau này.

Nhắc lại xác suất có điều kiện:

$$P(A|B) = \frac{P(AB)}{P(B)}$$

Định luật tổng xác suất: Coi A 1 , A 2 , . . . , A k , là các phần nhỏ của không gian mẫu Ω, , Ω= j = 1 k A j , = j = 1 k A j và biến cố B bất kì, ta có:

$$P(B)=\displaystyle \sum_{i=1}^kP(B|A_i)P(A_i)$$
  • Chứng minh: Định nghĩa C j = B A j , ta có C 1 , . . . , C k không giao nhau và B = j = 1 k C j , do đó: $$P(B) = \sum_{j}P(C_j)= \sum_{j}P(BA_j)=\sum_{j}P(B|A_j)P(A_j)$$

Luật Bayes: Với các A 1 , A 2 , . . . , A k , Ω, B được định nghĩa ở trên, ta có: $$P(A_i|B) = \frac{P(B|A_i)P(A_i)}{\sum_{j}P(B|A_j)P(A_j)}$$

  • Chứng minh: $$P(A_i|B) =\frac{P(BA_i)}{P(B)}=\frac{P(B|A_i)P(A_i)}{P(B)} =\frac{P(B|A_i)P(A_i)}{\sum_{j}P(B|A_j)P(A_j)}$$

Ví dụ: Định nghĩa một email gồm A 1 = " s p a m " , A 2 = " n o t s p a m " . Theo kinh nghiệm, ta có P ( A 1 ) = 0 . 3 P ( A 2 ) = 0 . 7 . Gọi B là biến cố có từ "làm giàu" trong một email. Theo kinh nghiệm: P ( B | A 1 ) = 0 . 9 P ( B | A 2 ) = 0 . 0 5 . Vậy nếu bạn nhận được một email có từ "làm giàu" thì xác suất nó là "spam" là bao nhiêu?

  • Lời giải: $$P(A_1|B) = \frac{P(B|A_1)P(A_1)}{P(B|A_1)P(A_1)+P(B|A_2)P(A_2)}\approx 0.89$$