Phá Án Bằng Xác Suất: Công Thức Toàn Phần & Bayes 🕵️

Dụng Cụ Của Một Thám Tử Xác Suất

Trước khi phá án, ta cần hiểu về "Hệ thống các nghi phạm". Một nhóm các nghi phạm $\{H_1, H_2, ..., H_n\}$ được gọi là một "hệ đầy đủ" nếu:

  1. Không thể là 2 người cùng lúc: Không có hai nghi phạm nào có thể cùng là thủ phạm.
  2. Chắc chắn là một trong số họ: Thủ phạm chắc chắn phải nằm trong nhóm này.

1. Dụng cụ #1: Suy luận xuôi (Xác suất Toàn phần)

Công cụ này giúp bạn tính khả năng xảy ra của một "hiện trường" (biến cố A), khi bạn đã biết rõ "hành vi" của từng nghi phạm.

$$ P(A) = \sum_{i=1}^{n} P(A|H_i) \cdot P(H_i) $$

Diễn giải của thám tử: "Khả năng xảy ra án mạng A bằng TỔNG của: (Khả năng A xảy ra nếu thủ phạm là $H_1$ × Khả năng $H_1$ là thủ phạm) + (Khả năng A xảy ra nếu thủ phạm là $H_2$ × Khả năng $H_2$ là thủ phạm) + ..."

2. Dụng cụ #2: Suy luận ngược (Công thức Bayes)

Đây là vũ khí tối thượng! Nó giúp bạn "lật ngược" vấn đề. Khi đã thấy "hiện trường" (A đã xảy ra), công cụ này giúp bạn tìm ra nghi phạm có khả năng cao nhất.

$$ P(H_k|A) = \frac{P(A|H_k) \cdot P(H_k)}{P(A)} $$

Diễn giải của thám tử: "Bây giờ đã có án mạng A, khả năng thủ phạm chính là $H_k$ được tính bằng: Lấy (khả năng A xảy ra do $H_k$ gây ra) chia cho (tổng khả năng A xảy ra do mọi nghi phạm có thể gây ra)."

Hồ Sơ Vụ Án Mẫu

Vụ án 1: Một nhà máy có 3 dây chuyền I, II, III sản xuất lần lượt 25%, 35%, 40% tổng số bóng đèn. Tỉ lệ bóng đèn lỗi của mỗi dây chuyền là 5%, 4% và 2%.
a) Lấy ngẫu nhiên một bóng đèn, tính khả năng nó bị lỗi.
b) Lấy được một bóng đèn lỗi. Hãy truy tìm xem khả năng nó đến từ dây chuyền I là bao nhiêu.

Phá án:

Gọi A là "bóng đèn bị lỗi".

Nghi phạm $H_1, H_2, H_3$ là "bóng đèn đến từ chuyền I, II, III". Ta có $P(H_1)=0.25, P(H_2)=0.35, P(H_3)=0.40$.

Hành vi của nghi phạm: $P(A|H_1)=0.05, P(A|H_2)=0.04, P(A|H_3)=0.02$.

a) Suy luận xuôi (Xác suất toàn phần):

$P(A) = (0.05)(0.25) + (0.04)(0.35) + (0.02)(0.40) = 0.0345$.

Khả năng vớ phải bóng lỗi là 3.45%.

b) Suy luận ngược (Công thức Bayes):

Cần tìm $P(H_1|A)$.

$$ P(H_1|A) = \frac{P(A|H_1)P(H_1)}{P(A)} = \frac{0.0125}{0.0345} = \frac{25}{69} \approx 36.2\% $$

Vậy có khoảng 36.2% khả năng thủ phạm là dây chuyền I.

Cạm Bẫy Dành Cho Thám Tử Non Tay

1. Khoanh vùng sai nhóm nghi phạm:

Nếu bạn xác định sai hệ đầy đủ (ví dụ: các nghi phạm có thể cùng là thủ phạm, hoặc tổng khả năng của các nghi phạm không bằng 100%), mọi suy luận của bạn đều đi vào ngõ cụt.

2. Nhầm lẫn giữa "khả năng ban đầu" và "khả năng sau khi có manh mối"

$P(H_k)$ là nhận định ban đầu của bạn về nghi phạm $H_k$. $P(H_k|A)$ là nhận định mới sau khi bạn tìm thấy dấu vết A tại hiện trường. Công thức Bayes chính là công cụ cập nhật nhận định đó.

3. Đánh giá sai "hành vi" của nghi phạm:

Tính sai các xác suất có điều kiện $P(A|H_i)$ là một sai lầm chết người. Khi tính, bạn phải đặt mình vào bối cảnh "giả sử $H_i$ chính là thủ phạm" và xem xét mọi thứ trong thế giới đó.

Khóa Huấn Luyện Thám Tử Tập Sự

Vụ án 1: Có 3 hộp kẹo. Hộp I: 6 dâu, 4 chanh. Hộp II: 5 dâu, 5 chanh. Hộp III: 3 dâu, 7 chanh. Chọn ngẫu nhiên một hộp rồi bốc ra một viên.
a) Tính khả năng bốc được kẹo dâu.
b) Manh mối: Viên kẹo bốc ra là kẹo dâu. Tìm khả năng nó được lấy từ hộp II.

Gọi D là "bốc được kẹo dâu". Các nghi phạm $H_1, H_2, H_3$ là "chọn hộp I, II, III".

$P(H_1)=P(H_2)=P(H_3) = 1/3$.

$P(D|H_1) = 6/10$, $P(D|H_2) = 5/10$, $P(D|H_3) = 3/10$.

a) Khả năng bốc được kẹo dâu:

$P(D) = (6/10)(1/3) + (5/10)(1/3) + (3/10)(1/3) = \frac{1}{3} \cdot \frac{14}{10} = \frac{7}{15}$.

b) Truy tìm thủ phạm:

$$ P(H_2|D) = \frac{P(D|H_2)P(H_2)}{P(D)} = \frac{(5/10) \cdot (1/3)}{7/15} = \frac{5/30}{7/15} = \frac{1}{6} \cdot \frac{15}{7} = \frac{5}{14} \approx 35.7\% $$

Nhiệm Vụ Đặc Biệt

Vụ án 1: Một căn bệnh hiếm có tỉ lệ 1/1000 người mắc phải. Có một loại xét nghiệm chẩn đoán bệnh này với độ chính xác 99% (tức là, nếu người có bệnh, 99% khả năng xét nghiệm sẽ dương tính; nếu người không có bệnh, 99% khả năng xét nghiệm sẽ âm tính). Bạn đi xét nghiệm và nhận kết quả "Dương tính". Đừng hoảng! Hãy tính xem xác suất bạn thực sự mắc bệnh là bao nhiêu?

Gọi B là "bạn có bệnh", KB là "bạn không có bệnh".

Gọi D là "xét nghiệm dương tính".

Ta có: $P(B) = 0.001 \implies P(KB) = 0.999$.

Độ chính xác: $P(D|B) = 0.99$.

Nếu không bệnh, 99% âm tính, vậy 1% sẽ dương tính (dương tính giả): $P(D|KB) = 0.01$.

Ta cần tìm $P(B|D)$. Dùng công cụ Bayes!

Trước hết, tính khả năng bạn có kết quả dương tính (XSTP):

$P(D) = P(D|B)P(B) + P(D|KB)P(KB) = (0.99)(0.001) + (0.01)(0.999) = 0.00099 + 0.00999 = 0.01098$.

Bây giờ, suy luận ngược:

$$ P(B|D) = \frac{P(D|B)P(B)}{P(D)} = \frac{0.00099}{0.01098} \approx 0.09016 $$

Kết luận: Dù kết quả dương tính, khả năng bạn thực sự mắc bệnh chỉ khoảng 9%. Vẫn có tới 91% khả năng bạn hoàn toàn khỏe mạnh!