🕵️‍♂️ Truy Vết Nguyên Nhân Với Bayes & Xác Suất Toàn Phần 🕵️‍♀️

Từ kết quả, liệu bạn có thể suy luận ngược về nguyên nhân? Hãy trở thành một thám tử xác suất!

Chọn manh mối chính xác nhất!

Câu 1: Sứ mệnh của Xác suất Toàn phần

Công thức xác suất toàn phần được dùng để làm gì?

Đáp án đúng là A.

Giải thích: Tên gọi "toàn phần" đã nói lên tất cả! Nó giúp ta tính xác suất tổng thể (toàn phần) của một sự kiện bằng cách tổng hợp xác suất của nó trong từng trường hợp (kịch bản) riêng lẻ. Giống như tính tổng doanh thu bằng cách cộng doanh thu từ nhiều cửa hàng khác nhau vậy.

Câu 2: Bài toán nhà máy (Phần 1)

Một nhà máy có 2 máy: Máy I sản xuất 30% sản phẩm với tỷ lệ lỗi 1%. Máy II sản xuất 70% sản phẩm với tỷ lệ lỗi 3%. Lấy ngẫu nhiên một sản phẩm. Xác suất sản phẩm đó bị lỗi là bao nhiêu?

Đáp án đúng là C.

Giải thích: Đây là lúc dùng công thức xác suất toàn phần. Gọi L là "sản phẩm lỗi".
\(P(L) = P(\text{Máy I}) \times P(L|\text{Máy I}) + P(\text{Máy II}) \times P(L|\text{Máy II})\)
\(P(L) = (0.30 \times 0.01) + (0.70 \times 0.03)\)
\(P(L) = 0.003 + 0.021 = 0.024\), tức là 2.4%.

Câu 3: Sứ mệnh của Công thức Bayes

Công thức Bayes có vai trò chính là gì?

Đáp án đúng là B.

Giải thích: Công thức Bayes là công cụ "suy luận ngược" kinh điển. Nó cho phép ta bắt đầu với một niềm tin ban đầu về một giả thuyết (xác suất tiên nghiệm), sau đó khi có thêm bằng chứng mới, ta "cập nhật" lại niềm tin đó để có một xác suất chính xác hơn (xác suất hậu nghiệm).

Câu 4: Bài toán nhà máy (Phần 2)

Vẫn với dữ kiện từ Câu 2. Nếu bạn lấy phải một sản phẩm bị lỗi, xác suất nó đến từ Máy I là bao nhiêu?

Đáp án đúng là A.

Giải thích: Đây là lúc thám tử Bayes ra tay! Ta cần tính \(P(\text{Máy I} | L)\).
Công thức: \(P(\text{Máy I} | L) = \frac{P(\text{Máy I}) \times P(L|\text{Máy I})}{P(L)}\)
Ta đã biết:
- \(P(\text{Máy I}) \times P(L|\text{Máy I}) = 0.30 \times 0.01 = 0.003\)
- \(P(L) = 0.024\) (từ Câu 2)
Vậy: \(P(\text{Máy I} | L) = \frac{0.003}{0.024} = \frac{1}{8} = 0.125\), tức là 12.5%.

Sự thật hay Cú lừa?

Câu 1: Mối quan hệ khăng khít

Kết quả tính được từ công thức xác suất toàn phần \(P(A)\) thường được dùng làm mẫu số trong công thức Bayes để tính \(P(H_i|A)\).

Đáp án là Đúng.

Giải thích: Chính xác! Công thức Bayes đầy đủ là \(P(H_i|A) = \frac{P(H_i)P(A|H_i)}{\sum P(H_j)P(A|H_j)}\). Cái mẫu số dài ngoằng ở dưới chính là công thức xác suất toàn phần của A. Hai công thức này là "cặp bài trùng" không thể tách rời.

Câu 2: Cập nhật niềm tin

Công thức Bayes cho phép chúng ta cập nhật độ tin cậy của một giả thuyết khi có thêm bằng chứng mới.

Đáp án là Đúng.

Giải thích: Đây chính là linh hồn của suy luận Bayes. Bạn có một "niềm tin" ban đầu (xác suất tiên nghiệm), sau khi quan sát một "bằng chứng", bạn dùng công thức Bayes để điều chỉnh lại niềm tin đó một cách hợp lý (xác suất hậu nghiệm). Nó mô phỏng cách con người học hỏi từ kinh nghiệm.

Câu 3: Nhầm lẫn phổ biến

Xác suất để một người có triệu chứng A khi mắc bệnh B - \(P(A|B)\), luôn bằng xác suất người đó mắc bệnh B khi có triệu chứng A - \(P(B|A)\).

Đáp án là Sai.

Giải thích: Đây là một lỗi logic rất phổ biến. Ví dụ: Hầu hết các bệnh nhân ung thư phổi đều ho (\(P(\text{ho}|\text{ung thư})\) cao), nhưng không phải tất cả những người bị ho đều bị ung thư phổi (\(P(\text{ung thư}|\text{ho})\) thấp). Công thức Bayes chính là công cụ để phân biệt và tính toán hai giá trị khác biệt này.

Câu 4: Vai trò của xác suất ban đầu

Trong công thức Bayes, xác suất ban đầu của giả thuyết \(P(H_i)\) không quan trọng bằng xác suất của bằng chứng \(P(A|H_i)\).

Đáp án là Sai.

Giải thích: Cả hai đều cực kỳ quan trọng. Một giả thuyết có thể giải thích bằng chứng rất tốt ( \(P(A|H_i)\) cao), nhưng nếu bản thân giả thuyết đó cực kỳ khó xảy ra ( \(P(H_i)\) rất thấp), thì xác suất cuối cùng \(P(H_i|A)\) vẫn sẽ thấp. Ví dụ: Giả thuyết "người ngoài hành tinh làm vỡ cửa sổ" giải thích rất tốt việc cửa sổ bị vỡ, nhưng xác suất ban đầu của nó quá thấp để được xem là hợp lý.

Nhập vai thám tử, điền con số quyết định! (Nhập kết quả thập phân, làm tròn 3 chữ số nếu cần)

Câu 1: Bài toán túi bi

Túi A có 2 bi đỏ, 3 bi xanh. Túi B có 4 bi đỏ, 1 bi xanh. Xác suất chọn túi A là 0.4 và túi B là 0.6. Tính xác suất toàn phần để bốc được một bi đỏ?

Đáp án là 0.64.

Giải thích:
Gọi R là biến cố "bốc được bi đỏ".
\(P(R|\text{Túi A}) = 2/5 = 0.4\).
\(P(R|\text{Túi B}) = 4/5 = 0.8\).
Áp dụng công thức xác suất toàn phần:
\(P(R) = P(\text{A})P(R|\text{A}) + P(\text{B})P(R|\text{B})\)
\(P(R) = (0.4 \times 0.4) + (0.6 \times 0.8) = 0.16 + 0.48 = 0.64\).

Câu 2: Truy tìm chiếc túi

Từ dữ kiện Câu 1, nếu bạn đã bốc được một bi đỏ, xác suất nó đến từ túi A là bao nhiêu?

Đáp án là 0.25.

Giải thích:
Ta cần tính \(P(\text{A}|R)\).
Áp dụng công thức Bayes: \(P(\text{A}|R) = \frac{P(\text{A})P(R|\text{A})}{P(R)}\).
Từ Câu 1, ta có: \(P(\text{A})P(R|\text{A}) = 0.4 \times 0.4 = 0.16\).
Và \(P(R) = 0.64\).
Vậy \(P(\text{A}|R) = \frac{0.16}{0.64} = \frac{1}{4} = 0.25\).

Câu 3: Thư rác hay không?

Một bộ lọc thư rác xác định rằng 50% email là thư rác. Từ "khuyến mãi" xuất hiện trong 10% thư rác nhưng chỉ xuất hiện trong 1% thư thường. Tính xác suất toàn phần để một email bất kỳ chứa từ "khuyến mãi".

Đáp án là 0.055.

Giải thích:
Gọi S là "thư rác", T là "thư thường", K là "chứa từ khuyến mãi".
\(P(S) = 0.5\), \(P(T) = 0.5\).
\(P(K|S) = 0.10\), \(P(K|T) = 0.01\).
Xác suất toàn phần của K:
\(P(K) = P(S)P(K|S) + P(T)P(K|T)\)
\(P(K) = (0.5 \times 0.10) + (0.5 \times 0.01) = 0.05 + 0.005 = 0.055\).

Câu 4: Kết luận của bộ lọc

Từ dữ kiện Câu 3, nếu một email chứa từ "khuyến mãi", xác suất nó thật sự là thư rác là bao nhiêu?

Đáp án là 0.909.

Giải thích:
Ta cần tính \(P(S|K)\).
Áp dụng công thức Bayes: \(P(S|K) = \frac{P(S)P(K|S)}{P(K)}\).
Từ Câu 3, ta có: \(P(S)P(K|S) = 0.5 \times 0.10 = 0.05\).
Và \(P(K) = 0.055\).
Vậy \(P(S|K) = \frac{0.05}{0.055} \approx 0.909\).
Nếu thấy từ "khuyến mãi", khả năng email đó là thư rác lên tới 90.9%!