Từ kết quả, liệu bạn có thể suy luận ngược về nguyên nhân? Hãy trở thành một thám tử xác suất!
Công thức xác suất toàn phần được dùng để làm gì?
Đáp án đúng là A.
Giải thích: Tên gọi "toàn phần" đã nói lên tất cả! Nó giúp ta tính xác suất tổng thể (toàn phần) của một sự kiện bằng cách tổng hợp xác suất của nó trong từng trường hợp (kịch bản) riêng lẻ. Giống như tính tổng doanh thu bằng cách cộng doanh thu từ nhiều cửa hàng khác nhau vậy.
Một nhà máy có 2 máy: Máy I sản xuất 30% sản phẩm với tỷ lệ lỗi 1%. Máy II sản xuất 70% sản phẩm với tỷ lệ lỗi 3%. Lấy ngẫu nhiên một sản phẩm. Xác suất sản phẩm đó bị lỗi là bao nhiêu?
Đáp án đúng là C.
Giải thích: Đây là lúc dùng công thức xác suất toàn phần. Gọi L là "sản phẩm lỗi".
\(P(L) = P(\text{Máy I}) \times P(L|\text{Máy I}) + P(\text{Máy II}) \times P(L|\text{Máy II})\)
\(P(L) = (0.30 \times 0.01) + (0.70 \times 0.03)\)
\(P(L) = 0.003 + 0.021 = 0.024\), tức là 2.4%.
Công thức Bayes có vai trò chính là gì?
Đáp án đúng là B.
Giải thích: Công thức Bayes là công cụ "suy luận ngược" kinh điển. Nó cho phép ta bắt đầu với một niềm tin ban đầu về một giả thuyết (xác suất tiên nghiệm), sau đó khi có thêm bằng chứng mới, ta "cập nhật" lại niềm tin đó để có một xác suất chính xác hơn (xác suất hậu nghiệm).
Vẫn với dữ kiện từ Câu 2. Nếu bạn lấy phải một sản phẩm bị lỗi, xác suất nó đến từ Máy I là bao nhiêu?
Đáp án đúng là A.
Giải thích: Đây là lúc thám tử Bayes ra tay! Ta cần tính \(P(\text{Máy I} | L)\).
Công thức: \(P(\text{Máy I} | L) = \frac{P(\text{Máy I}) \times P(L|\text{Máy I})}{P(L)}\)
Ta đã biết:
- \(P(\text{Máy I}) \times P(L|\text{Máy I}) = 0.30 \times 0.01 = 0.003\)
- \(P(L) = 0.024\) (từ Câu 2)
Vậy: \(P(\text{Máy I} | L) = \frac{0.003}{0.024} = \frac{1}{8} = 0.125\), tức là 12.5%.
Kết quả tính được từ công thức xác suất toàn phần \(P(A)\) thường được dùng làm mẫu số trong công thức Bayes để tính \(P(H_i|A)\).
Đáp án là Đúng.
Giải thích: Chính xác! Công thức Bayes đầy đủ là \(P(H_i|A) = \frac{P(H_i)P(A|H_i)}{\sum P(H_j)P(A|H_j)}\). Cái mẫu số dài ngoằng ở dưới chính là công thức xác suất toàn phần của A. Hai công thức này là "cặp bài trùng" không thể tách rời.
Công thức Bayes cho phép chúng ta cập nhật độ tin cậy của một giả thuyết khi có thêm bằng chứng mới.
Đáp án là Đúng.
Giải thích: Đây chính là linh hồn của suy luận Bayes. Bạn có một "niềm tin" ban đầu (xác suất tiên nghiệm), sau khi quan sát một "bằng chứng", bạn dùng công thức Bayes để điều chỉnh lại niềm tin đó một cách hợp lý (xác suất hậu nghiệm). Nó mô phỏng cách con người học hỏi từ kinh nghiệm.
Xác suất để một người có triệu chứng A khi mắc bệnh B - \(P(A|B)\), luôn bằng xác suất người đó mắc bệnh B khi có triệu chứng A - \(P(B|A)\).
Đáp án là Sai.
Giải thích: Đây là một lỗi logic rất phổ biến. Ví dụ: Hầu hết các bệnh nhân ung thư phổi đều ho (\(P(\text{ho}|\text{ung thư})\) cao), nhưng không phải tất cả những người bị ho đều bị ung thư phổi (\(P(\text{ung thư}|\text{ho})\) thấp). Công thức Bayes chính là công cụ để phân biệt và tính toán hai giá trị khác biệt này.
Trong công thức Bayes, xác suất ban đầu của giả thuyết \(P(H_i)\) không quan trọng bằng xác suất của bằng chứng \(P(A|H_i)\).
Đáp án là Sai.
Giải thích: Cả hai đều cực kỳ quan trọng. Một giả thuyết có thể giải thích bằng chứng rất tốt ( \(P(A|H_i)\) cao), nhưng nếu bản thân giả thuyết đó cực kỳ khó xảy ra ( \(P(H_i)\) rất thấp), thì xác suất cuối cùng \(P(H_i|A)\) vẫn sẽ thấp. Ví dụ: Giả thuyết "người ngoài hành tinh làm vỡ cửa sổ" giải thích rất tốt việc cửa sổ bị vỡ, nhưng xác suất ban đầu của nó quá thấp để được xem là hợp lý.
Túi A có 2 bi đỏ, 3 bi xanh. Túi B có 4 bi đỏ, 1 bi xanh. Xác suất chọn túi A là 0.4 và túi B là 0.6. Tính xác suất toàn phần để bốc được một bi đỏ?
Đáp án là 0.64.
Giải thích:
Gọi R là biến cố "bốc được bi đỏ".
\(P(R|\text{Túi A}) = 2/5 = 0.4\).
\(P(R|\text{Túi B}) = 4/5 = 0.8\).
Áp dụng công thức xác suất toàn phần:
\(P(R) = P(\text{A})P(R|\text{A}) + P(\text{B})P(R|\text{B})\)
\(P(R) = (0.4 \times 0.4) + (0.6 \times 0.8) = 0.16 + 0.48 = 0.64\).
Từ dữ kiện Câu 1, nếu bạn đã bốc được một bi đỏ, xác suất nó đến từ túi A là bao nhiêu?
Đáp án là 0.25.
Giải thích:
Ta cần tính \(P(\text{A}|R)\).
Áp dụng công thức Bayes: \(P(\text{A}|R) = \frac{P(\text{A})P(R|\text{A})}{P(R)}\).
Từ Câu 1, ta có: \(P(\text{A})P(R|\text{A}) = 0.4 \times 0.4 = 0.16\).
Và \(P(R) = 0.64\).
Vậy \(P(\text{A}|R) = \frac{0.16}{0.64} = \frac{1}{4} = 0.25\).
Một bộ lọc thư rác xác định rằng 50% email là thư rác. Từ "khuyến mãi" xuất hiện trong 10% thư rác nhưng chỉ xuất hiện trong 1% thư thường. Tính xác suất toàn phần để một email bất kỳ chứa từ "khuyến mãi".
Đáp án là 0.055.
Giải thích:
Gọi S là "thư rác", T là "thư thường", K là "chứa từ khuyến mãi".
\(P(S) = 0.5\), \(P(T) = 0.5\).
\(P(K|S) = 0.10\), \(P(K|T) = 0.01\).
Xác suất toàn phần của K:
\(P(K) = P(S)P(K|S) + P(T)P(K|T)\)
\(P(K) = (0.5 \times 0.10) + (0.5 \times 0.01) = 0.05 + 0.005 = 0.055\).
Từ dữ kiện Câu 3, nếu một email chứa từ "khuyến mãi", xác suất nó thật sự là thư rác là bao nhiêu?
Đáp án là 0.909.
Giải thích:
Ta cần tính \(P(S|K)\).
Áp dụng công thức Bayes: \(P(S|K) = \frac{P(S)P(K|S)}{P(K)}\).
Từ Câu 3, ta có: \(P(S)P(K|S) = 0.5 \times 0.10 = 0.05\).
Và \(P(K) = 0.055\).
Vậy \(P(S|K) = \frac{0.05}{0.055} \approx 0.909\).
Nếu thấy từ "khuyến mãi", khả năng email đó là thư rác lên tới 90.9%!