Áp dụng Định lý
Giới hạn Trung tâm (CLT)
Làm thế nào để giải quyết các bài toán xác suất phức tạp bằng cách biến đổi chúng về Phân phối Chuẩn. Một hướng dẫn thực hành cho các nhà phân tích dữ liệu.
Vấn đề
Tính toán chính xác trở nên quá tải hoặc bất khả thi với dữ liệu lớn (Ví dụ: Tung đồng xu 10.000 lần).
Giải pháp
Sử dụng CLT để xấp xỉ phân phối Nhị thức/Poisson về Phân phối Chuẩn đơn giản hơn.
Nền tảng: Phân phối Chuẩn
Còn gọi là phân phối Gaussian, đặc trưng bởi hình chuông đối xứng. Đây là đích đến của mọi phép xấp xỉ trong bài viết này.
Quy trình Chuẩn hóa
Biến mọi phân phối chuẩn về dạng chuẩn tắc để tra bảng \(\Phi(z)\).
Định lý Giới hạn Trung tâm (CLT)
"Dù phân phối gốc có hình dạng kỳ lạ thế nào, nếu lấy mẫu đủ lớn, tổng và trung bình của chúng sẽ trông giống hình chuông."
Phát biểu định lý
Với dãy biến ngẫu nhiên độc lập, cùng phân phối (i.i.d) có kích thước mẫu \(n\) đủ lớn:
- Trung bình mẫu \(\bar{X} \approx N\left(\mu, \frac{\sigma^2}{n}\right)\)
- Tổng mẫu \(S_n \approx N(n\mu, n\sigma^2)\)
Điều kiện áp dụng
- Độc lập: Các biến không ảnh hưởng lẫn nhau.
- Cùng phân phối: Cùng \(\mu\) và \(\sigma^2\).
- Kích thước mẫu: Quy tắc kinh nghiệm \(n \ge 30\).
Xấp xỉ Phân phối Nhị thức
Điều kiện tiên quyết
\(np \ge 5\) và \(n(1-p) \ge 5\)
Quy trình thực hiện từng bước
Xác định tham số Chuẩn (\(\mu, \sigma\))
Chuyển đổi tham số từ Nhị thức sang Chuẩn:
Hiệu chỉnh liên tục (Quan trọng!)
Vì xấp xỉ Rời rạc (thanh) bằng Liên tục (đường cong), ta phải mở rộng khoảng giá trị thêm 0.5.
\(\to P(Y \le x + 0.5)\)
\(\to P(Y \ge x - 0.5)\)
\(\to P(x-0.5 \le Y \le x+0.5)\)
Chuẩn hóa và Tính toán
Sử dụng công thức \(Z\) với các giá trị biên đã hiệu chỉnh.
Ví dụ: Tung xu 100 lần
Tìm xác suất được 45 đến 55 mặt ngửa.
1. Tham số
- \(\mu = 100 \times 0.5 = 50\)
- \(\sigma^2 = 50 \times 0.5 = 25 \implies \sigma=5\)
2. Hiệu chỉnh & Tính
- Khoảng gốc: \([45, 55]\)
- Hiệu chỉnh: \([44.5, 55.5]\)
- \(Z_1 = \frac{44.5-50}{5} = -1.1\), \(Z_2 = 1.1\)
- \(\implies P \approx 0.7286\)
Xấp xỉ Phân phối Poisson
Cơ sở lý thuyết
Khi tỷ lệ trung bình \(\lambda\) đủ lớn, phân phối Poisson trở nên đối xứng và tiến về phân phối Chuẩn.
*Cũng nên áp dụng hiệu chỉnh liên tục như Nhị thức.
Ví dụ: Lỗi tấm kính
100 tấm, \(\lambda_{con} = 0.5\). Tổng \(\lambda_{tong} = 50\).
Xác suất \(\le 40\) lỗi?
\(X \sim N(50, 50)\)
\(Z = \frac{40 - 50}{\sqrt{50}} \approx -1.41\)
Kết quả: ~7.93%
Danh sách kiểm tra cho Nhà phân tích
Để đảm bảo tính chính xác và chuyên nghiệp khi áp dụng phương pháp xấp xỉ.