Phương Pháp Luận

Áp dụng Định lý
Giới hạn Trung tâm (CLT)

Làm thế nào để giải quyết các bài toán xác suất phức tạp bằng cách biến đổi chúng về Phân phối Chuẩn. Một hướng dẫn thực hành cho các nhà phân tích dữ liệu.

Vấn đề

Tính toán chính xác trở nên quá tải hoặc bất khả thi với dữ liệu lớn (Ví dụ: Tung đồng xu 10.000 lần).

Giải pháp

Sử dụng CLT để xấp xỉ phân phối Nhị thức/Poisson về Phân phối Chuẩn đơn giản hơn.

2

Nền tảng: Phân phối Chuẩn

Còn gọi là phân phối Gaussian, đặc trưng bởi hình chuông đối xứng. Đây là đích đến của mọi phép xấp xỉ trong bài viết này.

\[ f(x) = \frac{1}{\sigma\sqrt{2\pi}} e^{-\frac{(x-\mu)^2}{2\sigma^2}} \]
Trung bình (\(\mu\)) Vị trí tâm của đỉnh chuông.
Phương sai (\(\sigma^2\)) Độ rộng/phân tán của chuông.

Quy trình Chuẩn hóa

\(X\)
\(N(\mu, \sigma^2)\)
\( Z = \frac{X - \mu}{\sigma} \)
\(Z\)
\(N(0, 1)\)

Biến mọi phân phối chuẩn về dạng chuẩn tắc để tra bảng \(\Phi(z)\).

3

Định lý Giới hạn Trung tâm (CLT)

"Dù phân phối gốc có hình dạng kỳ lạ thế nào, nếu lấy mẫu đủ lớn, tổng và trung bình của chúng sẽ trông giống hình chuông."

Phát biểu định lý

Với dãy biến ngẫu nhiên độc lập, cùng phân phối (i.i.d) có kích thước mẫu \(n\) đủ lớn:

  • Trung bình mẫu \(\bar{X} \approx N\left(\mu, \frac{\sigma^2}{n}\right)\)
  • Tổng mẫu \(S_n \approx N(n\mu, n\sigma^2)\)

Điều kiện áp dụng

  • Độc lập: Các biến không ảnh hưởng lẫn nhau.
  • Cùng phân phối: Cùng \(\mu\) và \(\sigma^2\).
  • Kích thước mẫu: Quy tắc kinh nghiệm \(n \ge 30\).
4

Xấp xỉ Phân phối Nhị thức

Điều kiện tiên quyết

\(np \ge 5\) và \(n(1-p) \ge 5\)

Quy trình thực hiện từng bước

1

Xác định tham số Chuẩn (\(\mu, \sigma\))

Chuyển đổi tham số từ Nhị thức sang Chuẩn:

\(\mu = np\) \(\sigma = \sqrt{np(1-p)}\)
2

Hiệu chỉnh liên tục (Quan trọng!)

Vì xấp xỉ Rời rạc (thanh) bằng Liên tục (đường cong), ta phải mở rộng khoảng giá trị thêm 0.5.

\(P(X \le x)\)
\(\to P(Y \le x + 0.5)\)
\(P(X \ge x)\)
\(\to P(Y \ge x - 0.5)\)
\(P(X = x)\)
\(\to P(x-0.5 \le Y \le x+0.5)\)
3

Chuẩn hóa và Tính toán

Sử dụng công thức \(Z\) với các giá trị biên đã hiệu chỉnh.

Ví dụ: Tung xu 100 lần

Tìm xác suất được 45 đến 55 mặt ngửa.

\(n=100, p=0.5\)
\(np=50 \ge 5\) (OK)

1. Tham số

  • \(\mu = 100 \times 0.5 = 50\)
  • \(\sigma^2 = 50 \times 0.5 = 25 \implies \sigma=5\)

2. Hiệu chỉnh & Tính

  • Khoảng gốc: \([45, 55]\)
  • Hiệu chỉnh: \([44.5, 55.5]\)
  • \(Z_1 = \frac{44.5-50}{5} = -1.1\), \(Z_2 = 1.1\)
  • \(\implies P \approx 0.7286\)
5

Xấp xỉ Phân phối Poisson

Cơ sở lý thuyết

Khi tỷ lệ trung bình \(\lambda\) đủ lớn, phân phối Poisson trở nên đối xứng và tiến về phân phối Chuẩn.

Quy đổi tham số:
\(\mu = \lambda\) \(\sigma^2 = \lambda\)

*Cũng nên áp dụng hiệu chỉnh liên tục như Nhị thức.

Ví dụ: Lỗi tấm kính

Dữ liệu

100 tấm, \(\lambda_{con} = 0.5\). Tổng \(\lambda_{tong} = 50\).

Bài toán

Xác suất \(\le 40\) lỗi?

Xấp xỉ

\(X \sim N(50, 50)\)

\(Z = \frac{40 - 50}{\sqrt{50}} \approx -1.41\)

Kết quả: ~7.93%

Danh sách kiểm tra cho Nhà phân tích

Để đảm bảo tính chính xác và chuyên nghiệp khi áp dụng phương pháp xấp xỉ.

Kiểm tra điều kiện: \(n \ge 30\) (CLT), \(np \ge 5\) (Nhị thức).
Hiệu chỉnh liên tục: Luôn \(\pm 0.5\) khi chuyển từ Rời rạc sang Liên tục.
Hiểu rõ hạn chế: Chỉ dùng xấp xỉ khi tính toán chính xác quá tốn kém.