Báo Cáo Phân Tích So Sánh: Các Phân Phối Xác Suất Rời Rạc
Công cụ chiến lược để ra quyết định dựa trên dữ liệu
1.0 Giới thiệu về Phân Phối Xác Suất Rời Rạc
Các phân phối xác suất rời rạc là công cụ nền tảng để mô hình hóa các hiện tượng ngẫu nhiên có kết quả đếm được. Việc lựa chọn mô hình phù hợp là quyết định chiến lược, ảnh hưởng trực tiếp đến chất lượng dự báo và quyết định kinh doanh.
Mục tiêu của báo cáo:
- Phân tích chi tiết các giả định và kịch bản ứng dụng của từng phân phối.
- Bao gồm: Nhị thức, Hình học/Nhị thức Âm, Siêu bội, Poisson, và Đa thức.
2.0 Phân Phối Nhị Thức (\(X \sim B(n, p)\))
Điều kiện Áp dụng
- Số lần thử (\(n\)) **cố định**.
- Thử nghiệm **độc lập** (Tương đương lấy mẫu có hoàn lại).
- Chỉ có **hai** kết quả (Thành công/Thất bại).
- Xác suất thành công (\(p\)) **không đổi**.
Tham số & Công thức Chính
| PMF | \(P(X=x) = C(n, x) \cdot p^x \cdot (1-p)^{n-x}\) |
| Kỳ vọng E(X) | \(np\) |
| Phương sai Var(X) | \(np(1-p)\) |
Ứng dụng Điển hình:
Kiểm soát Chất lượng:
Đếm số sản phẩm lỗi trong lô hàng cố định (\(n=20\), \(p=0.261\)).
3.0 Phân Phối Hình Học & Nhị Thức Âm
Mô hình hóa **số lần thử** cần thiết để đạt được \(r\) thành công (mô hình hóa "thời gian chờ đợi").
Hình học (Geometric) - \(r=1\)
- Đếm số lần thử đến thành công **đầu tiên**.
- Kỳ vọng \(E(X) = 1/p\).
- PMF: \(P(X = x) = (1-p)^{x-1} \cdot p\).
Nhị thức Âm (Negative Binomial) - \(r \ge 1\)
- Đếm số lần thử đến thành công thứ **\(r\)**.
- Kỳ vọng \(E(X) = r/p\).
- PMF: \(P(X = x) = C(x-1, r-1) \cdot (1-p)^{x-r} \cdot p^r\).
Ứng dụng Điển hình:
Tuyển dụng Nhân sự:
Dự trù số ứng viên cần phỏng vấn để tuyển đủ \(r=3\) nhân viên (\(E(X) = 5\)).
4.0 Phân Phối Siêu Bội (Hypergeometric Distribution)
Sự khác biệt Cốt lõi:
Áp dụng cho lấy mẫu **không hoàn lại** từ một tổng thể hữu hạn (\(N\)). Xác suất thành công thay đổi sau mỗi lần chọn.
Tham số:
- \(N\): Kích thước tổng thể.
- \(r\): Số thành công trong tổng thể.
- \(n\): Kích thước mẫu.
Công thức PMF:
Ứng dụng Điển hình:
Kiểm tra Lô hàng không Phục hồi (phá hủy):
Xác suất tìm thấy số sản phẩm lỗi khi kiểm tra \(n=5\) hộp từ thùng \(N=16\) hộp (có \(r=6\) hộp lỗi).
5.0 Phân Phối Poisson (\(X \sim P(\lambda)\))
Mục tiêu Cốt lõi:
Đếm **số lần** một sự kiện xảy ra trong một **khoảng** xác định (thời gian, không gian, khối lượng).
Tham số:
- \(\lambda\): Tốc độ trung bình xảy ra sự kiện.
Đặc điểm & Công thức PMF:
Đặc điểm: \(E(X) = \text{Var}(X) = \lambda\)
PMF: \(P(X = x) = \frac{e^{-\lambda} \cdot \lambda^x}{x!}\)
Ứng dụng Điển hình:
Quản lý Dịch vụ:
Dự báo số lượng cuộc gọi đến tổng đài trong một giờ, hoặc số lỗi trong một sản phẩm phần mềm (\(\lambda=3\)).
6.0 Phân Phối Đa Thức (Multinomial Distribution)
Tổng quát hóa Nhị thức:
Mỗi phép thử có **\(k \ge 2\)** kết quả rời rạc (thay vì chỉ 2).
Tham số:
- \(n\): tổng số lần thử nghiệm.
- \(p_1, p_2, \dots, p_k\): Xác suất của \(k\) kết quả.
Công thức PMF (kết hợp):
Ứng dụng Điển hình:
Phân tích Nguyên nhân Lỗi:
Xác suất phân bổ \(10\) sự cố tiếp theo thành Lỗi điện, Cơ khí, Vận hành (k=3).
7.0 Bảng Tóm Tắt So Sánh các Phân Phối
| Phân Phối | Câu hỏi Cốt lõi | Giả định Lấy mẫu | Tham số chính | Ví dụ Ứng dụng |
|---|---|---|---|---|
| Nhị thức | Số thành công trong \(n\) lần thử cố định? | Độc lập, xác suất \(p\) không đổi (có hoàn lại). | \(n, p\) | Kiểm soát chất lượng (\(n\) sản phẩm). |
| Hình học/NBA | Cần bao nhiêu lần thử để có \(r\) thành công? | Độc lập, xác suất \(p\) không đổi. | \(p, r\) | Dự báo số cuộc gọi/phỏng vấn cần thiết. |
| Siêu bội | Số thành công trong mẫu lấy **không hoàn lại**? | Không độc lập, lấy mẫu **không hoàn lại** từ tổng thể \(N\). | \(N, r, n\) | Kiểm tra lô hàng (lấy mẫu phá hủy). |
| Poisson | Số sự kiện trong một **khoảng** liên tục? | Quá trình đếm (tốc độ \(\lambda\) không đổi). | \(\lambda\) | Quản lý hàng đợi, Dự báo lưu lượng. |
| Đa thức | Phân bổ của \(k\) kết quả trong \(n\) lần thử? | Độc lập, \(k\) kết quả, \(\sum p_i = 1\). | \(n, p_1...p_k\) | Phân loại nguyên nhân lỗi, Phân khúc thị phần. |
8.0 Kết luận
Việc lựa chọn mô hình xác suất chính xác là nền tảng cho việc ra quyết định chiến lược và hiệu quả. Quá trình này được tóm tắt qua ba câu hỏi quan trọng:
-
Mục tiêu đếm là gì? Đếm số thành công trong \(n\) cố định (Nhị thức) hay đếm số lần thử cần thiết (Hình học/NBA)?
-
Bản chất của việc lấy mẫu là gì? Độc lập (Nhị thức) hay không hoàn lại từ tổng thể hữu hạn (Siêu bội)?
-
Đối tượng đếm là gì? Kết quả phép thử rời rạc hay số lần xuất hiện sự kiện trong khoảng liên tục (Poisson)?
Việc trả lời chính xác những câu hỏi này là điều kiện tiên quyết để xây dựng các mô hình xác suất đáng tin cậy.