Phân tích So sánh các
Phân phối Xác suất Liên tục
Từ lý thuyết toán học đến ứng dụng thực tế trong kỹ thuật và khoa học dữ liệu. Hướng dẫn chọn mô hình phù hợp nhất.
Giới thiệu Tổng quan
Việc lựa chọn đúng mô hình phân phối xác suất là một quyết định chiến lược. Báo cáo này sẽ phân tích 5 phân phối cốt lõi: Đồng nhất, Mũ, Gamma, Weibull và Beta. Chúng ta sẽ đi từ sự đơn giản của phân phối Đồng nhất đến tính linh hoạt của Weibull và Beta.
Phân phối Đồng nhất (Uniform)
Sự bình đẳng của cơ hội
Dùng khi không có thông tin ưu tiên. Mọi kết quả trong khoảng [a, b] đều có khả năng như nhau.
Hàm Mật độ (PDF)
\( f(x) = \frac{1}{b - a} \)
Kỳ vọng E(X)
\( E(X) = \frac{a + b}{2} \)
Ứng dụng: Ngọc trai
Giả sử đường kính ngọc trai \( \sim U(0, 10) \) mm.
- Kỳ vọng: 5 mm.
- Xác suất lấy được viên > 4mm (có giá trị) là 60%.
Phân phối Mũ (Exponential)
Thời gian chờ & Tỷ lệ hỏng hóc
Đặc trưng bởi tính "Không nhớ" (Memoryless). Quá khứ không ảnh hưởng đến tương lai.
\( f(x) = \lambda e^{-\lambda x} \)
Kỳ vọng
\( E(X) = \frac{1}{\lambda} \)
Săn tìm tàu đắm
Nếu thời gian tìm trung bình là 20 ngày (\(\lambda=0.05\)).
-> Xác suất tìm thấy trong 7 ngày đầu: ~30%.
Vết nứt dầm thép
Mô hình hóa khoảng cách giữa các vết nứt. Nếu trung bình cách nhau 0.23m, \(\lambda \approx 4.3\).
Phân phối Gamma
Tổng thời gian chờ
Nếu Mũ là thời gian chờ 1 sự kiện, thì Gamma là tổng thời gian chờ cho k sự kiện.
\( f(x) = \frac{\lambda^k x^{k-1} e^{-\lambda x}}{\Gamma(k)} \)
\(k\): hình dạng, \(\lambda\): tỷ lệ
Phân tích So sánh các
Phân phối Xác suất Liên tục
Từ lý thuyết toán học đến ứng dụng thực tế trong kỹ thuật và khoa học dữ liệu. Hướng dẫn chọn mô hình phù hợp nhất.
Giới thiệu Tổng quan
Việc lựa chọn đúng mô hình phân phối xác suất là một quyết định chiến lược. Báo cáo này sẽ phân tích 5 phân phối cốt lõi: Đồng nhất, Mũ, Gamma, Weibull và Beta. Chúng ta sẽ đi từ sự đơn giản của phân phối Đồng nhất đến tính linh hoạt của Weibull và Beta.
Phân phối Đồng nhất (Uniform)
Sự bình đẳng của cơ hội
Dùng khi không có thông tin ưu tiên. Mọi kết quả trong khoảng [a, b] đều có khả năng như nhau.
Hàm Mật độ (PDF)
\( f(x) = \frac{1}{b - a} \)
Kỳ vọng E(X)
\( E(X) = \frac{a + b}{2} \)
Ứng dụng: Ngọc trai
Giả sử đường kính ngọc trai \( \sim U(0, 10) \) mm.
- Kỳ vọng: 5 mm.
- Xác suất lấy được viên > 4mm (có giá trị) là 60%.
Phân phối Mũ (Exponential)
Thời gian chờ & Tỷ lệ hỏng hóc
Đặc trưng bởi tính "Không nhớ" (Memoryless). Quá khứ không ảnh hưởng đến tương lai.
\( f(x) = \lambda e^{-\lambda x} \)
Kỳ vọng
\( E(X) = \frac{1}{\lambda} \)
Săn tìm tàu đắm
Nếu thời gian tìm trung bình là 20 ngày (\(\lambda=0.05\)).
-> Xác suất tìm thấy trong 7 ngày đầu: ~30%.
Vết nứt dầm thép
Mô hình hóa khoảng cách giữa các vết nứt. Nếu trung bình cách nhau 0.23m, \(\lambda \approx 4.3\).
Phân phối Gamma
Tổng thời gian chờ
Nếu Mũ là thời gian chờ 1 sự kiện, thì Gamma là tổng thời gian chờ cho k sự kiện.
\( f(x) = \frac{\lambda^k x^{k-1} e^{-\lambda x}}{\Gamma(k)} \)
\(k\): hình dạng, \(\lambda\): tỷ lệ
Dây chuyền lắp ráp
Thời gian để 20 tấm kim loại (\(k=20\)) đến dây chuyền.
Giúp kỹ sư tính toán xác suất tin cậy 95% rằng vật liệu sẽ đến kịp tiến độ.
Phân phối Weibull
Mô hình hóa sự "Lão hóa"
Cho phép tỷ lệ hỏng hóc thay đổi theo thời gian (tăng do mòn hoặc giảm do lỗi ban đầu).
Độ mòn má phanh
Với \(a=3.5\) (mòn nhanh), ta tính được xác suất má phanh bền hơn 10.000 dặm.
Phân phối Beta
Tỷ lệ & Phần trăm
Công cụ lý tưởng để mô hình hóa xác suất, tỷ lệ hoàn thành, hoặc thị phần.
Giá cổ phiếu
Mô hình hóa tỷ lệ cổ phiếu tăng giá trong ngày. Giúp lượng hóa rủi ro thị trường.
Đàn ong
Tỷ lệ ong thợ rời tổ cùng ong chúa. Hiểu hành vi bầy đàn sinh học.
\( f(x) \propto x^{a-1}(1-x)^{b-1} \)
Bảng So Sánh Tổng Hợp
| Phân phối | Miền giá trị | Đặc điểm cốt lõi | Ứng dụng điển hình |
|---|---|---|---|
| Đồng nhất | [a, b] | Cơ hội ngang nhau | Ngọc trai, Xổ số |
| Mũ | [0, ∞) | Tính "Không nhớ" | Thời gian chờ, Tàu đắm |
| Gamma | [0, ∞) | Tổng thời gian chờ k sự kiện | Vết nứt dầm thép |
| Weibull | [0, ∞) | Tỷ lệ hỏng thay đổi | Tuổi thọ, Độ mòn |
| Beta | [0, 1] | Mô hình hóa Tỷ lệ | Thị phần, Sinh học |
Kết luận
Việc hiểu rõ các đặc điểm này không chỉ là bài tập lý thuyết mà là kỹ năng thực hành thiết yếu. Lựa chọn đúng mô hình là nền tảng cho dự báo chính xác và quyết định kinh doanh vững chắc.
Dữ liệu đúng + Mô hình đúng = Quyết định đúng