Technical Report

Phân tích So sánh các
Phân phối Xác suất Liên tục

Từ lý thuyết toán học đến ứng dụng thực tế trong kỹ thuật và khoa học dữ liệu. Hướng dẫn chọn mô hình phù hợp nhất.

01

Giới thiệu Tổng quan

Việc lựa chọn đúng mô hình phân phối xác suất là một quyết định chiến lược. Báo cáo này sẽ phân tích 5 phân phối cốt lõi: Đồng nhất, Mũ, Gamma, Weibull và Beta. Chúng ta sẽ đi từ sự đơn giản của phân phối Đồng nhất đến tính linh hoạt của Weibull và Beta.

02

Phân phối Đồng nhất (Uniform)

Cơ bản nhất

Sự bình đẳng của cơ hội

Dùng khi không có thông tin ưu tiên. Mọi kết quả trong khoảng [a, b] đều có khả năng như nhau.

Hàm Mật độ (PDF)

\( f(x) = \frac{1}{b - a} \)

Kỳ vọng E(X)

\( E(X) = \frac{a + b}{2} \)

Ứng dụng: Ngọc trai

Giả sử đường kính ngọc trai \( \sim U(0, 10) \) mm.
- Kỳ vọng: 5 mm.
- Xác suất lấy được viên > 4mm (có giá trị) là 60%.

03

Phân phối Mũ (Exponential)

Độ tin cậy

Thời gian chờ & Tỷ lệ hỏng hóc

Đặc trưng bởi tính "Không nhớ" (Memoryless). Quá khứ không ảnh hưởng đến tương lai.

PDF

\( f(x) = \lambda e^{-\lambda x} \)

Kỳ vọng

\( E(X) = \frac{1}{\lambda} \)

Săn tìm tàu đắm

Nếu thời gian tìm trung bình là 20 ngày (\(\lambda=0.05\)).
-> Xác suất tìm thấy trong 7 ngày đầu: ~30%.

Vết nứt dầm thép

Mô hình hóa khoảng cách giữa các vết nứt. Nếu trung bình cách nhau 0.23m, \(\lambda \approx 4.3\).

04

Phân phối Gamma

Tổng quát hóa

Tổng thời gian chờ

Nếu Mũ là thời gian chờ 1 sự kiện, thì Gamma là tổng thời gian chờ cho k sự kiện.

\( f(x) = \frac{\lambda^k x^{k-1} e^{-\lambda x}}{\Gamma(k)} \)

\(k\): hình dạng, \(\lambda\): tỷ lệ

Phân tích So sánh các
Phân phối Xác suất Liên tục

Từ lý thuyết toán học đến ứng dụng thực tế trong kỹ thuật và khoa học dữ liệu. Hướng dẫn chọn mô hình phù hợp nhất.

01

Giới thiệu Tổng quan

Việc lựa chọn đúng mô hình phân phối xác suất là một quyết định chiến lược. Báo cáo này sẽ phân tích 5 phân phối cốt lõi: Đồng nhất, Mũ, Gamma, Weibull và Beta. Chúng ta sẽ đi từ sự đơn giản của phân phối Đồng nhất đến tính linh hoạt của Weibull và Beta.

02

Phân phối Đồng nhất (Uniform)

Cơ bản nhất

Sự bình đẳng của cơ hội

Dùng khi không có thông tin ưu tiên. Mọi kết quả trong khoảng [a, b] đều có khả năng như nhau.

Hàm Mật độ (PDF)

\( f(x) = \frac{1}{b - a} \)

Kỳ vọng E(X)

\( E(X) = \frac{a + b}{2} \)

Ứng dụng: Ngọc trai

Giả sử đường kính ngọc trai \( \sim U(0, 10) \) mm.
- Kỳ vọng: 5 mm.
- Xác suất lấy được viên > 4mm (có giá trị) là 60%.

03

Phân phối Mũ (Exponential)

Độ tin cậy

Thời gian chờ & Tỷ lệ hỏng hóc

Đặc trưng bởi tính "Không nhớ" (Memoryless). Quá khứ không ảnh hưởng đến tương lai.

PDF

\( f(x) = \lambda e^{-\lambda x} \)

Kỳ vọng

\( E(X) = \frac{1}{\lambda} \)

Săn tìm tàu đắm

Nếu thời gian tìm trung bình là 20 ngày (\(\lambda=0.05\)).
-> Xác suất tìm thấy trong 7 ngày đầu: ~30%.

Vết nứt dầm thép

Mô hình hóa khoảng cách giữa các vết nứt. Nếu trung bình cách nhau 0.23m, \(\lambda \approx 4.3\).

04

Phân phối Gamma

Tổng quát hóa

Tổng thời gian chờ

Nếu Mũ là thời gian chờ 1 sự kiện, thì Gamma là tổng thời gian chờ cho k sự kiện.

\( f(x) = \frac{\lambda^k x^{k-1} e^{-\lambda x}}{\Gamma(k)} \)

\(k\): hình dạng, \(\lambda\): tỷ lệ

Dây chuyền lắp ráp

Thời gian để 20 tấm kim loại (\(k=20\)) đến dây chuyền.
Giúp kỹ sư tính toán xác suất tin cậy 95% rằng vật liệu sẽ đến kịp tiến độ.

05

Phân phối Weibull

Linh hoạt nhất

Mô hình hóa sự "Lão hóa"

Cho phép tỷ lệ hỏng hóc thay đổi theo thời gian (tăng do mòn hoặc giảm do lỗi ban đầu).

a < 1 Hỏng hóc giảm dần
a = 1 Không đổi (Mũ)
a > 1 Hỏng hóc tăng (Mòn)

Độ mòn má phanh

Với \(a=3.5\) (mòn nhanh), ta tính được xác suất má phanh bền hơn 10.000 dặm.

\( f(x) = a\lambda^a x^{a-1} e^{-(\lambda x)^a} \)
06

Phân phối Beta

Giới hạn [0, 1]

Tỷ lệ & Phần trăm

Công cụ lý tưởng để mô hình hóa xác suất, tỷ lệ hoàn thành, hoặc thị phần.

Giá cổ phiếu

Mô hình hóa tỷ lệ cổ phiếu tăng giá trong ngày. Giúp lượng hóa rủi ro thị trường.

Đàn ong

Tỷ lệ ong thợ rời tổ cùng ong chúa. Hiểu hành vi bầy đàn sinh học.

\( f(x) \propto x^{a-1}(1-x)^{b-1} \)

Bảng So Sánh Tổng Hợp

Phân phối Miền giá trị Đặc điểm cốt lõi Ứng dụng điển hình
Đồng nhất [a, b] Cơ hội ngang nhau Ngọc trai, Xổ số
[0, ∞) Tính "Không nhớ" Thời gian chờ, Tàu đắm
Gamma [0, ∞) Tổng thời gian chờ k sự kiện Vết nứt dầm thép
Weibull [0, ∞) Tỷ lệ hỏng thay đổi Tuổi thọ, Độ mòn
Beta [0, 1] Mô hình hóa Tỷ lệ Thị phần, Sinh học

Kết luận

Việc hiểu rõ các đặc điểm này không chỉ là bài tập lý thuyết mà là kỹ năng thực hành thiết yếu. Lựa chọn đúng mô hình là nền tảng cho dự báo chính xác và quyết định kinh doanh vững chắc.

Dữ liệu đúng + Mô hình đúng = Quyết định đúng