Statistics 101

Phân Phối Chuẩn

Hướng dẫn dành cho người mới bắt đầu về khái niệm quan trọng nhất trong thống kê.

1 Nó là gì & Tại sao quan trọng?

Phân phối chuẩn (Gaussian) mô tả cách dữ liệu phân bổ trong tự nhiên (chiều cao, huyết áp, sai số...). Nó là "trái tim" của thống kê.

"Nó là phân phối quan trọng nhất trong tất cả các phân phối xác suất liên tục và được sử dụng rộng rãi làm cơ sở cho nhiều phương pháp suy luận thống kê."

2

Đặc điểm Chính

Đường Cong Hình Chuông

Đối xứng tuyệt đối qua trung bình.

  • Hình dạng: Luôn là hình chuông.
  • Đối xứng: 50% dữ liệu nằm mỗi bên. Trung bình = Trung vị = Mốt.
  • Ký hiệu: \( X \sim N(\mu, \sigma^2) \)
3

Hai Tham số Quan trọng

Trung bình (\(\mu\))

Vị trí trung tâm.

Quyết định đỉnh của chuông nằm ở đâu trên trục số. Thay đổi \(\mu\) làm dịch chuyển đồ thị trái/phải.

Phương sai (\(\sigma^2\))

Mức độ phân tán.

Quyết định độ "béo/gầy" của chuông. \(\sigma\) lớn = chuông thấp rộng; \(\sigma\) nhỏ = chuông cao nhọn.

4

Phân phối Chuẩn hóa (Z)

Để không phải tính toán cho vô số đường cong khác nhau, ta quy tất cả về một "Thước đo chung".

  • Trung bình \(\mu = 0\)
  • Phương sai \(\sigma^2 = 1\)

Ký hiệu

\( Z \sim N(0, 1) \)

5

Công thức "Chuẩn hóa"

Chiếc cầu nối để chuyển đổi từ giá trị thực \(X\) sang thước đo chuẩn \(Z\).

\( Z = \frac{X - \mu}{\sigma} \)
\(X\) Giá trị cần tính.
\(\mu\) Trung bình gốc.
\(\sigma\) Độ lệch chuẩn gốc.

Ý nghĩa: Z-score cho biết X nằm cách trung bình bao nhiêu lần độ lệch chuẩn.

6

Quy tắc Thực nghiệm

68%
\( \mu \pm 1\sigma \)
95%
\( \mu \pm 2\sigma \)
99.7%
\( \mu \pm 3\sigma \)
7

Ví dụ: Khối Bê Tông

Bài toán: \(\mu = 11.0\) kg, \(\sigma = 0.3\) kg. Tính xác suất khối nặng dưới \(10.5\) kg?

1

Xác định giá trị

\(X = 10.5\), \(\mu = 11.0\), \(\sigma = 0.3\)

2

Chuẩn hóa (Tính Z)

\[ Z = \frac{10.5 - 11.0}{0.3} = \frac{-0.5}{0.3} \approx -1.67 \]

Nghĩa là 10.5kg thấp hơn trung bình 1.67 độ lệch chuẩn.

3

Tra cứu & Kết luận

Tra bảng \(P(Z \le -1.67) = 0.0475\)

Kết quả: 4.75%

3 Điểm Cốt Lõi Cần Nhớ

Hình Chuông: Xác định bởi Trung bình (vị trí) & Độ lệch chuẩn (độ rộng).
Chuẩn hóa: Mọi phân phối đều có thể quy về \(N(0,1)\) để tra bảng.
Z-score: Công cụ then chốt để chuyển đổi và tính xác suất.