Đây là công thức "gốc" (chia cho n), dùng để hiểu bản chất của phương sai. Nó đo "trung bình của các bình phương khoảng cách" từ mỗi đại sứ đến "trái tim".
Cách 1: $s^2 = \frac{1}{n}\sum n_i(x_i - \bar{x})^2$
Để tính toán nhanh hơn, ta có công thức "tắt" (sẽ được thực hành ở Cách 2):
Cách 2: $s^2 = \left( \frac{1}{n}\sum n_i x_i^2 \right) - (\bar{x})^2$
Độ lệch chuẩn chính là "bán kính quẩy"! Nó là căn bậc hai của "Chỉ Số Hỗn Loạn".
$$ s = \sqrt{s^2} $$Nó cho bạn biết, một cách trung bình, mỗi thành viên trong đám đông "đi quẩy" xa khỏi "trái tim" bao nhiêu.
Case Study: Điểm thi Toán của 40 học sinh. Hãy đo "Bán Kính Quẩy" của lớp này.
(Cách này dùng để hiểu bản chất, nhưng tính toán dài và dễ sai số. Bạn nên dùng Cách 2 khi làm bài.)
Bước 1: Triệu hồi các "Đại Sứ" và tính "tiền đóng góp"
| Nhóm Điểm | Số dân ($n_i$) | Đại sứ ($x_i$) | Tiền đóng góp ($n_i x_i$) |
|---|---|---|---|
| $[4; 6)$ | 10 | 5 | 50 |
| $[6; 8)$ | 20 | 7 | 140 |
| $[8; 10]$ | 10 | 9 | 90 |
| Tổng | $n=40$ | 280 |
Bước 2: Xác định "Trái Tim của Đám Đông"
$$ \bar{x} = \frac{280}{40} = 7 \text{ điểm} $$Bước 3: Tính "Mức độ bất mãn" của từng nhóm
| Nhóm Điểm | $n_i$ | $x_i$ | $x_i - \bar{x}$ | $(x_i - \bar{x})^2$ | Tổng bất mãn $n_i(x_i - \bar{x})^2$ |
|---|---|---|---|---|---|
| $[4; 6)$ | 10 | 5 | -2 | 4 | 40 |
| $[6; 8)$ | 20 | 7 | 0 | 0 | 0 |
| $[8; 10]$ | 10 | 9 | 2 | 4 | 40 |
| Tổng | $n=40$ | 80 |
Bước 4: Tính "Chỉ Số Hỗn Loạn" (Công thức gốc $n$)
$$ s^2 = \frac{\text{Tổng bất mãn}}{n} = \frac{80}{40} = 2 $$Bước 5: Tìm "Bán Kính Quẩy"
$$ s = \sqrt{2} \approx 1.41 \text{ điểm} $$Kết luận: Lớp này khá "ngoan", trung bình mỗi bạn có điểm số cách điểm trung bình 7 khoảng 1.41 điểm.
Công thức định nghĩa (Cách 1) rất tốt để hiểu, nhưng khi tính toán rất dễ sai số (vì $\bar{x}$ thường là số lẻ). Do đó, ta có "công thức tắt" (Cách 2) siêu tiện lợi:
Phương sai = (Trung bình của các Bình Phương) - (Bình Phương của Trung bình)
$$ s^2 = \left( \frac{1}{n}\sum n_i x_i^2 \right) - (\bar{x})^2 $$Case Study: Điểm thi Toán của 40 học sinh. ($n=40$)
Bước 1: Tính "Bình Phương của Trung bình" $(\bar{x})^2$
Bước 2: Tính "Trung bình của các Bình Phương" $(\frac{1}{n}\sum n_i x_i^2)$
Ta cần lập bảng mới với cột $x_i^2$ và $n_i x_i^2$:
| $n_i$ | $x_i$ | $x_i^2$ | $n_i x_i^2$ (Đóng góp) |
|---|---|---|---|
| 10 | 5 | 25 | $10 \times 25 = 250$ |
| 20 | 7 | 49 | $20 \times 49 = 980$ |
| 10 | 9 | 81 | $10 \times 81 = 810$ |
| $n=40$ | Tổng $\to$ | $\sum = 2040$ |
Bước 3: Trừ hai kết quả
$$ s^2 = (\text{Trung bình của các Bình Phương}) - (\text{Bình Phương của Trung bình}) $$ $$ s^2 = 51 - 49 = 2 $$Kết quả $s^2=2$ hoàn toàn trùng khớp với Cách 1!
Bước 4: Tìm "Bán Kính Quẩy"
$$ s = \sqrt{2} \approx 1.41 \text{ điểm} $$Triệu chứng: Lấy đầu mút nhóm (ví dụ số 4 hoặc 6) để tính toán thay vì "Đại Sứ" (số 5).
Cách fix: Luôn tính cột "Đại Sứ" $x_i$ đầu tiên. Đó là nhân vật chính!
Triệu chứng: Khi dùng công thức định nghĩa, quên mất dấu bình phương $(x_i - \bar{x})^2$.
Cách fix: Nhớ rằng ta cần bình phương để mọi khoảng cách đều là số dương và để "thổi phồng" những khoảng cách lớn.
Triệu chứng: Bạn dùng công thức chia cho $n-1$ thay vì $n$.
Cách fix: Ghi nhớ:
Triệu chứng: Nhầm lẫn giữa $(\bar{x})^2$ và $(\frac{1}{n}\sum n_i x_i^2)$.
Cách fix: Luôn ghi nhớ khẩu quyết: $s^2 = (\text{Trung bình của } x^2) - (\text{Bình Phương của } \bar{x})$. Bạn phải tính $x^2$ *trước* rồi mới lấy trung bình, sau đó trừ đi "trái tim" $\bar{x}$ đã được bình phương.
Nhiệm vụ 1: Tìm "Nhịp đập trung bình" (cân nặng trung bình) của một lô sản phẩm.
| Cân nặng (kg) | $[10; 12)$ | $[12; 14)$ | $[14; 16]$ |
|---|---|---|---|
| Số sản phẩm | 8 | 15 | 7 |
Tổng sĩ số $n = 30$. Đại sứ: 11, 13, 15.
Trung bình: $\bar{x} = \frac{8 \cdot 11 + 15 \cdot 13 + 7 \cdot 15}{30} = \frac{88 + 195 + 105}{30} = \frac{388}{30} \approx 12.93$ kg.
Nhiệm vụ 2: Đo "Bán Kính Quẩy" (độ lệch chuẩn) về thời gian online của sinh viên (dùng công thức gốc $n$).
| Thời gian (giờ) | $[5; 10)$ | $[10; 15)$ | $[15; 20)$ | $[20; 25]$ |
|---|---|---|---|---|
| Số sinh viên | 3 | 10 | 5 | 2 |
1. Tìm Trái Tim ($\bar{x}$) và Bình Phương Của Nó:
2. Tính Trung Bình Của Các Bình Phương:
Lập bảng nháp cho $n_i x_i^2$:
Tổng $\sum n_i x_i^2 = 168.75 + 1562.5 + 1531.25 + 1012.5 = 4275$.
Trung bình của các bình phương = $\frac{4275}{20} = 213.75$.
3. Đo đạc cuối cùng:
Chỉ số hỗn loạn: $s^2 = (\text{TB của } x^2) - (\text{TB của } \bar{x})^2 = 213.75 - 196 = 17.75$.
Bán kính quẩy: $s = \sqrt{17.75} \approx 4.21$ giờ.