Tần số (Frequency): Là số lần xuất hiện của một giá trị dữ liệu trong một tập hợp. Ký hiệu là $n_i$.
Tần số tương đối (Relative Frequency): Là tỉ số giữa tần số của một giá trị và tổng số các giá trị trong tập hợp (cỡ mẫu). Nó cho biết tỉ lệ hoặc phần trăm mà một giá trị chiếm trong toàn bộ dữ liệu.
Công thức tính tần số tương đối của giá trị thứ $i$ là:
$$f_i = \frac{n_i}{N}$$Trong đó:
Bảng tần số tương đối: Là một bảng thống kê bao gồm các cột: giá trị, tần số, và tần số tương đối (thường được biểu diễn dưới dạng số thập phân hoặc phần trăm).
Bài toán: Khảo sát màu sắc yêu thích của 40 học sinh trong một lớp học. Kết quả thu được như sau: Xanh (12), Đỏ (8), Vàng (6), Hồng (10), Khác (4).
Đầu tiên, ta lập bảng ghi lại số lần xuất hiện (tần số) của mỗi màu sắc. Cỡ mẫu $N = 40$.
| Màu sắc | Tần số ($n_i$) |
|---|---|
| Xanh | 12 |
| Đỏ | 8 |
| Vàng | 6 |
| Hồng | 10 |
| Khác | 4 |
| Tổng | N = 40 |
Áp dụng công thức $f_i = \frac{n_i}{N}$ cho từng màu sắc.
Ta có bảng tần số tương đối hoàn chỉnh:
| Màu sắc | Tần số ($n_i$) | Tần số tương đối ($f_i$) | Tần số tương đối (%) |
|---|---|---|---|
| Xanh | 12 | 0.30 | 30% |
| Đỏ | 8 | 0.20 | 20% |
| Vàng | 6 | 0.15 | 15% |
| Hồng | 10 | 0.25 | 25% |
| Khác | 4 | 0.10 | 10% |
| Tổng | 40 | 1.00 | 100% |
Lỗi: Sau khi tính toán, tổng các giá trị $f_i$ không bằng 1.
Nguyên nhân: Thường là do lỗi làm tròn số thập phân quá sớm hoặc tính toán sai. Ví dụ, làm tròn $\frac{1}{3} \approx 0.3$ thay vì $0.333...$ có thể gây ra sai số lớn khi cộng dồn.
Khắc phục: Giữ nhiều chữ số thập phân nhất có thể trong quá trình tính toán và chỉ làm tròn ở kết quả cuối cùng. Luôn kiểm tra lại bằng cách cộng tất cả các tần số tương đối.
Lỗi: Sử dụng số đếm (tần số) khi được yêu cầu tính tỉ lệ (tần số tương đối) hoặc ngược lại.
Ví dụ: Phát biểu "Tần số tương đối của màu xanh là 12" là sai. Phải là "Tần số của màu xanh là 12" và "Tần số tương đối của màu xanh là 0.3".
Khắc phục: Luôn nhớ rằng **tần số là một số đếm** (số nguyên), trong khi **tần số tương đối là một tỉ lệ** (số thập phân hoặc phần trăm).
Lỗi: Tính sai khi đổi từ số thập phân sang phần trăm.
Ví dụ: Tần số tương đối là $0.15$ nhưng lại viết thành $1.5\%$.
Khắc phục: Nhớ quy tắc: để đổi từ số thập phân sang phần trăm, ta **nhân với 100**. Ví dụ: $0.15 \times 100 = 15\%$.
Bài 1: Một cuộc điều tra về số lượng vật nuôi trong 25 gia đình cho kết quả trong bảng sau. Hãy hoàn thành cột tần số tương đối.
| Số vật nuôi | Tần số ($n_i$) | Tần số tương đối ($f_i$) | Tần số tương đối (%) |
|---|---|---|---|
| 0 | 5 | ? | ? |
| 1 | 10 | ? | ? |
| 2 | 7 | ? | ? |
| 3 | 3 | ? | ? |
| Tổng | 25 | ? | ? |
Cỡ mẫu N = 25.
| Số vật nuôi | Tần số ($n_i$) | Tần số tương đối ($f_i$) | Tần số tương đối (%) |
|---|---|---|---|
| 0 | 5 | 0.20 | 20% |
| 1 | 10 | 0.40 | 40% |
| 2 | 7 | 0.28 | 28% |
| 3 | 3 | 0.12 | 12% |
| Tổng | 25 | 1.00 | 100% |
Bài 2: Gieo một con xúc xắc 30 lần và ghi lại mặt xuất hiện:
1, 6, 4, 3, 5, 2, 4, 6, 1, 5, 3, 2, 4, 4, 5, 6, 1, 2, 4, 3, 5, 5, 6, 2, 4, 1, 5, 3, 2, 4
a. Lập bảng tần số và tần số tương đối cho kết quả trên.
b. Mặt nào có tần số tương đối cao nhất?
a. Bảng tần số và tần số tương đối:
Tổng số lần gieo N = 30.
| Mặt xúc xắc | Tần số (Đếm) | Tần số tương đối ($f_i$) | Tần số tương đối (%) |
|---|---|---|---|
| 1 | 4 | 4/30 $\approx$ 0.133 | 13.3% |
| 2 | 5 | 5/30 $\approx$ 0.167 | 16.7% |
| 3 | 4 | 4/30 $\approx$ 0.133 | 13.3% |
| 4 | 7 | 7/30 $\approx$ 0.233 | 23.3% |
| 5 | 6 | 6/30 = 0.200 | 20.0% |
| 6 | 4 | 4/30 $\approx$ 0.133 | 13.3% |
| Tổng | 30 | $\approx$ 1.000 | $\approx$ 100% |
b. Mặt có tần số tương đối cao nhất:
Mặt 4 có tần số tương đối cao nhất là $\approx 0.233$ (hay 23.3%).
Bài 1: So sánh hai nhóm
Trường A và trường B tiến hành khảo sát về phương tiện đến trường của học sinh. Kết quả như sau:
a. Lập bảng tần số tương đối cho mỗi trường.
b. Trường nào có tỉ lệ học sinh đi xe đạp đến trường cao hơn? Tại sao không thể chỉ dựa vào số lượng học sinh để so sánh?
a. Bảng tần số tương đối:
Trường A (N=800)
| Phương tiện | Tần số | Tần số tương đối (%) |
|---|---|---|
| Đi bộ | 120 | (120/800) = 15% |
| Xe đạp | 320 | (320/800) = 40% |
| Xe buýt | 240 | (240/800) = 30% |
| Phụ huynh đưa | 120 | (120/800) = 15% |
Trường B (N=1200)
| Phương tiện | Tần số | Tần số tương đối (%) |
|---|---|---|
| Đi bộ | 150 | (150/1200) = 12.5% |
| Xe đạp | 420 | (420/1200) = 35% |
| Xe buýt | 480 | (480/1200) = 40% |
| Phụ huynh đưa | 150 | (150/1200) = 12.5% |
b. So sánh tỉ lệ:
Trường A có tỉ lệ học sinh đi xe đạp cao hơn (40%) so với trường B (35%).
Không thể chỉ dựa vào số lượng (320 ở trường A và 420 ở trường B) để so sánh vì tổng số học sinh (cỡ mẫu) của hai trường là khác nhau. Tần số tương đối chuẩn hóa dữ liệu, cho phép so sánh công bằng về cơ cấu, tỉ lệ giữa các tập hợp có kích thước không bằng nhau.
Bài 2: Tìm giá trị còn thiếu
Bảng dưới đây cho thấy tần số tương đối về kết quả xếp loại học lực của một khối lớp. Tuy nhiên, một giá trị đã bị mờ đi.
| Xếp loại | Tần số tương đối (%) |
|---|---|
| Giỏi | 25% |
| Khá | 55% |
| Trung bình | ? |
| Yếu | 5% |
a. Tìm tần số tương đối (%) của xếp loại Trung bình.
b. Nếu cả khối có 240 học sinh, hãy tính số học sinh (tần số) cho mỗi loại học lực.
a. Tìm tần số tương đối còn thiếu:
Tổng các tần số tương đối phải bằng 100%. Vậy, tần số tương đối của loại Trung bình là:
$100\% - (25\% + 55\% + 5\%) = 100\% - 85\% = 15\%$
b. Tính số học sinh cho mỗi loại:
Cỡ mẫu N = 240 học sinh.
Kiểm tra lại: $60 + 132 + 36 + 12 = 240$.