Dữ liệu thô (Raw Data): Là các thông tin thu thập được ban đầu, chưa qua xử lý hay sắp xếp. Ví dụ: điểm số của các học sinh trong một bài kiểm tra.
Tần số (Frequency): Là số lần xuất hiện của một giá trị dữ liệu cụ thể trong một tập hợp. Tần số luôn là một số nguyên không âm. Ký hiệu là $n$.
Bảng tần số (Frequency Table): Là một bảng dùng để tóm tắt dữ liệu, thể hiện các giá trị khác nhau trong tập dữ liệu và tần số xuất hiện của chúng. Bảng này giúp sắp xếp dữ liệu thô một cách có tổ chức.
Biểu đồ tần số (Frequency Chart): Là một biểu đồ trực quan hóa dữ liệu từ bảng tần số. Các loại phổ biến bao gồm biểu đồ cột, biểu đồ tranh. Nó giúp ta dễ dàng so sánh và nhận xét về sự phân bố của dữ liệu.
Bài toán: Khảo sát số giờ tự học ở nhà trong một tuần của 20 học sinh. Kết quả (dữ liệu thô) thu được như sau:
5, 7, 8, 6, 7, 9, 5, 8, 7, 6, 7, 9, 10, 8, 7, 6, 8, 5, 7, 8
Các giá trị số giờ học khác nhau là: 5, 6, 7, 8, 9, 10.
Ta tiến hành đếm số lần xuất hiện của từng giá trị:
Từ kết quả đếm, ta có bảng tần số hoàn chỉnh. Ta nên kiểm tra lại bằng cách cộng cột tần số, tổng phải bằng cỡ mẫu (20).
| Số giờ học (Giá trị) | Tần số ($n$) |
|---|---|
| 5 | 3 |
| 6 | 3 |
| 7 | 6 |
| 8 | 5 |
| 9 | 2 |
| 10 | 1 |
| Tổng | N = 20 |
Trục tung (trục đứng) biểu thị tần số, trục hoành (trục ngang) biểu thị giá trị (số giờ học).
Nhận xét từ biểu đồ: Dễ dàng thấy rằng số giờ học phổ biến nhất là 7 giờ/tuần (vì cột cao nhất), và ít phổ biến nhất là 10 giờ/tuần (cột thấp nhất).
Lỗi: Tần số của một hoặc nhiều giá trị bị sai do đếm nhầm.
Hậu quả: Tổng tần số không bằng cỡ mẫu $N$, dẫn đến mọi phân tích sau đó đều sai.
Khắc phục: Khi đếm từ dữ liệu thô, hãy dùng phương pháp kiểm đếm có hệ thống. Ví dụ: gạch bỏ từng giá trị sau khi đã đưa nó vào bảng nháp. Luôn luôn cộng lại cột tần số để kiểm tra với cỡ mẫu $N$.
Lỗi: Khi đọc bảng, trả lời tần số là giá trị và ngược lại.
Ví dụ: Nhìn vào bảng ở ví dụ trên, khi được hỏi "Tần số của giá trị 8 là bao nhiêu?", câu trả lời sai là "8". Câu trả lời đúng phải là "5".
Khắc phục: Luôn đọc kỹ tiêu đề của các cột. Cột "Giá trị" cho biết "cái gì" đang được đo, cột "Tần số" cho biết "có bao nhiêu cái đó".
Lỗi: Gán nhầm trục tần số và trục giá trị.
Khắc phục: Quy ước chung là **trục tung (đứng) biểu thị tần số**, còn **trục hoành (ngang) biểu thị các giá trị** khác nhau của dữ liệu. Chiều cao của cột thể hiện tần số.
Bài 1: Điểm kiểm tra môn Toán của 15 học sinh tổ 1 là:
8, 7, 9, 10, 8, 6, 7, 9, 8, 10, 8, 9, 7, 8, 9
a. Lập bảng tần số cho dãy điểm trên.
b. Điểm số nào có tần số xuất hiện cao nhất?
a. Bảng tần số:
| Điểm số (Giá trị) | Tần số ($n$) |
|---|---|
| 6 | 1 |
| 7 | 3 |
| 8 | 5 |
| 9 | 4 |
| 10 | 2 |
| Tổng | N = 15 |
b. Điểm số có tần số cao nhất:
Điểm 8 có tần số cao nhất là 5.
Bài 2: Biểu đồ cột dưới đây thể hiện số lượng thú cưng của các gia đình trong một khu phố.
a. Lập bảng tần số từ biểu đồ trên.
b. Có tất cả bao nhiêu gia đình đã được khảo sát?
a. Bảng tần số:
| Số thú cưng (Giá trị) | Số gia đình (Tần số) |
|---|---|
| 0 | 16 |
| 1 | 20 |
| 2 | 12 |
| 3+ | 5 |
| Tổng | 53 |
b. Tổng số gia đình được khảo sát:
Tổng tần số = $16 + 20 + 12 + 5 = 53$. Có 53 gia đình đã được khảo sát.
Bài 1: Dữ liệu ghép nhóm
Chiều cao (cm) của 25 cầu thủ trong một đội bóng rổ được ghi lại như sau:
175, 181, 192, 178, 185, 195, 201, 188, 179, 190, 196, 183, 177, 189, 193, 203, 180, 186, 198, 176, 182, 191, 187, 194, 184
Hãy lập bảng tần số ghép nhóm bằng cách chia dữ liệu thành các nhóm (lớp) sau: [175-180], (180-185], (185-190], (190-195], (195-205].
Ghi chú: [a, b] nghĩa là từ a đến b, tính cả a và b. (a, b] là lớn hơn a và nhỏ hơn hoặc bằng b.
Ta tiến hành đếm số liệu thuộc vào mỗi nhóm:
Bảng tần số ghép nhóm:
| Nhóm chiều cao (cm) | Tần số |
|---|---|
| [175 - 180] | 6 |
| (180 - 185] | 5 |
| (185 - 190] | 5 |
| (190 - 195] | 5 |
| (195 - 205] | 4 |
| Tổng | N = 25 |
Bài 2: Tìm tần số còn thiếu
Kết quả khảo sát về cỡ giày của 50 khách hàng nam tại một cửa hàng được ghi trong bảng tần số dưới đây, tuy nhiên tần số của cỡ 42 đã bị mờ.
| Cỡ giày | Tần số |
|---|---|
| 39 | 5 |
| 40 | 12 |
| 41 | 15 |
| 42 | ? |
| 43 | 6 |
| Tổng | N = 50 |
Hãy tìm tần số của cỡ giày 42.
Tổng các tần số phải bằng cỡ mẫu N = 50.
Tổng các tần số đã biết là: $5 + 12 + 15 + 6 = 38$.
Vậy, tần số của cỡ giày 42 là:
$$ 50 - 38 = 12 $$Tần số của cỡ giày 42 là 12.