Tìm hiểu Bảng Tần số & Biểu đồ Tần số 📊

Định nghĩa & Tính chất

1. Các khái niệm cơ bản

Dữ liệu thô (Raw Data): Là các thông tin thu thập được ban đầu, chưa qua xử lý hay sắp xếp. Ví dụ: điểm số của các học sinh trong một bài kiểm tra.

Tần số (Frequency): Là số lần xuất hiện của một giá trị dữ liệu cụ thể trong một tập hợp. Tần số luôn là một số nguyên không âm. Ký hiệu là $n$.

Bảng tần số (Frequency Table): Là một bảng dùng để tóm tắt dữ liệu, thể hiện các giá trị khác nhau trong tập dữ liệu và tần số xuất hiện của chúng. Bảng này giúp sắp xếp dữ liệu thô một cách có tổ chức.

Biểu đồ tần số (Frequency Chart): Là một biểu đồ trực quan hóa dữ liệu từ bảng tần số. Các loại phổ biến bao gồm biểu đồ cột, biểu đồ tranh. Nó giúp ta dễ dàng so sánh và nhận xét về sự phân bố của dữ liệu.

2. Tính chất quan trọng

  • Tổng của tất cả các tần số trong bảng bằng tổng số dữ liệu thu thập được (còn gọi là kích thước mẫu hay cỡ mẫu $N$). $$ \sum n_i = n_1 + n_2 + \dots + n_k = N $$
  • Bảng tần số giúp nhanh chóng xác định được mốt (mode) của tập dữ liệu, tức là giá trị có tần số xuất hiện cao nhất.
  • Từ bảng tần số, ta có thể thấy được sự phân bố của dữ liệu: dữ liệu tập trung ở đâu, có đối xứng hay không, có giá trị nào bất thường không.

3. Sơ đồ tư duy

  • Bảng và Biểu đồ Tần số
    • Tần số là gì?
      • Là số lần một giá trị xuất hiện.
    • Bảng tần số
      • Gồm 2 cột chính: Giá trị & Tần số.
      • Giúp tổ chức dữ liệu thô.
    • Biểu đồ tần số
      • Biểu đồ cột, biểu đồ tranh.
      • Giúp trực quan hóa, so sánh dữ liệu.
    • Ứng dụng
      • Tìm mốt (mode).
      • Phân tích sự phân bố của dữ liệu.
      • Tóm tắt các bộ dữ liệu lớn.

Ví dụ & Minh họa

Bài toán: Khảo sát số giờ tự học ở nhà trong một tuần của 20 học sinh. Kết quả (dữ liệu thô) thu được như sau:

5, 7, 8, 6, 7, 9, 5, 8, 7, 6, 7, 9, 10, 8, 7, 6, 8, 5, 7, 8

Bước 1: Liệt kê các giá trị khác nhau

Các giá trị số giờ học khác nhau là: 5, 6, 7, 8, 9, 10.

Bước 2: Đếm tần số cho mỗi giá trị

Ta tiến hành đếm số lần xuất hiện của từng giá trị:

  • Số 5: xuất hiện 3 lần.
  • Số 6: xuất hiện 3 lần.
  • Số 7: xuất hiện 6 lần.
  • Số 8: xuất hiện 5 lần.
  • Số 9: xuất hiện 2 lần.
  • Số 10: xuất hiện 1 lần.

Bước 3: Lập bảng tần số

Từ kết quả đếm, ta có bảng tần số hoàn chỉnh. Ta nên kiểm tra lại bằng cách cộng cột tần số, tổng phải bằng cỡ mẫu (20).

Số giờ học (Giá trị)Tần số ($n$)
53
63
76
85
92
101
TổngN = 20

Bước 4: Vẽ biểu đồ tần số (Biểu đồ cột)

Trục tung (trục đứng) biểu thị tần số, trục hoành (trục ngang) biểu thị giá trị (số giờ học).

3
5 giờ
3
6 giờ
6
7 giờ
5
8 giờ
2
9 giờ
1
10 giờ

Nhận xét từ biểu đồ: Dễ dàng thấy rằng số giờ học phổ biến nhất là 7 giờ/tuần (vì cột cao nhất), và ít phổ biến nhất là 10 giờ/tuần (cột thấp nhất).

Sai lầm thường gặp

1. Đếm sai hoặc bỏ sót dữ liệu

Lỗi: Tần số của một hoặc nhiều giá trị bị sai do đếm nhầm.

Hậu quả: Tổng tần số không bằng cỡ mẫu $N$, dẫn đến mọi phân tích sau đó đều sai.

Khắc phục: Khi đếm từ dữ liệu thô, hãy dùng phương pháp kiểm đếm có hệ thống. Ví dụ: gạch bỏ từng giá trị sau khi đã đưa nó vào bảng nháp. Luôn luôn cộng lại cột tần số để kiểm tra với cỡ mẫu $N$.

2. Nhầm lẫn giữa "Giá trị" và "Tần số"

Lỗi: Khi đọc bảng, trả lời tần số là giá trị và ngược lại.

Ví dụ: Nhìn vào bảng ở ví dụ trên, khi được hỏi "Tần số của giá trị 8 là bao nhiêu?", câu trả lời sai là "8". Câu trả lời đúng phải là "5".

Khắc phục: Luôn đọc kỹ tiêu đề của các cột. Cột "Giá trị" cho biết "cái gì" đang được đo, cột "Tần số" cho biết "có bao nhiêu cái đó".

3. Vẽ sai trục trên biểu đồ cột

Lỗi: Gán nhầm trục tần số và trục giá trị.

Khắc phục: Quy ước chung là **trục tung (đứng) biểu thị tần số**, còn **trục hoành (ngang) biểu thị các giá trị** khác nhau của dữ liệu. Chiều cao của cột thể hiện tần số.

Bài tập Cơ bản

Bài 1: Điểm kiểm tra môn Toán của 15 học sinh tổ 1 là:
8, 7, 9, 10, 8, 6, 7, 9, 8, 10, 8, 9, 7, 8, 9

a. Lập bảng tần số cho dãy điểm trên.

b. Điểm số nào có tần số xuất hiện cao nhất?

Xem đáp án

a. Bảng tần số:

Điểm số (Giá trị)Tần số ($n$)
61
73
85
94
102
TổngN = 15

b. Điểm số có tần số cao nhất:

Điểm 8 có tần số cao nhất là 5.

Bài 2: Biểu đồ cột dưới đây thể hiện số lượng thú cưng của các gia đình trong một khu phố.

16
0
20
1
12
2
5
3+

a. Lập bảng tần số từ biểu đồ trên.

b. Có tất cả bao nhiêu gia đình đã được khảo sát?

Xem đáp án

a. Bảng tần số:

Số thú cưng (Giá trị)Số gia đình (Tần số)
016
120
212
3+5
Tổng53

b. Tổng số gia đình được khảo sát:

Tổng tần số = $16 + 20 + 12 + 5 = 53$. Có 53 gia đình đã được khảo sát.

Bài tập Nâng cao

Bài 1: Dữ liệu ghép nhóm

Chiều cao (cm) của 25 cầu thủ trong một đội bóng rổ được ghi lại như sau:

175, 181, 192, 178, 185, 195, 201, 188, 179, 190, 196, 183, 177, 189, 193, 203, 180, 186, 198, 176, 182, 191, 187, 194, 184

Hãy lập bảng tần số ghép nhóm bằng cách chia dữ liệu thành các nhóm (lớp) sau: [175-180], (180-185], (185-190], (190-195], (195-205].

Ghi chú: [a, b] nghĩa là từ a đến b, tính cả a và b. (a, b] là lớn hơn a và nhỏ hơn hoặc bằng b.

Xem đáp án

Ta tiến hành đếm số liệu thuộc vào mỗi nhóm:

  • [175-180]: 175, 178, 179, 177, 176, 180. (6 cầu thủ)
  • (180-185]: 181, 185, 183, 182, 184. (5 cầu thủ)
  • (185-190]: 188, 190, 186, 189, 187. (5 cầu thủ)
  • (190-195]: 192, 195, 191, 193, 194. (5 cầu thủ)
  • (195-205]: 201, 196, 203, 198. (4 cầu thủ)

Bảng tần số ghép nhóm:

Nhóm chiều cao (cm)Tần số
[175 - 180]6
(180 - 185]5
(185 - 190]5
(190 - 195]5
(195 - 205]4
TổngN = 25

Bài 2: Tìm tần số còn thiếu

Kết quả khảo sát về cỡ giày của 50 khách hàng nam tại một cửa hàng được ghi trong bảng tần số dưới đây, tuy nhiên tần số của cỡ 42 đã bị mờ.

Cỡ giàyTần số
395
4012
4115
42?
436
TổngN = 50

Hãy tìm tần số của cỡ giày 42.

Xem đáp án

Tổng các tần số phải bằng cỡ mẫu N = 50.

Tổng các tần số đã biết là: $5 + 12 + 15 + 6 = 38$.

Vậy, tần số của cỡ giày 42 là:

$$ 50 - 38 = 12 $$

Tần số của cỡ giày 42 là 12.