Biểu đồ Thống kê (Statistical Graphs)
Định nghĩa
Biểu đồ thống kê là một công cụ trực quan hóa dữ liệu. Chúng giúp đơn giản hóa các bộ dữ liệu phức tạp, làm nổi bật các mẫu, xu hướng và các giá trị ngoại lệ. Các loại phổ biến bao gồm biểu đồ cột, biểu đồ tròn, và biểu đồ đường.
Ví dụ minh họa
Doanh thu hàng tháng (Biểu đồ cột): Biểu đồ dưới đây so sánh doanh thu (tính bằng triệu đồng) của một cửa hàng trong 4 tháng đầu năm.
Từ biểu đồ, ta có thể thấy doanh thu cao nhất vào Tháng 3 và thấp nhất vào Tháng 2.
Sai lầm thường gặp
Trục Y không bắt đầu từ 0: Trong biểu đồ cột, nếu trục tung không bắt đầu từ 0, sự khác biệt giữa các cột sẽ bị phóng đại, gây hiểu lầm về tỷ lệ chênh lệch.
Biểu đồ Phân tán (Scatter Plots)
Định nghĩa
Biểu đồ phân tán sử dụng các điểm để biểu diễn giá trị của hai biến số, giúp quan sát mối quan hệ hoặc tương quan giữa chúng.
Phân tích mối tương quan
- Tương quan dương: Khi X tăng thì Y cũng có xu hướng tăng.
- Tương quan âm: Khi X tăng thì Y có xu hướng giảm.
- Không tương quan: Các điểm phân bố ngẫu nhiên.
Ví dụ minh họa
Số giờ học và điểm thi: Biểu đồ dưới đây thể hiện mối quan hệ giữa số giờ một sinh viên dành để học (trục X) và điểm thi của họ (trục Y).
Ta thấy một mối tương quan dương: nhìn chung, sinh viên học càng nhiều giờ thì điểm thi càng cao.
Bài tập cơ bản
Một nhà nghiên cứu thu thập dữ liệu về tuổi của một chiếc ô tô (tính bằng năm) và giá trị của nó (tính bằng triệu đồng). Bạn dự đoán mối tương quan sẽ là dương, âm hay không có tương quan? Giải thích.
Hiện đáp ánMối tương quan dự kiến là tương quan âm. Vì khi tuổi của một chiếc ô tô tăng lên (càng cũ), giá trị của nó có xu hướng giảm xuống.
Đường xu hướng (Line of Best Fit)
Định nghĩa
Đường xu hướng (đường hồi quy tuyến tính) là một đường thẳng đi qua biểu đồ phân tán để thể hiện tốt nhất mối quan hệ giữa các điểm dữ liệu. Phương trình của đường thẳng này thường có dạng $y = mx + b$.
Tính chất
- Tóm tắt xu hướng chính của dữ liệu.
- Có thể được sử dụng để dự đoán giá trị của một biến dựa trên biến còn lại.
Ví dụ minh họa
Dựa trên biểu đồ phân tán về giờ học và điểm thi, ta có thể vẽ một đường xu hướng để làm rõ mối quan hệ.
Đường thẳng này cho thấy một xu hướng tổng thể là điểm số tăng lên cùng với số giờ học. Dựa vào đường này, ta có thể ước tính rằng một sinh viên học 7 giờ sẽ đạt khoảng 85 điểm.
Bài tập nâng cao
Một công ty phân tích dữ liệu về chi phí quảng cáo (biến X, đơn vị: triệu đồng) và doanh thu (biến Y, đơn vị: trăm triệu đồng) trong 6 tháng. Họ tìm được đường xu hướng là $y = 1.5x + 3$.
a) Giải thích ý nghĩa của hệ số góc $1.5$.
b) Dự đoán doanh thu nếu công ty chi 10 triệu đồng cho quảng cáo.
a) Ý nghĩa hệ số góc: Hệ số góc $m = 1.5$ có nghĩa là với mỗi triệu đồng tăng thêm trong chi phí quảng cáo, doanh thu dự kiến sẽ tăng thêm $1.5 \times 100 = 150$ triệu đồng.
b) Dự đoán doanh thu: Thay $x = 10$ vào phương trình:
$y = 1.5 \times (10) + 3 = 15 + 3 = 18$.
Doanh thu dự đoán là 18 trăm triệu đồng, tức là 1.8 tỷ đồng.