Thống Kê Mô Tả: Trình Bày & Diễn Giải Dữ Liệu Hiệu Quả
Chuyển đổi dữ liệu thô thành thông tin chi tiết hữu ích. Biến sự phức tạp thành sự rõ ràng để ra quyết định tự tin.
Giới thiệu: Chuyển đổi Dữ liệu
Trọng tâm của thống kê là suy luận — đi ngược từ dữ liệu quan sát được để tìm hiểu về mô hình chưa biết.
Lý thuyết Xác suất
Từ mô hình đã biết Dữ liệu.
Suy luận Thống kê
Từ dữ liệu thực tế Mô hình chưa biết.
Quần thể và Mẫu
Tất cả quan sát khả dĩ. Nhóm lớn nhất mà ta quan tâm.
Tập con được đo lường. Phải có tính đại diện (tốt nhất là ngẫu nhiên).
Trực quan hóa Dữ liệu Phân loại
"Bảng liệt kê con số, nhưng biểu đồ kể chuyện."
Biểu đồ Thanh (Bar Charts)
So sánh độ lớn tần suất giữa các hạng mục. Dễ đọc, trực quan.
Biểu đồ Pareto
Sắp xếp giảm dần để tìm "số ít quan trọng" (Quy tắc 80/20). Dùng trong kiểm soát chất lượng.
CẢNH BÁO: Trục bị cắt ngắn
Luôn bắt đầu trục tần số từ 0. Việc bắt đầu từ con số khác (ví dụ: 70) sẽ phóng đại sự khác biệt và gây hiểu lầm nghiêm trọng.
Trình bày Dữ liệu Số
Mục tiêu: Hiểu Hình dạng, Tâm và Độ phân tán.
Biểu đồ tần suất (Histogram)
Trục X liên tụcĐiểm ngoại lai (Outliers)
Đừng xóa vội! Hãy điều tra. Nó có thể là lỗi, nhưng cũng có thể là một phát hiện đột phá (khách hàng VIP, lỗi hệ thống nghiêm trọng).
Định lượng Dữ liệu
Khuynh hướng Trung tâm
Nhạy cảm với ngoại lai. Bị kéo về phía đuôi dài.
Giá trị ở giữa. Bền vững trước ngoại lai. Tốt cho dữ liệu lương bổng.
Độ phân tán
-
Độ lệch chuẩn (s)
Cùng đơn vị với dữ liệu gốc. Dễ hình dung khoảng biến thiên.
-
Khoảng tứ phân vị (IQR)
Q3 - Q1. Chứa 50% dữ liệu ở giữa. Không bị ảnh hưởng bởi ngoại lai.
Biểu đồ Hộp (Boxplot)
Nguyên tắc Vàng
Checklist Trình bày Dữ liệu
- Bối cảnh: Mẫu có đại diện cho quần thể không?
- Công cụ đúng: Thanh/Tròn cho Phân loại. Histogram/Hộp cho Số.
- Trung thực: Không cắt ngắn trục tần số.
- Ngoài Trung bình: Luôn xem xét Trung vị nếu dữ liệu bị lệch.
- Kết hợp: Hình ảnh thu hút + Con số chứng minh.