Hiểu Thống Kê Mô Tả
Thống kê không chỉ là những con số, mà là công cụ giúp chúng ta hiểu được "trạng thái tự nhiên thực sự" của thế giới thông qua lăng kính dữ liệu.
Tổng Thể và Mẫu
Để bắt đầu, chúng ta cần phân biệt giữa bức tranh toàn cảnh (Tổng thể) và ảnh chụp nhanh (Mẫu).
Tổng thể (Population)
Tất cả các quan sát có thể có. Nhóm lớn chúng ta muốn tìm hiểu.
Mẫu (Sample)
Tập hợp con cụ thể được chọn ra để đo lường.
| Đặc điểm | Tổng thể | Mẫu |
|---|---|---|
| Quy mô | Toàn bộ thành viên | Một phần nhỏ quản lý được |
| Mục đích | Đối tượng chính cần kết luận | Cung cấp dữ liệu để suy luận |
Lấy Mẫu Ngẫu Nhiên
Tại sao phải công bằng?
Nguyên tắc "Rác vào, rác ra": Dữ liệu kém dẫn đến kết luận sai. Để có Mẫu đại diện, chúng ta cần Lấy mẫu ngẫu nhiên.
Nếu chỉ lấy sữa từ 2 máy mà bỏ qua máy thứ 3, bạn sẽ có cái nhìn sai lệch về toàn bộ nhà máy.
Mọi thành viên đều có cơ hội được chọn như nhau
Các Loại Dữ Liệu
Chúng ta đang đo lường cái gì? Việc nhận biết loại dữ liệu quyết định phương pháp phân tích phù hợp.
Dữ liệu Phân loại
CategoricalTrả lời câu hỏi: "Loại nào?"
- Nguyên nhân hỏng (Điện, Cơ khí)
- Màu mắt (Nâu, Xanh)
Dữ liệu Số
NumericalTrả lời câu hỏi: "Bao nhiêu?"
- Số lượng chip lỗi (0, 1, 2...)
- Đường kính xi lanh (mm)
Kết Luận
Bước Khởi Đầu Vững Chắc
Bạn đã nắm được 3 ý tưởng cốt lõi để bắt đầu hành trình phân tích dữ liệu:
- Tổng thể vs Mẫu: Sự khác biệt giữa toàn bộ và một phần.
- Lấy mẫu ngẫu nhiên: Chìa khóa để có kết luận công bằng.
- Loại dữ liệu: Phân loại hay Số? Nền tảng để chọn biểu đồ phù hợp.