Trong phân tích dữ liệu, mục tiêu cuối cùng là chuyển đổi dữ liệu thô thành những hiểu biết có thể hành động. Ước tính thống kê là một trong những công cụ cơ bản và mạnh mẽ nhất trong quá trình này. Nó cho phép chúng ta sử dụng thông tin từ một mẫu để đưa ra những suy luận có cơ sở về các đặc điểm của một tổng thể lớn hơn.
Để bắt đầu, điều quan trọng là phải phân biệt rõ ràng giữa hai khái niệm nền tảng:
Tham số (Parameter)
- ● Thuộc tính của Tổng thể (ví dụ: \(\mu\), \(\sigma^2\)).
- ● Giá trị không xác định, là mục tiêu của suy luận.
Thống kê (Statistic)
- ● Thuộc tính của Mẫu (ví dụ: \(\bar{x}\), \(s^2\)).
- ● Giá trị đã biết, được tính từ dữ liệu.
Chúng ta sử dụng các thống kê này như những ước tính điểm (point estimate)—những "dự đoán tốt nhất" của chúng ta cho các tham số chưa biết.