Ước tính trung bình tổng thể (\(\mu\)) bằng trung bình mẫu (\(\bar{x}\)) chỉ là một ước tính điểm. Khoảng tin cậy (Confidence Interval - CI) giải quyết vấn đề này bằng cách cung cấp một khoảng các giá trị "hợp lý" cho tham số \(\mu\), giúp lượng hóa mức độ không chắc chắn của một ước tính.
1.1. Cơ sở và Công thức Xây dựng Khoảng tin cậy t Hai phía
Một khoảng tin cậy đi kèm với một mức tin cậy (\(1 - \alpha\)), biểu thị xác suất mà khoảng tin cậy ngẫu nhiên được tạo ra sẽ chứa giá trị trung bình tổng thể thực sự. Các mức phổ biến là 90% (\(\alpha = 0.10\)), 95% (\(\alpha = 0.05\)), và 99% (\(\alpha = 0.01\)).
Công thức tổng quát để xây dựng một khoảng tin cậy t hai phía là:
\[ \mu \in \left[\bar{x} - t_{\alpha/2, n-1} \left( \frac{s}{\sqrt{n}} \right), \bar{x} + t_{\alpha/2, n-1} \left( \frac{s}{\sqrt{n}} \right) \right] \]
Các thành phần của Công thức
| Ký hiệu |
Ý nghĩa |
Mô tả chi tiết |
| \(\bar{x}\) |
Trung bình mẫu |
Ước tính điểm hay "dự đoán tốt nhất" cho \(\mu\). |
| \(s\) |
Độ lệch chuẩn mẫu |
Đo lường mức độ biến thiên trong mẫu. |
| \(n\) |
Kích thước mẫu |
Số lượng quan sát trong mẫu. |
| \(s/\sqrt{n}\) |
Sai số chuẩn |
Ước tính độ lệch chuẩn của phân phối lấy mẫu của \(\bar{x}\). |
| \(t_{\alpha/2, n-1}\) |
Giá trị tới hạn |
Giá trị từ phân phối t với \(n-1\) bậc tự do. |
Điều kiện áp dụng:
- Khi kích thước mẫu lớn (thường là \(n \geq 30\)).
- Khi kích thước mẫu nhỏ, dữ liệu gốc cần có phân phối xấp xỉ chuẩn.
1.2. Phân tích các Yếu tố Ảnh hưởng đến Độ dài Khoảng Tin cậy
Độ dài của khoảng tin cậy (\(L = 2 \cdot t_{\alpha/2, n-1} \cdot (s/\sqrt{n})\)) phản ánh độ chính xác. Khoảng càng ngắn, ước tính càng chính xác.
- Mức tin cậy (\(1 - \alpha\)): Tỷ lệ thuận. Mức tin cậy càng cao \(\rightarrow\) \(t\) càng lớn \(\rightarrow\) khoảng càng dài (kém chính xác hơn).
- Kích thước mẫu (\(n\)): Tỷ lệ nghịch. Kích thước mẫu càng lớn \(\rightarrow\) sai số chuẩn càng nhỏ \(\rightarrow\) khoảng càng ngắn (chính xác hơn).
- Hệ quả: Để giảm một nửa độ dài (tăng gấp đôi độ chính xác), cần tăng kích thước mẫu lên bốn lần.
1.3. Ví dụ Minh họa: Ứng dụng trong Thực tế
Ví dụ 1: Hàm lượng sữa trong hộp (n=50)
- Dữ liệu: \(\bar{x} = 2.0727\), \(s = 0.0711\), df = 49.
- KTC 90% (\(t=1.6766\)): (2.0558, 2.0895) lít
- KTC 95% (\(t=2.0096\)): (2.0525, 2.0929) lít
- KTC 99% (\(t=2.680\)): (2.0457, 2.0996) lít
Diễn giải 95%: Chúng ta tin cậy 95% rằng hàm lượng sữa trung bình thực sự nằm trong khoảng từ 2.053 đến 2.093 lít.
Ví dụ 2: Sản xuất xi lanh kim loại (n=60)
- Dữ liệu: \(\bar{x} = 49.999\) mm, \(s = 0.134\) mm.
- KTC 95%: (49.964, 50.034) mm
Lưu ý: Đây là khoảng tin cậy cho đường kính trung bình, không phải cho một xi lanh riêng lẻ.
1.4. Ước tính Kích thước Mẫu cần thiết
Để đạt được khoảng tin cậy có độ dài không quá \(L_0\), kích thước mẫu \(n\) cần thỏa mãn:
\[ n \geq 4 \left( \frac{t_{\alpha/2, n-1} \cdot s}{L_0} \right)^2 \]
Áp dụng vào ví dụ hàm lượng sữa:
- Yêu cầu: KTC 99% với độ dài không quá \(L_0 = 0.04\) lít.
- Thông số ban đầu: \(s = 0.0711\), \(t_{0.005, 49} = 2.680\).
- Tính toán: \(n \geq 4 \cdot ( (2.680 \cdot 0.0711) / 0.04 )^2 \approx 90.77\)
- Kết luận: Cần làm tròn lên 91 mẫu. Phải thu thập thêm \(91 - 50 = 41\) mẫu nữa.
1.5. Các Dạng Khoảng Tin cậy Khác
- Khoảng tin cậy một phía (One-Sided): Cung cấp một cận trên hoặc một cận dưới cho \(\mu\). Hữu ích khi chỉ quan tâm đến một giới hạn (ví dụ: độ bền tối thiểu, mức phơi nhiễm tối đa). Công thức sử dụng \(t_{\alpha, n-1}\) thay vì \(t_{\alpha/2, n-1}\), làm cho giới hạn "chặt chẽ" hơn.
- Khoảng tin cậy z (z-Intervals): Chỉ sử dụng trong trường hợp hiếm hoi khi độ lệch chuẩn tổng thể \(\sigma\) đã biết. Trong hầu hết các trường hợp thực tế, \(\sigma\) chưa biết, nên khoảng tin cậy t là quy trình chính xác.