Báo cáo Kỹ thuật Nội bộ
Phân tích So sánh
Phương pháp Thống kê
"Sự lựa chọn giữa tính hợp lệ và độ chính xác."
Giới thiệu Tổng quan
Tầm quan trọng của phương pháp luận
Mục tiêu báo cáo
Làm rõ sự khác biệt nền tảng, các giả định cơ bản và sự đánh đổi cố hữu giữa phương pháp tham số và phi tham số.
Phân loại & Giả định
Sự khác biệt cốt lõi nằm ở mức độ chặt chẽ của những giả định về dữ liệu đầu vào.
Tham số
Khuôn khổ chặt chẽ
Giả định phân phối cụ thể (Chuẩn, Weibull...).
Ước tính tham số: trung bình (µ), phương sai (σ²).
Phi tham số
Linh hoạt & Mạnh mẽ
Không yêu cầu giả định về dạng phân phối.
Công cụ linh hoạt khi thiếu thông tin nền tảng.
Đánh đổi Chiến lược
Sự cân bằng giữa tính hợp lệ và độ chính xác
| Đặc tính | Tham số | Phi tham số |
|---|---|---|
| Giả định | Yêu cầu giả định mạnh (Chuẩn). | Yêu cầu yếu (độc lập). |
| Sức mạnh (Power) | Cao (nếu đúng giả định) | Trung bình (nhưng ổn định) |
| Tính hợp lệ | ⚠️ Dễ sai lệch nếu dữ liệu bị lệch. | ✅ Hợp lệ tổng quát, an toàn. |
| Tính mạnh mẽ (Robustness) | Nhạy cảm với ngoại lai. | Ít nhạy cảm với ngoại lai. |
Phân tích Ứng dụng
Kịch bản 1: Phân tích một Tổng thể
Kiểm định t (t-test)
Dùng giá trị thực, yêu cầu phân phối chuẩn.
Kiểm định Sign
Đếm +/-. Cực kỳ mạnh mẽ trước ngoại lai.
Hạng Dấu (Signed Rank)
Dùng cả dấu và hạng. Chính xác hơn Sign test.
Kịch bản 2: So sánh Hai Tổng thể
Kolmogorov-Smirnov
So sánh toàn diện hàm phân phối tích lũy (hình dạng & vị trí).
Wilcoxon Rank Sum
Phát hiện sự chênh lệch vị trí (trung vị) dựa trên xếp hạng gộp.
Kịch bản 3: Ba hoặc nhiều Tổng thể
| Bối cảnh Thiết kế | Tham số (ANOVA) | Phi tham số |
|---|---|---|
| Bố trí một chiều | F-test | Kruskal-Wallis (Dùng hạng) |
| Thiết kế khối ngẫu nhiên | F-test | Friedman (Xếp hạng trong khối) |
Kết luận & Khuyến nghị
Mục tiêu không phải là chọn phương án an toàn nhất, mà là phương án phù hợp nhất dựa trên bằng chứng dữ liệu.
1. Luôn kiểm tra giả định
Đừng đoán mò. Sử dụng biểu đồ tần suất và đồ thị xác suất trước khi chọn phương pháp.
2. Chiến lược Lựa chọn
Dữ liệu chuẩn -> Tham số (Sức mạnh).
Dữ liệu lạ/Mẫu nhỏ -> Phi tham số (Hợp lệ).