Tổng quan về Phân tích Phương sai một yếu tố (ANOVA)
Làm thế nào để so sánh hiệu quả của không chỉ hai, mà là ba, bốn, hay nhiều nhóm khác nhau một cách khoa học? Khi các phương pháp so sánh hai trung bình (như t-test) không còn đủ, ANOVA là câu trả lời.
Mục tiêu: Kiểm tra xem mức độ hẹp của động mạch (0.78, 0.71, 0.65) có ảnh hưởng đến tốc độ dòng chảy không.
Câu hỏi: Sự khác biệt giữa 3 nhóm này là THẬT hay chỉ do MAY RỦI?
1. Câu hỏi Cốt lõi: Cặp Giả Thuyết
Mọi kiểm định đều bắt đầu bằng hai quan điểm đối lập:
"Không có gì xảy ra"
Tất cả các nhóm đều giống nhau. Sự khác biệt chỉ là ngẫu nhiên.
"Có chuyện gì đó"
Có ít nhất hai nhóm khác nhau thực sự.
2. Ý Tưởng Lớn: Phân Tách Tổng Biến Thiên
ANOVA không nhìn trực tiếp vào trung bình, mà nhìn vào Sự biến thiên (Phương sai).
Tổng biến thiên (SST) được chia thành hai phần:
Tổng
Tín Hiệu
Nhiễu
Sự khác biệt GIỮA các nhóm. (Do yếu tố tác động)
Sự biến thiên TRONG các nhóm. (Do ngẫu nhiên)
3. So sánh Biến thiên: Thống kê F
Làm sao để biết Tín hiệu có đủ mạnh so với Nhiễu không?
Nếu F ≈ 1: Tín hiệu yếu, chìm trong nhiễu (Chấp nhận \(H_0\)).
Nếu F lớn: Tín hiệu rõ ràng, vượt trội so với nhiễu (Bác bỏ \(H_0\)).
4. Bảng ANOVA: Bức Tranh Toàn Cảnh
Tất cả các tính toán được tóm tắt gọn gàng trong bảng này:
| Nguồn Biến Thiên | Bậc Tự Do (df) | Tổng Bình Phương (SS) | Bình Phương TB (MS) | F | P-value |
|---|---|---|---|---|---|
| Giữa các nhóm (Tín hiệu) | \(k-1\) | SSTr | MSTr | \(\frac{MSTr}{MSE}\) | Quan trọng nhất |
| Trong các nhóm (Nhiễu) | \(N-k\) | SSE | MSE | ||
| Tổng cộng | \(N-1\) | SST |
5. Đưa ra Kết Luận: Giải thích P-value
Giá trị P là chìa khóa cuối cùng để ra quyết định.
P nhỏ (< 0.05)
Sự khác biệt là Rất khó xảy ra ngẫu nhiên.
➔ Bác bỏ \(H_0\)
Kết luận: Các nhóm thực sự khác nhau.
P lớn (≥ 0.05)
Kết quả này là Bình thường nếu các nhóm giống nhau.
➔ Không bác bỏ \(H_0\)
Kết luận: Không đủ bằng chứng để nói có sự khác biệt.
6. Tổng Kết: Luồng Tư Duy
-
1Đặt câu hỏi: Các nhóm có khác nhau không?
-
2Phân tách: Tách Tín hiệu (SSTr) ra khỏi Nhiễu (SSE).
-
3Tính F: So sánh Tín hiệu / Nhiễu.
-
4Kiểm tra P: Ra quyết định thống kê cuối cùng.