Hướng dẫn thực hành: Khớp một đường Hồi quy Tuyến tính Đơn giản

Làm thế nào để biến dữ liệu thô thành một công cụ dự báo? Hướng dẫn này sẽ đưa bạn đi qua từng bước tính toán thủ công để tìm ra "đường thẳng phù hợp nhất" bằng phương pháp Bình phương Tối thiểu (Least Squares).

1. Tìm hiểu Mô hình Hồi quy

Trước khi tính toán, hãy hiểu công thức nền tảng:

\( y_i = \beta_0 + \beta_1x_i + \varepsilon_i \)
  • \(y\) (Biến phụ thuộc): Mức sử dụng điện (cần dự báo).
  • \(x\) (Biến độc lập): Sản lượng sản xuất (dữ liệu đầu vào).
  • \(\beta_1\) (Hệ số góc): Mức tăng điện năng khi sản xuất tăng 1 đơn vị.
  • \(\beta_0\) (Hệ số chặn): Mức điện năng nền tảng (khi sản xuất = 0).
  • \(\varepsilon\) (Sai số): Sự chênh lệch ngẫu nhiên.

2. Dữ liệu Nghiên cứu: Nhà máy Ô tô

Dữ liệu 12 tháng về sản lượng và tiêu thụ điện:

Tháng Sản lượng (x)
(Triệu $)
Điện năng (y)
(Triệu kWh)
14.512.48
23.582.26
34.312.47
45.062.77
55.642.99
64.993.05
75.293.18
85.833.46
94.703.03
105.613.26
114.902.67
124.202.53

3. Quy trình Tính toán Từng bước

Chúng ta sẽ đi tìm \(\hat{\beta}_0\) và \(\hat{\beta}_1\) từ dữ liệu trên.

1
Tính toán Giá trị Tổng hợp

Trước hết, cần tính tổng của các cột dữ liệu:

Số quan sát (n) 12
Tổng X (\(\Sigma x\)) 58.62
Tổng Y (\(\Sigma y\)) 34.15
Tổng \(X^2\) (\(\Sigma x^2\)) 291.2310
Tổng \(Y^2\) (\(\Sigma y^2\)) 98.6967
Tổng XY (\(\Sigma xy\)) 169.2532
2
Ước tính Hệ số Góc (\(\hat{\beta}_1\))

Công thức:

\( \hat{\beta}_1 = \frac{n\Sigma(xy) - (\Sigma x)(\Sigma y)}{n\Sigma(x^2) - (\Sigma x)^2} \)
Tử số: (12 * 169.2532) - (58.62 * 34.15) = 2031.0384 - 2000.823 = 30.2154 Mẫu số: (12 * 291.2310) - (58.62)^2 = 3494.772 - 3436.2844 = 58.4876 Kết quả: 30.2154 / 58.4876 = 0.49883

Kết quả: \(\hat{\beta}_1 \approx 0.499\)

Ý nghĩa: Sản xuất tăng 1 triệu $, điện tăng 0.499 triệu kWh.

3
Ước tính Hệ số Chặn (\(\hat{\beta}_0\))

Công thức: \( \hat{\beta}_0 = \bar{y} - \hat{\beta}_1\bar{x} \)

Trung bình x: 58.62 / 12 = 4.885 Trung bình y: 34.15 / 12 = 2.8458 Tính toán: beta_0 = 2.8458 - (0.49883 * 4.885) = 2.8458 - 2.4368 = 0.4090

Kết quả: \(\hat{\beta}_0 \approx 0.409\)

4
Viết Phương trình Hồi quy

Ghép nối các kết quả lại với nhau:

\( \hat{y} = 0.409 + 0.499x \)
Mô hình dự báo điện năng tiêu thụ

Ví dụ áp dụng: Nếu tháng tới sản xuất 5.5 triệu $:

y = 0.409 + (0.499 * 5.5) = 0.409 + 2.7445 = 3.1535 triệu kWh
5
Ước tính Sai số (\(\hat{\sigma}^2\))

Đo lường độ phân tán của dữ liệu quanh đường hồi quy.

Tử số: 98.6967 - (0.4090 * 34.15) - (0.49883 * 169.2532) = 98.6967 - 13.967 - 84.430 = 0.299 Mẫu số: n - 2 = 12 - 2 = 10 Kết quả: 0.299 / 10 = 0.0299

4. Tổng kết Kết quả

Chúng ta đã hoàn thành mô hình với các tham số sau:

  • Phương trình: \(\hat{y} = 0.409 + 0.499x\)
  • Hệ số góc: 0.499 (Tác động biên)
  • Hệ số chặn: 0.409 (Nền tảng)
  • Phương sai sai số: 0.0299 (Độ chính xác)

5. Kết luận

Chúc mừng! Bạn đã thực hiện thành công quy trình khớp một đường hồi quy tuyến tính đơn giản. Bằng cách chia nhỏ quy trình thành các bước có thể quản lý được, chúng ta đã biến một khái niệm thống kê phức tạp thành một công cụ dự báo thực tế.