Bài 17: Phương pháp bình phương tối thiểu từng phần ( Partial Least Squares - PLS) Một trong những vấn đề phổ biến nhất mà ta sẽ gặp phải trong học máy là đa cộng tuyến . Điều này xảy ra khi hai hoặc nhiều biến dự báo trong một tập dữ liệu có tương quan cao. Khi điều này xảy ra, một mô hình có thể fit tốt với tập dữ liệu huấn luyện nhưng nó có thể hoạt động kém trên một tập dữ liệu mới mà nó chưa biết vì gặp phải trường hợp overfits với tập dữ liệu huấn luyện. Một cách để giải quyết vấn đề đa cộng tuyến là sử dụng hồi quy các thành phần chính , tính toán M tổ hợp tuyến tính (được gọi là "thành phần chính") của p biến dự báo ban đầu và sau đó sử dụng phương pháp bình phương nhỏ nhất để fit với mô hình hồi quy tuyến tính bằng cách sử dụng các thành phần chính làm yếu tố dự báo. Hạn chế của hồi quy các thành phần chính (PCR) là nó không xem xét biến phản hồi khi tính toán các thành phần c...
Bài đăng
Đang hiển thị bài đăng từ Tháng 12, 2021