Bài đăng

Đang hiển thị bài đăng từ Tháng 12, 2021
Hình ảnh
Bài 17: Phương pháp bình phương tối thiểu từng phần ( Partial Least Squares - PLS) Một trong những vấn đề phổ biến nhất mà ta sẽ gặp phải trong học máy là  đa cộng tuyến  . Điều này xảy ra khi hai hoặc nhiều biến dự báo trong một tập dữ liệu có tương quan cao. Khi điều này xảy ra, một mô hình có thể fit tốt với tập dữ liệu huấn luyện nhưng nó có thể hoạt động kém trên một tập dữ liệu mới mà nó chưa biết vì gặp phải trường hợp  overfits  với tập dữ liệu  huấn luyện. Một cách để giải quyết vấn đề đa cộng tuyến là sử dụng  hồi quy các thành phần chính  , tính toán   M  tổ hợp tuyến tính (được gọi là "thành phần chính") của  p   biến dự báo   ban đầu  và sau đó sử dụng phương pháp bình phương nhỏ nhất để fit với mô hình hồi quy tuyến tính bằng cách sử dụng các thành phần chính làm yếu tố dự báo. Hạn chế của hồi quy các thành phần chính (PCR) là nó không xem xét  biến phản hồi  khi tính toán các thành phần c...