Bài đăng

Đang hiển thị bài đăng từ Tháng 12, 2021

Bài 16, 17: Dimension Reduction

Hình ảnh
  Bài 16: Hồi quy các thành phần chính ( Principal Components Regression) Một trong những vấn đề phổ biến nhất mà ta sẽ gặp phải khi xây dựng mô hình là  đa cộng tuyến  .  Điều này xảy ra khi hai hoặc nhiều biến dự báo trong một tập dữ liệu có tương quan cao. Khi điều này xảy ra, một mô hình nhất định có thể phù hợp tốt với tập dữ liệu đào tạo nhưng nó có thể sẽ hoạt động kém trên một tập dữ liệu mới mà nó chưa gặp, và rơi vào trường hợp overfitingtrên   tập hợp dữ liệu huấn luyện. Một cách để tránh overfiting là sử dụng một số loại   phương pháp  lựa chọn tập hợp con  như: Lựa chọn tập hợp con tốt nhất Lựa chọn từng bước Các phương pháp này cố gắng loại bỏ các yếu tố dự báo không thích hợp khỏi mô hình để chỉ còn lại các yếu tố dự báo quan trọng nhất có khả năng dự đoán sự thay đổi của biến phản ứng trong mô hình cuối cùng. Một cách khác để tránh overfiting là sử dụng một số loại   phương pháp  chính quy  như: Hồi quy Ridge Hồi quy Lasso Các phương pháp này cố gắng hạn chế hoặc  điều