منوی دسته بندی

تفاوت‌های بین روش PLS و OLS

تفاوت‌های بین روش PLS و OLS

تفاوت‌های بین روش PLS و OLS؛ روش PLS (Partial Least Squares) و OLS (Ordinary Least Squares)

1. کاربرد و هدف اصلی

  • OLS (حداقل مربعات معمولی):
    OLS یکی از پرکاربردترین روش‌های رگرسیون در مدل‌های آماری است که هدف اصلی آن تخمین ضرایب رگرسیون به‌طوری است که اختلاف (باقیمانده) بین مقادیر واقعی متغیر وابسته و مقادیر پیش‌بینی شده توسط مدل حداقل شود. در واقع، OLS از مفهوم مینیمم‌سازی فاصله بین داده‌های واقعی و پیش‌بینی شده استفاده می‌کند تا بهترین تخمین از ضرایب ارائه دهد. این روش برای مدل‌هایی مناسب است که در آن رابطه خطی بین متغیرهای مستقل و وابسته برقرار است. همچنین، فرضیات کلاسیک رگرسیون مانند نرمال بودن خطاها، استقلال آن‌ها، و همسانی واریانس در این مدل‌ها ضروری هستند. OLS به‌ویژه برای مدل‌هایی کاربرد دارد که تعداد متغیرهای مستقل زیاد نیست و هم‌خطی بین متغیرها وجود ندارد.
  • PLS (حداقل مربعات جزئی):
    در مقابل، PLS به‌ویژه زمانی کاربرد دارد که تعداد متغیرهای مستقل بسیار زیاد است یا اینکه هم‌خطی شدیدی بین این متغیرها وجود دارد. PLS به جای تخمین مستقیم ضرایب هر متغیر مستقل، ابتدا کامپوننت‌های جدیدی را ایجاد می‌کند که ترکیبی از متغیرهای اصلی هستند و سپس از این کامپوننت‌ها برای پیش‌بینی متغیر وابسته استفاده می‌کند. این روش در مواردی که داده‌های با نویز زیاد یا داده‌های نامنظم داریم نیز مناسب است، زیرا بر خلاف OLS نیاز به فرضیات کلاسیک شدید ندارد و حتی در صورت عدم نرمال بودن داده‌ها نیز می‌تواند نتایج خوبی ارائه دهد.

2. مقابله با هم‌خطی (Multicollinearity)

  • OLS:
    یکی از مشکلات اصلی OLS زمانی است که بین متغیرهای مستقل هم‌خطی وجود دارد، به این معنی که متغیرهای مستقل به شدت به هم وابسته هستند. در چنین شرایطی، OLS نمی‌تواند ضرایب رگرسیون را به‌طور صحیح تخمین بزند و نتایج ناپایدار و تورش‌دار به دست می‌دهد. هم‌خطی شدید ممکن است باعث شود که ضرایب متغیرهای مستقل به‌طور نادرستی تخمین زده شوند.
  • PLS:
    PLS به نحوی طراحی شده که به‌طور مستقیم با مشکل هم‌خطی مقابله کند. این روش با تبدیل متغیرهای مستقل به مجموعه‌ای از کامپوننت‌های جدید که مستقل از یکدیگر هستند، هم‌خطی را کاهش می‌دهد. در نتیجه، PLS می‌تواند حتی در شرایطی که OLS مشکل دارد، نتایج بهتری ارائه دهد.

3. تعداد متغیرها

  • OLS:
    اگر تعداد متغیرهای مستقل در مدل کم باشد و داده‌ها از کیفیت بالایی برخوردار باشند (بدون هم‌خطی)، OLS معمولاً بهترین انتخاب است. به‌طور خاص، OLS نیاز دارد که تعداد مشاهدات بیشتر از تعداد متغیرهای مستقل باشد.
  • PLS:
    PLS زمانی به کار می‌رود که تعداد متغیرهای مستقل زیاد است، حتی بیشتر از تعداد مشاهدات. این روش با استفاده از تعداد کمی کامپوننت به جای تعداد زیادی متغیر مستقل، مدل را ساده‌تر می‌کند و می‌تواند حتی در صورت داشتن متغیرهای بیش از حد یا داده‌های کوچک نیز مفید باشد.

4. مدل‌سازی و هدف اصلی

  • OLS:
    هدف اصلی OLS پیش‌بینی مقادیر متغیر وابسته با استفاده از متغیرهای مستقل است. این روش به بهترین شکل ممکن سعی می‌کند تا تفاوت بین مقادیر پیش‌بینی شده و مقادیر واقعی متغیر وابسته را به حداقل برساند.
  • PLS:
    علاوه بر پیش‌بینی، PLS سعی می‌کند روابط میان متغیرهای مستقل و وابسته را بهتر درک کند. این روش به طور هم‌زمان متغیرهای وابسته و مستقل را مدل‌سازی می‌کند و در شرایط پیچیده‌تر با مجموعه‌های داده‌های بزرگتر و متغیرهای زیاد، کارایی بیشتری دارد.

5. فرضیات و شرایط

  • OLS:
    یکی از نقاط ضعف OLS نیاز به فرضیات کلاسیک است. این روش فرض می‌کند که باقیمانده‌ها نرمال هستند، واریانس خطاها همسان است و متغیرهای مستقل بدون هم‌خطی هستند. اگر این فرضیات برقرار نباشند، نتایج OLS ممکن است نامعتبر باشد.
  • PLS:
    PLS نیازی به این فرضیات سخت‌گیرانه ندارد. این روش در شرایطی که داده‌ها نرمال نیستند، واریانس خطاها همسان نیست یا هم‌خطی وجود دارد، به خوبی عمل می‌کند. بنابراین، PLS می‌تواند گزینه مناسبی در مواجهه با داده‌های پیچیده‌تر و شرایط نامنظم باشد.

6. تفسیر ضرایب

  • OLS:
    ضرایب در OLS به‌طور مستقیم تأثیر هر متغیر مستقل بر متغیر وابسته را نشان می‌دهند. به عنوان مثال، اگر ضریب یک متغیر مستقل مثبت باشد، به این معنی است که با افزایش آن متغیر، مقدار متغیر وابسته افزایش می‌یابد.
  • PLS:
    در PLS، تفسیر ضرایب کمی پیچیده‌تر است، زیرا این ضرایب مربوط به کامپوننت‌های جدیدی هستند که از ترکیب متغیرهای اصلی به‌دست آمده‌اند. بنابراین، تفسیر دقیق آن‌ها ممکن است به دانش و تخصص بیشتری نیاز داشته باشد.

نتیجه‌گیری:

  • OLS برای شرایطی که فرضیات کلاسیک برقرار باشد و تعداد متغیرهای مستقل کم باشد، بهترین گزینه است.
  • PLS به‌ویژه در مواجهه با مشکلاتی مانند هم‌خطی، داده‌های پیچیده، یا تعداد بالای متغیرهای مستقل کاربردی‌تر است و می‌تواند در شرایط مختلف تحلیل‌های دقیق‌تری ارائه دهد.

 

برای تهیه 😍کتاب تصویری ارزشمند😍 ایویوز کلیک کنید…

 
Dr.Bahar وب‌سایت
من همیشه یک دانشجو خواهم ماند... درجستجوی علم پایانی نیست.

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *