سلام دوستان.از امروز هر هفته یکی از مفاهیم آماری رو بطور تقریبا کامل براتون میزارم.
امروز توضیح رگرسیون رو میذارم.برای شروع.دوستان اگر مطلب خاصی مورد نظرشونه در نظرات اعلام کنند تا در صورت امکان روی وبلاگ قرار بگیره
رگرسیون خطی یا تنازل خطی (به انگلیسی: Linear regression) یکی از روشهایتحلیل رگرسیون است. در رگرسیون خطی، متغیر وابسته yi ترکیب خطیای خطی از ضرایب (پارامترها) است (لازم نیست که نسبت به متغیرهای مستقل خطی باشد). مثلاً تحلیل رگرسیونی سادهٔ زیر با N نقطه، متغیر مستقل xi و ضرایب β0 و β1 خطی است:
- خط راست:
در رگرسیون چندگانه، بیش از یک متغیر مستقل وجود دارد:
- سهمی:
این همچنان رگرسیون خطی است، زیرا yi همچنان ترکیب خطی پارامترها (β0 و β1) است، هرچند که نسبت به متغیر وابسته (xi) خطی نیست.
در هر دو حالت، εi مقدار خطاست و پانویس i شمارهٔ هر مشاهده (هر جفت xi و yi) را نشان میدهد. با داشتن مجموعهای از این نقطهها میتوان مدل را به دست آورد:
عبارت ei مانده نام دارد: . روش رایج برای بهدستآوردن پارامترها، روش کمترین مربعات است. در این روش پارامترها را با کمینهکردن تابع زیر به دست میآورند:
در مورد رگرسیون ساده، پارامترها با این روش برابر خواهند بود با:
که در آن و
میانگین x و y هستند.