تشریح مفهوم رگرسیون
در صورتی که بین متغیرها رابطه وجود داشته باشد، می توان آن را با الگوهای ریاضی بیان کرد. معمولا چنین الگویی ممکن است از نوع خطی یا غیر خطی باشد. اگر بتوان الگوی همبستگی را به صورت یک معادله خط نوشت، به آن معادله رگرسیون خطی میگویند.
در رگرسیون هدف آن است که با استفاده از معادله رگرسیون و به کمک یک نمونه تصادفی و بعضی روش های آماری، رفتار متغیر وابسته را با آگاهی از مقادیر و مشخصات متغیرهای مستقل، پیش بینی کنیم.
در رگرسیون خطی ساده اگرy را متغیر وابسته و x را متغیر مستقل در نظر بگیریم، میتوان معادله خط رگرسیون را به صورت زیر نوشت:Y = aX + b
در این معادلهa و b را پارامترهای خط گفته و مانند هر پارامتر دیگری می توان آن ها را برآورد کرد.
برآورد کردن پارامترهای خط رگرسیون: روش های متفاوتی برای برآورد کردن دو پارامترa و b وجود دارد. یکی از این روش ها، روش «کمترین مربعات خطا» است که در آن این دو پارامتر به روش زیر برآورد میشود:
مثال: با توجه به داده های جدول زیر، بررسی انجام شده نشان داد بین تعداد سیگار و ساعات خواب افراد سیگاری رابطه وجود دارد. معادله خط رگرسیون را به دست آورید.
x = تعداد سیگار متغیر مستقل و Y = ساعات خواب متغیر وابسته است.
حل: با توجه به داده های فوق پارامترهای خط رگرسیون را برآورد کرده و معادله خط را می نویسیم.
معادله خط رگرسیون به این صورت است: y = -0/8x + 8/6
در رگرسیون هدف آن است که با استفاده از معادله خط رگرسیون رفتار متغیر وابسته را با آگاهی از مقادیر و مشخصات متغیرهای مستقل، پیش بینی کنیم.
مثال: با توجه به نتایج مثال قبل معادله خط رگرسیون را به صورت زیر دست آوردهایم:
در صورتی که فرد سیگاری روزی x=7 سیگار استعمال کند، چه مدت خواب برای او پیش بینی میکنید
y=0/8x+3.8
X=تعداد سیگار متغیر مستقل وY =ساعات خواب متغیر وابسته است
حل: باقرار دادن مقدار x=7 در معادله خط رگرسیون داریم:
2/9 = 3/8 + y = -0/87