رگرسیون و انواع آن
چهارشنبه, ۲ مرداد ۱۳۹۸، ۰۸:۴۶ ق.ظ
رگرسیون خطی یکی از تکنیک های پیچیده آماری برای داده هایی است که معمولاً در سطح سنجش فاصله ای می باشند. رگرسیون خطی به دو صورت رگرسیون خطی ساده و رگرسیون خطی چند متغیره مطرح می گردد. رگرسیون خطی ساده به پیش بینی مقدار یک متغیر وابسته بر اساس مقدار یک متغیر مستقل می پردازد. اما رگرسیون چند متغیره روشی است برای تحلیل مشارکت جمعی و فردی دو یا چند متغیر مستقل (Xi) در تغییرات یک متغیر وابسته (Y).
روش های رگرسیون خطی
برای ورود متغیرهای رگرسیو رگرسیونی به مدل، 5 روش وجود دارد که محقق بسته به هدف تحلیل خود می تواند از یکی از این 5 روش استفاده کند که البته معمولاً نتایج این 5 روش مشابه یکدیگر است. در زیر به تفکیک به شرح ماهیت هر روش پرداخته می شود:
الف: روش همزمان (Enter Method)
در این روش، کلیه متغیرهای مستقل به طور همزمان وارد مدل می شوند تا تأثیر کلیه متغیرهای مهم و غیر مهم بر متغیر وابسته مشخص گردد (منصورفر، 1385: 173).
ب: روش گام به گام (Stepwise Method)
این روش، مانند روش Forward، متغیرها را یک به یک وارد مدل می کند. یعنی ابتدا متغیری که بیش ترین همبستگی را با متغیر وابسته دارد، انتخاب می کند. دومین متغیری که وارد تحلیل می شود، متغیری است که پس از تفکیک متغیر مقدم بر آن، موجب بیش ترین افزایش در مقدار ضریب تعیین (r2) می شود. در این روش، ورود متغیرها به مدل را یک به یک و تا زمانی انجام می دهیم که معنی داری متغیر به 95 درصد برسد، یعنی سطح خطا 5 درصد گردد. سپس، عملیات متوقف می شود (منصورفر، 1385: 173).
ج: روش حذف (Remove Method)
با این روش می توان متغیرهای یک بلوک را از مدل رگرسیونی حذف کرد. بنابراین، این روش را نمی توان به عنوان روش اولین بلوک به کار برد. زیرا می بایست متغیرها در یکی از بلوک های قبلی وارد مدل شوند و سپس در بلوک های بعدی، با انتخاب این روش، آن ها را حذف نمود. روش حذف کاملاً مانند روش Enterاست، اما کاربرد چندانی در رگرسیون چند متغیره ندارد، چون تحلیل واریانس را انجام نمی دهد ( منصورفر، 1385: 174).
د: روش پس رونده (Backward method)
در این روش، همانند روش Enter، ابتدا کلیه متغیرهای مستقل وارد معادله شده و اثر کلیه متغیرها بر روی متغیر وابسته سنجیده می شود.
ه: روش پیش رونده (Forward Method)
این روش، ابتدا همبستگی ساده بین هر یک از متغیرهای مستقل را با متغیر وابسته محاسبه می کند. سپس، متغیر مستقلی که بیش ترین همبستگی را با متغیر وابسته دارد و به عبارتی بیش ترین مقدار واریانس آن را تعیین می کند، وارد تحلیل می کند.
رگرسیون خطی ساده/ دو متغیره (Simple Linear Regression)
رگرسیون خطی ساده زمانی مورد استفاده قرار می گیرد که یک متغیر وابسته و یک متغیر مستقل داریم. از طرفی، مقیاس هر دو متغیر ( هم وابسته و هم مستقل) در سطح سنجش حداقل فاصله ای است. بنابراین، در رگرسیون دو متغیره ساده، مقادیر یک متغیر ( متغیر وابسته با y) از روی مقادیر متغیر دیگر ( متغیر مستقل یا X) به کمک یک معادله خطی (خط مستقیم) برآورد می شود.
آزمون هم خطی
یکی از مفروضات مهم اکثر آزمون ها به خصوص در آزمون های مربوط به فرضیه های علمی این است که نباید بین متغیرها رابطه هم خطی وجود داشته باشد. بدین معنی که هیچ یک از متغیرهای مستقل نباید رابطه خطی با همدیگر داشته باشند. رابطه هم خطی وضعیتی است که نشان می دهد یک متغیر مستقل تابعی خطی از سایر متغیرهای مستقل است. اگر هم خطی در یک معادله رگرسیون بالا باشد، بدین معنی است که بین متغیرهای مستقل همبستگی بالایی وجود دارد، و در چنین حالتی، با وجود بالا بودن R2، مدل اعتبار بالایی ندارد. به عبارت دیگر، با وجود آن که مدل خوب به نظر می رسد، ولی دارای متغیرهای مستقل معنی داری نمی باشد. در شکل شماره (11-1)، X1و X2 متغیرهای مستقل و Y متغیر وابسته است.
ناحیه (1) مقدار واریانسی از متغیرY را نشان می دهد که توسط متغیر X1 توضیح داده شده است. همچنین، ناحیه (2) میزانی از واریانسی متغیر Y را که توسط متغیر X2 تبیین شده، نشان می دهد. در این حالت، دو متغیر X1و X2 رابطه خطی با هم ندارند.
منبع: راهنمای جامع کاربرد SPSS در تحقیقات پیمایشی. کرم حبیب پور و رضا صفری
۹۸/۰۵/۰۲