آموزش تخصصی آمار و معادلات ساختاری

SPSS- AMOS- LISREL- Smart PLS- Warp PLS- R

آموزش تخصصی آمار و معادلات ساختاری

SPSS- AMOS- LISREL- Smart PLS- Warp PLS- R

آموزش تخصصی آمار و معادلات ساختاری

تحلیل آماری یک ابزار بسیار مفید برای دستیابی به راهکارهای مناسب در زمانی که فرآیندهای واقعی تحلیل به شدت پیچیده یا در شکل واقعی آن ناشناخته است. می‌باشد. تحلیل آماری، فرآیند جمع آوری، بررسی، خلاصه سازی و تفسیر اطلاعات کمّی را برای ارائه ی دلایل زیربنایی، الگوها، روابط، و فرآیندها پوشش می دهد.

*********
اینجانب سیدسعید انصاری فر دارای لیسانس و فوق لیسانس مهندسی صنایع، فوق لیسانس مدیریت دولتی گرایش MIS و دانشجو دکترا مدیریت دولتی گرایش تصمیم‌گیری و خط مشی‌گذاری عمومی می‌باشم. برخی از سوابق علمی پژوهشی به شرح زیر است:

1- دارای بیش از 40 مقاله در موضوعات مختلف (کنفرانس های بین المللی و مجلات علمی پژوهشی و ژورنال ISC)
2- مولف سه کتاب (مبانی سازمان و مدیریت، آموزش مدل سازی معادلات ساختاری و SPSS، نگهداری کارکنان، چالش ها و نظریه ها)
3- مشاوره آماری و انجام تجزیه و تحلیل آماری در بیش از 700 پایان نامه ارشد و 50 پایان نامه دکترا
4- رتبه 7 کنکور دکترا
5- تدریس خصوصی آمار توصیفی و استنباطی و نرم افزارهای SPSS، AMOS، Smart PLS، LISREL
6- کسب رتبه پژوهشگر برتر و برگزیده در جشنواره علمی پژوهشی شهرداری اصفهان

*********
تماس با ما:
ایمیل: ansarifar2020@gmail.com
شماره همراه: 09131025408
شبکه اجتماعی ایتا: 09131025408

*********
گروه علمی آموزشی پژوهشگران برتر:
این گروه با بهره مندی از کادری مجرب آمادگی تجزیه و تحلیل کیفی و داده های کمی آماری در موضوعات مختلف با استفاده از نرم افزارهای مختلفی چون SPSS ، Smart PLS، LISREL،R ، AMOS، Nvivo، Max QDA را دارد.

همکاران:
1-مجید دادخواه
دکتری مدیریت از دانشگاه آزاد اصفهان
2- مرسا آذر:
دکتری مدیریت از دانشگاه آزاد اصفهان
3- زهرا وحیدی:
دکتری مدیریت آموزشی، مدرس تحلیل کیفی
4-محمد مهدی مقامی:
دکتری آمار از دانشگاه اصفهان
5- طناز فریدنی:
کارشناسی ارشد آمار و ریاضی از دانشگاه اصفهان
6- زینب احمدی:
کارشناسی ارشد روان شناسی از دانشگاه اصفهان


***********
از دلایلی که پژوهشگران انجام تحلیل آماری را به ما می سپارند:
- تیم حرفه ای و با تجربه
- متخصص در زمینه انواع نرم افزارهای تحلیل آماری با بیش از 10 سال تجربه
- پشتیبانی و آموزش حضوری به صورت رایگان

نرم افزار SPSS یک نرم افزار بسیار قدرتمند در زمینه  آمار می باشد. شما به راحتی می توانید انواع آمار توصیفی و استنباطی را به وسیله این نرم افزار به انجام برسانید. این نرم افزار برای افرادی که در حال انجام پایان نامه کارشناسی ارشد و دکترا هستند علی الخصوص در رشته های علوم انسانی، مدیریت دولتی، مدیریت آموزشی، مدیریت فرهنگی، برنامه ریزی درسی، علوم تربیتی، روان شناسی و پزشکی بسیار مفید و حتی ضروری است.

قابلیت‌های نرم افزار SPSS  به ‌شرح زیر است:

  • تهیه خلاصه‌های آماری مانند گراف‌ها، جداول‌، آماره‌ها و …

  • انواع توابع ریاضی مانند قدر مطلق، تابع علامت، لگاریتم، توابع مثلثاتی و …

  • تهیه انواع جداول سفارشی مانند جداول فراوانی، فراوانی تجمعی، درصد فراوانی و …

  • انواع توزیع‌های آماری شامل توزیع‌های گسسته و پیوسته

  • تهیه انواع طرح‌های آماری

  • انجام آنالیز واریانس یکطرفه، دوطرفه، چندطرفه و آنالیز کوواریانس

  • تکنیک‌های تجزیه و تحلیل سری‌های زمانی

  • ایجاد داده‌های تصادفی و پیوسته

  • محاسبه انواع آماره‌های توصیفی

  • انواع آزمون‌های مرتبط با مقایسه میانگین بین دو یا چند جامعه مستقل و وابسته

  • قابلیت مبادله اطلاعات با نرم‌افزارهای دیگر

  • برازش انواع مختلف رگرسیون

  • و ……

۰ نظر موافقین ۰ مخالفین ۰ ۱۱ مهر ۹۹ ، ۰۰:۴۵
سید سعید انصاری فر

جدول زیر تعدادی از تفاوت های عمده میان پژوهش های کیفی و کمی را نشان می دهد:

                                           تحقیقات کمی در برابر کیفی : تفاوتشان در چیست؟ - وبلاگ بپرسیم

انتخاب رویکردها و استراتژی های تحقیق در بازرگانی

 

۰ نظر موافقین ۰ مخالفین ۰ ۱۱ مهر ۹۹ ، ۰۰:۳۱
سید سعید انصاری فر

 

اولا، انتخاب روش آماری برای هر فرضیه مطرح شده باید بصورت منطقی صورت گیرد، در غیر این صورت تفسیر معناداری نمی تواند از نتایج به دست آمده صورت گیرد.

مثلا، اگر پژوهشگری قصد بررسی تفاوت میانگین های نمرات دو گروه را داشته باشد و روش آماری همبستگی میان متغیرها را برگزیند، تفسیر او از نتایج اساساً بی معنا خواهد بود.

بطور عمده بر اساسی دو اصل کلی انتخاب می شود:

مقیاس اندازه گیری به کاربرده شده در سنجش متغیرها. در نتیجه، پژوهنده پیش از آن که تصمیم بگیرد داده های خود را تحلیل کند باید بتواند معین کند که فرضیه یا فرضیه های مورد نظر، هریک چه ماهیتی دارد؟

این داده ها از چه نوع است؟

وی باید آگاه باشد که سازمان دادن، خلاصه کردن و نمایش داده ها، بستگی به سطح و مقیاس اندازه گیری متغیر (اسمی، رتبه ای، فاصلهای و نسبی) دارد.

روش های تجزیه و تحلیل داده های آماری - نرم افزار داشبورد مدیریتی RAMIX (  مبتنی بر وب )

۰ نظر موافقین ۰ مخالفین ۰ ۱۱ مهر ۹۹ ، ۰۰:۲۵
سید سعید انصاری فر

هدف پژوهش های کیفی درک پدیده ها در بستر نهادی و اجتماعی خاص آنها است.

هدفی که با رویکردهای کمی چندان قابل وصول نیست.

به اعتقاد پژوهشگران کیفی، واژه «آزمودنیها» باید به «مشارکت کنندگان» تبدیل شوند و افراد نه برای تأیید دانش قیاسی خود بلکه برای مطالعه و فهم نقش آنها در بستر خاص خود فهم کرد .

در پژوهش های از نوع کیفی، در صورت استفاده از روش مصاحبه، تعیین نوع سؤال های مصاحبه با توجه به متغیرهای پژوهش، آن هم قبل از انجام مصاحبه و توجه به شیوه های کدگذاری (اعم از کد گذاری از نوع باز یا واقعی، کدگذاری محوری، نظری و کد گذاری انتخابی) بنا به اقتضاء، ضرورت دارد.

در صورت امکان ضبط مصاحبه ها میتواند در فرصت مناسب امکان تحلیل آن را برای پژوهشگر فراهم نماید .

تنظیم و تحلیل داده های کیفی مستلزم سه فعالیت است:

الف) تلخیص داده ها

ب) عرضه داده ها

ج) نتیجه گیری و تأیید

طی دهه های اخیر توجه به رویکردهای مختلف از جمله پژوهش کیفی به طور فزاینده ای مورد استفاده قرار می گیرد.

اصولأ، لزوم توجه به این گونه تحقیقات را که مطالعه انسانی در متن جامعه و نگاه همزمان به انسان، محیط و همه متغیرهای تأثیرگذار ہر آن را مورد تأکید قرار می دهد، خاطر نشان ساخته است.

پژوهش کیفی در جست و جوی پدیده ها یا حوزه های پیچیده است که رویکرد مطالعه به شیوه کمی چندان مؤثر نیست.

روش تحقیق کیفی - پارس مدیر

۰ نظر موافقین ۰ مخالفین ۰ ۱۱ مهر ۹۹ ، ۰۰:۲۱
سید سعید انصاری فر

آزمون تی ، یک آزمون استنباطی برای تحلیل داده های پارامتری است. هدف از آزمون تی t برای بررسی تفاوت بین میانگین های دو گروه مستقل است که پژوهشگر را در زمینه تصمیم گیری یاری کند.

پژوهشگر باید تصمیم بگیرد که تفاوت مشاهده شده بین دو میانگین نمونه (به عنوان مثال گروه های آزمایش و گواه) در اثر عوامل شانس به وجود آمده یا تفاوت مشاهده شده بیانگر تفاوت واقعی بین دو جامعه است.

به بیانی، این آزمون برای ارزیابی یکسان بودن و نبودن میانگین نمونه ای با میانگین جامعه در حالتی به کار مرود که انحراف معیار جامعه مجهول باشد، چون توزیع t در مورد نمونه های کوچک با استفاده از درجات آزادی تعدیل می شود، می توان از این آزمون برای نمونه های بسیار کوچک استفاده نمود.

هم چنین این آزمون مواقعی که خطای استاندارد جامعه نامعلوم و خطای استاندارد نمونه معلوم باشد، کاربرد دارد برای به کاربردن این آزمون، متغیر مورد مطالعه باید در مقیاس فاصله ای باشد، شکل توزیع آن نرمال باشد.

به عنوان مثال، پژوهشگری نمونه های مورد نیاز را به طور تصادفی از بین دانش آموزان همتا انتخاب کرده است و درصدد است تأثیر یک روش خاص تدریس را بر پیشرفت یا عملکرد تحصیلی آن ها، ارزیابی کند.

روش تدریس مورد نظر در چندین جلسه در باره گروه آزمایش اجرا می شود، در حالی که گروه گواه بر کنار از این تأثیر می باشد.

در این شرایط، معنادار بودن تفاوت بین دو میانگین از نظر پیشرفت تحصیلی را می توان به وسیله آزمون تی t برای میانگین های مستقل تعیین کرد.

به کارگیری آزمون تی t در پژوهش های علی - مقایسه ای وابسته به سه پیش فرض می باشد:

۱. نمره ها براساس مقیاس فاصله ای یا نسبی باشد؛

۲. توزیع نمره ها در جامعه پژوهش دارای توزیع نرمال باشد (توزیع طبیعی باشد):

۳. واریانس نمره ها در دو جامعه پژوهش برابر باشد (میانگین توزیع برابر صفر است).

روش های آزمون تی t مختلف است که شامل تی با یک مقدار معین (تی صفر)، تی مستقل و تی وابسته می شود.

 

الف) تی با مقدار معین

این آزمون بررسی میکند که آیا میانگین مشاهده شده در مقایسه با یک مقدار معین (معمولاً حد متوسط که توسط پژوهشگر قابل تعیین و تغییر است) متفاوت است یا خیر؟

در این آزمون مقایسه یک عدد فرضی (میانگین نظری) با میانگین جامعه نمونه مورد نظر است.

به عبارتی، زمانی که پژوهشگر علاقه مند است که ببیند آیا میانگین یک نمونه با میانگین یک جامعه مشخص شده تفاوت معنادار دارد یا خیر از آزمون تی t برای با مقدار معین استفاده می کند و هم چنین زمانی که مقدار خطای معیار میانگین نامعلوم است و مقدار آن از طریق داده های به دست آمده گروه نمونه برآورد می شود، می توان از این آزمون استفاده کرد.

آزمون تی t، وسیله ای است برای اندازه گیری تفاوت بین میانگین نمونه و میانگین جامعه برحسب واحد خطای معیار که این واحد از طریق داده های به دست آمده از گروه نمونه برآورد می شود.

شرط استفاده از توزیع نمونه گیری با جهت آزمون فرضیه ها چند شرط دارد:

۱. نمره ها به صورت نمونه گیری تصادفی از جامعه مورد نظر انتخاب شده باشد:

۲. شکل توزیع پراکندگی نمره ها در جامعه نرمالی باشد (از نظر شکلی متقارن باشند). فرض کنید که پژوهشگری یک نمونه از دانش آموزان کلاسی را که داری ویژگیهای مشترکی هستند مطالعه می کند.

این تحقیق، یک آزمون هوشی (مانند آزمون وکسلر) را برای آنها اجرا کند و میانگین بهره هوشی کلاس برابر ۱۰۹ به دست می آید.

این پژوهشگر به عنوان بخشی از تحلیل یافته ها علاقه مند است بداند که آیا بین این میانگین (۱۰۹) و میانگین جامعه تفاوت معناداری وجود دارد یا خیر.

اگر فرض شود که میانگین جامعه برابر ۱۰۰ است، می توان از آزمون تی t برای یک میانگین استفاده نمود و تفاوت بین ۱۰۰ (میانگین جامعه) و ۱۰۹ (میانگین نمونه) را از نظر معنادار بودن آماری مشخص نمود.

 

ب) تی با نمونه مستقل

ان دسته از طرح هایی که در ان دو متغیر و یا نمونه مستقل در دو موقعیت مورد ازمون ومقایسه قرار می گیرد.

مانند بررسی تاثیر دو روش تدریس (فعال و غیر فعال) در پیشرفت تحصیلی دانش آموزان، در این مثال میانگین ها و نمونه ها مستقل از هم فرض می شود.

 

ج) تی زوجی یا وابسته

آن دسته از طرح هایی که در آن یک متغیر مستقل در دو موقعیت مورد آزمون قرار گیرد و در این دو موقعیت، آزمودنیهای یکسان یا همتا شرکت داشته باشند، از از مونتی زوجی یا وابسته استفاده میشود.

این ازمون «مقایسه زوج ها» هم نامیده می شود.

برای مثال، جهت بررسی تاثیر روش تدریس بر یادگیری ازمودنیها و برای تعیین معنادار بودن تفاوت بین نمره ها در قبل و بعد اجرای روش تدریس، از از مونتی برای مقایسه دو میانگین همبسته (زوج ) استفاده می شود و طرحی که برای ارزشیابی استفاده می شود پیش ازمون و پس ازمون است.

یا اینکه پژوهشگری قصد دارد وضعیت موجود و مطلوب جو یک سازمان را مورد بررسی قرار دهد و دریابد که ایا بین این دو وضعیت با توجه به نظر و ارزش گذاری مدیران، تفاوت وجود دارد یا نه؟

به این منظور، وی تعدادی از مدیران را به طور تصادفی انتخاب و نظر آنان را درباره ارزش گذاری وضعیت جو سازمان، جویا می شود.

یعنی هر مدیر، هم زمان درباره جو موجود و نیز مطلوب سازمان اظهار نظر می کند.

سپس این تفاوت تحلیل آماری می شود. مزیت این آزمون در آن است که در مقایسه با آزمون تی t برای میانگین های مستقل، در این آزمون خطای معیار کمتری وجود دارد.

در نتیجه احتمال بیشتری وجود دارد که پژوهشگر بتواند تفاوت معناداری را بین میانگین ها به دست آورد.

۰ نظر موافقین ۰ مخالفین ۰ ۱۱ مهر ۹۹ ، ۰۰:۱۹
سید سعید انصاری فر

توزیع t نیز مانند توزیع نرمال قرینه است ولی دارای پراکندگی بیشتری نسبت به توزیع نرمال است. و برای مقادیر مختلف حجم نمونه (n) میزان پراکندگی توزیع t تغیر می کند و با افزایش حجم نمونه این پراکندگی کمتر شده و برای  توزیع t یا t- استودنت چیست؟  توزیع t با توزیع Z برابر می شود.
بنابراین شکل این توزیع به حجم نمونه بستگی دارد که انرا با r نشان داده و درجه آزادی می نامیم.

توزیع t یا t- استودنت چیست؟

در شکل زیر سطح زیر منحنی در دنباله راست توزیع t، با توجه به پارامتر درجه آزادی ثبت شده است.

توزیع t یا t- استودنت چیست؟

برای استفاده از جدول t فوق احتیاج به دو عدد

  • سطح منحنی در دنباله سمت راست توزیع
  • درجه آزادی توزیع t داریم

ما حرف ta,r را به مفهوم مقدار t با سطح زیر منحنی a و درجه آزادی r به کار می بریم.
مثال: اگر a=0.025 و r=15 باشد مقدار t را به دست آورید.

t0.025,15=2.131

برای پیدا کردن عدد 2.131 در جدول t کافی است که از سطر اول جدول، عدد 0.025 و از ستون اول جدول درجه آزادی 15 را پیدا کنیم محل برخورد سطر و ستون عدد 2.131 را ارائه می کند.

نکته:
اگر جامعه مورد بررسی نرمال و انحراف معیار جامعه معلوم نباشد و نمونه تصادفی به حجم n از جامعه اختیار کنیم ان گاه آماره

توزیع t یا t- استودنت چیست؟

که در آن توزیع t یا t- استودنت چیست؟   و توزیع t یا t- استودنت چیست؟   است دارای توزیع t با n-1 درجه آزادی است.
سوال: چرا درجه آزادی برابر n-1 است؟
در توجیه درجه آزادی به مثال زیر توجه کنید اگر n=5 و توزیع t یا t- استودنت چیست؟  = 8 باشد بنابراین جمع این 5 مشاهده باید برابر 40 باشد. فرض کنید بخواهیم این مجموعه اعداد را مشخص کنیم. برای این کار می توانیم هر چهار عددی که دوست داریم به صورت آزادانه انتخاب کنیم ولی هیچگونه آزادی در انتخاب عدد پنجم نداریم زیرا عدد پنجم را باید بگونه ای انتخاب کرد که جمع 5 عدد برابر 40 شود. بنابراین درجه آزادی ما برابر 4 است.

۱ نظر موافقین ۰ مخالفین ۰ ۱۰ مهر ۹۹ ، ۲۰:۰۸
سید سعید انصاری فر

تدریس اینترنتی درس آمار استنباطی

روش های نمونه گیری:

نمونه گیری تصادفی ساده

نمونه گیری منظم یا سیستماتیک

نمونه گیری طبقه ای

نمونه گیری خوشه ای

خطای نمونه گیری

خطای استاندارد میانگین

خطای استاندارد میانه

خطای استاندارد نسبت

خطای استاندارد انحراف استاندارد

خطای استاندارد فراوانی

 

آزمون فرضیه:

فرض صفر

فرض خلاف

خطای نوع اول

خطای نوع دوم

توان آزمون

سطح اطمینان

آزمون های یک دامنه و دو دامنه

تفسیر تایید یا ردفرض صفر

 

آزمون های t:

توزیع t استودنت

درجات آزادی

ویژگی های توزیع t استودنت

استفاده از توزیع t در آزمون فرضیه

آزمون فرضیه درباره میانگین جامعه (آزمون یک گروهی)

توزیع t برای معنادار بودن اختلاف بین میانگین ها

توزیع تفاوت بین دو میانگین

خطای استاندارد تفاوت بین دو میانگین

توزیع t برای تفاوت بین میانگین های دو نمونه

توزیع t برای گروه های همبسته

مقایسه توان آزمون ها

 

آزمون های معنادار بودن: نسبت، واریانس و همبستگی:

آزمون نسبت

آزمون معنادار بودن مقایسه یک نسبت با یک نسبت ثابت

آزمون معنادار بودن تفاوت بین دو نسبت مستقل

آزمون معنادار بودن تفاوت بین دو نسبت همبسته

آزمون واریانس

مقایسه واریانس های مستقل

آزمون معنادار بودن همبستگی

آزمون معنادار بودن ضریب همبستگی

آزمون معنادار بودن تفاوت دو ضریب همبستگی در نمونه های مستقل

آزمون معنادار بودن تفاوت بین دو ضریب

همبستگی در نمونه های همبسته

 

تجزیه و تحلیل واریانس یک طرفه:

برآورد واریانس جامعه

نسبت F

مقایسه میانگین ها پس از آزمون F

مفروضه های تجزیه و تحلیل واریانس

 

طرح های بلوکی تصادفی:

آزمون معنادار بودن در طرح بلوکی تصادفی شده

دسته بندی کردن آزمودنی ها در بلوک ها

 

تحلیل واریانس اندازه گیری مکرر:

مجموع مجذورات و درجات ازادی

 

آزمون های تعقیبی:

دامنه استودنت شده

آزمون چنددامنه ای دانکن

آزمون نیومن کلز

آزمون توکی

آزمون شفه

 

طرح عاملی:

طرح عاملی واکنش متقابل

اثرات اصلی و کنش متقابل

درجات ازادی، میانگین مجذورات و آزمون F

 

آزمون خی دو:

نیکویی برازش خی دو

درجات ازادی

تصحیح خی دو

درجات ازادی برای جداول توافقی

ضریب فی

ضریب توافقی

۰ نظر موافقین ۰ مخالفین ۰ ۰۷ مهر ۹۹ ، ۲۲:۱۵
سید سعید انصاری فر

ابتدا و پیش از هر چیزی اجازه دهید به این پرسش پاسخ دهیم که انحراف معیار چیست؟ انحراف معیار (Standard deviation) از دو واژه تشکیل یافته است. جزء اول یعنی انحراف به میزان دوری هر عضو یک مجموعه داده از مقدار میانگین گفته می‌شود. واژه معیار نیز به معنی استاندارد بودن این مقدار است. هر چه انحراف معیار مجموعه‌ای از داده‌ها عدد پایین‌تری باشد، نشانه آن است که داده‌ها به میانگین نزدیک هستند و پراکندگی اندکی دارند. در صورتی که انحراف معیار عدد بزرگی باشد، نشان می‌دهد که پراکندگی داده‌ها زیاد است. پس انحراف معیار، عددی برای نشان دادن میزان پراکندگی اعضای یک مجموعه از داده‌ها است.

انحراف معیار به چه دردی می‌خورد؟

انحراف معیار مفهومی است که میزان پراکندگی داده‌های یک مجموعه را مشخص می‌کند و بدین جهت یکی از مهم‌ترین مقیاس‌های آماری در زمینه آمار توصیفی به حساب می‌آید. اگر میانگین برآوردی از نقطه ثقل توزیع داده‌های یک مجموعه به دست می‌دهد، و از این رو مقیاسی تک‌بعدی برای برآورد یک مجموعه داده‌ها فراهم می‌سازد، می‌توان گفت که انحراف معیار نیز میزان پراکندگی داده‌ها از نقطه میانگین را نشان می‌دهد و از این رو مقیاسی دوبعدی برای برآورد توزیع داده‌ها در اختیار ما قرار می‌دهد.

مثال

برای مثال اگر یک معلم هستید، احتمالاً برایتان مهم است که بدانید دانش‌آموزان شما در امتحانی که اخیراً گرفته‌اید چه عملکردی داشته‌اند. اگر ۲۰ یا ۳۰ دانش‌آموز داشته باشید با نگاه کردن به تک‌تک نمرات شاید نتوانید برآورد صحیحی از عملکرد کل کلاس به دست آورید، ولی مسلماً در صورتی که میانگین نمره‌های همه دانش‌آموزان را محاسبه کنید، می‌توانید بدانید که وضعیت کل کلاس چگونه بوده است. برای مثال اگر میانگین نمره‌های کلاس برابر با ۱۲٫۵ باشد و میانگین محاسبه شده برای امتحان قبلی ۱۴ بوده باشد، نشان دهنده افت نمرات است و نیاز به چاره‌جویی وجود دارد.

شما به عنوان یک معلم باید با کدام دانش‌آموزان بیشتر کار کنید؟ مسلماً برای دانش‌آموزانی که عملکرد بهتری دارند نیاز چندانی به تلاش بیشتر وجود ندارد، اما به دانش‌آموزانی که عملکرد ضعیف‌تری دارند می‌بایست توجه ویژه‌ای صورت بگیرد. اما چگونه می‌توان فهمید که کدام دانش‌آموزان عملکرد بالاتر دارند، متوسط هستند یا عملکرد ضعیف‌تری دارند؟ پاسخ به این سؤال از طریق محاسبه انحراف معیار است. انحراف معیار مقیاسی به دست می‌دهد که با استفاده از آن می‌توانیم بدانیم میانگین اختلاف عملکرد دانش‌آموزان از نقطه میانگین کلاسی چقدر است.

برای مثال فرض کنید در کلاس شما انحراف معیار برابر با ۲٫۵ باشد. اگر توزیع نمرات دانش‌آموزان به صورت یک توزیع نرمال باشد (که در اغلب موارد در مورد چنین اندازه‌گیری‌هایی از توزیع نرمال پیروی می‌کند)، این عدد نشان می‌دهد که نمرات بیش از دو سوم یا ۶۸٫۲% از دانش‌آموزان شما در محدوده ۲٫۵ + ۱۲٫۵ قرار دارد. این عدد طبق تعریف انحراف معیار به دست می‌آید. یک سوم دیگر از دانش‌آموزان یا نمراتی بالاتر از ۱۵ کسب کرده‌اند که طبعاً نیاز چندانی به تلاش بیشتر شما ندارند و یا نمراتی زیر ۱۰ کسب کرده‌اند که مسلماً نیازمند توجه ویژه هستند. بدین ترتیب با محاسبه انحراف معیار نمره‌های کلاسی می‌توانید دانش‌آموزان را به سه دسته ضعیف (کمتر از ۱۰)، متوسط (۱۰ تا ۱۵) و قوی (بالاتر از ۱۵) تقسیم‌بندی کنید.

فرض کنید در مثال فوق تعداد دانش‌آموزانی که نمرات زیر ۱۰ کسب کرده بودند یعنی مردود بودند برابر با ۵ بوده است. همچنین فرض می‌کنیم معلم با این دسته از دانش‌آموزان تمرین می‌کند ولی در امتحان بعدی میانگین نمرات کلاس هنوز همان ۱۲٫۵ است. شاید در نگاه اول به نظر برسد، تلاش‌های وی بی‌نتیجه بوده است؛ اما با محاسبه انحراف معیار می‌بینیم که این عدد به ۱ کاهش یافته است، یعنی نمرات بیش از دوسوم کلاس در محدوده ۱ + ۱۲٫۵ قرار دارد. این به آن معنی است که به احتمال بسیار زیاد تعداد دانش‌آموزانی که نمره زیر ۱۰ کسب کرده‌اند، کاهش یافته است.

در تصویر فوق به خوبی اهمیت مفهوم انحراف معیار در برآورد توزیع داده‌ها را می‌بینید. هر دو مجموعه داده‌های آبی و قرمز رنگ میانگینی برابر با ۱۰۰ دارند ولی انحراف معیار مجموعه داده‌های آبی ۵ برابر داده‌های قرمز است. علامتی که برای نشان دادن انحراف معیار استفاده می‌شود، حرف یونانی سیگما ” σ ” است. روشی که عموماً برای محاسبه انحراف معیار استفاده می‌شود از طریق جذر گرفتن از واریانس است. خب اکنون شاید بپرسید واریانس چیست؟

واریانس چیست؟

واریانس به صورت «مقدار متوسط مربع اختلاف مقادیر از میانگین» تعریف شده است. شاید در نگاه نخست تعریف دشواری به نظر برسد! اما هیچ جای نگرانی نیست چون در عمل خواهید دید که مفهوم بسیار ساده‌ای است.

برای محاسبه واریانس، باید گام‌های زیر را دنبال کنید:

  • ابتدا میانگین را پیدا کنید (میانگین ساده اعداد).
    سپس برای هر عدد، مقدار میانگین را از آن تفریق کرده و سپس نتیجه را به توان دو برسانید (مربع اختلاف).
    و در نهایت میانگین مربع اختلافات به دست آمده را محاسبه کنید.

واریانس داده‌ها آماده است. به همین سادگی!

مثال

فرض کنید متصدی یک محل نگهداری از سگ‌ها می‌خواهد قد سگ‌های موجود را به منظور خاصی اندازه‌گیری کند. نتایج این اندازه‌گیری قد (از شانه) به شرح زیر است:

۳۰۰، ۴۳۰، ۱۷۰، ۴۷۰ و ۶۰۰ میلی‌متر

اینک می‌خواهیم میانگین، واریانس و انحراف معیار این داده‌ها را پیدا کنیم. گام اول یافتن میانگین است:

پس میانگین قد همه سگ‌ها برابر با ۳۹۴ میلی‌متر است. اکنون خط میانگین را روی شکل رسم می‌کنیم:

اکنون اختلاف قد هر کدام از سگ‌ها را از مقدار میانگین حساب می‌کنیم:

برای محاسبه واریانس، اختلاف تک‌تک داده‌ها را به توان دو رسانده و سپس میانگین می‌گیریم:

پس، واریانس برابر است با: ۲۱۷۰۴

و انحراف معیار همان جذر واریانس است، پس:

و اما نکته خوب در مورد انحراف معیار، سودمند بودن آن است. اکنون می‌توانیم بفهمیم قد کدام سگ‌ها در محدوده یک انحراف معیار میانگین (۱۴۷ میلی‌متر) قرار دارد.

پس با استفاده از انحراف معیار، ما یک راه “استاندارد” برای یافتن محدوده مقادیر نرمال، مقادیر بیش از نرمال و مقادیر کمتر از نرمال در دست داریم.

اما زمانی که به همه اعضای یک مجموعه دسترسی نداشته باشیم از نمونه‌گیری استفاده می‌کنیم. نمونه‌گیری به معنی انتخاب تصادفی برخی از اعضای یک مجموعه بزرگ (جامعه آماری نامیده می‌شود) است که در محاسبه‌های آماری به عنوان مثالی گویا از کل نمونه در نظر گرفته می‌شود و در این حالت برای محاسبه انحراف معیار و واریانس تفاوتی اندک وجود دارد. برای نمونه در مثال سگ‌ها مجموعه داده‌های ما مربوط به یک جمعیت بود (۵ سگ تنها سگ‌های مورد بررسی بودند). اما اگر داده‌های ما یک نمونه یعنی یک جمعیت کوچک در نظر گرفته شده از یک جمعیت بزرگ‌تر، برای مثال ۵ سگ که از میان ۵۰ سگ به صورت تصادفی انتخاب شده‌اند باشد، در این صورت محاسبات تغییر می‌یابند.

وقتی N داده وجود داشته باشند، هنگام محاسبه واریانس مجموع مربعات اختلاف از میانگین‌ها بر N تقسیم می‌شوند. اما هنگامی که قرار باشد این محاسبات بر روی نمونه‌ای از یک جامعه آماری انجام یابد مجموع مربعات اختلاف از میانگین‌ها بر N-1 تقسیم می‌شود. در این حالت باقی محاسبات از جمله روش محاسبه میانگین به همان شکل می‌ماند.

مثال: اگر ۵ سگ موجود فقط نمونه‌ای از جمعیت بزرگ‌تر سگ‌ها باشد، مقدار را به جای ۵، باید بر ۴ تقسیم کنیم:

واریانس نمونه: ۱۰۸۵۲۰/۴ = ۲۷۱۳۰

انحراف معیار نمونه = ۲۷۱۳۰√ = ۱۶۴ (نزدیک‌ترین داده)

دلیل این منهای یک کردن، خارج از حوصله این نوشته است و برای اطلاعات بیشتر می‌توانید به لینک‌های انتهای نوشته مراجعه کنید.

فرمول‌ها:

در ادامه فرمول‌های ریاضی حالت کلی محاسبه انحراف معیار برای هر دو حالت جمعیت و نمونه آماری ارائه شده است:

گرچه پیچیده به نظر می‌آید، اما ما قبلاً آن را به طرز بسیار ساده‌ای محاسبه کرده‌ایم. تنها تفاوت مهم، تقسیم‌بر N-1 (بجای N) هنگام محاسبه واریانس نمونه است.

چرا اختلاف از میانگین‌ها را به توان دو می‌رسانیم؟

اگر ما تنها اختلاف‌ها را میانگین‌گیری می‌کردیم… اعداد منفی، اعداد مثبت را خنثی می‌کردند:


پس این راه‌حل درست نیست. اما آیا از قدر مطلق مقادیر می‌توانیم استفاده کنیم؟

همان‌طور که می‌بینید به نظر می‌رسد انحراف میانگین به طور صحیحی محاسبه شده است؛ اما در مورد حالت زیر چه می‌توان گفت؟

می‌بینید که مقدار انحراف معیار همچنان ۴ محاسبه شده است، در حالی که اختلاف میانگین‌ها بسیار پراکنده‌تر است.

در نهایت می‌بینیم که مربع کردن هر اختلاف و محاسبه جذر در آخر روش بهتری محسوب می‌شود.

 

منبع : کانون علمی نخبگان شریف

۶ نظر موافقین ۰ مخالفین ۰ ۰۶ مهر ۹۹ ، ۱۹:۰۳
سید سعید انصاری فر

در تحقیقاتی که هدف، آزمودن مدل خاصی از رابطه بین  متغیرها است، از تحلیل مدل معادلات ساختاری یا مدل های علّی استفاده می‌شود.

در این مدل داده ها به صورت ماتریس های کواریانس یا همبستگی درآمده و یک مجموعه معادلات رگرسیون بین متغیرها تدوین می‌شود. چنانچه در مدل برای هر متغیر از بیش از یک نشانگر استفاده شود، مدل شامل مولفه اندازه گیری نیز می‌شود.

تحلیل مدل معادلات ساختاری برآوردهایی از پارامترهای مدل (ضرایب مسیر و جملات خطا) و چند شاخص نیکویی برازش فراهم می آورد.

امکان تحلیل مدل های علّی پس از نگارش نرم افزارهایی از جمله لیزرل، آموس و smart PLS صورت گرفته است. این نرم افزارها به تدریج کامل تر و پیچیده تر شده اند.

مثالی از نمودار مسیر مدل ساختاری

به طور کلی مدل های ساختاری به منظور بررسی اثرهای مستقیم و غیر مستقیم متغیرها در جهت شناخت روابط علی محتمل مورد استفاده قرار می گیرد. تصویر زیر یک نمونه نمودار تحلیل مسیر مدل ساختاری برآورد شده را نشان می دهد:

نمودار مسیر

نمودار مسیر مدل ساختاری

 

منبع: داده پردازی آماری اطمینان شرق

۰ نظر موافقین ۰ مخالفین ۰ ۰۴ مهر ۹۹ ، ۱۱:۳۸
سید سعید انصاری فر

نوشتن صحیح و اصولی فرضیات یا سوالات تحقیق یکی از گامهای اساسی و مهم در پیشبرد کار پایان نامه یا تحقیق شماست. تدوین اصولی فرضیه، تشخیص و تفکیک درست فرضیه تحقیق از فرضیه آماری یا فرض صفر مهیا کننده اقدام بعدی در جهت آزمون فرضیه آماری (آزمون فرض آماری) با استفاده از نرم افزار spss و توسط روشها و آزمونهای آماری می باشد.

طراحی پرسشنامه نیز می بایست بر اساس فرضیات تحقیق انجام شود و بگونه ای این کار صورت پذیرد که متغیرهای مذکور در فرضیه توسط ابزار پرسشنامه به درستی اندازه گیری شوند.

چه خوب است که در همان ابتدای کار تدوین فرضیه و طراحی پرسشنامه ، به نتیجه نهایی یعنی آزمون فرضیات آماری نیز نگاهی داشته باشید تا از دوباره کاری ها پرهیز شده و در  وقت و انرژی شما صرفه جویی گردد. حالتی را تصور نمایید که فرضیه به درستی تدوین نشده است، یا سوالات پرسشنامه به اندازه گیری و کمی کردن متغیرهای مورد نظر منتهی نمی شود!!

پیشنهاد ما به شما این است که در طی مراحل تحقیق خود با ما به عنوان مشاور آماری مطمئن در تماس و ارتباط باشید (از طریق واتساپ یا ایمیل) تا با گامهای اصولی و درست و مطمئن به هدف خویش در پایان نامه یا تحقیق نائل شوید. انجام آزمون آماری فرضیات تحقیق را می توانید به ما بسپارید یا در این مسیر از مشاوره ما بهره مند گردید.

تدوین فرضیه

پس از انتخاب و نوشتن مسئله باید محقق تصویری ذهنی از چگونگی متغیرها و نحوه ارتباط آنها با یکدیگر ارائه دهد تا بر اساس آن تلاش کاوشگرانه خود را آغاز کند. بنابراین اقدام به تدوین و تبیین قضایای فرضی و پیشنهادی در چهارچوب مساله تحقیق خود می نماید، به نحوی که چگونگی متغیر یا پدیده و نیز روابط آنها را با یکدیگر توضیح دهد.

فرضیه سازی یکی از مراحل حساس تحقیق را تشکیل می دهد؛ چرا که فرضیه ها نقش راهنما را دارند و به فعالیتهای تحقیقاتی جهت می دهند. فرضیه ها به محقق کمک می کنند تا از بین طرق فراوان رسیدن به مقصد تنها چند مورد آن را که بیش از همه نزدیک تر به مقصد به نظر می رسد بر گزیند.

مبادی شکل گیری فرضیه

فرضیه ها در ذهن دانشجویان و محققان ، به صورت انفرادی و یا ترکیبی ، از مبادی زیر پدیدار می شوند و به عنوان سرچشمه پیدایش و شکل گیری فرضیه و گمان علمی در ذهن پژوهشگر عمل می نمایند:

۱- معلومات پیشین که در قالب گزاره های نظری مانند اصول و قوانین علمی، نظریه ها،‌حقایق، مفاهیم، مدلها و غیره وجود دارند و در شکل ادبیات نظری پژوهش تدوین می شوند.

۲- تجربیات دیگران، نظیر سوابق پژوهشی و تجربی سایرین که درباره موضوع یا مشابه آن وجود دارد.

۳- تجربیات پژوهشگر؛ در محیط واقعی یا در آزمایشگاه

۴- تعامل با دیگران، گفتگو و مصاحبه با صاحب نظران و متخصصان

مفهوم و تعریف فرضیه

در تعریف فرضیه می توان گفت: فرضیه عبارت است از حدس یا گمان اندیشمندانه درباره ماهیت، چگونگی و روابط بین پدیده ها، اشیاء و متغیرها، که محقق را در تشخیص نزدیک ترین و محتمل ترین راه برای کشف مجهول کمک می نماید؛ بنابراین فرضیه گمانی است موقتی که درست بودن یا نبودنش باید مورد آزمایش قرار گیرد.

تفاوت فرضیه با نظریه و قوانین یا معلومات کلی این است که نظریه و قوانین عمدتا مشتمل بر قضایای کلی و عمومی هستندو به مورد خاصی تعلق ندارند و می توانند مصادیق زیادی داشته باشند، در حالی که فرضیه حالت کلی ندارد و مختص مسئله تحقیق است که از قضایای کلی ناشی می شود ولی در قلمرو یک تحقیق خاص شکل می گیرد؛ به همین دلیل، یک محقق نمی تواند فرضیه خود را در تحقیق مورد نظرش به صورت قضیه کلی بیان نماید. هر چند از قضایای کلی به روش قیاسی و از کل به جزء فرضیه سازی می نماید و فرضیه های خود را از قضایای کلی استنتاج می کند، ولی باید مفاهیم و اصطلاحات مربوط به فرضیه را به مساله تحقیق خود یعنی همان مطالعه موردی محدود کند.

نقش فرضیه در تحقیق علمی

فرضیه، توجیه و تبیینهای حدسی معینی را درباره واقعیات عرضه می کند و پژوهشگران را در بررسی این واقعیات و تجارب کمک و هدایت می کند. فرضیه یک پیشنهاد توجیهی و  به زبان دیگر راه حل مسئله است که هم به یافتن نظم و ترتیب در بین واقعیات کمک می کند و هم باعث استنتاج می شود.

فرضیه ها ضمن اینکه برای پیگیری و انجام دادن امور تحقیق به طور کلی به محقق جهت می دهند باعث می گردند که :

نخست،‌ مطالعه منابع و ادبیات مربوط به موضوع تحقیق جهت دار شود و از مطالعه منابعی که ربطی به پژوهش ندارند جلوگیری به عمل آید.

دوم، پژوهشگر را نسبت به جنبه های موقعیتی و معنی دار مسئله پژوهش حساس تر می نمایند.

سوم، فرضیه باعث می شود تا محقق مسئله پژوهش را بهتر درک کند و روشهای جمع آوری اطلاعات را بهتر تعیین نماید.

چهارم، فرضیه چهارچوبی برای تجزیه و تحلیل و تفسیر اطلاعات جمع آوری شده و نتیجه گیری از آن ارائه می دهد.

نکته ای که باید به آن توجه شود آن است که تحقیقات علمی از هر نوعی که باشند نیاز به تدوین فرضیه دارند.

در تحقیقات توصیفی فرضیه ها مبین تصویر حدسی از وجود حالات، شرایط، صفات، ویژگیهای اشیاء و اشخاص، موقعیتها، پدیده ها و رخدادهایی هستند که نسبت وقوع رویداد، صفات، ویژگیهای اشیاء و پدیده ها را توضیح می دهد.

در تحقیقات علی و همبستگی فرضیه از وجود رابطه صحبت می کند، چه رابطه های همبستگی و چه رابطه های علّی که مبین رابطه علت و معلولی هستند.

نکته: گاهی اوقات امکان تدوین فرضیه وجود ندارد. مثلا:

۱- طرحهایی که ماهیت مطالعاتی داشته و شبه پژوهش هستند و عمدتا بر پایه اطلاعات و معلومات پیشین و دست دوم تهیه می شوند.  مانند، تهیه و تدوین اطلسها، دایره المعارفها، بررسیهای توصیفی، و امثال آن.

۲- برخی پژوهشهای کاربردی که از جنس طراحی هستند، مانند طرح های آمایشی

فرضیه آماری (فرضیه صفر) در مقابل فرضیه تحقیق

انواع فرضیه در تحقیقات همبستگی و تجربی را به دو نوع تقسیم می کنند: فرضیه تحقیق یا یک (H1: Research Hypothesis) و فرضیه پوچ یا صفر (H0: Null or Statistical Hypothesis) .

فرضیه تحقیق از وجود رابطه یا اثر و یا تفاوت بین متغیرها خبر می دهد یا در واقع وجود این حالات را تایید نموده آن را واقعی و حقیقی می داند. این فرضیه به دو نوع جهت دار و بدون جهت تقسیم می شود.

فرضیه صفر که به فرضیه آماری یا پوچ نیز موسوم است بر خلاف فرضیه تحقیق، وجود رابطه، اثر یا تفاوت بین متغیرها را رد کرده، انکار می نماید و اظهار می دارد که این حالات واقعی نیست و حقیقت ندارد و صرفا ناشی از تصادف و اشتباهات آماری به ویژه در نمونه گیری است.

از فرضیه های مزبور می توان به فرضیه های زوجی نیز تعبیر نمود. یعنی فرضیه مرکب از زوج صفر و یک می باشد.

مثال زیر انواع فرضیه را نشان می دهد:

الف- فرضیه تحقیق جهت دار:

– به نظر می رسد کارایی معلمان آموزش دیده بیشتر از معلمان آموزش ندیده است.

ب) فرضیه تحقیق بدون جهت، در تحقیق مورد نظر:

– به نظر می رسد بین آموزش معلمان و کارایی آنها رابطه وجود دارد.

ج) فرضیه صفر در تحقیق مورد نظر:

– به نظر می رسد کارایی معلمان آموزش دیده و آموزش ندیده مساوی است.

اگر چه محقق فرضیهٔ تحقیق را مطرح می کند و درصدد آزمایش آن است، پس از گردآوری اطلاعات و داده ها و طبقه بندی آنها عملاً فرضیه ی صفر را مورد آزمایش قرار می دهد؛ زیرا روشهای آماری تجزیه و تحلیل داده ها قادر به آزمون فرضیه صفر هستند. البته ممکن است محقق در فرضیات خود اشاره ای به فرضیه ی صفر ننماید، ولی در عمل  فرضیهٔ صفر مورد آزمون قرار می گیرد و هر حکمی که در مورد فرضیه صفر پذیرفته شد، محقق می تواند عکس آن را در مورد فرضیه تحقیق به کار گیرد.

مطالعه چگونگی روابط بین متغیرها در یکی از سه حالت زیر انجام می پذیرد:

الف) محقق به دنبال بررسی و مقایسه تفاوت تاثیر دو یا چند متغیر بر یک یا چند متغیر است؛ مانند تفاوت تاثیر دو روش تدریس بر شاگردان.

ب) محقق در پی مطالعهٔ میزان همبستگی بین دو یا چند متغیر است؛ مانند بررسی همبستگی مشکلات روانی و گرایش به اعتیاد.

ج) محقق به دنبال کشف و تعیین رابطهٔ علت و معلولی بین دو یا چند متغیر است؛ مانند تاثیر عامل هوش در پیشرفت تحصیلی.

نکته: فرضیه های زوجی (صفر و یک) مختص پژوهشهایی است که هدف آنها کشف رابطهٔ بین متغیرهاست. نظیر تحقیقات همبستگی و تجربی آزمایشگاهی. بنابراین در تحقیقاتی که کشف رابطه ها مد نظر نمی باشند فرضیه زوجی موضوعیت ندارد و پژوهشگر نسبت به تدوین فرضیه های انفرادی اقدام خواهد نمود. مثلا در تحقیقات توصیفی، تاریخی و پس رویدادی غیر کمی محقق نسبت به تدوین فرضیه های انفرادی اقدام می کند و فرضیه زوجی برای آنها بی معنی است.

ویژگیهای یک فرضیه خوب

۱- فرضیه باید قدرت تبیین حقایق را داشته باشد و واقعیت مسئله یا متغیر یا روابط مورد مطالعه را منعکس کند.

۲- فرضیه باید بتواند پاسخ مساله تحقیق را بدهد. یعنی آنچنان با مسئله تحقیق یا سوالات فرعی مرتبط باشد که اطلاعات گردآوری شده پس از تجزیه و تحلیل، پاسخگوی حل مسئله  قابل استفاده باشد.

۳- فرضیه باید قابلیت حذف حقایق نامرتبط با مساله تحقیق را داشته باشد و با سایر سؤالات فرعی و فرضیه های دیگر تداخل نداشته باشد.

۴- فرضیه باید شفاف، ساده و قابل فهم باشد و از در آن از عبارات مبهم، طولانی و دو پهلو استفاده نشود.

۵- فرضیه باید قابلیت آزمون را داشته باشد؛ یعنی مفاهیم و متغیرهای مطرح شده در فرضیه قابل تبدیل به تعاریف عملیاتی و واجد معرفها و شاخصهایی برای اندازه گیری، ارزیابی و سنجش باشند تا بتوان با وسایل و امکانات موجود آن را مورد آزمایش قرار داد.

۶- فرضیه نباید با حقایق و قوانین مسلم و اصول علمی تایید شده مغایرت داشته باشد.

۷- در فرضیه نباید از واژه ها و مفاهیم ارزشی استفاده شود.

۸- فرضیه باید به مطالعه و پژوهش جهت بدهد و راهنمای فعالیتهای محقق باشد.

۹- فرضیه باید به صورت جمله خبری باشد تا از نحوه ارتباط متغیرها خبر بدهد.

۱۰- فرضیه‌ها باید مختص مطالعه موردی مساله تحقیق باشند. بنابراین از تدوین فرضیه های عام و غیر قابل حمل بر مصداق خاص مورد تحقیق باید پرهیز نمود.

۱۱- باید بین فرضیه ها و سوالهای ویژه یا فرعی تحقیق تناظر صوری و محتوایی وجود داشته باشد. فرضیه  ها در واقع پاسخهای حدسی به سوالهای فرعی یا ویژه مربوط به تحقیق هستند.

نکته: چنانچه فرضیه های متعدد داشته باشیم، باید این فرضیه ها به گونه ای تنظیم شوند که مجموعا یک واحد کلی و یک سیستم یا دستگاه حدسی را تشکیل دهند و هماهنگ و همسو باشند.

 

منبع: داده پردازی آماری اطمینان شرق

۰ نظر موافقین ۰ مخالفین ۰ ۰۴ مهر ۹۹ ، ۱۱:۳۴
سید سعید انصاری فر

 

  • مدیریت منابع انسانی،
  • هوش هیجانی،
  • چابکی سازمان،
  • هماهنگی راهبردی عناصر سازمانی،
  • عملکرد سازمان،
  • استراتژی های منابع انسانی،
  • مدیریت دانش،
  • سبک های مدیریت تعارض،
  • اثربخشی سازمان،
  • فرهنگ سازمان،
  • تعهد سازمان،
  • توانمندسازی منابع انسانی،
  • سبک رهبری،
  • خلاقیت سازمانی،
  • پاسخگویی سازمانی،
  • اعتماد عمومی،
  • شهروندی سازمانی،
  • سودآوری سازمان،
  • عدالت سازمانی،
  • مدیریت مشارکتی،
  • حفظ ونگهداری منابع انسانی،
  • سیستم های اطلاعات مدیریت (MIS)،
  • رضایت شغلی،
  • ساختار سازمانی،
  • جو سازمانی،
  • سلامت سازمانی،
  • فساد اداری،
  • خصوصی سازی،
  • فناوری اطلاعات،
  • سرمایه اجتماعی،
  • سرمایه‌های فکری (سرمایه انسانی، سرمایه ساختاری، سرمایه مشتری)
۰ نظر موافقین ۰ مخالفین ۰ ۲۵ شهریور ۹۹ ، ۱۶:۴۶
سید سعید انصاری فر

شناسایی منابع هسته

نخستین قدم در انتخاب موضوع پایان­ نامه، شناسایی منابع هسته (کتاب، مجله و هر منبعی که بیشترین استنادها را به خود اختصاص می­ دهد) است. این منابع معمولا بیشترین تاثیر را در رشته مورد نظر شما دارند. برای یافتن این منابع نیز باید به مطالعات زیادی بپردازید، معمولا در فصل آخر پایان­ نامه­ ها بخشی به نام “پیشنهادهایی برای پژوهش­ های بیشتر” وجود دارد که می ­توانید آن­ها را مطالعه کنید و منابعی که در پایان ­نامه­ های مرتبط با رشته شما ذکر شده است را بررسی کنید.

 

جستجو در اینترنت

اینترنت کارها را آسان کرده است، تقریبا درباره هر موضوعی می­توانید در اینترنت جستجو کنید و نتایج بی ­نهایتی بدست بیاورید. همچنین برای آگاهی از موضوعات روز رشته شما نیز جستجو در اینترنت یک راهکار مفید است.

 

شرکت در همایش ها و کنفرانس ها

بسیار مهم است که بدانید در ارتباط با رشته شما چه همایش ­ها و گردهمایی­ هایی برقرار است. شناسایی و بررسی فهرست کنفرانس­ ها و همایش­های روز در رابطه با رشته شما و موضوعاتی که در این کنفرانس ­ها مورد بحث قرار می­ گیرند نیز می­توانند به انتخاب موضوع پایان­ نامه شما کمک کنند.

 

 

جستجو در پایگاه ­های مربوط به پژوهش­های جاری

انتخاب موضوع پایان­ نامه را به مطالعه پایان­ نامه­ ها و مطالعات کشور محدود نکنید، برای انتخاب یک موضوع خوب برای پایان­ نامه باید پا را فراتر قرار دهید و به شناسایی و بررسی پایگاه ­ها و فهرست پایان­ نامه­ های انجام شده در مراکز اطلاعات ملی یا وب سایت­ های دانشگاه­ های معتبر در خارج از کشور بپردازید. منابع استفاده شده در این تحقیقات و پایان­ نامه ­ها نیز می­ توانند ذهن شما را در انتخاب موضوع پایان­ نامه باز کنند.

علاوه بر اینکه باید بدانید چطور برای انتخاب موضوع پایان ­نامه تحقیق کنید، معیارهای دیگری نیز در انتخاب موضوع پایان­ نامه وجود دارد که به آن قدرت می بخشد.

 

علاقه ­مند بودن و تسلط به موضوع انتخاب شده

باید به موضوعی که انتخاب می­ کنید تسلط داشته باشید، علاقه­ مند بودن به موضوع نیز یکی از شرایط مهم انتخاب موضوع پایان­ نامه است. توانایی­ های خود از جمله قدرت تجزیه و تحلیل، توانایی تحلیل آماری، توانایی برقراری ارتباط با جامعه ­ی مورد تحقیق را در نظر بگیرید.

 

پژوهش پذیر بودن

پایان ­نامه باید کاربردی باشد و بتواند به یک نیاز مهم پاسخ دهد. همچنین امکان استفاده از نتایج آن در کوتاه­ مدت یا میان مدت وجود داشته باشد. همچنین باید بتوان پژوهش ­های بیشتری درباره موضوع انتخاب شده انجام داد.

 

هدفمند بودن

از انتخاب این موضوع برای پایان ­نامه چه هدفی دارید و به چه نتیجه­ ای می­خواهید برسید؟ بی هدف بودن هنگام انتخاب موضوع پایان­ نامه موجب می­ شود پس از انجام پایان ­نامه از نتیجه­ ی بدست آمده راضی نباشیم.

 

فراهم بودن اطلاعات مورد نیاز پایان ­نامه

شاید به این فکر کنید که چطور ممکن است برای موضوعی اطلاعات وجود نداشته باشد. اما گاهی ممکن است اطلاعات مورد نیاز برای پایان ­نامه جنبه کاملا شخصی و محرمانه داشته باشند که نتوان آن­ها را از طریق جستجو در اینترنت یا مواردی که گفته شد بدست آورد.

حتما بخوانید:   8 راه ساده برای جلوگیری از سرقت ادبی (+مثال)

 

در نظر گرفتن عامل زمان

موضوعی که برای پایان ­نامه انتخاب می­ کنید باید طوری باشد که تحقیق درباره آن تا زمان مشخص شده برای ارائه پایان­ نامه امکان پذیر باشد.

 

نگذشتن از کنار موضوعات ساده

فکر نکنید موضوعات ساده بی اهمیت هستند گاهی در میان همین مسائل که از نظر شما پیش پا افتاده هستند می ­توانید موضوعات مهمی بیابید.

 

استفاده از تجربیات شخصی

از تجربه­ هایی که داشتید استفاده کنید و آن­ها را ارزشمند بدانید. یک اتفاق ساده در زندگی شما ­می­ تواند موضوع یک بررسی علمی باشد. پس به دنیای پیرامونتان دقت بیشتری داشته باشید.

 

وفاداری به تحقیقات پیشین

موضوعی که انتخاب می­ کنید می­تواند ادامه یک تحقیق در گذشته باشد. بنابراین با نگاهی جدید و از زاویه ای دیگر به موضوعات قبلی بنگرید. شاید در دل این موضوعات بتوانید موضوعات جدیدتری بیابید.

 

تصمیم ­گیری نهایی در انتخاب موضوع

شما تمام مراحل و نکاتی که پیش­تر گفته شد را رعایت کردید و حالا نوبت تصمیم گیری نهایی است. در طی مراحل قبل بهتر است هربار موضوعی مناسب برای پایان­ نامه به ذهنتان رسید را یادداشت کنید. بنابراین در نهایت یک فهرست از موضوعات مختلف با توجه به معیارها و موارد گفته شده خواهید داشت.

این فهرست را با دقت بیشتری بررسی کرده و سبک سنگین کنید. معمولا در این مرحله به موضوعاتی برخورد می ­کنید که امتیاز کافی را از نظر شما برای یک موضوع خوب بودن نمی­گیرند. بنابراین آن­ها را حذف کنید. موضوعات حذف شده معمولا آن­هایی هستند که از نظر شما تحقیق و رسیدن به نتیجه مطلوب در رابطه با آن­ها دشوار است.

در نهایت باید برای شما دو یا سه موضوع باقی بماند. این موضوعات را از لحاظ وجود منابع اطلاعاتی بررسی کنید، حتما در این مرحله با استاد راهنمای خود مشورت کنید تا شما را در رابطه با انتخاب بهترین موضوع راهنمایی کند.

 

در نهایت می ­توانید به روش ­های زیر موضوع پایان ­نامه را جهت اطمینان از تکراری نبودن بررسی کنید :

 

۰ نظر موافقین ۰ مخالفین ۰ ۲۱ شهریور ۹۹ ، ۲۳:۳۹
سید سعید انصاری فر

در تحلیل‌های آماری بخصوص مباحث مربوط به آزمون‌های فرض آماری، بر وجود توزیع برای داده‌ها تکیه داریم. در این حالت برای داده‌های کمی، «توزیع نرمال» (Normal Distribution) و برای داده‌های کیفی، توزیع «دوجمله‌ای» (Binomial Distribution) یا «چند جمله‌ای» (Multinomial) در نظر گرفته می‌شود. به این ترتیب هنگام استفاده از روش‌های آماری هرچه قیدهای بیشتری در مورد توزیع داده‌ها داشته باشیم به «روش‌های پارامتری» (Parametric Methods) نزدیک‌تر شده‌ایم. مشخصا این شیوه و روش‌ها در «آمار پارامتری» (Parametric Statistics) مورد بحث و بررسی قرار می‌گیرند. برعکس هر چه قیدهای کمتری در مورد توزیع داده‌ها وجود داشته باشد، روش‌های تحلیلی به سمت «روش‌های ناپارامتری» (Non-Parametric methods) می‌روند و به شاخه «آمار ناپارامتری» (Non-Parametric Statistics) نزدیک می‌شوند. این نوشتار به آمار پارامتری و ناپارامتری اختصاص داشته و ویژگی و خصوصیات هر یک را بازگو می‌کند.

 

در این نوشتار به بررسی تفاوت روش‌های پارامتری و ناپارامتری در آمار می‌پردازیم و نقاط ضعف و قوت هر یک را مرور خواهیم کرد. برای مطالعه بیشتر در زمینه تحلیل‌ها و آزمون‌های فرض آماری مطلب آزمون های فرض و استنباط آماری — مفاهیم و اصطلاحات مناسب به نظر می‌رسد. همچنین آگاهی از نحوه اجرای آزمون‌های پارامتری در مورد میانگین جامعه که در نوشتار آزمون فرض میانگین جامعه در آمار — به زبان ساده آمده است، خالی از لطف نیست.

آمار پارامتری و ناپارامتری

در حوزه «تجزیه و تحلیل آماری داده‌ها» (Statistical Data Analysis)، توزیع جامعه آماری که نمونه از آن گرفته شده، مهم است زیرا هر چه اطلاعات بیشتر در زمینه رفتار داده‌ها و شکل پراکندگی و توزیع آن‌ها وجود داشته باشد، نتایج قابل اعتمادتر و دقیق‌تر خواهند بود. در مقابل، وجود اطلاعات کم از توزیع جامعه آماری مربوط به نمونه، باعث کاهش اعتماد به نتایج حاصل از روش‌های معمول (پارامتری) آماری می‌شود. بنابراین در این حالت مجبور به استفاده از روش‌های ناپارامتری هستیم که برای اجرای آن‌ها فرضیاتی در مورد توزیع داده‌ها وجود ندارد. به همین علت به روش‌های ناپارامتری گاهی «روش‌های توزیع-آزاد» (Distribution-free Methods) نیز می‌گویند.

آمار پارامتری و روش‌های تجزیه و تحلیل مرتبط

داده‌های پارامتری به نمونه‌ای گفته می‌شود که از توزیع جامعه آماری آن مطلع هستیم. معمولا این توزیع آماری برای داده‌های کمی، نرمال یک یا چند متغیره در نظر گرفته می‌شود. در این حالت از آزمون‌های آماری پارامتری مثل آزمون T، آزمون F و یا آزمون Z استفاده می‌کنیم. همچنین برای اندازه‌گیری میزان همبستگی بین متغیرهای دو یا چند بعدی نیز از ضریب همبستگی پیرسون استفاده خواهیم کرد.

 

اگر حجم نمونه در روش‌های تجزیه و تحلیل آمار پارامتری بزرگ انتخاب شود، معمولا توان آزمون مناسب خواهد بود و به راحتی می‌توان نتایج حاصل از آزمون فرض را به جامعه نسبت داد. جدول زیر به معرفی روش‌های پارامتری در انجام آزمون‌های فرض آماری پرداخته است.

مسئله نوع آزمون شرایط اجرای آزمون
مقایسه میانگین با مقدار ثابت از جامعه نرمال با واریانس معلوم آزمون تک نمونه‌ای با آماره Z مشاهدات بیشتر از 30 نمونه و چولگی نیز کم باشد.
مقایسه میانگین با مقدار ثابت از جامعه نرمال با واریانس نامعلوم آزمون تک نمونه‌ای با آماره T مشاهدات بیشتر از 20 نمونه و چولگی نیز کم باشد.
مقایسه میانگین دو جامعه مستقل نرمال با واریانس معلوم آزمون دو نمونه‌ای با آماره Z در هر گروه تعداد مشاهدات بیشتر از ۳۰ باشد و چولگی نیز کم باشد.
مقایسه میانگین دو جامعه مستقل نرمال با واریانس نامعلوم آزمون دو نمونه‌ای با آماره T در هر گروه تعداد مشاهدات بیشتر از 20 باشد و چولگی نیز کم باشد.
مقایسه میانگین زوجی آزمون دو نمونه‌ای زوجی با آماره T مشاهدات زوجی بیش از ۲۰ مشاهده باشند، چولگی نیز کم باشد.
مقایسه میانگین چند جامعه مستقل نرمال با واریانس برابر ولی نامعلوم آنالیز واریانس (ANOVA) تعداد مشاهدات نمونه در هر گروه از جامعه بیش از ۲۰ باشد. واریانس‌ها برابر یا تقریبا برابر باشند، هر جامعه دارای توزیع نرمال باشد.

آمار ناپارامتری و روش‌های تجزیه و تحلیل مرتبط

اگر توزیع جامعه آماری نامشخص باشد و از طرفی حجم نمونه نیز کوچک باشد بطوری که نتوان از قضیه حد مرکزی برای تعیین توزیع حدی یا مجانبی جامعه آماری، استفاده کرد، از تحلیل‌های ناپارامتری استفاده می‌شود، زیرا در این حالت کارآمدتر از روش‌های پارامتری هستند. به این ترتیب در زمانی که توزیع جامعه مشخص نباشد و یا حجم نمونه کم باشد، روش‌ها و آزمون‌های ناپارامتری نسبت به روش‌ها و آزمون‌های پارامتری از توان آزمون بیشتری برخوردارند و نسبت به آن‌ها ارجح هستند.

بهتر است شرایط بهره‌گیری از روش‌های ناپارامتری را به صورت زیر لیست کنیم:

  • برای داده‌ها، نتوان توزیع آماری مناسبی در نظر گرفت.
  • وجود داده‌های پرت (Outlier)، وجود چند نما و … امکان انتخاب توزیع نرمال را برایشان میسر نمی‌کند.
  • کم بودن حجم نمونه برآورد پارامترهای توزیع نرمال مانند میانگین و بخصوص واریانس را دچار مشکل می‌کند و در عمل امکان بررسی توزیع نرمال به علت حجم کم نمونه برای جامعه وجود ندارد.

روش‌های ناپارامتری در چنین موقعیت‌های می‌تواند راهگشا باشد و به محقق و «تحلیل‌گر داده‌» (Data Scientist) برای شناخت داده‌ها یاری برساند.

parametric-vs-nonparametrictest

نکته: باید توجه داشت که اگر توزیع جامعه آماری قابل تحقیق و تعیین باشد، اجرای روش‌های پارامتری بر روش‌های ناپارامتری ارجح هستند زیرا در این حالت روش‌های پارامتری نسبت به روش‌های ناپارامتری از دقت بیشتری برخوردارند. بنابراین فقط زمانی که از توزیع جامعه آماری مطلع نیستم، به اجبار از روش‌های ناپارامتری استفاده خواهیم کرد. البته اگر حجم نمونه بزرگ باشد، در اکثر موارد، نتایج حاصل از آزمون‌های پارامتری و ناپارامتری با یکدیگر همخوانی دارند.

 

از آنجایی که در بیشتر روش‌های ناپارامتری به جای داده‌ها، ترتیب آن‌ها به کار گرفته می‌شود، بهتر است با مفهوم رتبه‌ (Rank) بیشتر آشنا شویم. در ادامه به معرفی رتبه و کاربردهای آن در آمار ناپارامتری می‌پردازیم.

داده‌های رتبه‌بندی شده (Ranked Data)

استفاده از رتبه‌ها به جای مقدارها، یکی از ویژگی‌های روش‌های ناپارامتری است. برای مثال همانطور که دیده‌اید ضریب همبستگی اسپیرمن یک روش ناپارامتری برای اندازه‌گیری همبستگی بین مقدارها است. برای محاسبه ضریب همبستگی اسپیرمن به جای استفاده از مقدارها، رتبه‌هایشان ملاک قرار می‌گیرد و ضریب همبستگی عادی (پیرسون) به جای مقدارها از روی رتبه‌ها محاسبه می‌شود.

برای ایجاد رتبه‌ها کافی است که آن‌ها را به ترتیب چیده و از کمترین تا بیشترین مقدار، برچسب‌های از ۱ تا N را نسبت دهیم. این برچسب‌ها «رتبه‌» (Rank) را نشان می‌دهد.

برای مثال فرض کنید که ۵ مقدار مختلف در یک ستون داریم.

 

1

2

3

4

5

0.020

0.184

0.431

0.550

0.620

اگر آن‌ها را مرتب و رتبه‌بندی کنیم، به صورت زیر قرار خواهند گرفت. همانطور که دیده می‌شود، کوچکترین مقدار، رتبه ۱ و بزرگترین مقدار نیز رتبه 5 گرفته است.

 

1

2

3

4

5

1 = 0.021055

2 = 0.404622

3 = 0.488733

4 = 0.618510

5 = 0.832803

اگر منظور مقایسه بین دو جامعه باشد، می‌توان برای نمونه دوم نیز به همین ترتیب عمل کرد و بین رتبه‌های حاصل، مقایسه انجام داد.

نکته: اگر در بین داده‌های موجود در نمونه، دو مقدار یا بیشتر با یکدیگر برابر باشند، ممکن است برای دو مقدار یکسان شیوه‌های رتبه‌بندی متفاوتی به کار گرفته شود. برای مثال ممکن است حداقل یا حداکثر رتبه انتخاب شود. حتی میانگین رتبه‌ها نیز یکی از روش‌های تخصیص رتبه است.

در زیر کد مربوط به رتبه‌بندی داده‌ها به زبان پایتون نوشته شده است. در اینجا ۱۰۰۰ عدد تصادفی تولید شده و پس از رتبه‌بندی، ۱۰ سطر اول نمایش داده شده‌اند.

 

1

2

3

4

5

6

7

8

9

10

11

12

13

from numpy.random import rand

from numpy.random import seed

from scipy.stats import rankdata

# seed random number generator

seed(1)

# generate dataset

data = rand(1000)

# review first 10 samples

print(data[:10])

# rank data

ranked = rankdata(data)

# review first 10 ranked samples

print(ranked[:10])

نتیجه اجرای این کد به صورت زیر خواهد بود.

 

1

2

3

4

[4.17022005e-01 7.20324493e-01 1.14374817e-04 3.02332573e-01

1.46755891e-01 9.23385948e-02 1.86260211e-01 3.45560727e-01

3.96767474e-01 5.38816734e-01]

[408. 721.   1. 300. 151.  93. 186. 342. 385. 535.]

همانطور که گفته شد، گاهی ممکن است بعضی از مقدارها در لیست داده‌ها با هم برابر باشند. در این میان رتبه‌ها برایشان یکسان خواهد بود. چنین موقعیتی را «گره» (Tie) می‌نامند. برای آنکه با شیوه‌های مختلف رتبه و ایجاد گره‌ها آشنا شوید کد زیر در R تهیه شده است. همانطور که مشخص است اعداد ۱ تا ۵ لیست شده‌اند ولی عدد ۳ دوبار تکرار شده است. انتظار داریم که برای این شش عدد رتبه‌های مختلفی ایجاد شود.

 

1

2

3

4

5

6

7

8

x=c(1,2,3,3,4,5)

method= c("min","max","average","random","first")

for (i in method)

  {

r=rank(x,ties.method =i)

print(paste(" method = ",i))

print(r)

}

خروجی به صورت زیر خواهد بود.

 

1

2

3

4

5

6

7

8

9

10

11

[1] " method =  min"

[1] 1 2 3 3 5 6

[1] " method =  max"

[1] 1 2 4 4 5 6

[1] " method =  average"

[1] 1.0 2.0 3.5 3.5 5.0 6.0

[1] " method =  random"

[1] 1 2 4 3 5 6

[1] " method =  first"

[1] 1 2 3 4 5 6

>

همانطور که دیده می‌شود ۵ روش معمول برای مشخص کردن رتبه برای گره‌ها وجود دارد. در روش Min، کمترین رتبه برای مقدارهای تکراری در نظر گرفته می‌شود. همچنین به کمک روش Max، بزرگترین رتبه را برای داده‌های تکراری قرار خواهیم داد. روش میانگین یا Average یکی از معمول‌ترین روش‌ها است که میانگین رتبه‌ها را برای مقدارهای تکراری در نظر می‌گیرد. روش‌های تصادفی یا Random نیز از رتبه‌های ایجاد شده برای هر داده‌ تکراری، یکی را به تصادف انتخاب و به آن نسبت می‌دهد. همچنین در روش اول یا First، مشاهدات به ترتیب رتبه بندی شده و رتبه تکراری نخواهیم داشت.

نکته: در روش‌های Min, Max و Average، رتبه برای داده‌های تکراری، یکسان خواهد بود ولی در روش Random و First هر مشاهده رتبه منحصر به فردی خواهد داشت.

انواع روش‌های آزمون‌های ناپارامتری

روش‌های آزمون فرض آمار ناپارامتری که وابسته به رتبه‌ها هستند در جدول زیر معرفی شده‌اند.

مسئله نوع آزمون
آزمون تک نمونه‌ای- مقایسه میانگین با مقدار ثابت آزمون علامت (Sign test)

آزمون ویلکاکسون (Wilcoxon)

آزمون دو نمونه‌ای مستقل آزمون من ویتنی (Mann-Whitney)
آزمون مقایسه میانگین چند جامعه مستقل آزمون کروسکال والیس (Kruskal-Wallis)

آزمون میانه (Mood’s median test)

آنالیز واریانس دو طرفه آزمون فریدمن (Friedman test)

از آنجایی در زمان وجود چولگی زیاد در داده‌ها، «میانه» (Median) معیار مرکزی مناسب‌تری نسبت به میانگین است، در بسیاری از تحلیل‌های ناپارامتری میانه محاسبه و مقایسه می‌شود. بنابراین زمانی که میانه برآوردگر بهتری برای نقطه تمرکز جامعه آماری باشد، روش‌های ناپارامتری مفید خواهند بود.

skewed distribution

از طرف دیگر وجود داده‌های پرت نیز باعث انحراف میانگین خواهند شد. در چنین مواقعی باز هم میانگین نمی‌توان نماینده خوبی برای مشاهدات باشد. در چنین مواقعی نیز از میانه استفاده شده و به کارگیری روش‌های ناپارامتری مفید و موثرتر از روش‌های پارامتری است.

در روش‌های ناپارامتری علاوه بر رتبه‌ها از چندک‌ها (چارک، دهک و صدک) نیز به کار گرفته می‌شوند. روش‌های «رگرسیون ناپارامتری» (Non Parametric Regression) بر چنین شاخص‌های تکیه دارند.

non parametric regression

در نوشتارهای آینده به بررسی روش‌های آمار ناپارامتری نظیر «رگرسیون چندکی» (Quantile Regression) و همچنین «آزمون‌های فرض ناپارامتری» (Nonparametric Hypothesis Tests) خواهیم پرداخت. همچنین در آنجا برای انجام محاسبات مربوط به این گونه روش‌ها از نرم‌افزارهای آماری نظیر SPSS، Minitab و R نیز کمک خواهیم گرفت.

منبع: https://blog.faradars.org/parametric-and-non-parametric-statistics/

۰ نظر موافقین ۰ مخالفین ۰ ۲۱ شهریور ۹۹ ، ۱۹:۲۵
سید سعید انصاری فر

bootstrapping tech

 

روش بوت استرپ از گروه روش‌های ناپارامتری و در بخش تکنیک‌های باز نمونه‌گیری قرار می‌گیرد. هدف از اجرای بوت استرپ، پیدا کردن خطای (واریانس) برآوردگر با استفاده از تکرار مراحل نمونه‌گیری و برآوردیابی است. در هر بار تکرار براساس یک عمل باز‌نمونه‌گیری از داده‌ها، برآوردگر مورد نظر محاسبه می‌شود. تکرار این مراحل مثلا به تعداد ۱۰۰ بار، منجر به تولید ۱۰۰ مقدار مختلف برای برآوردگر می‌شود. میانگین این مقادیر، برای بدست آوردن امید ریاضی یا اریبی برآوردگر و واریانس یا انحراف معیار این مقدارها نیز می‌تواند برای پیدا کردن خطای برآوردگر به کار رود. در اینجا قصد داریم این روش را در SPSS مرور و به کار بگیریم. در نتیجه کار را با یک مثال در SPSS دنبال می‌کنیم. البته توجه داشته باشید که برای استفاده از این روش باید نسخه SPSS® Statistics Premium Edition را داشته یا بسته افزونه Bootstrapping را روی SPSS نصب کرده باشید.

استفاده از بوت استرپ در دستور Explore

با توجه به مقدمه‌ای که در مورد روش بوت استرپ گفته شد، در این قسمت به بررسی یک مثال به کمک داده‌های آموزشی SPSS می‌پردازیم. فایل Employee data.sav در پوشه samples مربوط به مشخصات کارمندان یک شرکت است. البته می‌توانید با کلیک روی اینجا این فایل را با قالب فشرده دریافت کنید. مدیریت شرکت احتیاج به بررسی تجربه کاری کارمندان در محل کار قبلی دارد. این متغیر کاملا به راست چوله است که باعث می‌شود، میانگین (Mean) برآوردگر خوبی برای شاخص تمرکز نباشد. بنابراین بهتر است از میانه (Median) برای نمایش نقطه تمرکز این متغیر استفاده شود. ولی متاسفانه برای میانه نمی‌توان به راحتی یک فاصله اطمینان به فرم بسته پیدا کرد. بنابراین از روش بوت استرپ برای پیدا کردن یک فاصله اطمینان برای میانه سابقه کار در این مثال استفاده می‌کنیم.

 

پس از باز کردن فایل اطلاعاتی Employee data.sav برای دسترسی به دستور Explorer مراحل زیر را طی کنید.

Analyze > Descriptive Statistics > Explore…

به این ترتیب پنجره مربوط به دستور Explorer باز می‌شود. تنظیمات این پنجره را مطابق با تصویر زیر انجام دهید.

explore dialog box

مشخص است که متغیر با نام prevexp و با برچسب (Previous Experience (months برای محاسبه میانه و فاصله اطمینان آن در کادر Dependent List قرار گرفته است. همچنین به انتخاب گزینه Statistics در کادر Display‌ دقت کنید. به این ترتیب فقط آماره‌ها محاسبه شده و نمودارها ترسیم نخواهند شد. برای اجرای روش بوت‌استرپ و محاسبه فاصله اطمینان، دکمه Bootstarp را انتخاب کنید. پنجره‌ای به مانند زیر ظاهر می‌شود. تنظیمات در تصویر دیده می‌شود. البته هر یک از این پارامترها را در ادامه توضیح خواهیم داد.

bootstrap_dialogbox

با انتخاب گزینه اول یعنی Perform bootstrapping از SPSS می‌خواهید که خطای برآوردگرها را به کمک این روش محاسبه کند. در کادر Number of samples تعداد نمونه‌ها را مشخص می‌کنید. هر چه تعداد نمونه‌های بیشتری را عمل باز‌نمونه‌گیری معرفی کنید، دقت برآوردگرها بیشتر خواهد شد. البته این کار منجر به افزایش زمان محاسبات نیز خواهد شد. از آنجایی که انتخاب نمونه‌ها به صورت تصادفی صورت می‌گیرد، با تکرار دستور Explorer، نمونه‌ها و میزان خطای محاسبه شده متفاوت خواهند بود. ولی با انتخاب یک seed برای تولید اعداد تصادفی مربوط به انتخاب نمونه‌ها، می‌توانید نتایج یکسانی از تکرار این دستور داشته باشید. البته انجام این کار ضرورتی ندارد ولی با این کار و اجرای دستورات، نتایجی درست به مانند نتایجی که ما در این نوشتار بدست آورده‌ایم، حاصل خواهد شد. به این منظور در کادر Seed مقدار 592004 را وارد کنید تا همیشه همین نتایج را بدست آوریم.

در کادر «فاصله اطمینان» (Confidence Intervals) نیز امکان تعریف خصوصیات فاصله اطمینان را دارید. مقدار سطح اطمینان را در قسمت (%)Level بین ۵۰ تا ۱۰۰ وارد کنید. اگر می‌خواهید یک فاصله اطمینان ۹۵٪ برای میانه ایجاد کنید، مقدار ۹۵ را در این کادر بنویسید. برای ایجاد این فاصله اطمینان دو روش در این پنجره معرفی شده‌اند. روش ابتدایی و ساده‌تر، استفاده از چندک‌ها یا همان صدک‌های میانه‌های حاصل از باز‌نمونه‌گیری‌ها است. روش دوم استفاده از تکنیک BCa یا (Bias Correction and acceleration) است که البته زمان و بار محاسباتی بیشتری دارد ولی در عوض دارای دقت بیشتری نیز هست زیرا اریبی را کاهش می‌دهد. بنابراین در اینجا از این راهکار استفاده کرده‌ایم.

در قسمت انتهایی یعنی Sampling می‌توانید روش نمونه‌گیری را به صورت یکی از حالت‌های نمونه‌گیری ساده تصادفی (Simple) یا نمونه‌گیری طبقه‌ای (Stratified) انتخاب کنید. در نمونه‌گیری طبقه‌ای باید متغیری که باعث ایجاد طبقات می‌شود را در کادر strata variables قرار دهید. با فشردن دکمه Continue به پنجره قبلی بازگشته و با انتخاب دکمه Ok خروجی را در پنجره output‌ مشاهده خواهید کرد.

 

همانطور که در خروجی شاهد هستید، برای متغیر prevexp شاخص‌های آماری به همراه یک فاصله اطمینان ۹۵٪ حاصل از روش بوت استرپ دیده می‌شود. برای میانه نیز این فاصله به صورت (60.00،50.0060.00،50.00) ظاهر شده است. همچنین خطا و اریبی (Bias) برآورد میانه نیز محاسبه و نمایش داده شده است. توجه داشته باشید که این سابقه برحسب ماه در نظر گرفته شده است.

همانطور که می‌دانید براساس انحراف استاندارد داده‌ها، می‌توان انحراف استاندارد میانگین (Std. Error) را محاسبه کرد. به این ترتیب خطای برآورد میانگین برابر با انحراف استاندارد داده‌ها تقسیم بر جذر تعداد نمونه‌ها است. همانطور که دیده می‌شود مقدار انحراف استاندارد میانگین یا همان خطای برآوردگر میانگین (4.804) که در ستون سوم جدول زیر دیده می‌شود با میزان برآورد خطای میانگین با روش بوت استرپ (مقدار ستون پنجم 4.86) تقریبا برابر است. ولی این کار برای میانه به سادگی صورت نمی‌گیرد. به همین منظور از برآورد بوت استرپ برای محاسبه خطا و فاصله اطمینان برای میانه استفاده کردیم.

output_bootstrap_explore

با استفاده از جدول بالا کاملا مشخص است که مقدار میانه «سابقه کار قبلی» برابر با 55.00 ماه با خطای 3.66 ماه و میزان اریبی 0.11- ماه برآورد شده است، زیرا ارقام مربوط به سابقه کار برحسب ماه بیان شده بودند. البته می‌توان مشاهده کرد که برای دیگر ویژگی‌های این متغیر مانند واریانس و چولگی و کشیدگی محاسبات مربوط به فاصله اطمینان و اریبی و خطای برآورد توسط روش بوت استرپ انجام و نمایش داده شده است.

۰ نظر موافقین ۰ مخالفین ۰ ۱۱ شهریور ۹۹ ، ۰۰:۰۱
سید سعید انصاری فر

ممکن است بپرسید آیا می توانیم از تحلیل کوواریانس چند متغیری و تحلیل واریانس چند متغیری استفاده کنم؟ تحلیل کوواریانس (آنکووا)، تحلیل واریانس چند متغیری ( مانوا ) و تحلیل کووارایانس چند متغیری ( مانکووا ) و تحلیل جایگزین های آزمون t و تحلیل واریانس هستند.

تحلیل کوواریانس چند متغیری

تحلیل کوواریانس چند متغیری ، نوعی تحلیل واریانس است که در آن، تاثیر آماری یک یا چند متغیر (که متغیر کمکی نامیده می شوند) بر متغیر وابسته حذف می شود. به طور نظری، اگر بتوانید تحلیل واریانس را با سطوح متغیرهای کمکی که از طریق تصادفی سازی کنترل شده اند انجام دهید مثل این است که تحلیل کوواریانس را انجام داده اید (در عمل، انجام این کار دشوار است). وقتی که نتوانیم چنین کنترلی را انجام دهیم، ممکن است تحلیل کوواریانس جایگزین مناسبی برای تحلیل واریانس باشد. وقتی بین متغیر وابسته و متغیر دیگری که با متغیر مستقل مرتبط است رابطه قوی وجود داشته باشد تحلیل کوواریانس می تواند به جای تحلیل واریانس انجام شود. به یاد داشته باشید که می خواهید تاثیر متغیر مستقل را در متغیر وابسته بسنجید و نمی خواهید تاثیر سایر متغیرهایی را که نتوانسته اید آنها را کنترل کنید اندازه بگیرید. مثلاً رابطه بین نژاد و پیشرفت تحصیلی را در نظر بگیرید. این جایگاه اجتماعی- اقتصادی و پیشرفت تحصیلی و نیز بین جایگاه اجتماعی- اقتصادی و نژاد رابطه قوی وجود دارد. اگر جایگاه اجتماعی- اقتصادی را کنترل نکنید، ممکن است نتیجه بگیرید که نژاد و پیشرفت تحصیلی باهم رابطه دارند در حالی که این طور نیست تحلیل کوواریانس ، واریانس ناشی از رابطه بین متغیر کمکی و متغیر وابسته را حذف می کند و از این طریق، واریانس خطا را کاهش می دهد (تاباچنیک و فیدل ۲۰۱۱) به همین دلیل، احتمال بیشتری وجود دارد که متغیر مستقل در متغیر وابسته تاثیر معنی دار بگذارد. مثلا فرض کنید میخواهید تاثیر سه برنامه خواندن را در نمرات خواندن بررسی کنید. با وجود این، میدانید که هوش بهر با نمرات خواندن همبستگی بالایی دارد. رابطه هوش بهر و نمرات خواندن ممکن است چنان قوی باشد که باعث شود تفاوت های بین سه روش مداخله را نتوانید مشاهده کنید مگر این که بتواند این رابطه را کنترل کنید. به طور خلاصه، انجام تحلیل کوواریانس و در نظر گرفتن هوش بهر به عنوان متغیر کمکی موجب می شود بتوانید رابطه بین هوش بهر و خواندن را از تحلیل هایتان حذف کنید و تاثیر متغیر مستقل را ساده تر کشف کنید .

 

گاهی پژوهشگران از کاربرد تلحیل کوواریانس در چنین موقعیتی دفاع می کنند :

وقتی متغیر مداخله گری وارد پژوهش می شود و می خواهید تاثیر آن را خنثی کنید . مثلا می خواهید درمان بینش مدار را با درمان حل مساله مدار مقایسه کنید . فرض کنید دریافته اید ، علی رغم واگذاری تصادفی گروه ها ، گروه بیشن مدار نسبت به گروه حل مساله مدار تحصیلات بسیار بالاتری دارد .

همچنین فرض کنید سطح تحصیلات با نتیجه درمان ارتباط دارد . در این وضعیت اگر نتیجه درمان به سود گروه بینش مدار بباشد ممکن است به دلیل تحصیلات بالاتر آزمودنی های گروه باشد نه به دلیل کارآمدتر بودن روش درمانی. برای جلوگیری از این مشکل، می توانید تحصیلات را متغیر کمکی در نظر بگیرید. به لحاظ نظری ، این کار تاثیر احتمالی تحصیلات را در متغیر وابسته حذف می کند تا بتوانید تاثیر مداخله درمانی را در متغیر وابسته مشاهده کنید . با وجود این ، درباره مناسب بودن تحلیل کوواریانسن بحث و جدل هایی وجود دارد زیرا در برخی موقعیت های خاص ، تفسیر نتایج تحلیل کوواریانس دشوار است یا حتی نتایج گمراه کننده به دست می دهد. در قسمت های بعدی در این باره توضیح می دهیم. از جمله چیزهای دیگری که باید درباره تحلیل کوواریانس بدانید می توان به موارد زیر اشاره کرد. نخست این که فقط در صورتی می توان از تحلیل کوواریانس برای کنترل تاثیر متغیرهای مداخله گر استفاده کرد که رابطه معنی داری بین متغیر کمکی و متغیر وابسته وجود داشته باشد. اگر بین متغیر کمکی و متغیر وابسته رابطه ای وجود نداشته باشد، متغیر مداخله گر واقعاً وجود ندارد و نمی تواند در متغیر وابسته تاثیر بگذارد. همچنین، نتایج تحلیل کوواریانس چندان تفاوتی با نتایج تحلیل واریانس ندارد ( اما با وارد کردن متغیر کمکی، مقداری از توان آزمون کم می شود ) . دوم این که تحلیل کوواریانس فقط رابطه خطی بین متغیر کمکی و متغیر وابسته را کنترل می کند، یعنی اگر بین متغیر کمکی و متغیر وابسته رابطه غیر خطی وجود داشته باشد ممکن است نتواند اثر متغیر در حالی که به این که وقتی متغیر کمکی با متغیر مستقل ارتباط داشته باشد یا برای متغیر مستقل ایجاد شود استفاده از تحلیل کوواریانس باعث می شود تفسیر نتایج دشوار شود ( مکسول و دیلاتی، ۲۰۰۴) . چهارم این که اگر آزمودنی ها به طور تصادفی به گروههای آزمایش و کنترل واگذار ’ نشده باشند و از تحلیل کوواریانس استفاده شود تفسیر نتایج دشوار می شود ( یعنی پژوهش شما ازمایش واقعی نیست ) . هویتما (۱۹۸۰) به تفصیل در این باره توضیح داده است . احتمالا ً به دلیل وجود چنین مشکلاتی، برخی پیشنهاد می کنند فقط زمانی از تحلیل کوواریانس استفاده کنیم که می خواهیم واریانس بین متغیر وابسته و متغیر کمکی را حذف کنیم نه اینکه بخواهیم متغیرهای مداخله گر پیش بینی نشده یا پیش بینی شده را کنترل کنیم . بنابراین هر چند تحلیل کوواریانس ممکن است روش قدرتمند و مفدی باشد ، تفسیر نتایج آن احتمالا ساده نیست . برای استفاده از تحلیل کوواریانس به نقاط قوت و ضعف آن توجه کنید . هویتما ( ۱۹۸۰ ) ، مکسول و دیلانی ( ۲۰۰۴ ) و شادیش و همکاران ( ۲۰۰۲ ) درباره تحلیل کوواریانس توضیح داده اند. همچنین، هویتما (۱۹۸۰) آزهای تعقیبی متعددی را توضیح داده است که می توانند با تحلیل کوواریانس به کار روند.

 

تحلیل وارایانس چند متغیری چیست ؟ تحلیل وارایانس چند متغیری مانند تحلیل واریانس است به جز این که همزمان چند متغیر وابسته را بررسی می کند . مثلاً در پژوهشی که تاثیر درمان بینش مدار را با درمان حل مساله مدار مقایسه می کرد، تحلیل واریانس چند متغیری می تواند رضایت از رابطه، رضایت جنسی و رضایت از وظایف مهم را بررسی کند (سه متغیر وابسته). تحلیل واریانس چند متغیری معمولاً میرسد: آیا عوامل مختلف ( متغیرهای مستقل ) در متغیرهای وابسته تاثیر می گذارند؟ روش های تحلیل واریانس چند متغیری، یک متغیر ترکیبی ایجاد می کنند که شامل همه متغیرهای وابسته است، سپس متغیر ترکیبی را تحلیل می کنند و معنی دار شدن تأثیرات اصلی و تعامل های بین متغیر ترکیبی را نشان می دهند. یعنی تحلیل واریانس چند متغیری نشان می دهد متغیر مستقل در متغیر ترکیبی تاثیر گذاشته است اما معلوم نیست در کدام یک از اجزای متغیر ترکیبی تاثیر داشته است.

پژوهشگران معمولا برای کاهش خطای نوع ۱ از تحلیل واریانس چند متغیری استفاده می کنند. هنگامی که بر روی چندین متغیر وابسته جداگانه ، آزمون های آماری متعددی انجام شوند خطای نوع ۱ ممکن است افزایش یابد. بنابراین به دلیل انجام آزمون های آماری متعدد احتمال به دست آمدن حداقل تیجه معنی دار بیشتر می شود. به دلیل این که تحلیل واریانس چند متغیری، متغیرهای وابسته را یک گروه در نظر می گیرد، تحلیل های کمتری انجام می شوند و احتمال خطای نوع ۱ کاهش می یابد. اگر تحلیل واریانس چند متغیری معنی دار شود ، تحلیل گر می تواند در مورد هر یک از متغیرهای وابسته یک تحلیل واریانس جداگانه انجام دهد تا ببیند چه چیزی باعث معنی داری آماری شده است، درست مثل ه آزمون های تعقیبی که پس از معنی دار شدن تحلیل واریانس، برای مقایسه گروه های خاص، به کار می روند . هم چنین تحیل گر می تواند از روش نزولی استفاده کند، یعنی متغیرها را یکی یکی حذف کند تا ببیند کدام متغیر باعث معنی داری نتیجه شده است ( تاباچتیک و فیدل، ۲۰۰۱) .

 

هابرتی و موریس منطق این روش را زیر سوال برده اند . آن ها ادعا می کنند تحلیل واریانس چند متغیری به طور یکنواخت خطای نوع ۱ را کاهش نمی دهد و عمدتا زمانی مناسب است که تحلیل گر علاقه مند باشد متغیر وابسته را یک سیستم در نظر بگیرد یا زمانی که متغیر های وابسته از نظر مفهومی با هم مرتبط باشند و سازه های یکسان یا مشابهی را بسنجند . آن ها معتقدند استفاده از تحلیل واریانس در موارد زیر اولویت دارد : هنگامی که متغیر های وابسته از نظر مفهومی با هم ارتباط دارند ، هنگامی که پژوهش های قبلی از تحلیل های تک متغیری جداگانه استفاده کرده اند ( بنابراین می توانید داده هایتان را با داده های پژوهشگران قبلی مقایسه کنید ) ، و هنگامی که برابر بودن گروه ها را بررسی می کنید . توصیه ما این است که اگر متغیر های وابسته از نظر مفهومی با هم ارتباط دارند ، می توانید از تحلیل وارایانس چند متغیری استفاده کنید ، به شرطی که مفروضه های آن را رعایت کنید یا نوع خاصی از تحلیل واریانس چند متغیری ( مثلا اندازه های مکرر ) در برابر نقض مفروضه هایش مقاوم باشد . اگر متغیر های وابسته از نظر مفهومی با هم ارتباط ندارند ، می توانید سطح آلفا را اصلاح کنید تا در صورت لزوم از خطای نوع ۱ جلوگیری کنید . اگر در این موقعیت هنوز می خواهید از تحلیل واریانس چند متغیری استفاده کنید ، باید دلایل خوبی داشته باشید و بتوانید پاسخ های قانع کننده ای به منتقدان بدهید.

۰ نظر موافقین ۰ مخالفین ۰ ۲۹ مرداد ۹۹ ، ۲۳:۵۴
سید سعید انصاری فر

 

انواع رگرسیون لجستیک

هدف از نوشتن این مقاله بررسی رگرسیون لجستیک و انواع آن می باشد. رگرسیون لجستیک ابتدا در اوایل قرن بیستم در حوزه علوم زیستی مورد استفاده قرار گرفت و پس از آن به سرعت استفاده از این مدل آماری در سایر علوم بخصوص در حوزه علوم اجتماعی افزایش یافت. رگرسیون لجستیک زمانی استفاده می شود که متغیر وابسته  به صورت گروه بندی شده باشد.

متغیر وابسته می تواند ذاتا طبقه بندی شده باشد، بعنوان مثال :

  • آیا یک ایمیل اسپم است (1) یا اسپم نیست (0)
  • آیا یک تومور بدخیم است (1) یا خوش خیم (0)

متغیر وابسته می تواند ذاتا هم طبقه بندی شده نباشد و دارای مقیاس کمی فاصله ای یا نسبی باشد و خود محقق با توجه به سوال پژوهشی تحقیق، با در نظر گرفتن نقطه برش متغیر کمی موجود را به متغیر طبقه بندی شده تبدیل نماید و از رگرسیون لجستیک استفاده کند. بعنوان مثال:

  • آیا یک فرد چاق است (1) یا در وضعیت نرمال و یا کمی اضافه وزن قرارد دارد (0). مشخص است که وضعیت چاقی فرد با شاخص BMI سنجیده می شود و اگر شخصی شاخص BMI بیشتر از 30 داشته باشد آن شخص چاق می باشد. در واقع می توان از مدل رگرسیون لجستیک برای طبقه بندی وضعیت چاقی یک فرد استفاده کرد، واضح است که متغیر BMI یک متغیر کمی فاصله ای می باشد که ما با در نظر گرفتن نقطه برش 30≤BMI آنرا به یک متغیر گروه بندی شده تبدیل کردیم (افرادی با 30>BMI در گروه افرادی با وضعیت نرمال و کمی اضافه وزن  داشته باشند و افرادی که 30≤BMI دارند در گروه چاق قرار بگیرند).

انواع رگرسیون لجستیک

  1. رگرسیون لجستیک باینری یا دو وجهی (Binary logistic regression)
  2. رگرسیون لجستیک چند سطحی یا چند وجهی (Multinomial logistic regression)
  3. رگرسیون لجستیک ترتیبی (Ordinal logistic regression)

انواع رگرسیون لجستیک

در ادامه به صورت مجزا رگرسیون لجستیک و انواع آن را  مورد بررسی قرار می دهیم.

رگرسیون لجستیک دو وجهی 


در این مدل رگرسیونی متغیر وابسته به صورت دو وجهی می باشد لذا، تنها دو گروه خواهیم داشت.

رگرسیون لجستیک باینری، رگرسیون دو وجهی

مثال رگرسیون لجستیک دو وجهی

آیا یک ایمیل اسپم است (1) یا اسپم نیست (0)

نحوه مدل بندی در رگرسیون لجستیک دو وجهی

هدف از طراحی مدل لجستیک این است که با استفاده از یک سری متغیر مستقل پیش بینی انجام دهیم، بطوریکه اگر یک فرد جدید از جامعه ای که مدل سازی را بر اساس اطلاعات نمونه ای این جامعه انجام داده ایم را انتخاب کنیم مدل پیش بینی کند که فرد در کدام طبقه قرار می گیرد.

اما چرا در رگرسیون لجستیک از تابع logit بعنوان تابع ربط استفاده می کنیم؟؟

در واقع اگر بخواهیم برای احتمال مدل سازی را انجام دهیم، مدل به صورت:

 

P(yi=1)=βο+β1x1i+β2x2i+…+βkxkiP(yi=1)=βο+β¹x1i+β²x2i+…+βkxki

 

 

خواهد بود. که طرف راست مدل که یک ترکیب خطی از متغیر های مستقل است برابر با، مقدار احتمال تعلق داشتن به گروه اول ( کد 1 برای گروه اول و کد 0 برای گروه رفرنس ) می باشد که ممکن است هر مقداری از∞- تا ∞+ را اختیار کند (یک تناقض!!!!(چونکه احتمال بین صفر و یک است)).

استراتژی برای رفع مشکل

برای رفع این مشکل بجای مدل کردن احتمال تعلق داشتن به گروه 1 از مدل کردن odds تعلق داشتن به گروه 1 استفاده می شود (odds =احتمال تعلق داشتن به گروه 1 تقسیم بر تعلق نداشتن به گروه 1 )، زیرا odds می تواند هر مقدار بین صفر تا ∞+ را اختیار کند (چونکه نسبت دو مقدار بین صفر و یک، کمیتی بین صفر تا بی نهایت است)، اما همچنان نمی تواند مقادیر منفی را اختیار کند

حال اگر از (Ln(odds بجای odds برای مدل بندی استفاده کنیم در این صورت دیگر (Ln(odds هر مقداری بین ∞- تا ∞+ را می تواند اختیار کند و مشکل به صورت کلی حل خواهد شد. به این دلیل است که از لینک logit استفاده می شود و این مدل رگرسیونی را رگرسیون لجستیک می نامند. لذا مدل رگرسیون لجستیک به صورت زیر می باشد:

                                                                                                               

ln(P(yi=1)P(yi=0))=βο+β1x1i+β2x2i+…+βkxki→ln(P(yi=1)1−P(yi=1))=βο+β1x1i+β2x2i+…+βkxkiln(P(yi=1)P(yi=0))=βο+β¹x1i+β²x2i+…+βkxki→ln(P(yi=1)1-P(yi=1))=βο+β¹x1i+β²x2i+…+βkxki

 

با در نظر گرفتن                                                                                                            

p(yi=1)=π1وp(yi=0)=ποp(yi=1)=π¹وp(yi=0)=πο

 

 

 

π1=exp (βο+β1x1i+β2x2i+…+βkxki)1+exp (βο+β1x1i+β2x2i+…+βkxki)π1=exp (βο+β¹x1i+β²x2i+…+βkxki)1+exp (βο+β¹x1i+β²x2i+…+βkxki)

 

 

                                                                                                                                                                       

رگرسیون لجستیک چند سطحی


در این مدل رگرسیونی متغیر وابسته چند وجهی (سه گروه و بیشتر ) می باشد. فی الواقع همانند رگرسیون لجستیک دو وجهی در اینجا نیز می خواهیم بر اساس یکسری از متغیر های پیشگو، پیش بینی کنیم که یک نمونه جدیدبر اساس مدل در کدام یک از گروه ها قرار می گیرد.

رگرسیون چند سطحی، رگرسیون چند وجهی

مثال رگرسیون لجستیک چند سطحی

فرض کنید شغل های موجود در یک جامعه را در چهار گروه طبقه بندی کرده ایم و می خواهیم بررسی کنیم که آیا انتخاب شغل افراد در جامعه می تواند تحت تاثیر سطح تحصیلات آنها و شغل پدارانشان قرار بگیرد. برای بررسی این موضوع از مدل رگرسیون چند جمله ای می توان استفاده نمود و متغیر پاسخ در این مثال رده های شغلی می باشند که یک متعیر اسمی با چهار سطح است.

نحوه مدل بندی در رگرسیون لجستیک چند سطحی

فرض کنید J تعداد گروه ها برای متعیر پاسخ (Y) باشد و مجموعه زیر بیانگر احتمال های مربوط به هر گروه پاسخ باشد.                                                           

{π1,π2,…,πJ}{π¹,π²,…,πJ}

بطوریکه:

 

 

∑j(πj)=1∑j(πj)=1

 

 

رگرسیون چند سطحی به طور همزمان تمام جفت گروه ها ( گروه رفرنس با سایر گروه ها) را با استفاده ار odds متغیر پاسخ آنها مدل می کند. در این نوع مدل بندی ترتیب گروه بندی اهمیتی ندارد چرا که مدل برای متغیر پاسخ، مقیاس اسمی را در نظر می گیرد.

نحوه مدل بندی

با در نظر گرفتن تنها یک متغیر پیشگو (صرفا برای سادگی) و گروه J بعنوان گروه رفرنس، مدل هایی که پاسخ یا در گروه j-ام  قرار می گیرد یا در گروه رفرنس به صورت زیر می باشد.

 

ln(πjπJ)=βο+β1x          j=1,2,…,J−1ln(πjπJ)=βο+β¹x          j=1,2,…,J-1

این مدل J-1 معادله دارد که هر معادله ضرایب متفاوتی خواهد داشت.

 

نرم افزار های آماری تمام J-1 معادله را به صورت همزمان برازش می دهند. که در این حالت ضرایب برآورد شده دقیقتری (دارای انحراف استاندارد کمتر)  خواهیم داشت نسبت به حالتی که برای هر یک از J-1 جفت گروه به صورت جداگانه مدل لجستیک دو وجهی برازش داده شود . نکته حائز اهمیت این است که اگر از مدل رگرسیون چند سطحی که به صورت همزمان ضرایب تمام J-1 معادله  را برآورد می کند، انتخاب گروه رفرنس کاملا اختیاری می باشد و تاثیری در برآورد ضرایب نخواهد داشت. 

رگرسیون لجستیک ترتیبی


زمانی که متغیر پاسخ به صورت ترتیبی می باشد مدل لجستیک می تواند از این ترتیب ها استفاده کند. در نتیجه نتایجی که از  مدل لجستیک ترتیبی حاصل می شود به نسبت مدل لجستیک چند سطحی (که متغیر پاسخ را به صورت یک متغیر اسمی در نظر می گیرد) تفسیرپذیرتر و دارای توان آماری بیشتر خواهد بود.

رگرسیون لچستیک ترتیبی، رگرسیون لچستیک اوردینال

مثال رگرسیون لجستیک ترتیبی

یک محقق بازاریابی در یک شرکت می خواهد عوامل تاثیرگذار بر سایز نوشابه ( کوچک، متوسط و بزرگ) را که توسط مردم در فست فود های زنجیره ای سفارش داده می شود مورد بررسی قرار دهد. نوع ساندویج سفارش داده شده، سفارش سیب زمینی سرخ شده و سن مشتریان بعنوان عوامل تاثیرگذار بر سفارش سایز نوشابه می باشد. همانطور که مشخص است متغیر پاسخ(سایز نوشابه)، یک متغیر ترتیبی می باشد.

نحوه مدل بندی در رگرسیون لجستیک ترتیبی

در این نوع مدل از رگرسیون لجستیک، از احتمال تجمعی برای متغیر پاسخ استفاده می شود. برای گروه پاسخ j، احتمال تجمعی برابر

p(y≤j)=π1+π2+…+πj  ,  j=1,…,Jp(y≤j)=π¹+π²+…+πj  ,  j=1,…,J

می باشد.

 

 

logit[p(y≤j)]=ln[p(y≤j)1−p(y≤j)]=ln[π1+π2+…+πjπj+1+πj+2+…+πJ]    j=1,…,J−1logit[p(y≤j)]=ln[p(y≤j)1-p(y≤j)]=ln[π¹+π²+…+πjπj+1+πj+2+…+πJ]    j=1,…,J-1

 

 

در واقع مدل logit تجمعی شبیه به مدل رگرسیون باینری می باشد. بطوری که گروه 1 تا j  در گروه اول و گروه j+1 تا J در گروه دوم در نظر گرفته می شود. در مدل رگرسیون ترتیبی می توان خاصیت نسبتی بودن odds را بررسی کرد.

در این مقاله به بررسی رگرسیون لجستیک و انواع آن پرداختیم، حال می خواهیم وجه های مثبت رگرسیون لجستیک نسبت به تحلیل تشخیصی را مورد بررسی قرار دهیم.

تفاوت رگرسیون لجستیک و تحلیل تشخیصی (ممیزی)


رگرسیون لجستیک هیچ پیش فرض خاصی برای توزیع متغیر ها در نظر نمی گیرد در حالی که در تحلیل تشخیصی فرض نرمال بودن متغیر ها ضروری می باشد. لذا در حجم نمونه زیاد، این دو روش نتایج تقریبا یکسانی خواهند داشت، چونکه در حجم نمونه زیاد توزیع متغیرها به نرمال بیشتر گرایش پیدا می کنند.(وقتی حجم نمونه کم است (کمتر از 50) و یا توزیع متغیر ها نرمال نمی باشد، استفاده از روش تحلیل تشخیصی از لحاظ تئوری اشتباه می باشد)

فرض دیگری که باید برای استفاده از تحلیل تشخیصی درنظر گرفته شود، عدم وجود رابطه هم خطی بین متغیر های مستقل می باشد.(یعنی متغیر های مستقل با هم همبستگی بالایی نداشته باشند)

رگرسیون لجستیک زمانی که متغیر های مستقل کمی فاصله ای، نسبتی، کیفی، ترتیبی و یا ترکیبی از اینها باشد و یا اگر بین متغیر های مستقل همخطی نیز وجود داشته باشد، می تواند مورد استفاده قرار بگیرد.لذا همواره کاربرد بیشتری خواهدداشت.

۰ نظر موافقین ۰ مخالفین ۰ ۲۹ مرداد ۹۹ ، ۲۲:۲۵
سید سعید انصاری فر

نحوه نگارش فصل دوم پایان نامه

چگونه فصل دوم پایان نامه را بنویسیم ؟

اگر میخواین با نحوه نگارش فصل دوم پایان نامه آشنا بشین و فصل دوم پایان نامتون رو بنویسن و نمی‌دونین از کجا شروع کنین این مقاله میتونه در این مورد بهتون کمک کنه. البته من نمیخوام متود پایان نامه نویسی رو آموزش بدم. بیشتر قصدم اینه که یه جهتی رو نشون بدم و بگم به چه سمتی باید حرکت کرد.

این فصل معمولا با عنوان‌های “بررسی مبانی نظری پژوهش“، “ادبیات نظری و پیشینه پژوهش” و یا “بررسی ادبیات موضوع” نام گذاری میشه و به طور خلاصه داخلش به بررسی مطالعات انجام شده در خصوص موضوع پژوهش پرداخته میشه.

البته طبیعیه که طبق فرمت دانشگاه و بنا به نظر استادها عنوان فصل دوم پایان نامه با همین مضامین تغییر کنه.

به صورت ساده تر بگم : در این فصل متغیرهای تحقیق (کلیدواژه‌ها) از لحاظ نظری بررسی شده و باید نظریه های مهمی که محققین قبلی در مورد متغیرهای پژوهش ما کارکردن شرح داده بشن.

مقدمه فصل دوم پایان نامه را چگونه بنویسیم ؟

در بخش مقدمه فصل دوم پایان نامه علاوه بر این که به صورت خلاصه در مورد موضوع پژوهشمون صحبت می کنیم، می تونیم مشخص کنیم این فصل شامل چند قسمت یا بخش میشه و داخل این فصل می خوایم چیکار کنیم ؟ برای مثال متن زیر رو به عنوان نمونه مقدمه فصل دوم پایان نامه بررسی می کنیم :

عنوان پایان نامه : بررسی ارتباط فناوری اطلاعات و کیفیت تصمیم گیری سازمانی

نمونه مقدمه فصل دوم پایان نامه

هدف از این بخش، بررسی پژوهش ­ها و مطالعاتی است که در زمینه فناوری اطلاعات و کیفیت تصمیم گیری انجام گرفته است. این قسمت از تحقیق خواننده را با کارها و زمینه­ های قبلی و همچنین با حیطه موضوع مورد مطالعه آشنا می­ سازد و به پنج بخش تقسیم شده است. در بخش اول به بیان مقدمه، در بخش دوم به مطالعه مبانی نظری و تحقیقات انجام شده در رابطه با تکنولوژی و فناوری اطلاعات، در بخش سوم مبانی نظری و مطالعات و بررسی­ های انجام شده در رابطه با نرخ تصمیم گیری، بخش چهارم به بیان پیشینه تحقیق داخلی و خارجی و در انتها چارچوب نظری و مدل مفهومی پژوهش معرفی می ­شود.

همونطوری که در بالا مشاهده می کنیم در بخش مقدمه فصل دوم این پایان نامه، محقق ابتدا فناوری اطلاعات و مدل های نظریش رو توضیح داده و بعد رفته سراغ متغیر بعدی که متغیر کیفیت تصمیم گیری هستش. در ادامه مبانی نظری نرخ تصمیم گیری شرح داده شده و بعد قسمت های بعدی که در ادامه بیشتر توضیح میدم. برای نگارش مقدمه فصل دوم پایان نامه مثال زیر هم میتونه کمک کننده باشه :

عنوان پایان نامه : اولویت بندی عوامل موثر بر کیفیت خدمات بیمه ای

مثال دوم برای مقدمه فصل دوم پایان نامه

امروزه کیفیت خدمات به یک ابزار کلیدی بازاریابی برای دستیابی به تمایز رقابتی و ترویج وفاداری مشتری تبدیل شده است. رمز موفقیت سازمان‌های برتر ارائه کننده خدمات را نیز میتوان در مشتری مداری و توجه به کیفیت خدمات آنان جستجو کرد. کیفیت خدمات نقش مهمی در صنایع خدماتی نظیر خدمات بیمه‌ای، بانکی و حمل و نقل و…. ایفا می کند. چرا که کیفیت خدمات برای دستیابی به ادراک مشتریان و به دنبال آن، بقا و سودآوری سازمان امری حیاتی به شمار می رود.

شرکت های بیمه برای حفظ موجودیت خود و دستیابی به رشد و نیز ایفاء نقش بهتر در صحنه اقتصاد کشور، بویژه در شرایط رقابتی حال حاضر بازار بیمه کشور باید به کیفیت خدمات خود توجه نمایند. از آنجایی که خدمات بیمه ای جزو خدمات با پیچیدگی بالا محسوب می شوند لازم است ابزار مناسبی با در نظر گرفتن ویژگی های این خدمات برای سنجش کیفیت مورد استفاده قرار گیرد. در این فصل به بررسی ادبیات مربوط به این تحقیق، تئوری های پایه در زمینه موضوع مورد بررسی و پیشینه تحقیق پرداخته می‌شود.

با خوندن متن بالا میبینیم که محقق برای نگارش مقدمه فصل دوم ابتدا توضیحاتی در مورد موضوع پایان نامه و در انتها به صورت کلی گفته که قرار هست در فصل دوم پایان نامه چه اتفاقی بیفته و چه چیزی نوشته بشه.

نحوه نوشتن مبانی نظری تحقیق

بعد از نوشتن مقدمه و مشخص کردن بخش هایی که قرار هست در این فصل نوشته بشه نوبت به نگارش مبانی نظری متغیرهای پژوهش هست. به طور معمول برای متغیرهای تحقیق باید (تاریخچه، تعاریف مختلف از چند نویسنده معتبر، نظریه های علمی، مزایا و معایب بررسی، عواملی که بر اون متغیر تاثیر می گذارند، عواملی که متغیر می تونه بر آن ها تاثیر بگذاره و بررسی ارتباط متغیرها) در فصل دوم پایان نامه آورده بشه.

برای مثال اگر موضوع پایان نامه ما بررسی ارتباط فناوری اطلاعات و کیفیت تصمیم گیری سازمانی هست عناوین زیر برای نوشتن مبانی نظری میتونه مناسب باشه :

  • مفهوم فناوری اطلاعات
  • تاریخچه پیدایش و تحول فناوری اطلاعات
  • مولفه های فناوری اطلاعات
  • مزایای فناوری اطلاعات
  • مدل های بکارگیری و پذیرش فناوری اطلاعات
  • نظریه های علمی پذیرش فناوری اطلاعات در سازمان
  • تاثیر فناوری اطلاعات بر سازمان ها

همچنین برای متغیر کیفیت تصمیم گیری عناوین زیر مناسب است :

  • مفهوم تصمیم گیری سازمانی و انواع آن
  • مدل های نظری کیفیت تصمیم گیری
  • عوامل موثر بر کیفیت تصمیم گیری
  • روش ها و انواع سبک های تصمیم گیری
  • سیستم پشتیبان تصمیم گیری
  • فواید و ویژگی های پشتیبان تصمیم گیری

و در انتهای این قسمت هم به بررسی مبانی نظری و نظریه های علمی موجود در خصوص ارتباط فناوری اطلاعات و کیفیت تصمیم گیری پرداخته میشه.

جهت نگارش فصل دوم پایان نامه از چه سایت هایی استفاده کنیم ؟

برای این که بتونیم فصل دوم پایان نامه رو بنویسیم نیازه که از منابع اطلاعاتی مختلفی استفاده کنیم. می دونیم کتاب و مقاله مهم ترین این منابع هستن. برای استفاده از کتاب های فارسی متناسب با موضوع پایان نامتون که می تونید از کتابخونه دانشگاهتون استفاده کنید. اما برای دسترسی به کتاب های لاتین و همچنین مقالات فارسی و لاتین میتونید از سایت های زیر استفاده کنید :

1- گوگل اسکالر (google scholar)

به نظر بنده مناسب ترین سایت برای جست و جوی مقالات و کتاب های لاتین، سایت گوگل اسکالر هست. شما میتونید جست و جوی مقالات رو از لحاظ زمانی فیلتر گذاری کنید، برای مثال میتونید تعیین کنید که برای جست و جو، مقالات 2017 و جدید تر نمایش داده بشه. خیلی ساده میتونید منبع اون مقاله رو هم به فرمت های مختلف (APA, ونکوور و …) جهت استفاده در فهرست منابع، دریافت کنید.

نحوه نگارش فصل دوم پایان نامه

1-سایت علم نت

وبسایت علم نت در واقع همون گوگل اسکالر ایرانی هست و همون کاری رو انجام میده که گوگل اسکالر برای مقالات لاتین میکنه. میتونیم از طریق علم نت به تمامی مجلات علمی پژوهش، تمامی کنفرانس ها و به طور کلی بگم به تموم کتاب خونه های ایرانی به صورت یکجا دسترسی داشته باشیم. فیلتر نوع جست و جو (کتاب، مقاله نشریه، مقاله کنفرانسی، پایان نامه ها و غیره) و فیلتر زمان چاپ مقاله مورد نظر می تونه در جست و جوی بهتر در این سایت به ما کمک کنه. پس از این که مقاله (از نوع نشریه) مورد نظرتون رو سرچ کردید برای دانلود میتونید با سرچ کردن همون عنوان در گوگل به صورت رایگان فایل مورد نظرتون رو دانلود کنید. استخراج منابع  به فرمت های مختلف برای درج در فهرست منابع پایان نامه از امکانات دیگه این سایت محسوب میشه.

نگارش فصل دوم پایان نامه

3-گنج ایرانداک

مطمعنا بهترین سایتی که می تونه به نگارش فصل دوم پایان نامه کمک کنه پایگاه گنچ ایرانداک هست. با ثبت نام و داشتن یک اکانت در سایت گنج تازه ایرانداک میتونید هفته ای 5 پایان نامه به صورت کامل ! و اون هم به صورت رایگان دریافت کنید.

نحوه نوشتن فصل دوم پایان نامه

نحوه نگارش پیشینه تحقیق فصل دوم پایان نامه

در قسمت پیشینه تحقیق فصل دوم پایان نامه به مرور نتایج و یافته­ های تحقیقات انجام شده در داخل و خارج ایران پرداخته میشه. میتونیم از طریق جست و جو در پایگاه های اطلاعات پژوهشی که در بالا معرفی شد منابعی که با موضوع پایان نامه شباهت دارند رو پیدا کنیم و با استفاده از چکیده شون پیشینه پژوهشمون رو بنویسیم. بهتره منابعی رو انتخاب کنیم که جدید باشند و حداکثر 5 سال از زمان نوشتنشون گذشته باشه. معمولا پیشینه پژوهش به فرمت زیر نوشته میشه :

فامیلی نویسنده ها + سال چاپ + موضوع مقاله + روش تحقیق + نتایج

متن زیر به عنوان مثال برای نحوه نگارش پیشینه تحقیق آورده شده :

گیلینگهام (2017) در مقاله ­ای با عنوان تصمیم ­گیری در مورد بکارگیری فناوری اطلاعات به بررسی عوامل موثر بر اتخاذ و بکارگیری سیستم های اطلاعاتی و کاربرد آن بر کیفیت تصمیم گیری پرداخت. نتایج تحقیق وی نشان می­ دهد که از جمله مهمترین عوامل تاثیرگذار بر انتخاب و بکارگیری سیستم ­های اطلاعاتی، افزایش سرعت و دقت در تصمیم­ گیری می­ باشد.

نیکوفکر و دانایی (1397) در پژوهش خود تحت عنوان “بررسی نقش تجربه در فرآیند تصمیم‌گیری مدیران (مطالعه موردی: شعب بانک کشاورزی شهر مشهد)” به بررسی نقش تجربه در فرآیند تصمیم گیری مدیران بانک کشاورزی شهر مشهد پرداختند. روش پژوهش از لحاظ هدف کاربردی و از لحاظ نحوه جمع ­آوری داده ها به صورت توصیفی پیمایشی بود بر مبنای این متغیرهای تحقیق، پرسش نامه ای مبتنی بر 16 سوال طراحی گردید و روایی آن از طریق خبرگان،  و پایایی آن (0.76) بود که مورد تایید قرار گرفت.

نتایج حاصل از آزمون t-استیودنت تک گروهی با استفاده از نرم افزار SPSS نشان می­ دهد که تجربه بر فرآیند تصمیم­گیری مدیران نقش موثر و معناداری دارد همچنین ابعاد همانندسازی در فرآیند تصمیم­ گیری، کاهش خلاقیت و نوآوری در فرآیند تصمیم گیری، کاهش ریسک و خطرپذیری در فرآیند تصمیم ­گیری، افزایش سرعت در فرآیند تصمیم­ گیری نیز بر فرآیند تصمیم گیری مدیران نقش موثر و معناداری را دارند.

جدول خلاصه پیشینه داخلی و خارجی پژوهش

خیلی خوبه که خلاصه ای از پیشینه پژوهش که در قسمت قبل گفتم رو به صورت جدولی تحت عنوان جدول خلاصه نتایج تحقیقات قبلی (یا جدول خلاصه نتایج پیشینه تحقیق) در انتهای فصل دوم بیاریم.

جدول خلاصه نتایج پیشینه تحقیق

 

محقق سال انتشار نتایج
گیلینگهام 2017 از جمله مهمترین عوامل تاثیرگذار بر انتخاب و بکارگیری سیستم ­های اطلاعاتی، افزایش سرعت و دقت در تصمیم­ گیری می­ باشد.
نیکوفکر و دانایی 1397 تجربه بر فرآیند تصمیم­گیری مدیران نقش موثر و معناداری دارد همچنین ابعاد همانندسازی در فرآیند تصمیم­ گیری، کاهش خلاقیت و نوآوری در فرآیند تصمیم گیری، کاهش ریسک و خطرپذیری در فرآیند تصمیم ­گیری، افزایش سرعت در فرآیند تصمیم­ گیری نیز بر فرآیند تصمیم گیری مدیران نقش موثر و معناداری را دارند

 

این کار علاوه بر این که باعث میشه پیشینه تحقیقمون یه انسجام کلی پیدا کنه، مقایسه کردن نتایج تحقیقات قیلی توسط خواننده خیلی راحت تر صورت می‌گیره.

نکات مهم برای نحوه نگارش فصل دوم پایان نامه

1-بهتر است که برای نوشتن فصل دوم پایان نامه تمامی اطلاعات جمع آوری شده را از زبان خودتان خلاصه نویسی کنید و در مطلب خود با خلاقیت خودتان جدول و اشکالی را که مرتبط با بحث هستند اضافه کنید.

2- در نگارش مبانی نظری در فصل دوم پایان نامه بایستی به نحوه نگارش نیز دقت داشته باشید، سعی کنید یکپارچگی متن، تیترها، روش منبع نویسی و ارجاع دهی مطالب را رعایت کنید. وجود بهم ریختگی در متن فصل دوم این فکر را در سر می پروراند که مطالب نگارش شده کپی است.

3- مطالب نوشته شده باید انسجام داشته باشند. یعنی هر مطلب باید تکمیل کننده و در راستای مطلب قبلی باشد. رعایت آیین نامه نگارشی، اندازه و نوع قلم فونت، فاصله بین خطوط بر اساس فرمت دانشگاه و نظر اساتید نیز باید رعایت شود.

سخن آخر

موارد ذکر شده در بالا، جهت آموزش فصل 2 پایان نامه صرفا بر اساس تجربه کاری فردیست. ممکن است ساختار دانشگاه و نظر اساتید شما در رابطه با نحوه نگارش فصل دوم پایان نامه متفاوت باشد. همچنین مطالب گفته شده در خصوص نحوه نگارش فصل دوم برای پایان نامه ارشد می باشد. طبیعی است که انجام فصل دوم پایان نامه در مقطع دکتری پیچیدگی های خاص خود را دارد.

۰ نظر موافقین ۰ مخالفین ۰ ۱۹ مرداد ۹۹ ، ۲۰:۰۹
سید سعید انصاری فر
    •  
    •  

    یکی از پرکاربردترین روش‌های آماری برای تجزیه و تحلیل داده ها در علوم مختلف، رگرسیون خطی ساده یا چندگانه است. در تحلیل رگرسیون نوع روابط متغیرها و این که آیا یک متغیر می تواند در متغیر دیگر تأثیرگذار باشد یا خیر، بررسی می شود. به عبارت دقیق‌تر بر اساس اطلاع از یک یا چند متغیر مستقل، می‌توان یک معادله رگرسیونی نوشت و از آن برای پیش‌بینی مقادیر متغیر وابسته استفاده کرد. (برای مثال : پیش‌بینی وزن افراد به وسیله فشار خون، قند خون و چربی خون افراد / پیش‌بینی عملکرد شرکت بر اساس مسئولیت اجتماعی، اهرم مالی و ساختار مالکیت).

    برای استفاده از این روش آماری، پیش فرض هایی ذکر گردیده است :

    پیش‌فرض‌های رگرسیون خطی

    1) نرمال بودن توزیع مانده‌ها

    2) همسانی واریانس مانده‌ها

    3) عدم وجود همبستگی سریالی در مانده‌ها

    4) عدم وجود همخطی میان متغیرهای مستقل (رگرسیون چندگانه)

    بررسی پیشفرض نرمال بودن مانده‌ها

    اجازه دهید با ارائه مثالی مفهوم این که چرا باید باقی مانده های بدست آمده از مدل رگرسیون دارای توزیع نرمال باشند را برایتان توضیح دهم. فرض کنید نمرات ریاضی و آی‌کیو تعداد 10 نفر از دانش آموزان را به صورت فرضی داشته باشیم. این نمرات به شرح زیر هستند :

    جدول (1) داده های فرضی دانش آموزان

    به وسیله‌ی این داده‌ها مدل رگرسیونی برای پیش بینی نمرات آی کیو به توسط نمرات ریاضی دانش آموزان به وسیله مدل زیر برآورد می‌شود :

    حال از طریق جای گذاری نمرات ریاضی دانش آموزان در فرمول فوق مقادیر پیش بینی شده نمرات آی کیو در جدول (1) بدست می‌آید. از تفریق مقادیر واقعی آی کیو از مقادیر پیش بینی شده، مانده ها یافت می شود (ستون آخر جدول (1)). حال مسئله اساسی این است که چرا این اعداد باید نرمال باشند ؟

    شکل (1) تابع چگالی توزیع نرمال

    شکل (1) تابع چگالی توزیع نرمال را نشان می‌دهد. منحنی توزیع نرمال، زنگوله شکل است، نسبت به محور عمودی خود متقارن است و بیشتر داده‌ها را حول میانگین جای می‌دهد. با توجه به نمودار ملاحظه می‌شود میانگین برابر صفر است (وسط نمودار). همانطور که ملاحظه می‌کنید 95 داده‌ها حول صفر قرار دارند و فقط 5 درصد داده‌ها نسبت به میانگین اعدادی پرت هستند. حال اگر به مانده‌های جدول (1) نگاه کنیم می‌بینیم که همگی حول عدد صفر (میانگین) قرار دارند (اگر مانده‌ای عدد صفر اختیار کند بدین معناست که مقدار پیش‌بینی شده با مقدار واقعی برابر است.) بنابراین وقتی می‌گوییم یکی از پیشفرض‌های رگرسیون نرمال بودن مانده‌ها است بدین معنی است که اکثر مانده‌ها (95 درصد) نزدیک به صفر بوده و فقط اندکی از آن‌ها (5 درصد) از صفر دور باشند. به عبارت دیگر اکثر مقادیر پیش بینی شده نزدیک به مقادیر واقعی بوده و فقط اندکی از مقادیر پیش بینی شده با مقادیر واقعی تفاوت زیادی داشته باشد (بدین معنی که دقت پیش بینی بالا باشد).

    ۱ نظر موافقین ۰ مخالفین ۰ ۱۹ مرداد ۹۹ ، ۱۹:۵۴
    سید سعید انصاری فر


    همیشه باید داده ­هایی (اطلاعاتی) که وارد برنامه ­هایی مانند اِکسل یا SPSS می­ کنیم را بررسی و بازبینی کنیم. همواره احتمال دارد که در داده ­ها با مقادیر غیرعادی مواجه شویم. موارد غیرعادی می ­تواند شامل مقادیر تعریف نشده و مقادیر پِرت (دور افتاده) باشد. همواره قبل از انجام هرگونه تحلیل آماری بر روی داده ­ها، باید چاره ­ای در مورد مقادیر پرت بیندیشیم.
    افرادی که اندازه­ های انتهایی یا غیرمعمول در یک متغیر واحد (تک متغیری) یا در ترکیبی از متغیرها (چندمتغیری) دارند، دور افتاده یا پرت نامیده می­ شوند. داده ­های پرت اغلب سه یا بیش از سه واحد انحراف معیار (SD3±) از میانگین مربوط به خودشان فاصله دارند که از مشکلات احتمالی در ابزار اندازه­ گیری، شیوه ثبت یا ضبط پاسخ­ ها یا عضویت شرکت­ کنندگان در جامعه ه­ای که فرض می ­شود از آن نمونه ­گیری شده است، ناشی می ­شود. حضور داده ­های پرت می­ تواند نتایج تحلیل را به گونه ه­ای نامطلوب تحت تأثیر قرار دهد(تحریف کند). به همین دلیل بیشتر متخصصان پیشنهاد می­ کنند که اندازه­ های پرت قبل از تحلیل داده­ ها باید حذف شوند.

    انواع داده ­های پرت
    داده­ های پرت را می توان در دو دسته­ داده ­های پرت تک متغیری و داده­ های پرت چند متغیری تقسیم کرد:.
    1) داده­ های پرت تک متغیری
    داده­ های پرت تک متغیری مربوط به یک متغیر می ­شوند. به عنوان مثال وقتی که در یک پژوهش دانشجویی در زمینه میزان رضایت مردم از عملکرد شهرداری تهران؛ ما در متغیر سن افراد با عدد 150 روبرو می­ شویم!، به احتمال زیاد با داده پرت مواجه شده ایم. چرا که می ­دانیم احتمال وجود فردی با چنین سن و سالی بسیار بعید است! و یا وقتی که در متغیر درآمد، شخصی درآمد ماهانه خود را از یک کار تمام وقت 25 هزار تومان اعلام می­ کند و یا وقتی که در پاسخ سوالی که از فرد می ­پرسیم تا چه اندازه به آینده امیدوار است و او باید میزان رضایت خود را از عدد 1 (به معنای خیلی کم) تا عدد 5 (به معنی خیلی زیاد) اعلام کند، در فایل داده ­ها با عدد 6 روبرو می شویم (به دلیل اشتباه در ورود داده)، همگی نشان از وجود داده ­های پرت تک متغیری دارد که نخست باید آن­ها را شناسایی کرد و سپس در مورد آن­ها چاره­ ای اندیشید.
     البته زمانی که با متغیرهای کیفی (اسمی و ترتیبی) سروکار داریم گاهی با مقادیری در داده­ ها روبرو می­ شویم که داده پرت محسوب نمی­ شوند اما مقادیری هستند که به اشتباه وارد شده­ اند و باید حذف شوند. مثلا در متغیر جنس، اگر ما زنان را با کد 1 و مردان را با کد 2 تعریف کرده باشیم و در این­ حال با عدد 1.5 در داده­ ها مواجه شویم؛ با داده پرت مواجه نیستیم اما با داده های اشتباه مواجه شده­ ایم (به دلیل اشتباه پاسخگو در پاسخ به سوال یا اشتباه در ورود داده) و باید آن­ها را شناسایی کرده و حذف یا اصلاح نماییم.

    شناسایی داده­ های پرت تک متغیری
    برای شناسایی داده­ های پرت تک متغیری باید از جدول فراوانی و نمودار جعبه ­ای استفاده کرد. از جدول فراوانی برای شناسایی داده ­های پرت در متغیرهای اسمی و ترتیبی استفاده می­ کنیم و از نمودار جعبه ­ای برای شناسایی داده ­های پرت در متغیرهای فاصله­ ای/­نسبی. البته از جدول فراوانی هم می ­توان برای شناسایی داده ­های پرت در متغیرهای فاصله­ ای/نسبی استفاده کرد ولی نمودار جعبه­ ای برتری دارد و آسان ­تر است.

    الف) جداول فراوانی
    از جدول فراوانی برای کشف مقادیر پرت تک متغیری در متغیرهای اسمی و ترتیبی استفاده می­ کنیم. متغیرهایی مثل جنس، وضعیت تاهل، قومیت، تحصیلات و درآمد (هر دو به صورت چندگزینه­ ای و ترتیبی سنجیده شده باشند، مثلا تحصیلات در قالب سوالات دیپلم، فوق دیپلم، لیسانس و... سنجیده شده باشد) و یا تمام سوالاتی که در قالب طیف لیکرت سنجیده شده باشند. یعنی سوالاتی که پاسخ­ های آنان معمولا 3 تا 7 گزینه دارد و پاسخ ­هایی مثل کاملا موافقم تا کاملا مخالفم، اصلا تا همیشه و خیلی ­کم تا خیلی ­زیاد را در برمی ­گیرد. همچنین اگر متغیری فاصله ­ای/نسبی داشته باشیم که تعداد طبقات آن محدود (مثلا حدود 10 طبقه) باشد، می ­توانیم از جدول فراوانی استفاده کنیم.

    مثال                 
    در یک پژوهش (فرضی) از دانشجویان دختر و پسر دانشگاه شهید بهشتی خواسته شد تا میزان رضایت خودشان از عملکرد ریاست دانشگاه را اعلام کنند. بر این اساس از دانشجویان تعدادی سوال پرسیده شد که دو سوال آن عبارت بود از جنس دانشجویان و میزان رضایت­شان از عملکرد ریاست دانشگاه. جنس دانشجویان شامل دو جنس (دختر کد 1،  و پسر کد 2) و میزان رضایت در طیف لیکرت 5 گزینه ­ای (خیلی کم کد 1، کم کد 2 ، متوسط کد 3، زیاد کد 4 و خیلی زیاد کد 5) سنجیده شد. همان­طور که مشاهده می­ شود ما هنگام ورود اطلاعات مربوط به جنس افراد به دانشجویان دختر کد یا عدد 1 و به دانشجویان پسر کد 2 داده ­ایم و در فایل داده­ ها و خروجی (برون­داد) مربوط به آن، تنها باید عدد 1 و عدد 2 مشاهده کنیم. در مورد متغیر میزان رضایت هم تنها باید اعداد 1، 2، 3، 4 و 5 را مشاهده کنیم و نباید اعداد دیگری را (مثلا 6، 1.5، 20) مشاهده کنیم.

    اجـ ـرا:
    دستور فراوانی را اجرا می­ کنیم:

    Analyze --->Descriptive Statistics --->Frequencies



     نتـ ـایج:
    نتایج جدول فراوانی دو متغیر جنس و میزان رضایت در ادامه ارائه شده است. در جدول فراوانی جنس افراد مقادیر پرت مشاهده نمی ­شود، چرا که تنها دو کد یا طبقه 1 و 2 (دختر و پسر) وجود دارند. توجه شود که داده­ های گمشده (Missing) جزء داده های پرت به حساب نمی ­آیند. ما در فایل داده­ ها مقادیر گمشده را با عدد 9 نشان داده­ ایم و در فایل خروجی اعداد گمشده با عدد 9 ظاهر شده­ اند. به غیر از اعداد 1 و 2 و مقادیر گمشده، عدد دیگری در فایل خروجی جنس دانشجویان دیده نمی ­شود و بدین معناست که در متغیر جنس دانشجویان داده پرت وجود ندارد.
    اما در متغیر میزان رضایت ما با اعدادی غیر از 1 ، 2، 3، 4 و 5 مواجه­ ایم و این اعداد مقادیر گمشده هم نیستند و نشان می دهد که دو مقدار پرت در داده ­ها وجود دارد (1.3 و 22) که باید در فایل داده­ ها شناسایی و حذف شود. چون پاسخگویان تنها می ­توانستند یکی از اعداد 1، 2، 3، 4 و 5 را انتخاب کنند در نتیجه اعداد دیگری که وجود دارند (1.3 و 22) مقادیر پرت حساب می­ شوند و باید از تحلیل حذف شوند.
    لازم به ذکر است که عدد 1.3 داده پرت به حساب نمی آید و یک داده غیر­عادی و تعریف نشده است. در این­جا به جهت آسان ­تر شدن آموزش، داده­ های غیرعادی و تعریف نشده در ارتباط با متغیرهای اسمی و ترتیبی را داده پرت به حساب آورده ایم.

     

    منبع: کتاب "راهنمای آسان تحلیل آماری با SPSS" تالیف آقای رامین کریمی

    ۰ نظر موافقین ۰ مخالفین ۰ ۱۳ مرداد ۹۹ ، ۱۳:۲۴
    سید سعید انصاری فر

    پس از آموزش نحوه ورود داده ها و رسم مدل و برآورد ضرایب مدل و بررسی معنی داری آن نوبت به آن است که به بررسی درست بودن مدل و پیشفرض‌های معادلات ساختاری با نرم‌افزار اسمارت PLS بپردازیم. از مهم ترین شاخص های نیکویی برازش نرم افزار اسمارت پی.ال.اس می‌توان به موارد زیر اشاره نمود :

    1-سازگاری درونی
    آلفای کرونباخ شاخصی کلاسیک برای تحلیل پایایی و نشان دهنده یک سنت قوی در معادلات ساختاری می‌باشد که برآوردی را برای پایایی بر اساس همبستگی درونی گویه‌ها ارائه می‌دهد و مقدار مناسب برای آن بزرگتر از 0/7 می‌باشد به منظور محاسبه پایایی معیار دیگری نیز وجود دارد که برتری‌هایی را نسبت به روش سنتی محاسبه آن به وسیله آلفا کرونباخ را به همراه دارد و به آن پایایی ترکیبی (CR) گفته می‌شود. برتری پایایی ترکیبی نسبت به آلفای کرونباخ در این است که پایایی سازه ها نه به صورت مطلق، بلکه با توجه به همبستگی سازه هایشان با یکدیگر محاسبه می‌گردد. همچنین برای محاسبه آن، شاخص‌های با بارعاملی بیشتر اهمیت زیادتری دارند. در نتیجه برای سنجش بهتر پایایی، هر دوی این معیارها استفاده می‌شوند. برای پایایی مرکب میزان بالای 0/7 مناسب گزارش شده است.

    2-روایی همگرا
    سنجه رایج برای ایجاد روایی همگرا در سطح سازه، میانگین واریانس استخراج شده (AVE) است. این معیار به عنوان مقدار میانگین کل توان دوم بارهای معرف متناظر با هر سازه تعریف می‌شود (مجموع توان دوم بارها تقسیم بر تعداد معرف‌ها). بنابراین AVE، معادل اشتراک یک سازه است. مقدار میانگین واریانس استخراجی برابر 0/5 یا بالاتر نشان می دهد که، به طور متوسط، سازه بیش از نیمی از واریانس معرف های متناظر را تشریح می کند. به طور معکوس، زمانی که AVE کمتر از 0/5 باشد، نشان دهنده این است که به طور میانگین، خطای بیشتری در آیتم ها نسبت به واریانس تشریح شده به وسیله سازه ها باقی می ماند.

    3-روایی واگرا
    جهت بررسی روایی واگرای مدل اندازه گیری، از معیار فورنل و لارکر استفاده می‌شود. بر اساس این معیار، روایی واگرای قابل قبول یک مدل حاکی از آن است که یک سازه در مدل، نسبت به سازه‌های دیگر تعامل بیشتری با شاخص‌هایش دارد. فورنل و لارکر (1981) بیان می‌کنند؛ روایی واگرا وقتی در سطح قابل قبولی است که میزان AVE برای هر سازه بیشتر از واریانس اشتراکی بین آن سازه و سازه‌های دیگر در مدل باشد. در PLS بررسی این امر به وسیله ماتریسی حاصل می‌شود.

    برای بررسی سه معیار فوق در نرم افزار اسمارت PLS از طریق اجرای دستور PLS Algorithm از قسمت Calculate (همانطور که در پست قبل توضیح داده شد.) پنجره زیر نمایان می‌شود.

    پس از انتخاب دستور Construct Reliability and Validity خروجی زیر نمایان می‌شود.

    همانطور که در شکل فوق ملاحظه می‌شود اعدادی که به رنگ سبز هستند، از مناسب بودن آن معیار برای متغیر (سازه) مورد نظر خبر می‌دهند. برای مثال در مدل فوق میانگین واریانس استخراجی متغیر مدیریت دانش در رنج قابل قبولی قرار ندارد و به رنگ قرمز نمایش داده شده است. برای رفع این مشکل، از بازنگری داده‌ها و حذف سوالی که دارای کمترین بار عاملی است استفاده خواهیم کرد.

    3-تناسب پیش بین
    دومین شاخص برازش مدل ساختاری، شاخص (Q^2) است. این معیار که توسط استون و گیسر (۱۹۷۵) معرفی شد، قدرت پیش بینی مدل در سازه‌های درون‌زا را مشخص می‌کند. به اعتقاد آن‌ها مدل‌هایی که دارای برازش ساختاری قابل قبول هستند، باید قابلیت پیش‌بینی متغیرهای درون‌زای مدل را داشته باشند. بدین معنی که اگر در یک مدل، روابط بین سازه‌ها به درستی تعریف شده باشند، سازه‌ها تاثیر کافی بر یکدیگر گذاشته و از این راه فرضیه‌ها به درستی تائید شوند. هنسلر و همکاران (۲۰۰۹) سه مقدار 0/02، 0/15 و 0/35 را به عنوان قدرت پیش بینی کم، متوسط و قوی تعیین نموده اند.
    برای بررسی سه معیار فوق در نرم افزار اسمارت PLS از طریق اجرای دستور Blindfolding از قسمت Calculate، پنجره زیر نمایان می‌شود.

    بدون تغییر پیشفرض‌ نرم افزار با کلیک بر روی گزینه Start Calculation پنجره زیر باز می‌شود.

    با انتخاب گزینه Construct Crossvalidated Communality پنجره زیر که مربوط به خروجی تناسب پیش‌بین می‌شود نمایش داده می‌شود.

    ۰ نظر موافقین ۰ مخالفین ۰ ۱۲ مرداد ۹۹ ، ۲۲:۴۴
    سید سعید انصاری فر