پایایی ابزار اندازه گیری(قابلیت اعتماد)
قابلیت اعتماد که واژههایی مانند پایایی، ثبات و اعتبار برای آن به کار برده میشود و معادل انگلیسی آن Reliability است، یکی از ویژگیهای ابزار اندازه گیری (پرسشنامه یا مصاحبه یا سایر آزمونهای علوم اجتماعی) است. مفهوم یاد شده با این امر سروکار دارد که ابزار اندازه گیری در شرایط یکسان تا چه اندازه نتایج یکسانی به دست میدهد. از جمله تعریفهایی که برای قابلیت اعتماد ارائه شده است میتوان به تعریف ارائه شده توسط ایبل و فریسبی (1989) اشاره کرد: «همبستگی میان یک مجموعه از نمرات و مجموعه دیگری از نمرات در یک آزمون معادل که به صورت مستقل بر یک گروه آزمودنی به دست آمده است.
با توجه به این امر معمولاً دامنه ضریب قابلیت از صفر (عدم ارتباط) تا 1+ (ارتباط کامل) است. ضریب قابلیت اعتماد نشانگر آن است که تا چه اندازه ابزار اندازه گیری ویژگیهای با ثبات آزمودنی و یا ویژگیهای متغیر و موقتی وی را میسنجد.
لازم به ذکر است که قابلیت اعتماد در یک آزمون میتواند از موقعیتی به موقعیت دیگر و از گروهی به گروه دیگر متفاوت باشد. برای محاسبه ضریب قابلیت اعتماد ابزار اندازه گیری شیوه های مختلفی به کار برده میشود. از آن جمله میتوان به الف) اجرای دوباره (روش بازآزمایی) ، ب) روش موازی (همتا) ، ج) روش تصنیف (دو نیمه کردن) ، د) روش کودر- ریچاردسون و سایر اشاره کرد.
الف) اجرای دوباره آزمون یا روش بازآزمایی
این روش عبارت است از ارائه یک آزمون بیش از یک بار در یک گروه آزمودنی تحت شرایط یکسان. برای محاسبه ضریب قابلیت اعتماد با این روش، ابتدا ابزار اندازه گیری بر روی یک گروه آزمودنی اجرا شده و سپس در فاصله زمانی کوتاهی دوباره در همان شرایط، آزمون بر روی همان گروه اجرا میشود. نمرات بدست آمده از دو آزمون مورد نظر قرار گرفته و ضریب همبستگی آنها محاسبه میشود. این ضریب نمایانگر قابلیت اعتماد (پایایی) ابزار است. روش بازآزمایی برای ارزیابی ثبات مؤلفه های یک ابزار اندازه گیری به کار میرود ولی با این اشکال نیز روبه رو است که نتایج حاصله از آزمون مجدد میتواند تحت تأثیر تمرین (تجربه) و حافظه آزمودنی قرار گرفته و بنابراین منجر به تغییر در قابلیت اعتماد ابزار اندازه گیری گردد.
ب) روش موازی یا استفاده از آزمونهای همتا
یکی از روشهای متداول ارزیابی قابلیت اعتماد در اندازه گیریهای روانی- تربیتی استفاده از آزمونهای همتا است که شباهت زیادی با یکدیگر دارند ولی کاملاً یکسان نیستند.
ضریب قابلیت اعتماد بر اساس همبستگی نمرات دو آزمون همتا به دست میآید. خطاهای اندازه گیری و کمبود یا عدم وجود همسانی میان دو فرم همتای آزمون (تفاوت در سوالات یا محتوای آنها) قابلیت اعتماد را کاهش میدهد.
ممکن است فرمهای همتا به طور همزمان ارائه نگردد. در این صورت قابلیت اعتماد هم شامل ثبات و همسانی میشود. اگر فاصله اجرای فرمهای همتا زیاد باشد و تغییراتی در ضریب قابلیت اعتماد مشاهده گردد، ممکن است که این تغییر مربوط به عوامل فردی (آزمودنیها)، همتا نبودن آزمونها و یا ترکیبی از هر دو باشد.
ج) روش تنصیف (دو نیمه کردن)
این روش برای تعیین هماهنگی درونی یک آزمون به کار میرود. برای محاسبه ضریب قابلیت اعتماد با این روش، سؤالهای (اقلام) یک آزمون را به دو نیمه تقسیم نموده و سپس نمره سؤالهای نیمه اول و نمره سؤالهای نیمه دوم را محاسبه میکنیم. پس از آن همبستگی بین نمرات این دو نیمه را بدست میآوریم. ضریب همبستگی به دست آمده برای ارزیابی قابلیت اعتماد کل آزمون مورد استفاده قرار میگیرد. برای محاسبه ضریب قابلیت اعتماد کل آزمون از فرمول -اسپیرمن- براون- برای این مورد استفاده میشود.
د) روش کودر- ریچاردسون
کودر و ریچاردسون دو فرمول را برای محاسبه هماهنگی درونی آزمونها ارائه نمودهاند. فرمول اول برآوردی از میانگین ضرایب قابلیت اعتماد برای تمام طرق ممکن تنصیف (دو نیمه کردن) را به دست میدهد. این ضریب برابر است با:
n تعداد سوال ها – p نسبت پاسخهای صحیح – q نسبت پاسخهای غلط -واریانس نمرات کل
فرمول دوم: برای استفاده از فرمول دوم باید سطح دشواری سؤالهای آزمون یکسان باشد:
فرمول دوم:
برای محاسبه ضریب قابلیت اعتماد با این روش، نیازی به داشتن نسبت پاسخهای صحیح و غلط نیست، بلکه در دست داشتن واریانس نمره های کل و میانگین نمرات کفایت میکند.
برای مثال، آزمونی دارای 40 سؤال است. این آزمون به گروهی از دانش آموزان داده شده است. میانگین نمره های آزمون 25 و واریانس کل 26 محاسبه شده است. سطح دشواری سؤالها نیز یکسان است. ضریب قابلیت اعتماد این آزمون را محاسبه کنید:
ه) روش آلفای کرونباخ
یکی دیگر از روشهای محاسبه قابلیت اعتماد استفاده از فرمول کرونباخ است. این روش برای محاسبه هماهنگی درونی ابزار اندازه گیری از جمله پرسشنامهها یا آزمونهایی که خصیصه های مختلف را اندازه گیری میکند بکار میرود. در این گونه ابزارها، پاسخ هر سوال می تواند مقادیر عددی مختلف را اختیار کند.
برای محاسبه ضریب آلفای کرونباخ ابتدا باید واریانس نمره های هر زیر مجموعه سؤالهای پرسشنامه (یا زیر آزمون) و واریانس کل را محاسبه کرد. سپس با استفاده از فرمول زیر مقدار ضریب آلفا را محاسبه کرد.
برای مثال اگر پرسشنامه دارای سه زیر مجموعه سؤال باشد، به طوری که واریانس هر زیر مجموعه به ترتیب 6، 4 و 7 بوده و واریانس کل برابر با 32 باشد، مقدار ضریب آلفای کرونباخ با استفاده از فرمول یاد شده به صورت زیر به دست میآید:
مقدار صفر این ضریب نشان دهنده عدم قابلیت اعتماد و 1+ نشان دهنده قابلیت اعتماد کامل است.
و) عوامل موثر بر ضریب قابلیت اعتماد
ضریب قابلیت اعتماد یک آزمون تحت تأثیر عوامل مختلفی قرار دارد که عبارتست از :
- طول آزمون: علیالاصول آزمونهای طولانیتر از قابلیت اعتماد بالاتری در مقایسه با آزمونهای کوتاه برخوردارند. برای مثال ضریب قابلیت اعتماد یک آزمون 60 سو الی میتواند بیشتر از یک آزمون 40 سؤالی باشد.
- سؤالهای مشابه از نظر محتوا و با سطح دشواری متوسط، قابلیت اعتماد آزمون را افزایش میدهد.
- ماهیت متغیر اندازه گیری شده نیز ضریب قابلیت اعتماد را تحت تأثیر قرار میدهد.
لازم به ذکر است که ضریب قابلیت اعتماد در تفسیر نتایج مهم بوده و شرط اساسی در انتخاب یک ابزار اندازه گیری است.