ابزارهای گردآوری دادهها و اطلاعات
پیش از گردآوری داده ها باید طرح مشخص برای اینکاردر نظر گرفت. پاسخ به سوالات زیر می تواند راهگشا باشد.
· داده ها چگونه توصیف و تفسیر می شوند ؟
· چه مقدار هزینه برای گردآوری داده ها و تفسیر آنها لازم است ؟
· داده ها چگونه گزارش می شوند ؟
۱- استفاده از اطلاعات و مدارک موجود
· در
برخی تحقیقات اطلاعاتی که باید بعنوان داده مورد بررسی و تجزیه و تحلیل
قرار گیرند از پیش آماده هستند. بدین صورت که محقق بدنبال اطلاعات جدید
نیست بلکه می تواند نسبت به جمع آوری اطلاعاتی که از قبل تهیه شده اند و در
پرونده های ( درمانگاهی بیمارستانی ثبت احوال، دانشجویی ،دانش آموزی و
مراجعین به مراکز مختلف شهرداری ها و... ) موجود است اقدام کند.
·
مزایا: به واسطه موجود بودن اطلاعات ارزان است. در وقت صرفه جویی می شود.
مهمترین مزیت آن امکان ارزیابی روند موضوع مورد بررسی در گذشته است که در
مطالعات گذشته نگر بسیار حائز اهمیت است.
· معایب: ناقص بودن و دردسترس
نبودن اطلاعات از اشکالات عمده این روش است. گاهی ملاحظات اخلاقی مانع از
دستیابی به اطلاعات مورد نظر می باشد. قدیمی و کهنه بودن اطلاعات هم ممکن
است در برخی موارد مطرح باشد.
۲- مشاهده
· از روش های جمع آوری اطلاعات
است که در آن رفتار مشخصات موجودات زنده اشیا و پدیده ها با استفاده از
ویژگی های گوناگون آنها ملاحظه و ثبت می گردد. منظور از مشاهده ثبت دقیق
تمام جوانب بروز حادثه ویژه یا رفتار و گفتار فرد یا افراد از راه حواس و
یا سایر راه های ادراکی ( کمک گرفتن از ابزار خاص ) می باشد.
· مشاهده منظم در تحقیق ضروری است بنابراین مشاهده باید:
· به هدف تحقیق مربوط باشد
· برنامه و نحوه عمل آن از قبل مشخص و تنظیم شده باشد
· به طور دقیق و منظم ثبت شود
· میزان اعتبار و صحت انجام آن قابل سنجش و بررسی باشد
·
مزایا: امکان بررسی جزئیات موضوع وجود دارد. می توان صحت اطلاعات جمع آوری
شده را با وسائل دیگر آزمایش کرد .برای جمع آوری اطلاعات زمینه ای مناسب
است. در زمان کوتاه اطلاعات زیادی بدست می آید و اعتبار علمی اطلاعات
بالاست· معایب: حضور مشاهده گر می تواند بر روند فعالیت مورد مشاهده تاثیر
گذار باشد. تمایلات شخصی مشاهده گر و میزان توانائی او در مشاهده و ثبت
دقیق فعالیت مورد مشاهده ممکن است تاثیر گذار باشد. عوامل محیطی بر نوع و
روش گرد آوری اطلاعات موثر است. استاندارد کردن و طبقه بندی اطلاعات مشکل
است ( بویژه در ثبت رفتار انسانی ) .مشکلات اخلاقی در مشاهده اعمال شخصی
وجود دارد. برای نمونه های زیاد وقت گیر و پر هزینه است.
۳- مصاحبه
· مصاحبه یکی از روش های جمع آوری
اطلاعات است که در آن به صورت حضوری یاغیر حضوری از افراد یا گروهی ار
آنان پرسش می شود. نکته مهم آن است که سوالات مصاحبه از پیش اندیشیده شده و
تعیین شده است. آنچه مصاحبه را به صورت های مختلف طبقه بندی می کند میزان
انعطاف پذیری آن و یا نحوه اجرای آن است. مصاحبه را یکی ازروش هائی دانسته
اند که امکان دریافت پاسخ در آن بیش از روش های دیگر است، زیرا در هنگام
مصاحبه امکان تحریک آزمودنی برای دادن پاسخ وجود دارد و نیز می توان در
صورت ابهام با توضیح موضوع را روشن ساخت.
· مهمترین انواع مصاحبه به شرح زیر عنوان شده اند:
·
مصاحبه انعطاف پذیر یا آزاد : در این نوع چارچوب وحدود پرسش ا برای کصاحبه
گر مشخص است لی زمان و توالی پرسش به سلیقه مصاحبه گر بستکی دارد. دراین
حالت رفتار آزمودنی طبیعی تر است و اطلاعات واقعی تری بدست می آید. مصاحبه
گر می تواند سوالات اضافی نیز طرح کندمصاحبه با انعطاف پذیری متوسط یا منظم
: در این نوع مصاحبه ، مصاحبه گر از پرسشنامه ای با پرسش های مشخص و با
توالی ثابت استفاده می کند ، اما معمولا پرسش ها به صورت باز هستند.در این
جا جمع آوری اطلاعات کمی و سطحی است.· مصاحبه با انعطاف ناپذیریا پرسشنامه
همراه با مصاحبه : مصاحبه گر از پرسش نامه ای با پرسش های مشخص و با توالی
استاندارد استفاده می کند. پاسخها ثابت و از قبل پیش بینی و طیقه بندی شده
اند و معمولا پرسش ها به صورت بسته هستند. این روش در مطالعات بزرگ و زمانی
که پژوهشگر از تنوع پاسخ ها اطلاع دارد بکار می رود.
· نکات مهم در موردانجام مصاحبه
· تکلم با زبان شخص مصاحبه شونده
· دخالت ندادن تمایلات شخصی مصاحبه گر
· کسب اجاره درهنگام استفاذه از دستگاه ضبط صدا
· رعایت مقام وموقعیت اجتماعی افراد
· بیان توضیحات کافی قبل از شروع مصاحبه
۴- پرسشنامه
پرسشنامه به عنوان یکی از
متداول ترین ابزار جمع آوری اطلاعات در تحقیقات پیمایشی مورد استفاده قرار
میگیرد و عبارت است از مجموعهای از پرسشهای هدف دار که با بهره گیری از
مقیاسهای گوناگون نظر، دیدگاه و بینش یک فرد پاسخگو را مورد سنجش قرار می
دهد.
· پرسشنامه شامل دسته ای از پرسش هاست که برطبق اصول خاصی تدوین
گردیده است و به صورت کتبی یه افراد ارائه می شود و پاسخگو بر اساس تشخیص
را خود جواب ها رادر آن می نویسد. هدف از ارائه پرسشنامه کسب اطلاعات معین
در مورد موضوعی مشخص است. بزرگ بودن گروه یا جامعه مورد مطالعه یکی از
دلایل مهم برای استفاده از پرسش نامه است چه امکان مطالعه نمونه های بزرگ
را فراهم می آورد. کیفیت تنظیم پرسشنامه دربدست آمدن اطلاعات صحیح و درست و
قابل تعمیم بسیار با اهمیت است.
· بر اساس نحوه اجرای پرسش نامه و نیز نوع سوالات پرسشنامه می توان آنرا به دستجات متفاوت تقسیم نمود.
· طبقه بندی بر اساس ماهیت پرسشنامه :
·
پرسشنامه باز: در این نوع پرسشنامه با سوالات باز روبرو هستیم.در اینجا
پاسخگو می تواند بدون محدودیت هرپاسخی را که مد نظرش باشد در مورد آن پرسش
بنویسد و یا در آن زمینه توضیح دهد. در اینگونه سوالات ، اطلاعات دقیق تر،
کامل تر و دارای ارزش بیشتر هستند ولی طبقه بندی و نتیجه گیری از آنها مشکل
تر و له تجربه زیاد نیازمند است.
· پرسشنامه بسته : پرسش های بسته در
این نوع پرسشنامه ارائه می شود.برای هر پرسش تعدادی گزینه و پاسخ انتخاب
شده است که فرد پاسخ دهنده باید یکی از آنها رابه عنوان پاسخ بگزیند.هریک
از پاسخ ها به گونه ای تنظیم شده است که در عین منطقی بودن برای آن سوال از
پاسخ مربوط به دیگر سوالات مجزاست. در اینجا پاسخ ها را می توان به سرعت
نوشت و تجزیه و تحلیل و طبقه بندی پاسخ ها نیز ساده تر است اما اطلاعات به
دقت و کاملی پرسش نامه باز نیست.
· طبقه بندی بر اساس نحوه اجرا
·
پرسشنامه همراه با مصاحبه : این پرسشنامه همان مصاحبه انعطاف ناپذیر است که
به صورت حضوری پرسش ها از افراد پرسیده می شود و پاسخ ها را پرسشگر در
برگه پرسشنامه وارد می کند.
· پرسشنامه پستی : پرسشنامه برای افراد از طریق پست ارسال می شود . فرد پس از تکمیل آنرا برای محقق عودت می دهد.
·
پرسشنامه الکترونیک : در این نوع از پرسشنامه که به تازگی موارد استفاده
از آن گسترش یافته است ، محقق با استفاده از شبکه های اطلاع رسانی و
اینترنت ، اقدام به ارسال پرسشنامه الکترونیک برای افراد می کند و افراد
پاسخ ها را در همان پرسشنامه وارد و با پست الکترونیک برای محقق باز می
گردانند.در برخی موارد ممکن است افراد نسخه ای از پرسشنامه را چاپ کرده و
بعد از پاسخگوئی به شکل پستی باز گردانند.
· نکات مهم در طراحی پرسشنامه
· داشتن یک مقدمه رسا ، جذاب و واضح در ابتدای پرسشنامه
· وجود پرسش های قابل فهم و خالی از ابهام
· قرار دادن پرسش های حساس و مهم در پایان پرسش نامه
· استفاده از پرسش های باز و بسته به همراه هم
·
در هنگام نوشتن پرسشنامه باید دقت نمود تا ابتدا از پرسش های زمینه ای
استفاده گردد و سپس به پرسش هائی که در زمینه موضوع طراحی شده اند ، رسید.
منصفانه:
دلالت بر معنا و مفهوم خاصی ننمایر و آزمدنی را به موضع خاص نکشاند· بی
آزار : به مسائل خصوصی افراد وارد نشود مگر با اجازه قبلی خود آنها
:خصوصیات یک پرسش
مقایسهای اندازه گیری نگرش
از جمله ابزارهای گردآوری داده ها در تحقیقات مدیریت و علوم
رفتاری، مقیاسهاس سنجش نگرش است. مهمترین مقیاسها اندازهگیری نگرش
عبارتند از:
مقیاس لیکرت، مقیاس افتراق معنایی، مقیاس ثرستون، مقیاس گاتمن و مقیاس فاصله اجتماعی بوگاردوس
منبع اصلی: روش های تحقیق در علوم رفتاری، تالیف دکتر زهره سرمد، عباس بازرگان و الهه حجازی. 1376، موسسه نشر آگه، تهران.
۱- مقیاس لیکرت
این مقیاس از مجموعه ای
منظم از گویه ها که به ترتیب خاصی تدوین شده است ساخته میشود. این گویه ها
حالات خاصی از پدیده مورد اندازه گیری را بصورت گویه هایی که از لحاظ ارزش
اندازه گیری دارای فاصله های مساوی است عرضه می کند. برای تدوین این گویه
ها معمولا از عبارات مساعد و نامساعد درباره پدیده مورد اندازه گیری به
تعداد مساوی استفاده میشود. جهت امتیاز دهی و ارزش گزاری کمی پاسخهای
سوالات مقیاس معمولا از طیف لیکرت ۵ درجه استفاده میشود.
گزینه انتخابی |
بسیار کم |
کم |
متوسط |
زیاد |
بسیار زیاد |
امتیاز |
۱ |
۲ |
۳ |
۴ |
۵ |
نمره دهی به سوالات در طیف لیکرت
پاسخ دهنده میزان موافقت خود را با هر یک از این عبارات در یک مقییاس درجه بندی شده که معمولا از یک تا پنج یاهفت درجه است نشان می دهد. سپس ازمودنی به هریک از گویه ها از نظر عددی(رتبه) ارزش گذاری می شود. حاصل جمع عددی این ارزشها نمره ازمودنی را در این مقیاس بدست می دهد. در ساختن مقیاس لیکرت باید ۶ مرحله به شرح زیررا رعایت کرد:
۱- انتخاب مقوله های تشکیل دهنده مقیاس اندازه گیری وتدوین گویه های مساعد و نامساعد مربوط به موضوع
۲- اجرای مقدماتی گویه ها در یک نمونه تصادفی ازپاسخ دهنده ها
۳- محاسبه نمره کل برای هر پاسخ دهنده
۴- تعین توان افتراقی گویه ها
۵- انتخاب گویه های برگزیده
۶- تعیین ضریب قابلیت اعتماد مقیاس
۲- مقیاس افتراق معنایی
افتراق معنایی روش
کمی برای اندازه گیری معنایی مفاهیم نزد افراد است وعکس العمل افراد نسبت
به یک مفهوم یا شیء را توصیف میکند. در این مقیاس از پاسخ دهنده خواسته می
شود تا مفهومی ررا روی یک مقیاس دو قطبی هفت درجه ای علامت گذاری کند. در
دو قطب مقیاس دو صفت متضاد با هم قرار دارند. معمولا پاسخهای ازمودنی را
می توان به شیوه های مختلف تحلیل کرد. برای تحلیل کمی می توان به درجه
بندیهای هر مقیاس نمره هایی از 1تا 7 یا از3- تا3+ داده و سپس با محاسبه
جمع یک نمره های هر مفهوم در هر یک از مقیاسها، مشخص ساخت که دو مفهوم از
نظر یک فرد یا یک گروه تا چه اندازه به یگدیگر شبیه هستند. مقیاس افتراق
معنایی ، ابزاری است که در مدت زمان کوتاه ، اطلاعات بسیار مفیدی را درباره
نگرش افراد بدست می دهد. با کمک این مقیاس می توان نیمرخ نتایج را ترسیم
نموده وبا مقایسه نیمرخها اختلاف نگرش نسبت به مفاهیم را نشان داد. مقیاس
افتراق معنایی بررسی تغییر در نگرش فرد را نسبت به یک موضوع ا مکان
پذیرمیکند ازاین مقیاس در پژوهش های روان – درمانی نیز استفاده می شود.
خاطر نشان می شود که تفسیر نتایج حاصله از این مقیاس به آسانی صورت نمی
گیرد واین خطر همیشه وجود دارد که درک افراد نسبت به معنای مفاهیم متفاوت
از یکدیگر باشد. مراحل ساخت مقیاس به شرح زیر است:
۱- مفاهیم موردنظر را انتخاب کند.این مفاهیم باید با مساله
تحقیق مرتبط بوده و نسبت به تفاوتها و شباهت های گروه مورد مطالعه حساس
باشد.
۲- زوج صفت هایی را برای مقیاس انتخا کند.وقتی هدف اندازه گیری
طرز فکر باشد از صفتهایی که بیشترین وزنه ارزشی را دارد باید استفاده کرد.
۳- صفت
های متضاد را باید طوری در دو انتهای مقیاس قرار داد که ترتیب خاصی وجود
نداشته باشد.برای مثال در یک انتها فقط صفت های نشان دهنده قدرت ،فعالیت یا
مطلوبیت قرار نگرفته باشد.
۳-مقیاس ثرستون
این مقیاس شامل مجموعه ای
از گویه ها است که برای سنجش برخی از مفاهیم به کار می رود. در مقیاس
ثرستون از پاسخ دهنده خواسته می شود ، تا تمام مواردی را که با آنها موافق
است علامت بزند . امتیاز هر فرد در این مقیاس به وسیله تعداد گویه هایی که
با آن موافق است تعیین می شود. مراحل ساختن مقیاس ترستون به شرح زیر است:
۱- تهییه مجموعه ای از گویه هایی کوتاه و دقیق راکه نشانگر طیفی از طرز فکر نسبت به شیئی یا حادثه خاصی باشد.
۲- طبقه بندی گویه ها روی یک مقیاس از یک تا یازده ( از قوی ترین تا ضعیف ترین ) به وسیله یک گروه داور
۳- در نظر گرفتن توزیع ارزشهای مقیاسی ( 1 تا 11 ) هر گویه و محاسبه میانه این توزیع
۴- گویه
هایی که ارزش نیم دامنه چارکی نصف دامنه بین ربع اول و سوم خیلی زیاد است
باید حذف شود. دامنه بزرگ نشانگر اختلاف زیاد بین داوران است.
۵- گویه
های باقی مانده رابه نمونه ای از آزمودنی ها عرضه کرده و از آنان خواسته
شود تا گویه هایی را که با آن موافق هستند علامت بگذارند. گویه هایی که از
لحاظ آماری دارای هماهنگی درونی پایین است ، حذف می شود.
۶- از میان گویه های باقی مانده آنهایی که نیم فاصله چارکی آنها فواصل یکسانی را نشان می دهد ، یکی انتخاب کرد.
۴- مقیاس گاتمن
این مقیاس شامل مجموعه ای
از گویه هاست که در رابطه با نگرش فرد نسبت به یک موضوع تنظیم شده است .
گویه ها بر حسب دشواری ، پیچیدگی یا ارزش وزنی مرتب می شوند و موافقت یا
تاکید یک گویه ، موافقت با سایر گویه های کم وزن تر را به دنبال دارد. این
ویژگی تراکمی بودن مقیاس گاتمن امکن می دهد تا با داشتن امتیاز کلی فرد
نمره فرد را در هر گویه ای پیش بینی نماییم. مراحل ساخت مقیاس گاتمن:
۱- انتخاب وتدوین گویه های مناسب درباره نگرش نسبت به موضوع
مورد نظر .برای انتخاب گویه ها می توان به برخی منابع از قبیل روزنامه ها ،
کتابها،مقاله های علمی،نتایج تحقیات و مصاحبه با افراد متخصص مراجعه کرد.
۲- اجرای مقدماتی گویه های تدوین شده
۳- تجزیه و تحلیل پاسخهای بدست آمده
۴- محاسبه ضریب بازیابی (cr)
ساختن مقیاس گاتمن مستلزم طی مراحل دشواریست ولی در مقایسه بامقیاس لیکرت وثرستون مزایایی به قرار زیر دارد:
الف) امکان تعیین نیمرخ پاسخهای فرد را فراهم می کند.
ب) با توجه به ماهیت تراکمی مقیاس برای ارزیابی تغییرات نگرش مناسبتر است.
0- مقیاس فاصله اجتماعی بوگاردوس
نوعی مقیاس سنجش
نگرش است که در بررسی نگرش نسبت به گروهای قومی – نژادی طبقات اجتماعی
،گروه های مذهبی و حرفه ای مورد استفاده قرار می گیرد . پیش فرض این مقیاس
آن است که فرد پیشداوری بیشتر در مورد یک گروه ویژه داشته باشد ، فاصله
اجتماعی بین او و اعضای آن گروه بیشتر خواهد بود . در این مقیاس گویه ها
به صورت موقعیت های فرضی به ترتیبی که معرف فاصله اجتماعی باشد ارائه می
شود
پرسشنامه متداول ترین ابزار جمع آوری اطلاعات در پایاننامه رشته مدیریت است. پرسشنامه عبارت است از مجموعهای از پرسشهای هدف دار که با بهرهگیری از مقیاسهای گوناگون نظر، دیدگاه و بینش یک فرد پاسخگو را مورد سنجش قرار می دهد(حافظ نیا،1377).
جهت نگارش پرسشنامه برای پایان نامه ابتدا باید موضوع مورد بررسی به مولفههای آن تجزیه شود. مثلا وقتی موضوع بررسی کیفیت زندگی کاری است باید مولفههای موجد کیفیت مانند رضایت، انگیزش، خلاقیت را در نظر گرفت. هر یک از این مولفهها یک فرضیه یا سوال تحقیق را میسازند. در مرحله بعد باید برای هر مولفه یک مجموعه آیتم را شناسائی کرد. برمبنای نظریه چرچیل (1979) برای ایجاد یک مقیاس زمانیکه ابعاد شناسائی شدند باید مجموعه ای از آیتم ها در ارتباط با هر بعد ایجاد گردند(سین و دیگران،2005). زمانیکه مجموعه آیتمها را شناسائی کردید باید با نظر اساتید و متخصصین به یک جمع بندی برسید و پرسشنامه مقدماتی را تدوین کنید.
اجزای پرسشنامه
هر پرسشنامه به طور معمول شامل دو دسته سوالات عمومی و تخصصی
است. سوالات عمومی مشخصات فردی پاسخ دهندگان را در بر میگیرد. این سوالات
عبارتند از: جنسیت، سن، مرتبه سازمانی، وضعیت استخدامی و میزان تحصیلات.
سوالات
تخصصی بخش اصلی پرسشنامه است که براساس مولفههای تشکیل دهنده موضوع شکل
گرفته است. جهت امتیاز دهی و ارزش گزاری کمی پاسخهای سوالات تخصصی از طیف لیکرت استفاده میشود.
گزینه انتخابی |
بسیار کم |
کم |
متوسط |
زیاد |
بسیار زیاد |
امتیاز |
1 |
2 |
3 |
4 |
5 |
روائی پرسشنامه یا قابلیت اعتبار ابزار اندازه گیری
قابلیت اعتماد (پایایی یا Reliability) و همچنین اعتبار (روایی یا Validity) یک پرسشنامه یا ابزار اندازه گیری، از موضوعات بسیار مهم در امر جمع آوری اطلاعات و مشاهدات میباشد که متاسفانه گاهی مورد غفلت قرار میگیرد.. در اینجا به شرح این دو موضوع مهم میپردازیم:
منبع اصلی: روش های تحقیق در علوم رفتاری، تالیف دکتر زهره سرمد، عباس بازرگان و الهه حجازی. 1376، موسسه نشر آگه، تهران.
پایائی یا قابلیت اعتماد ابزار اندازه گیری
مفهوم اعتبار (روایی) به این سوال پاسخ میدهد که ابزار اندازه گیری تا چه حد خصیصه مورد نظر را می سنجد. بودن آگاهی از اعتبار ابزار اندازه گیری نمیتوان به دقت داده های حاصل از آن اطمینان داشت. ابزار اندازه گیری ممکن است برای اندازه گیری یک خصیصه ویژه دارای اعتبار باشد، در حالی که برای سنجش همان خصیصه بر روی جامعه دیگر از هیچ گونه اعتباری برخوردار نباشد. برای مثال یک آزمون ریاضی ممکن است برای سنجش توانایی ریاضی دانش آموزان پایه پنجم ابتدایی از اعتبار لازم برخوردار باشد اما برای سنجش توانایی ریاضی دانش آموزان پایه سوم راهنمایی فاقد اعبتار باشد. روش های متعددی برای تعیین اعتبار ابزار اندازه گیری وجود دارد که در این جا به اختصار در مورد هر یک توضیح داده خواهد شد؛
۱- اعبتار محتوا
اعتبار محتوا نوعی اعتبار
است که معمولا برای بررسی اجزای تشکیل دهنده یک ابزار اندازه گیری به کار
برده میشود. به عنوان مثال برای یک آزمون پیشرفت تحصیلی باید اعتبار
محتوای آن را مورد نظر قرار داد. اعتبار محتوای یک ابزار اندازه گیری به
سوال های تشکیل دهنده آن بستگی دارد. اگر سوال های ابزار معرف وپژگی ها و
مهارت های ویژه ای باشد که محقق قصد اندازه گیری آنها را داشته باشد،
آزمون دارای اعتبار محتوا است. برای اطمینان از اعتبار محتوا، باید در موقع
ساختن ابزار (مانند طراحی پرسشنامه) چنان عمل کرد که سوال های تشکیل دهنده
ابزار معرف قسمت های محتوای انتخاب شده باشد. بنابراین اعتبار محتوا ویژگی
ساختاری ابزار است که همزمان با تدوین آزمون در آن تنیده میشود. اعتبار
محتوای یک آزمون معمولا توسط افرادی متخصص در موضوع مورد مطالعه تعیین
میشود. از این رو اعتبار محتوا به قضاوت داوران بستگی دارد.
۲- اعبتار ملاکی
اعتبار ملاکی عبارتست از
کارآمدی یک ابزار اندازه گیری در پیش بینی رفتار یک فرد در موقعیت های خاص.
برای این منظور عملکرد هر فرد در آزمون با یک ملاک مقایسه میشود. به
عبارت دیگر اعتبار ملاکی یک ابزار اندازه گیری عبارتست از همبستگی بین
نمرات آزمون و نمره ملاک. اعتبار ملاکی بر دو نوع است:
1- اعتبار پیش بین ، 2- اعتبار همزمان
1-اعتبار پیش بین: در اندازه گیری های روانی- تربیتی، اعتبار پیش بین عبارتست از بررسی رابطه نمره های آزمونی که برخی ویژگی ها را می سنجد و آن چه ادعای پیش بینی آن را دارد. اعتبار پیش بین میتواند به وسیله رابطه عملکرد در یک آزمون با آزمون ملاک رفتاری به دست آید. به عبارت دیگر ضریب همبستگی نمره های حاصل از اجرای آزمون با نمره های متغیر ملاک، نمایانگر اعتبار پیش بین است. برای مثال در یک تحقیق، 882 مرد و زن به یک آزمون رغبت شغلی پاسخ گفته اند. آزمونی ها 12 ساله بودند و در 19 سالگی مجدد مورد بررسی قرار گرفتند. 51 درصد به شغلی که در آزمون انتخاب کرده بودند اشتغال داشتند. این داده ها اعبتار پیش بین این ابزار را نشان میدهد.
2- اعتبار همزمان: اعتبار همزمان در مواردی به کار میرود که داده های حاصله از دو اندازه گیری در یک زمان در دسترس باشد. در این گونه موارد عملکرد در یک آزمون به عملکرد در آزمون دیگر مرتبط میگردد. این فرایند اعتبار همزمان نامیده میشود. اعتبار همزمان در مواردی محاسبه میشود که هدف جانشین کردن یک ابزار اندازه گیری به جای ابزار دیگری باشد. این امر بیشتر به علت ملاحظات مربوط به سهولت اجرای آزمون یا جانشین کردن یک آزمون کوتاهتر به جای یک آزمون طویل تر است. در این مورد نیز ضریب همبستگی بین نمره های حاصل از اجرای آزمون با نمره های بدست آمده از اجرای آزمون دیگر یا اندازه های حاصل از اندازه گیری دیگری که همزمان به عمل آمده است به عنوان میزان اعتبار اندازه گیری به کار میرود.
۳- اعتبار سازه
اعتبار سازه یک ابزار
اندازه گیری نمایانگر آن است که ابزار اندازه گیری تا چه اندازه یک سازه یا
خصیصه ای را که مبنای نظری دارد می سنجد. در بررسی اعتبار سازه باید به
تدوین فرضیه هایی درباره مفاهیم اندازه گیری شده، آزمودن این فرضیه ها و
محاسبه همبستگی نتایج با اندازه گیری اولیه پرداخت. اگر ضریب همبستگی حاصله
بالا باشد اعتبار سازه افزایش مییابد ولی اگر همبستگی معنی دار نباشد علت
را میتوان به عوامل زیر نسبت داد:
- جمع آوری داده ها با اشکال همراه بوده است.
- پیش بینی و فرضیه ها غلط بوده است.
- ابزار، خصیصه مورد نظر را اندازه گیری نمیکند.
اگر چه فرایند برقراری اعتبار سازه امر بی انتهایی است ولی محقق یا سازنده آزمون میتواند اعتبار سازه یک آزمون را در موقعیت های خاص نشان دهد. از جمله شیوه هایی که برای تعیین اعتبار سازه به کار میرود موارد زیر است:
- تفاوت های گروهی: اگر نظریه ای تفاوتی را بین گروهها (یا
هیچ تفاوتی را) در نمرات آزمون پیش بینی کند، آزمونی که این تفاوت را نشان
دهد (یا ندهد) دارای اعتبار سازه است. برای مثال پیش بینی میشود که کودکان
و بزرگسالان در بلوغ اجتماعی با هم تفاوت دارند. بنابراین اگر آزمونی که
برای اندازه گیری خصیصه بلوغ اجتماعی ساخته شده باشد، تفاوت معنی داری را
بین کودکان و بزرگسالان نشان دهد دارای اعتبار سازه است.
- تغییرات:
چنانچه نظریه ای پیش بینی کند که خصیصه مورد اندازه گیری تحت تاثیر زمان یا
مداخله آزمایشی قرار می گیرد، اگر نمرات آزمون این تاثیر را نشان دهد
داراری اعتبار سازه است. برای مثال اگر آزمونی مهارت های کلامی را می سنجد
باید با افزایش سن آزمودنی ها نمرات افزایش یابد، یا اگر مداخله اجتماعی
برای پرورش این مهارت ها صورت گرفته باشد نمرات پیش آزمون و پس آزمون باید
تغییرات معنی داری را نشان دهد.
- اعتبار همگرا و واگرا (تشخیصی): هر
گاه یک یا چند خصیصه از طریق دو یا چند روش اندازه گیری شوند همبستگی بین
این اندازه گیری ها دو شاخص مهم اعتبار را فراهم می آورد. اگر همبستگی بین
نمرات آزمون هایی که خصیصه واحدی را اندازه گیری میکند بالا باشد، آزمون
ها دارای اعتبار همگرا میباشد. چنانچه همبستگی بین آزمون هایی که خصیصه
های متفاوتی را اندازه گیری میکند پایین باشد، آزمون ها دارای اعبتار
تشخیصی یا واگرا است.
۴- اعبتار عاملی
اعتبار عاملی صورتی از
اعتبار سازه است که از طریق تحلیل عاملی به دست میآید. یک عامل، یک متغیر
فرضی (سازه) است که نمرات مشاهده شده را در یک یا چند متغیر تحت تاثیر قرار
میدهد. هر گاه تحلیل عاملی روی یک ماتریس همبستگی صورت گیرد آزمون هایی
که تحت تاثیر عوامل خاصی قرار گرفته دارای بار عاملی بالا در آن عامل است
پایائی پرسشنامه یا قابلیت اعتماد ابزار اندازه گیری
قابلیت اعتماد (پایایی یا Reliability) و همچنین اعتبار (روایی یا Validity) یک پرسشنامه یا ابزار اندازه گیری، از موضوعات بسیار مهم در امر جمع آوری اطلاعات و مشاهدات میباشد که متاسفانه گاهی مورد غفلت قرار میگیرد.. در اینجا به شرح این دو موضوع مهم میپردازیم:
منبع اصلی: روش های تحقیق در علوم رفتاری، تالیف دکتر زهره سرمد، عباس بازرگان و الهه حجازی. 1376، موسسه نشر آگه، تهران.
پایائی یا قابلیت اعتماد ابزار اندازه گیری
قابلیت اعتماد که واژه هایی مانند پایایی، ثبات و اعتبار برای آن به کار برده میشود و معادل انگلیسی آن Reliability است، یکی از ویژگی های ابزار اندازه گیری (پرسشنامه یا مصاحبه یا سایر آزمون های علوم اجتماعی) است. مفهوم یاد شده با این امر سروکار دارد که ابزار اندازه گیری در شرایط یکسان تا چه اندازه نتایج یکسانی به دست می دهد. از جمله تعریف هایی که برای قابلیت اعتماد ارائه شده است می توان به تعریف ارائه شده توسط ایبل و فریسبی (1989) اشاره کرد: «همبستگی میان یک مجموعه از نمرات و مجموعه دیگری از نمرات در یک آزمون معادل که به صورت مستقل بر یک گروه آزمودنی به دست آمده است.»
با توجه به این امر معمولا دامنه ضریب قابلیت از صفر (عدم ارتباط) تا 1+ (ارتباط کامل) است. ضریب قابلیت اعتماد نشانگر آن است که تا چه اندازه ابزار اندازه گیری ویژگی های با ثبات آزمودنی و یا ویژگی های متغیر و موقتی وی را می سنجد.
لازم به ذکر است که قابلیت اعتماد در یک آزمون میتواند از موقعیتی به موقعیت دیگر و از گروهی به گروه دیگر متفاوت باشد. برای محاسبه ضریب قابلیت اعتماد ابزار اندازه گیری شیوه های مختلفی به کار برده میشود. از آن جمله میتوان به الف) اجرای دوباره (روش بازآزمایی) ، ب) روش موازی (همتا) ، ج) روش تصنیف (دو نیمه کردن) ، د) روش کودر- ریچاردسون و سایر اشاره کرد.
۱- اجرای دوباره آزمون یا روش بازآزمایی
این
روش عبارت است از ارائه یک آزمون بیش از یک بار در یک گروه آزمودنی تحت
شرایط یکسان. برای محاسبه ضریب قابلیت اعتماد با این روش، ابتدا ابزار
اندازه گیری بر روی یک گروه آزمودنی اجرا شده و سپس در فاصله زمانی کوتاهی
دوباره در همان شرایط، آزمون بر روی همان گروه اجرا میشود. نمرات بدست
آمده از دو آزمون مورد نظر قرار گرفته و ضریب همبستگی آنها محاسبه میشود.
این ضریب نمایانگر قابلیت اعتماد (پایایی) ابزار است. روش بازآزمایی برای
ارزیابی ثبات مولفه های یک ابزار اندازه گیری به کار میرود ولی با این
اشکال نیز روبه رو است که نتایج حاصله از آزمون مجدد میتواند تحت تاثیر
تمرین (تجربه) و حافظه آزمودنی قرار گرفته و بنابراین منجر به تغییر در
قابلیت اعتماد ابزار اندازه گیری گردد.
۲- روش موازی یا استفاده از آزمون های همتا
یکی
از روشهای متداول ارزیابی قابلیت اعتماد در اندازه گیری های روانی- تربیتی
استفاده از آزمون های همتا است که شباهت زیادی با یکدیگر دارند ولی کاملا
یکسان نیستند.
ضریب قابلیت اعتماد بر اساس همبستگی نمرات دو آزمون همتا به دست میآید. خطاهای اندازه گیری و کمبود یا عدم وجود همسانی میان دو فرم همتای آزمون (تفاوت در سوالات یا محتوای آنها) قابلیت اعتماد را کاهش میدهد.
ممکن است فرم های همتا به طور همزمان ارائه نگردد. در این صورت قابلیت اعتماد هم شامل ثبات و همسانی میشود. اگر فاصله اجرای فرم های همتا زیاد باشد و تغییراتی در ضریب قابلیت اعتماد مشاهده گردد، ممکن است که این تغییر مربوط به عوامل فردی (آزمودنی ها)، همتا نبودن آزمون ها و یا ترکیبی از هر دو باشد.
۳- روش تنصیف (دو نیمه کردن)
این روش برای
تعیین هماهنگی درونی یک آزمون به کار میرود. برای محاسبه ضریب قابلیت
اعتماد با این روش، سوال های (اقلام) یک آزمون را به دو نیمه تقسیم نموده و
سپس نمره سوال های نیمه اول و نمره سوال های نیمه دوم را محاسبه میکنیم.
پس از آن همبستگی بین نمرات این دو نیمه را بدست میآوریم. ضریب همبستگی به
دست آمده برای ارزیابی قابلیت اعتماد کل آزمون مورد استفاده قرار میگیرد.
برای محاسبه ضریب قابلیت اعتماد کل آزمون از فرمول -اسپیرمن- براون- برای
این مورد استفاده میشود:
(1+همبستگی بین دو نیمه) / 2 * همبستگی بین دو نیمه = ضریب قابلیت اعتماد کل آزمون
برای مثال آزمونی با 80 سوال به 35 دانشجوی سال اول ارائه شده است. آزمون به دو نیمه (40 سوال) تقسیم شده است. همبستگی میان نمرات دو تست r=0.7 میباشد. قابلیت اعتماد کل آزمون به قرار زیر است:
2*0.7 / (1+0.7) = 0.82 = ضریب قابلیت اعتماد کل آزمون
۴- روش کودر- ریچاردسون
کودر و ریچاردسون
دو فرمول را برای محاسبه هماهنگی درونی آزمون ها ارائه نموده اند. فرمول
اول برآوردی از میانگین ضرایب قابلیت اعتماد برای تمام طرق ممکن تنصیف (دو
نیمه کردن) را به دست میدهد. این ضریب برابر است با:
که در آن :
n تعداد سوال ها - p نسبت پاسخ های صحیح - q نسبت پاسخ های غلط - واریانس نمرات کل
فرمول دوم: برای استفاده از فرمول دوم باید سطح دشواری سوال های آزمون یکسان باشد:
که در آن :
n تعداد سوال ها - واریانس نمره های کل - میانگین نمرات
برای محاسبه ضریب قابلیت اعتماد با این روش، نیازی به داشتن نسبت پاسخ های صحیح و غلط نیست، بلکه در دست داشتن واریانس نمره های کل و میانگین نمرات کفایت میکند.
برای مثال، آزمونی دارای 40 سوال است. این آزمون به گروهی از دانش آموزان داده شده است. میانگین نمره های آزمون 25 و واریانس کل 26 محاسبه شده است. سطح دشواری سوال ها نیز یکسان است. ضریب قابلیت اعتماد این آزمون را محاسبه کنید:
۵- روش آلفای کرونباخ
یکی دیگر از روشهای
محاسبه قابلیت اعتماد استفاده از فرمول کرونباخ است. این روش برای محاسبه
هماهنگی درونی ابزار اندازه گیری از جمله پرسشنامه ها یا آزمونهایی که
خصیصه های مختلف را اندازه گیری می کند بکار می رود. در این گونه ابزارها،
پاسخ هر سوال می تواند مقادیر عددی مختلف را اختیار کند.
برای محاسبه ضریب آلفای کرونباخ ابتدا باید واریانس نمره های هر زیر مجموعه سوال های پرسشنامه (یا زیر آزمون) و واریانس کل را محاسبه کرد. سپس با استفاده از فرمول زیر مقدار ضریب آلفا را محاسبه کرد.
که در آن:
تعداد زیر مجموعه سوال های پرسشنامه یا آزمون.
واریانس زیر آزمون ام.
واریانس کل آزمون.
برای مثال اگر پرسشنامه دارای سه زیر مجموعه سوال باشد، به طوری که واریانس هر زیر مجموعه به ترتیب 6 ، 4 و 7 بوده و واریانس کل برابر با 32 باشد، مقدار ضریب آلفای کرونباخ با استفاده از فرمول یاد شده به صورت زیر به دست میآید:
مقدار صفر این ضریب نشان دهنده عدم قابلیت اعتماد و 1+ نشان دهنده قابلیت اعتماد کامل است.
در خصوص آزمون آلفای کروبناخ مطالب دیگری نیز در بخش آزمون کرونباخ آلفا ارائه شده است.
عوامل موثر بر ضریب قابلیت اعتماد
ضریب قابلیت اعتماد یک آزمون تحت تاثیر عوامل مختلفی قرار دارد که عبارتست از :
۱- طول آزمون: علی الاصول آزمون های طولانی تر از قابلیت اعتماد بالاتری در مقایسه با آزمون های کوتاه برخوردارند. برای مثال ضریب قابلیت اعتماد یک آزمون 60 سوالی میتواند بیشتر از یک آزمون 40 سوالی باشد.
۲- سوال های مشابه از نظر محتوا و با سطح دشواری متوسط، قابلیت اعتماد آزمون را افزایش میدهد.
۳- ماهیت متغیر اندازه گیری شده نیز ضریب قابلیت اعتماد را تحت تاثیر قرار میدهد.
لازم به ذکر است که ضریب قابلیت اعتماد در تفسیر نتایج مهم بوده و شرط اساسی در انتخاب یک ابزار اندازه گیری است.
مقدمه
مقاله های علمی-پژوهشی را با روش ها و آزمون های آماری مورد استفاده می شناسند و دیگر گرد هم آوردن مطالب نویسندگان مختلف ارزش علمی و پژوهشی ندارد. علم آمار با پردازش داده ها و تبدیل آنها به اطلاعات مورد نیاز، زمینه اخذ تصمیم را فراهم می آورد. هنر مدیران و کارشناسان در نحوه استفاده از روشهای آماری و تحلیل اطلاعات به دست آمده تجلی پیدا می کند. امروزه بندرت می توان بدون استفاده از روشهای آماری اقدام به تفسیر، تبیین و تحلیل نتایج به دست آمده از تحقیق ها و پژوهش های علمی کرد.
آمار در دو شاخه آمار توصیفی و احتمالات و آمار استنباطی بحث و بررسی می شود. احتمالات و تئوریهای احتمال اساسا از دایره بحث ما خارج است. همچنین آمار توصیفی مانند فراوانی، میانگین، واریانس و ... نیز مفروض در نظر گرفته شده اند. در این مقاله با تاکید بر فنون و روش های آماری استنیاطی، کاربرد آمار در مقاله های علمی-پژوهشی ارائه خواهد شد.
1. آمار استنباطی و آمار توصیفی
در یک پژوهش جهت بررسی و توصیف ویژگیهای عمومی پاسخ دهندگان از روش های موجود در آمار توصیفی مانند جداول توزیع فراوانی، در صد فراوانی، درصد فراوانی تجمعی و میانگین استفاده میگردد. بنابراین هدف آمار توصیفی یا descriptive محاسبه پارامترهای جامعه با استفاده از سرشماری تمامی عناصر جامعه است.
در آمار استنباطی یا inferential پژوهشگر با استفاده مقادیر نمونه آماره ها را محاسبه کرده و سپس با کمک تخمین و یا آزمون فرض آماری، آماره ها را به پارامترهای جامعه تعمیم می دهد.برای تجزیه و تحلیل داده ها و آزمون فرضیه های پژوهش از روش های آمار استنباطی استفاده می شود.
پارامتر شاخص بدست آمده از جامعه آماری با استفاده از سرشماری است و شاخص بدست آمده از یک نمونه n تائی از جامعه آماره نامیده می شود. برای مثال میانگین جامعه یا µ یک پارامتر مهم جامعه است. چون میانگین جامعه همیشه در دسترس نیست به همین خاطر از میانگین نمونه یا که آماره برآورد کننده پارامتر µ است در بسیاری موارد استفاده می شود.
2. آزمون آماری و تخمین آماری
همانطور که در بخش روش نگارش یک مقاله علمی-پژوهشی عنوان شد در یک مقاله پژوهشی یا یک پایان نامه باید سوال پژوهش یا فرضیه پژوهش مطرح شود. اگر تحقیق از نوع سوالی و صرفا حاوی پرسش درباره پارامتر باشد، برای پاسخ به سوالات از تخمین آماری استفاده می شود و اگر حاوی فرضیه ها بوده و از مرحله سوال گذر کرده باشد، آزمون فرضیه ها و فنون آماری آن به کار می رود.
هر نوع تخمین یا آزمون فرض آماری با تعیین صحیح آماره پژوهش شروع می شود. سپس باید توزیع آماره مشخص شود. براساس توزیع آماره آزمون با استفاده از داده های بدست آمده از نمونه محاسبه شده آماره آزمون محاسبه می شود. سپس مقدار بحرانی با توجه به سطح خطا و نوع توزیع از جداول مندرج در پیوست های کتاب آماری محاسبه می شود. در نهایت با مقایسه آماره محاسبه شده و مقدار بحرانی سوال یا فرضیه تحقیق بررسی و نتایج تحلیل می شود. در ادامه این بحث موشکافی می شود.
3. آزمون های آماری پارامتریک و ناپارامتریک
آمار پارامتریک که در خلال جنگ جهانی دوم شکل گرفت در برابر آمار پارامتریک قرار می گیرد. آمار پارامتریک مستلزم پیش فرضهائی در مورد جامعه ای که از آن نمونه گیری صورت گرفته می باشد. به عنوان مهمترین پیش فرض در آمار پارامترک فرض می شود که توزیع جامعه نرمال است اما آمار ناپارامتریک مستلزم هیچگونه فرضی در مورد توزیع نیست. به همین خاطر بسیاری از تحقیقات علوم انسانی که با مقیاس های کیفی سنجیده شده و فاقد توزیع (Free of distribution) هستند از شاخصهای آمارا ناپارامتریک استفاده می کنند.
فنون آمار پارامتریک شدیداً تحت تاثیر مقیاس سنجش متغیرها و توزیع آماری جامعه است. اگر متغیرها از نوع اسمی و ترتیبی بوده حتما از روشهای ناپارامتریک استفاده می شود. اگر متغیرها از نوع فاصله ای و نسبی باشند در صورتیکه فرض شود توزیع آماری جامعه نرمال یا بهنجار است از روشهای پارامتریک استفاده می شود در غیراینصورت از روشهای ناپارامتریک استفاده می شود.
4. خلاصه آزمونهای پارامتریک
آزمون t تک نمونه : برای آزمون فرض پیرامون میانگین یک جامعه استفاده می شود. در بیشتر پژوهش هائی که با مقیاس لیکرت انجام می شوند جهت بررسی فرضیه های پژوهش و تحلیل سوالات تخصصی مربوط به آنها از این آزمون استفاده می شود.
آزمون t وابسته : برای آزمون فرض پیرامون دو میانگین از یک جامعه استفاده می شود. برای مثال اختلاف میانگین رضایت کارکنان یک سازمان قبل و بعد از تغییر مدیریت یا زمانی که نمرات یک کلاس با پیش آزمون و پس آزمون سنجش می شود.
آزمون t دو نمونه مستقل: جهت مقایسه میانگین دو جامعه استفاده می شود. در آزمون t برای دو نمونه مستقل فرض می شود واریانس دو جامعه برابر است. برای نمونه به منظور بررسی معنی دار بودن تفاوت میانگین نمره نظرات پاسخ دهندگان بر اساس جنسیت در خصوص هر یک از فرضیه های پژوهش استفاده میشود.
آزمون t ولچ: این آزمون نیز مانند آزمون t دو نمونه جهت مقایسه میانگین دو جامعه استفاده می شود. در آزمون t ولچ فرض می شود واریانس دو جامعه برابر نیست. برای نمونه به منظور بررسی معنی دار بودن تفاوت میانگین نمره نظرات پاسخ دهندگان بر اساس جنسیت در خصوص هر یک از فرضیه های پژوهش استفاده میشود.
آزمون t هتلینگ : برای مقایسه چند میانگین از دو جامعه استفاده می شود. یعنی دو جامعه براساس میانگین چندین صفت مقایسه شوند.
تحلیل واریانس (ANOVA): از این آزمون به منظور بررسی اختلاف میانگین چند جامعه آماری استفاده می شود. برای نمونه جهت بررسی معنی دار بودن تفاوت میانگین نمره نظرات پاسخ دهندگان بر اساس سن یا تحصیلات در خصوص هر یک از فرضیه های پژوهش استفاده می شود.
تحلیل واریانس چندعاملی (MANOVA): از این آزمون به منظور بررسی اختلاف چند میانگین از چند جامعه آماری استفاده می شود.
تحلیل کوواریانس چندعاملی (MANCOVA): چنانچه در MANOVA بخواهیم اثر یک یا چند متغیر کمکی را حذف کنیم استفاده می شود.
ضریب همبستگی گشتاوری پیرسون: برای محاسبه همبستگی دو مجموعه داده استفاده می شود.
5. خلاصه آزمونهای ناپارامتریک
آزمون علامت تک نمونه : برای آزمون فرض پیرامون میانگین یک جامعه استفاده می شود.
آزمون علامت زوجی : برای آزمون فرض پیرامون دو میانگین از یک جامعه استفاده می شود.
ویلکاکسون : همان آزمون علامت زوجی است که در آن اختلاف نسبی تفاوت از میانگین لحاظ می شود.
مان-ویتنی: به آزمون U نیز موسوم است و جهت مقایسه میانگین دو جامعه استفاده می شود.
کروسکال-والیس: از این آزمون به منظور بررسی اختلاف میانگین چند جامعه آماری استفاده می شود. به آزمون H نیز موسوم است و تعمیم آزمون U مان-ویتنی می باشد. آزمون کروسکال-والیس معادل روش پارامتریک آنالیز واریانس تک عاملی است.
فریدمن: این آزمون معادل روش پارامتریک آنالیز واریانس دو عاملی است که در آن k تیمار به صورت تصادفی به n بلوک تخصیص داده شده اند.
نیکوئی برازش : برای مقایسه یک توزیع نظری با توزیع مشاهده شده استفاده می شود و به آزمون خی-دو یا χ² نیز موسوم است. مدل معادلات ساختاری که در آن پژوهشگر یک مدل نظری را براساس روابط متغیرها ترسیم کرده است از همین ازمون بهره گرفته می شود. اکنون به تبع افزایش توانمندی نرم افزارهایی مانند LISREL می توان از آن به سهولت استفاده کرد.
کولموگروف-اسمیرنف : نوعی آزمون نیکوئی برازش برای مقایسه یک توزیع نظری با توزیع مشاهده شده است.
آزمون تقارن توزیع : در این آزمون شکل توزیع مورد سوال قرار می گیرد. فرض بدیل آن است که توزیع متقارن نیست.
آزمون میانه : جهت مقایسه میانه دو جامعه استفاده می شود و برای k جامعه نیز قابل تعمیم است.
مک نمار : برای بررسی مشاهدات زوجی درباره متغیرهای دو ارزشی استفاده می شود.
آزمون Q کوکران: تعمیم آزمون مک نمار در k نمونه وابسته است.
ضریب همبستگی اسپیرمن: برای محاسبه همبستگی دو مجموعه داده که به صورت ترتیبی قرار دارند استفاده می شود
منبع پایگاه علمی -پژوهشی پارس مدیر
منبع: http://www.spss-iran.com