ضریب همبستگی چیست؟

ضریب همبستگی چیست و چه کاربردی دارد؟
در دنیای کسبوکار پیش میآید که تصمیمگیر به رابطه بین دو متغیر علاقهمند است. در آمار، از کوواریانس (Covariance) و همبستگی (Correlation) برای کمّی کردن رابطه بین متغیرها بهره میبرند. در این مقاله ضریب همبستگی چیست؟ به تعاریف ریاضی این مفاهیم میپردازم. علاوه بر این با یک مثال در حوزه مدیریت کیفیت و اجرای آن در نرمافزار R، کاربرد این مفهوم را در تصمیمگیری نشان خواهم داد.
کوواریانس نمونه آماری
کوواریانس یک شاخص توصیفی است که وجود رابطه خطی بین دو متغیر را سنجش میکند. اگر نمونهای آماری از متغیرهای و دارای مشاهده باشد، آنگاه کوواریانس بین این دو متغیر از رابطه زیر محاسبه میشود:
در فرمول بالا ابتدا فاصله هریک از مقادیر متغیرهای و از میانگین آن محاسبه میشود. این انحرافها از میانگین برای مقادیر متناظر و در هم ضرب و مجموع آن محاسبه شده؛ سپس این مقدار بر تقسیم میگردد.
همبستگی نمونه آماری
واحد کوواریانس تابع واحد متغیرهای و است. به همین دلیل مقایسه این شاخص برای سنجیدن شدت رابطه بین متغیرها دشوار میشود. با تقسیم کوواریانس بر حاصلضرب انحراف معیار متغیرهای و ضریب همبستگی پیرسون (Pearson Correlation Coefficient) به دست میآید که تحت تأثیر واحد متغیرها نیست:
ضریب همبستگی همواره عددی بین ۱ و ۱- است. این ضریب دو بخش دارد: مقدار عددی و علامت. مقدار عددی نشان میدهد چقدر رابطه خطی بین دو متغیر قدرتمند است. علامت نشان میدهد جهت این رابطه مثبت است یا منفی.
اگر ضریب همبستگی مثبت باشد، به این مفهوم است که افزایش در مقادیر یک متغیر با افزایش در مقادیر متغیر دیگر همراه است. همینطور کاهش در مقادیر یک متغیر با کاهش در مقادیر متغیر دیگر همراه است. در این حالت اگر نمودار پراکندگی دو متغیر رسم شود، میتوان خطی با شیب مثبت را از بین نقاط برازش داد (شکل-۱). به همین ترتیب اگر ضریب همبستگی منفی باشد، میتوان خطی با شیب منفی را از بین نقاط برازش داد (شکل-۱).
هرچه مقدار مطلق ضریب همبستگی (صرفنظر از علامت) به ۱ نزدیک باشد، نشان میدهد شدت رابطه خطی بین دو متغیر قویتر است. در مقابل ضریب همبستگی نزدیک صفر نشان میدهد که رابطه خطی بسیار ضعیفی بین متغیرهای و برقرار است. در این حالت اگر نمودار پراکندگی دو متغیر رسم شود، اینطور به نظر میرسد نقاط به شکل تصادفی در صفحه رسم شدهاند (شکل-۱).
شکل-۱
اگر بین دو متغیر رابطه غیرخطی برقرار باشد، همچنان این امکان وجود دارد ضریب همبستگی نزدیک صفر باشد که نشاندهنده نبود رابطه خطی بین دو آن است (شکل-۲). به همین دلیل در هنگام تحلیل بهتر است نمودار پراکندگی بین متغیرها رسم شود تا به وجود این روابط پی برد.
شکل-۲
باید توجه کرد که اگر بین دو متغیر همبستگی دیده شود لزوماً به این معنی نیست که یکی دلیل وجود دیگری است. این امکان وجود دارد این همبستگی جعلی (Spurious Correlations) باشد به این معنی که متغیر پنهان سومی روی هر دو متغیر اثر میگذارد و یا اینکه همبستگی کاملاً تصادفی است.
در نرمافزار اکسل (Excel) از تابع ()CORREL برای محاسبه ضریب همبستگی استفاده میشود. در شکل-۳ در خانه C12 از فرمول زیر برای محاسبه ضریب همبستگی بین متغیرهای X و Y استفاده شده است:
شکل-۳
یک مثال در حوزه مدیریت کیفیت
این مثال مربوط به خط تولید یک نوع ارهبرقی است که در آن از پرچ برای متصل کردن دو قطعه به یکدیگر استفاده میشود. یکی از شاخصهایی که جهت کنترل کیفیت در این خط تولید سنجیده میشود ارتفاع بیرونزدگی سر پرچ است. فرض کنید بهعنوان مدیر خط تولید، با بررسی روند موجود در نمودارهای کنترل کیفیت پی بردید که بهزودی ممکن است این ارتفاع از محدوده استاندارد خارج شود. در جلسهای که با تیم بهبود کیفیت خود دارید، یکی از اعضا پیشنهاد میدهد واریانس مشاهدهشده در فرآیند تولید، به علت ضخامت رنگی است که دور سوراخ پرچ مینشیند. رنگ زدن قطعات قبل از فرآیند پرچ اتفاق میافتد و بعد از آن ارتفاع پرچ سنجش میشود. با جمعآوری نمونه تصمیم میگیرید این فرضیه را بیازمایید که آیا بین ارتفاع پرچ (Rivet Height) و ضخامت رنگ (Paint Thickness) همبستگی وجود دارد یا خیر.
این مثال را در نرمافزار R اجرا کردم. در ابتدا دادهها وارد و نمودار پراکندگی و خط رگرسیون رسم شده است (شکل-۴).
مفهوم ضریب همبستگی چیست و چه کاربردی دارد؟
- مفهومی کلی از ضریب همبستگی در ذهن داشته باشند.
- وقتی جایی در گزارشی میخوانند که دو متغیر با هم ضریب همبستگی مثبت یا منفی دارند، منظور کلی نویسنده یا محقق را درک کنند.
- مراقب باشند که ضریب همبستگی را با رابطهی بین علت و معلول اشتباه نگیرند.
- در موارد ساده، با استفاده از نرم افزار اکسل، بتوانند ضریب همبستگی را محاسبه کنند.
بحث ضریب همبستگی بحث بسیار گستردهای است که دامنهی آن از فلسفه تا آمار و از نیوتون تا هایزنبرگ گسترده است.
طبیعتاً قصد ما در این درس، این نیست که شما را درگیر پیچیدگیهای این موضوع کنیم.
اما میخواهیم چند نکتهی ساده دربارهی همبستگی را مطرح کنیم تا در درسهای دیگر بتوانیم به آن ارجاع دهیم.
در ابتدای این درس، یک توضیح غیردقیق و سادهشده از ضریب همبستگی ارائه میکنیم که برای بسیاری از درسهای متمم کافی است. در ادامه (بخش پایانی) توضیحات کاملتری دربارهی ضریب همبستگی ارائه شده است.
اگر قرار نیست کارهای مطالعاتی و تحقیقاتی پیچیده انجام دهید و فقط میخواهید در هنگام مطالعهی متنهای عمومی مدیریتی، درک درستی از ضریب همبستگی داشته باشید، احتمالاً توضیحات زیر برای شما کافی خواهد بود:
- اگر ضریب همبستگی دو پارامتر با یکدیگر مثبت باشد، به این معناست که در فضایی که مطالعه و بررسی انجام شده، افزایش یک پارامتر با افزایش پارامتر دیگر و نیز کاهش آن پارامتر با کاهش پارامتر دیگر همراه است.
- اگر ضریب همبستگی دو پارامتر با یکدیگر منفی باشد، به این معناست که در فضایی که مطالعه و بررسی انجام شده، افزایش یک پارامتربا کاهش پارامتر دیگر و کاهش آن پارامتربا افزایش پارامتر دیگر همراه است.
- صفر بودن ضریب همبستگی به این معناست که دو پارامتر – در فضایی که مورد بررسی قرار گرفته – مستقل از یکدیگر بودهاند و بر اساس اطلاعات موجود ازکاهش یا افزایش یکی، نمیتوان در مورد کاهش یا افزایش دیگری اظهار نظر کرد.
- ضریب همبستگی بین منفی یک و مثبت یک است. هر چه این ضریب از صفر دورتر شود (و به مثبت یا منفی یک نزدیکتر شود) میتوان نتیجه گرفت که روند هم جهت بودن یا مخالف بودن دو پارامتر مورد بررسی، جدیتر است.
- ضریب همبستگی هیچ ارتباطی با رابطهی علت و معلول ندارد. احتمال دارد در یک جامعهی آماری، بین حجم موتور ماشین و درآمد مالک ماشین، ضریب همبستگی مثبت وجود داشته باشد. اما این بدان معنی نیست که اگر ماشینی بخرید که حجم موتور بالاتری دارد، ثروتمندتر میشوید یا اگر سپردهی بانکی شما افزایش یابد، حجم موتور ماشین شما رشد خواهد کرد. این بحث را میتوانید به شکل دقیقتر در درس نظریه علمی یا واقعیت آماری مطالعه کنید.
بعضی از بحثهای متمم که به نوعی با ضریب همبستگی رابطه دارند:
بسته به هدفی که دارید و جامعهی آماری که مد نظر شماست، شیوههای متعددی برای محاسبهی ضریب همبستگی یا Correlation Coefficient وجود دارد.
برای اینکه با یکی از شیوههای محاسبهی ضریب همبستگی آشنا شویم، ما در اینجا ضریب همبستگی پیرسون را به عنوان نمونه انتخاب کردهایم. این ضریب در مقالات تحقیقاتی معمولاً با نماد r نمایش داده میشود.
همانطور که در درس نظریه علمی یا واقعیت آماری اشاره شد، مهمترین نکتهای که باید در مورد ضریب همبستگی به خاطر داشته باشیم این است که ضریب همبستگی، به رابطهی علت با معلول اشاره نمیکند و صرفاً مشخص میکند که بین دو متغیر رابطه خطی وجود دارد.
به عنوان مثال، تحقیقات نشان میدهند که ضریب همبستگی بین تعداد سیگارهایی که یک نفر در طول زندگی کشیده و عمر او، منفی است.
اما از این تحقیق نمیتوان نتیجه گرفت که سیگار کشیدن، عمر را کوتاه میکند.
ممکن است این دو متغیر، تابع متغیر سومی به نام سختیهای زندگی باشند.
به این معنی که با افزایش سختیهای زندگی، تنش افزایش یافته و با افزایش تنش، ضمن اینکه تعداد سیگارهای مصرفی افزایش مییابد، عمر نیز کاهش یابد.
اگر چه در این مثال خاص، تحقیقات متعدد دیگر نشان دادهاند که مصرف سیگار میتواند علت مستقیم کاهش عمر باشد، اما این نتیجه را نمیتوان صرفاً از منفی بودن ضریب همبستگی استخراج کرد.
برخی از دوستان متممی که به این درس علاقه مندند: احمد ، سعید تروال ، محمدرضا ، مهری آزردار ، مهدی خانی
ضریب همبستگی چیست و چه کاربردی در بورس دارد؟
ضریب همبستگی روابط میان دو متغیر را به ما نشان میدهد. یعنی با توجه به این ضریب میتوانیم بفهمیم که آیا دو متغیر با هم ارتباط دارند یا نه. و اگر ارتباطی دارند جهت این ارتباط کدام طرفی است. از این ضریب در بازار بورس به منظور پیدا کردن روابط بین سهام استفاده میکنیم.
بارها توسط افراد مختلف در حوزههای شغلی گوناگون یا در رسانهها به منظور تحلیل آماری و بیان نتایج تحقیقات، واژه ضریب همبستگی یا اصطلاح لاتین آن Correlation را شنیدهایم. یکی از مهم ترین کاربردهای این مفهوم در بازارهای مالی است، که در این مطلب به بررسی آن و مباحث پیرامونی در حوزه بازار بورس میپردازیم. ضریب همبستگی یک ابزار آماری برای تعیین نوع و درجه رابطه متغیرهای کمی با یکدیگر است. این مفهوم یکی از معیارهای تشخیص میزان همبستگی دو متغیر میباشد. در واقع این ضریب نوع رابطه یعنی مستقیم یا معکوس بودن و شدت رابطه یعنی بازه ۱+ تا ۱- را نشان میدهد. همچنین اگر میان دو متغیر مذکور رابطهای وجود نداشته باشد، مقدار ضریب همبستگی برابر صفر است.
انواع روابط بین متغیرها
الف ) رابطه مستقیم
اندازه عددی بدست آمده برای این ضریب بین 1- تا 1+ می باشد که به کمک آن می توان درجه ای را که دو متغیر بایکدیگر در ارتباط هستند را نشان داد. در صورتی که عدد همبستگی بین صفر تا 1 باشد نوع رابطه را مستقیم می نامیم.
رابطه مستقیم به این معنی ضریب همبستگی چیست؟ است که با افزایش یک متغیر انتظار می رود که اندازه متغیر دیگر نیز افزایش یابد و برعکس با کاهش اندازه یک متغیر اندازه متغیر دیگر نیز کاهش یابد. به عنوان مثال وقتی گفته می شود بین مصرف میوه با شادابی پوست رابطه مستقیمی وجود دارد یعنی که اگر فردی مصرف میوه اش بیشتر باشد انتظار می رود که پوست شادابتری داشته باشد و یا اینکه افراد هر چقدر پوست شادابتری داشته باشند انتظار می رود که مصرف میوه آنها نیز بالاتر باشد و برعکس.
ب ) رابطه معکوس
در صورتی که عدد ضریب همبستگی بین صفر تا 1 – باشد رابطه را از نوع معکوس می نامیم. رابطه معکوس به این معنی است که با افزایش یک متغیر انتظار می رد که اندازه متغیر دیگر نیز کاهش یابد و برعکس با کاهش اندازه یک متغیر اندازه متغیر دیگر نیز افزایش یابد. به عنوان مثال وقتی گفته می شود بین مصرف سیگار با طول عمر رابطه معکوس وجود دارد یعنی که اگر فردی مصرف سیگارش بیشتر باشد انتظار می رود که طول عمر کمتری داشته باشد و یا اینکه افراد هر چقدر طول عمر بیشتری داشته باشند انتظار می رود که کمتر سیگار مصرف کرده باشند و برعکس.
علاوه بر این درصورتی که مقدار عددی همبستگی برابر 1+ باشد همبستگی را مستقیم کامل و اگر برابر 1 – باشد آن را معکوس کامل و در صورتی که برابر صفر باشد می گوییم بین دو متغیر هیچگونه رابطه ای وجود ندارد.
انواع روش های همبستگی Correlation
- ضریب همبستگی پیرسون
- ضریب همبستگی اسپیرمن
- ضریب همبستگی تاو کندال
بطور کلی:
۱- اگر هر دو متغیر با مقیاس رتبهای باشند از شاخص تاوکندال استفاده میشود.
۲- اگر هر دو متغیر با مقیاس نسبتی و پیوسته باشند از ضریب همبستگی پیرسون استفاده میشود.
۳- اگر هر دو متغیر با مقیاس نسبتی و گسسته باشند از ضریب همبستگی اسپیرمن استفاده میشود.
در پایین فقط ضریب همبستگی پیرسون را با هم بررسی میکنیم.
ضریب همبستگی پیرسون
ضریب همبستگی پیرسون را میتوانیم معروفترین انواع این ضریب بدانیم. وقتی تعداد دادهها زیاد است و توزیعها هم نرمال هستند بهتر است از ضریب پیرسون استفاده کنیم تا شدت و جهت روابط بین دو متغیر را بررسی کنیم. این ضریب مقدار وابستگی بین دو متغیر تصادفی را خیلی خوب به ما نشان میدهد.
در ابتدای مقاله فرمول مربوط به این ضریب را بررسی کردیم. وقتی دادهها را در فرمول جایگذاری کنیم، نتایج مختلفی به دست میآید. در تفسیر ضریب همبستگی پیرسون به طور کلی سه حالت ضریب همبستگی چیست؟ زیر را داریم:
- مثبت: اعداد مثبت نشان از رابطهی مستقیم بین دو متغیر دارند. یعنی اگر مقدار یکی از متغیرها زیاد شود، مقدار متغیر دیگری هم زیاد میشود. در مورد کاهش مقدار هم این قضیه برقرار است. اگر نتیجهی محاسبات اعدادی بین ۰.۸ تا ۱ باشند، در تفسیر ضریب همبستگی باید بگوییم که این دو متغیر رابطهای بسیار قوی دارند. اعداد بین ۰.۸ تا ۰.۶ نشان از رابطهای قوی دارند. همچنین اعداد ۰.۶ تا ۰.۴ رابطهای متوسط را نشان میدهند و مقادیر کمتر نشان از رابطهی ضعیف دارد. اگر نتیجه در بازهی ۰.۲ تا صفر قرار بگیرد رابطه بین دو متغیر یا خیلی ناچیز است یا اصلا رابطهای وجود ندارد.
- منفی: این نتیجه برعکس قبلی است. یعنی اگر ضریب همبستگی پیرسون بین دو متغیر منفی باشد، وقتی مقدار یک متغیر زیاد شود، مقدار متغیر دیگری کم میشود و بالعکس.
- صفر: کاملا مشخص است که ضریب صفر به چه معناست. این عدد نشان میدهد که رابطهای بین دو متغیر تصادفی وجود ندارد.
چه نکاتی در همبستگی دو نماد وجود دارد؟
دو نکته اصلی درباره همبستگی بین نمادها نهفته است که میتواند به تصمیم گیری بهتر به ما کند.
نکته اول: امکان ندارد که عمده پرتفوی بورسی یک شرکتی چندین روز مثبت باشد ولی خود آن سهم منفی باشد. اگر چنین شد، فرصت خوبی برای سرمایه گذاری ایجاد شده است و هر چقدر این اختلاف بیشتر شود سود بیشتری در انتظار خواهد بود. برای مثال اگر دیدید فملی چندین روز صف خرید است و وسپه در حال درجا زدن است، احتمالا وسپه گزینه خوبی برای خرید است چرا که درصدی از فملی برای وسپه است و از رشد آن متنفع خواهد شد. این مسئله تحت عنوان NAV سهم در تحلیل بنیادی مورد بررسی قرار میگیرد.
نکته دوم: برخی نمادها به علت پرتفوی مشابه، رفتار قیمتی مشابهی دارند. این موضوع به یک سرمایه گذار حرفه ای کمک خواهد کرد که موقعیتهای خوبی را شناسایی کند. برای مثال اگر در یک روز وسپه صف خرید بود و تاصیکو منفی، احتمالا میتوانید تاصیکو را حداقل به دید کوتاه مدت خریداری کنید چرا که ضریب همبستگی بین این دو نماد بالاست.
مثالی از کاربرد ضریب همبستگی در ترکیب پرتفوی
این بخش را با یک مثال از کاربرد ضریب همبستگی در چیدمان سبد سهام ادامه میدهیم. دو شرکت الف و ب را در نظرتان مجسم کنید. حالا فرض کنید شرکت الف ۱۱۰ میلیون سهم شرکت ب را که در گروه خودروسازی فعال است خریداری کرده است. پس انتظار داریم وقتی در سهم ب اتفاقات مثبتی رخ بدهد، شاهد تعدیل مثبت در سهم الف باشیم. یعنی با افزایش قیمت سهم ب، سهم الف هم سودسازی خوبی را خواهد داشت. هر چه شرکت الف درصد مالکیت بالاتری داشته باشد، سودسازیاش هم بیشتر خواهد بود. اما این اطلاعات به چه دردی میخورند؟
قضیه خیلی ساده است. اگر سهم شرکت الف را خریدهاید دیگر سهم شرکت ب را نخرید. درست است که این دو شرکت سهام متفاوتی دارند اما به هر حال با یکدیگر همبستگی دارند. اینطور میتوانید سبد سهامی بچینید که پوشش ریسک در آن رعایت شده است. این مسئله یکی از اصول اولیه برای متنوع سازی سبد سهام است. اگر به ترکیب سهامداران شرکتهای فعال در بورس ایران نگاه کنید، میتوانید ببینید عمده سهامداران شرکتها چه کسانی هستند. به این ترتیب نه تنها ریسک را کم کردهاید بلکه ممکن است بازده بیشتری را هم به دست بیاورید.
مفاهیم: ضریب همبستگی چیست؟
همشهری آنلاین: ضریب همبستگی (Correlation Coefficient) ابزاری آماری برای تعیین نوع و درجه رابطهٔ یک متغیر کمی با متغیر کمی دیگر است.
ضریب همبستگی، یکی از معیارهای مورد استفاده در تعیین همبستگی دو متغیر است.
ضریب همبستگی شدت رابطه و همچنین نوع رابطه (مستقیم یا معکوس) را نشان میدهد. این ضریب بین ۱ تا ۱- است و در عدم وجود رابطه بین دو متغیر، برابر صفر است.
همبستگی بین دو متغیر تصادفی X و Y به صورت زیر تعریف میشود:
که در آن E عملگر امید ریاضی، cov به معنای کوواریانس، corr نماد معمول برای همبستگی (کورولیشن) پیرسون، و سیگما نماد انحراف معیار است.
در نظریه احتمالات؛ امید ریاضی، میانگین، مقدار مورد انتظار یا ارزش مورد انتظار یک متغیر تصادفی گسسته برابر است با مجموع حاصلضرب احتمال وقوع هر یک از حالات ممکن در مقدار آن حالت. در نتیجه میانگین برابر است با مقداری که بطور متوسط از یک فرایند تصادفی با بینهایت تکرار انتظار میرود.
کواریانس یا هموردایی (Covariance):
در نظریه احتمالات، اندازه تغییرات هماهنگ دو متغیر تصادفی است. (اگر دو متغیر یکی باشند کواریانس برابر واریانس خواهد شد). چنانکه دو متغیر تصادفی ناوابسته باشند کواریانس آنها صفر خواهد بود.
ضریب همبستگی پیرسون ( Pearson Correlation Coefficient):
روشی پارامتری است و برای دادههایی با توزیع نرمال یا تعداد دادههای زیاد استفاده میشود.
ضریب همبستگی اسپیرمن (Spearman Correlation Coefficient):
در صورتی که تعداد دادهها کم و فرض نرمال بودن آنها معقول نباشد، از ضریب همبستگی اسپیرمن استفاده میشود. ضریب همبستگیای که بر اساس رتبهٔ دادهها محاسبه میشود، توسط اسپیرمن محاسبه شدهاست.
انحراف معیار(Standard deviation):
نوعی سنجش پراکندگی برای یک توزیع احتمالی یا متغیر تصادفی است و نمایندهٔ پخششدگی مقادیر آن حول مقدار میانگین است.
همبستگی Correlation
همبستگی Correlation یک رابطه آماری بین ضریب همبستگی چیست؟ دو متغیر تصادفی یا دو دسته داده است که لزوما به معنای ارتباط علی و معلولی آنها نیست. همبستگی روابط متغیرها را به صورت دوبهدو و جدا از تاثیر همزمان سایر متغیرها بررسی میکند. عمده ترین روشهای شناخته شده در این زمینه توسط پیرسون (برای دادههای نرمال) و اسپیرمن (برای دادههای غیرنرمال) ارائه شده است. همبستگی برای بررسی نوع و میزان رابطه متغیرها استفاده میشود. در حالیکه رگرسیون پیشبینی روند آینده یک متغیر ملاک (وابسته) براساس یک مجموعه روابط بین متغیر ملاک با یک چند متغیر پیشبین (مستقل) است که در گذشته ثبت و ضبط شده است. بحث تفاوت رگرسیون و همبستگی را مطالعه کنید.
از سوی دیگر در دستهبندی انواع روش تحقیق در مدیریت و علوم اجتماعی نیز تحقیق همبستگی یکی از روشهای بااهمیت است. این نوع تحقیق یکی از روشهای تحقیق توصیفی (غیرآزمایشی) است که رابطه میان متغیرها را براساس هدف تحقیق بررسی میکند. میتوان تحقیقات همبستگی را براساس هدف به سه دسته تقسیم کرد: همبستگی دو متغیری، تحلیل رگرسیون و تحلیل کوواریانس یا ماتریس همبستگی. در این زمینه در بخش اول قسمت تقسیمبندی روشهای تحقیق براساس هدف توضیح لازم ارائه گردید.
در این آموزش از منظر آماری به موضوع همبستگی Correlation پرداخته شده است. ضریب همبستگی شاخصی است ریاضی که جهت و مقدار رابطه ی بین دو متغیر را توصیف میکند. ضریب همبستگی درمورد توزیعهای دویا چند متغیره به کار میرود. اگر مقادیر دو متغیر شبیه هم تغییر کند یعنی با کم یا زیاد شدن یکی دیگری هم کم یا زیاد شود به گونهای که بتوان رابطه آنها را به صورت یک معادله بیان کرد گوییم بین این دو متغیرهمبستگی وجود دارد.
انواع روشهای همبستگی Correlation
- ضریب همبستگی پیرسون
- ضریب همبستگی اسپیرمن
- ضریب همبستگی تاو کندال
بطور کلی:
۱- اگر هر دو متغیر با مقیاس رتبهای باشند از شاخص تاوکندال استفاده میشود.
۲- اگر هر دو متغیر با مقیاس نسبتی و پیوسته باشند از ضریب همبستگی پیرسون استفاده میشود.
۳- اگر هر دو متغیر با مقیاس نسبتی و گسسته باشند از ضریب همبستگی اسپیرمن استفاده میشود.
تفسیر نتایج ضریب همبستگی برونداد SPSS
براساس یک قاعده کلی براساس مقادیر زیر میتوان درباره میزان همبستگی متغیرها قضاوت کرد. بخاطر داشته باشید همین تفسیر برای مقادیر منفی نیز قابل استفاده است:
ضریب همبستگی | تفسیر |
۰.۰۰ – ۰.۱۹ | خیلی اندک و قابل چشم پوشی |
۰.۲۰ – ۰.۳۹ | خیلی اندک تا اندک |
۰.۴۰ – ۰.۶۹ | متوسط |
۰.۷۰ – ۰.۸۹ | زیاد |
۰.۹۰ – ۱.۰۰ | خیلی زیاد |
این مقادیر یک قانون ثابت نیستند و به صورت تجربی بدست آمده است. در برخی متون مانند زیر نیز ارائه شده است:
ضریب همبستگی | تفسیر |
۰.۰ – ۰.۱ | خیلی اندک و قابل چشم پوشی |
۰.۱ – ۰.۳ | اندک |
۰.۳ – ۰.۵ | متوسط |
۰.۵ – ۱.۰ | زیاد |
همچنین آماره .sig یا همان P-Value مربوط به همبستگی مشاهده شده باید کوچکتر از سطح خطا باشد. یک قانون کلی وجود دارد و آن اینکه اگر همبستگی بزرگتر از ۰.۳ باشد مقدار معناداری کوچکتر از سطح خطای ۰/۰۵ خواهد بود. تجربه آماری من نیز همیشه مطابق این قانون بوده است.
ضریب همبستگی پیرسون
در بررسی همبستگی Correlation دو متغیر اگر هردو متغیر مورد مطالعه در مقیاس نسبی و فاصلهای باشند از ضریب همبستگی پیرسون استفاده میشود. اگر ضریب همبستگی جامعه ρ و ضریب همبستگی نمونهای به حجم n از جامعه r باشد، ممکن است r تصادفی و اتفاقی بدست آمده باشد. برای این منظور از آزمون معنی داری ضریب همبستگی استفاده میشود. در این آزمون بررسی میشود آیا دو متغیر تصادفی و مستقل هستند یا خیر. به عبارت دیگر آیا ضریب همبستگی جامعه صفر است یا خیر.
این ضریب میزان همبستگی بین دو متغیر فاصلهای یا نسبی را محاسبه کرده مقدار آن بین ۱+ و ۱- میباشد اگر مقدار بدست آمده مثبت باشد به معنی این است که تغییرات دو متغیر به طور هم جهت اتفاق میافتد یعنی با افزایش در هر متغیر، متغیر دیگر نیز افزایش مییابد و برعکس اگر مقدار r منفی شد یعنی اینکه دو متغیر در جهت عکس هم عمل میکنند یعنی با ضریب همبستگی چیست؟ افزایش مقدار یک متغیر مقادیر متغیر دیگر کاهش مییابد و برعکس. اگر مقدار بدست آمده صفر شد نشان میدهد که هیچ رابطهای بین دو متغیر وجود ندارد و اگر ۱+ شد همبستگی مثبت کامل و اگر ۱- شد همبستگی کامل و منفی است.
ضریب همبستگی اسپیرمن
هرگاه دادهها بصورت رتبهای جمع آوری شده باشند یا به رتبه تبدیل شده باشند، میتوان از همبستگی اسپیرمن rs که یکی از روشهای ناپارامتریک است، استفاده کرد. یکی از مزیتهای ضریب همبستگی رتبهای اسپیرمن به ضریب همبستگی پیرسون این است که اگر یک یا چند داده نسبت به سایر اعداد بسیار بزرگ باشد چون تنها رتبه آنها محسوب میشود، سایر دادهها تحت الشعاع قرار نمیگیرند.
برای محاسبه ضریب همبستگی رتبهای دادههای زوجی (Xi, Yi) ابتدا به تمام xها برحسب مقادیرشان رتبه میدهیم و همین کار را نیز برای yها انجام میدهیم، سپس تفاضل بین رتبههای هر زوج را که با نشان میدهیم حساب میکنیم. در مرحله بعد توان دوم dها را محاسبه کرده، در نهایت با استفاده از این فرمول ضریب همبستگی رتبهای را حساب میکنیم.
ضریب همبستگی کندال
موریس گریگور کندال به سال ۱۹۳۰ به مطالعه در مورد این ضریب پرداخت. دقت کنید ضریب هماهنگی کندال با ضریب همبستگی تاو کندال تفاوت دارد. کندال در ضریب همبستگی کندال دارای خواصی نظیر ضریب همبستگی ساده است. برای برآورد آن از آماره τ استفاده میشود.
ضریب هماهنگی توافقی کندال
ضریب هماهنگی کندال که با نماد w نشان داده میشود یک آزمون ناپارامتریک است و برای تعیین میزان هماهنگی میان نظرات استفاده میشود. ضریب کندال بین ۰ و ۱ متغیر است. اگر ضریب کندال صفر باشد یعنی عدم توافق کامل و اگر یک باشد یعنی توافق کامل وجود دارد. ویژگیهای ضریب کندال یکی از مهمترین کاربردهای این آزمون را در مدیریت فراهم کرده است. برای پایان راندهای تکنیک دلفی میتوان از ضریب هماهنگی کندال استفاده کرد.
سایر ضرائب همبستگی Correlation
ضریب همبستگی چوپروف T : ضریب هبستگی چوپروف به منظور تعیین شدت وابستگی بین متغیرهای مورد مطالعه به کار گرفته میشود و مقدار آن همواره بین صفر ویک در نوسان میباشد زمانی از آن استفاده کرده که هر دو متغیر اسمی و یا یکی اسمی و دیگری ترتیبی باشد. اما نباید تعداد سطر و ستون با هم برابر باشند.یعنی در جدول توافقی ۲در۲ نمی توان از آن استفاده کرد. در چنین مواردی باید از ضریب فی استفاده کرد.
ضریب همبستگی فی: به منظور بررسی شدت همبستگی Correlation بین دو متغیر اسمی که جدول توافقی ۲ در ۲ میباشد مورد استفاده قرار میگیرد.خی دو سطح معنی دار بودن همبستگی بین دو متغیر را تعیین میکند اما ضریب فی شدت همبستگی آنها را نشان میدهد. مقدار آن همواره بین صفر و یک در نوسان است.
ضریب کرامر: این ضریب برای تغیین میزان شدت همبستگی بین دو متغیر اسمی مورد استفاده قرارمی گیرد و آن را با (V2) نشان میدهند و مقدار آن نیز همواره بین صفر ویک در نوسان است. هم جدول توافقی بیشتر از ۲ در ۲ وهم برای مستطیلی بکار میرود.