معادله ضریب همبستگی


انتخاب آزمون مناسب و مرتبط برای تحلیل داده های پژوهش تنها وابسته به یک عنصر نبوده و عوامل مختلفی در آن دخالت دارند. در آزمون های سنجش تفاوت و اختلاف (مقایسه ای) گاهی نوع فرضیه شما به گونه ای است که قصد دارید مقایسه ای را بین میانگین های دو گروه یا بیشتر و یا حتی میانگین صفتی را در یک گروه با مقدار ثابتی مقایسه کنید. در این صورت از آزمون های زیر که در زیرمجموعه آزمون های پارامتریک قرار دارند، می توانید استفاده نمایید.

تحلیل آماری و انجام پروژهای اس پی اس اس

انجام پروژه به وسیله نرم افزار اس پی اس اس (09399861113) وب سایت اصلی ما: www.spssv21.ir

انواع ضریب همبستگی

کی از تعاریف اساسی در علم آمار تعریف همبستگی و رابطه بین دو متغیر می باشد. بطور کلی شدت وابستگی دو متغیر به یکدیگر را همبستگی تعریف می کنیم. و ممکن علاوه بر شدت همبستگی جهت همبستگی نیز مورد نیاز پژوهشگر باشد. در آمار انواع زیادی از ضرایب همبستگی­ متفاوت وجود دارند که هر کدام همبستگی بین دو متغیر را با توجه به نوع داده­ها و شرایط متغیرها اندازه­گیری می­کنند. لذا با توجه به اهمیت این موضوع که چه ضریب همبستگی را در چه زمانی مورد استفاده قراردهیم،

در اینجا قصد داریم به تعریف انواع همبستگی پرداخته و سعی بر آن داریم که زمان استفاده از این ضرایب همبستگی­ها و روش محاسبه آنها را در یکی از نرم­افزارهای آماری ذکر کنیم.

محاسبه ضرایب همبستگی تا حدود زیادی متاثر از مقیاس اندازه گیری متغیر ها است، بعنوان معادله ضریب همبستگی مثال برای متغیر­های اسمی جهت رابطه اصلا معنی ندارد، بین جنس و معدل تنها می­توان گفت که شدت وابستگی چه مقدار است اما افزایش یا کاهش جنس معنی ندارد.

با توجه به نوع متغیر ها ضریب همبستگی می­تواند یکی از حالت­های زیر را داشته باشد.

1- دو متغیر اسمی

2- دو متغیر رتبه­ای

3- دو متغیر فاصله­ای- نسبی

4- متغیر اسمی و متغیر رتبه ای

5- متغیر اسمی و متغیر فاصله­ای - نسبی

6- متغیر رتبه­ای و متغیر فاصله­ای – نسبی

برای هر کدام از حالت­های بالا ضرایب همبستگی متفاوتی وجود دارند که در نسخه pdf به اختصار مهمترین آنها را آورده ایم و بعضا روش محاسبه آنها را در نرم افزار های spss ، lisrel و R آورده شده است.

کلمات کلیدی : انواع ضرایب همبستگی، ضریب همبستگی پیرسون، ضریب همبستگی اسپیرمن، ضریب همبستگی کرامر و فی، ضریب همبستگی لاندا، ضریب همبستگی تاو گودمن کروسکال، ضریب همبستگی گاما، ضریب همبستگی تاو کندال،ضریب همبستگی چند رشته­ای( polyserial correlation)، ضریب همبستگی چند حالتی(Polychoric correlation) و .

1. آمار ناپارامتریک،1382، سید یعقوب حسینی، انتشارات دانشگاه علامه طباطبایی

2. website of the NC STATE UNIVERSITY, http://faculty.chass.ncsu.edu

3. A coefficient of agreement for nominal scale, 1960, Cohen J. Educat Psychol Measure; 20: 37-46

4. The polyserial correlation coefficient, 1982, U Olsson, F Drasgow, NJ Dorans - Psychometrika, Springer

5. On the Estimation of Polychoric Correlations and their Asymptotic Covariance Matrix, (1994), Joreskog, K. GPsychometrika, 59:3, 381-389.

انواع ضریب همبستگی

1- انواع ضرایب همبستگی
سر فرانسیس گالتون همبستگی و رگرسیون را برای وارسی کواریانس در دو یا تعداد بیشتری از خصیصه ها مفهوم سازی کرد و کارل پیرسون (1896) براساس نظریه گالتون فرمول آماری برای ضریب همبستگی و رگرسیون ارائه داد(1986).به مدت کوتاهی پس از آن چارلز اسپیرمن(1904) روش همبستگی را برای روش تحلیل عاملی به کار برد.تکنیک های همبستگی ،رگرسیون و تحلیل عاملی برای دهه های متمادی پایه و اساس تهیه ی آزمون ها و تعریف سازه ها را شکل داده اند. .

ضریب همبستگی پیرسون پایه ای را برای ارائه و آزمون مدل ها در میان متغیرهای اندازه گیری شده و پنهان مهیا می کند. علاوه برآن همبستگی های تفکیکی و نیمه تفکیکی تعریف خاصی از روابط دو متغیره را بین متغیرها امکان پذیر می سازند که در آن واریانس صرفاً مشترک بین دو متغیر، در حالی که نفوذ سایر متغیرها کنترل شده است، تبیین می شود. همبستگی هایتفکیکی و نیمه تفکیکی نیز همچون ضریب همبستگی پیرسون می توانند مورد آزمون معناداری قرار گیرند.

در کنار ضریب همبستگی پیرسون که تأثیرات فراوانی بر علم آمار دارد سایر ضرایب همبستگی نیز بسته به سطح سنجش متغیرها معرفی شده اند.استیونز(1968) انواعی از مقیاس های اندازه گیری را معرفی کرده است که به عنوان مقیاس های اسمی، ترتیبی، فاصله ای و نسبی شناخته شده اند. انواع ضرایب همبستگی توسعه یافته برای این سطوح اندازه گیری در جدول زیر مشخص شده اند.

با احترام داده پردازی آماری اطمینان شرق

در ادامه با توجه به نقش با اهمیتی که همبستگی(واریانس مشترک) در مدل سازی معادله ساختاری بازی می کند، عواملی را طرح می کنیم که بر ضرایب همبستگی اثر می گذارند.

2- عوامل موثر بر ضرایب همبستگی

عوامل اصلی در این رابطه عبارتند از: سطح اندازه گیری، محدودیت دامنه تغییرات مقادیر(تغییر پذیری، چولگی و کشیدگی)، داد های از دسترفته، غیر خطی بودن، مقادیر دورافتاده ، تصحیح تضعیف و موارد مرتبط با تغییر نمونه گیری، فاصله اطمینان، حجم اثر، معناداری و توان بیان شده در برآوردهای خودگردان.

همبستگی

2-1. سطح اندازه گیری و دامنه تغییرات مقادیر:

چهار نوع یا سطح اندازه گیری برای مقیاس های سنجش متغیرهای اسمی ، ترتیبی، فاصله ای و نسبی تعریف شده است (استیونز 1968).در مدل سازی معادله ساختاری هر یک از انواع چهارگانه ی مذکور را می توان در ساخت مدل مشارکت داد. مدل سازی معادله ساختاری به متغیرهای اندازه گیری شده در سطح فاصله ای یا نسبی نیاز داشته و لذا ضرایب همبستگی گشتاوری پیرسون دررگرسیون، تحلیل مسیر، تحلیل عاملی و مدل سازی معادله ساختاری مورد استفاده قرار می گیرد.همچنین لازم است که مقادیر متغیرهای فاصله ای و نسبی برای محاسبه واریانس دارای دامنه تغییرات به اندازه کافی بزرگ باشند.اگر دامنه تغییرات نمرات محدود باشد شدت همبستگی کاهش می یابد.

نکته ی دیگری که در مورد همبستگی بین مقادیر بایستی بدان اهمیت داده شود این است که اگر توزیع متغیرها به طور گسترده ای واگرا هستند، همبستگی می تواند تحت تأثیر قرار گیرد.برای جلوگیری از این موضوع تغییر شکل هایی مانند تبدیل ریشه دوم، تبدیل لگاریتمی، تبدبل معکوس و . پیشنهاد می شود.

2-2. غیر خطی بودن :

: ضریب همبستگی پیرسون نشان دهنده ی درجه رابطه خطی بین دو متغیر است.بنابراین ممکن است دو متغیری که دارای رابطه ی غیر خطی با یکدیگر هستند براساس این ضریب رابطه ای را نشان ندهند. در اینجا از ضریب اتا به عنوان شاخصی برای رابطه غیرخطی بین دو متغیر و با آزمون اثرات خطی ، درجه دوم و درجه سوم استفاده می شود.

2-3. داده های از دست رفته:

در یک ماتریس همبستگی با چندین متغیر، ضرایب همبستگی متفاوتی برای حجم نمونه های متفاوت می توانند محاسبه شوند.حذف انفرادی یا زوجی آزمودنی ها منجر به تفاوت در حجم نمونه برای ضرایب همبستگی موجود در ماتریس همبستگی می شود.

یک رویکرد مقدماتی در برخورد با داده های از دست رفته ، حذف هر مورد مشاهده شده ای است که دارای داده ی از دست رفته باشد. اما این روش توصیه نمی شود چراکه باعث از دست رفتن اطلاعات برای سایر متغیرها خواهد شد.روش دیگرحذف زوجی می باشد، این رویکرد داده ها را تنها هنگامی کنار می گذارد که آن ها برای دو متغیر از متغیرهای گزینش شده در تحلیل دارای داده از دست رفته باشند. سومین رویکرد که جایگزین کردن داده ها است، مقادیر از دست رفته را با یک برآورد جایگزین میکند. به عنوان مثال میانگین یک متغیر برای داده های موجود، با مقادیر از دست رفته برای کلیه موارد داده های فاقد داده همان متغیر جایگزین می شود.

2-4. مقادیر دور افتاده:

: ضریب همبستگی پیرسون به طور قابل توجهی به وسیله ی یک داده ی دورافتاده منفرد چه برای X و چه برای Y تحت تأثیر قرار می گیرد. در پژوهش های بسیاری این موضوع به دقت مورد بررسی قرار گرفته است که چگونه داده های دور افتاده متفاوت برای x یا Y یا هردو روبط همبستگی را تحت تأثیر قرار می دهند و چگونه می توان با استفاده از آماره های استوارار به تحلیل بهتری دست یافت.

: یک مفروضه ی اصلی در نظریه اندازه گیری این است که داده های مشاهده شده دارای خطای سنجش هستند. یک ضریب همبستگی پیرسون بسته به اینکه آیا آن ضریب با نمرات مشاهده شده (دارای خطا) یا نمرات واقعی(هنگامی که خطای سنجش را کنار گذاشته ایم) محاسبه شود مقادیر متفاوتی را نشان می دهد. ضریب همبستگی پیرسون می تواند برای خطاهای سنجش تضعیف کننده و ناپایدار در نمرات، تصحیح شده و به این ترتیب به یک مقدار واقعی از ضریب دست یابیم.در عین حال ضریب تصحیح شده می تواند مقداری بیش از 1 را معادله ضریب همبستگی نیز به خود بگیرد. پایین بودن قابلیت اعتماد در متغیرهای مستقل یا وابسته همراه با یک همبستگی بالا بین متغیر مستقل و وابسته می تواند ضریب همبستگی را به بالاتر از مقدار 1 برساند.

2-6. ماتریس های معین غیر مثبت:

ضرایب همبستگی بالاتر از مقدار1 در یک ماتریس همبستگی باعث معین و غیر مثبت شدن ماتریس همبستگی می شود.در اینصورت حل معادله مجاز نبوده و برآورد پارامترها قابل محاسبه نمی باشد.

ماتریس کواریانس معین غیر مثبت هنگامی رخ می دهد که دترمینان ماتریس صفر است و یا اینکه محاسبه معکوس ماتریس ممکن نیست. عواملی که چنین وضعیتی را بوجود می آورند عبارتند از ضریب همبستگی بزرگتر از 1، وابستگی خطی در میان متغیرهای مشاهده شده، همخطی در میان متغیرهای مشاهده شده، وجود وتغیری که ترکیب خطی از سایر متغیرها است، حجم نمونه کمتر از تعداد متغیرها، وجود واریانس صفر یا منفی، واریانس-کواریانس(همبستگی) خارج از دامنه تغییرات مجاز(∓1) و مقدار شروع کننده نامناسب در مدل هایی که توسط کاربر تعریف شده اند.

راه حل های ممکن برای حل چنین خطایی عبارتند از : کاهش میزان اشتراک یا تثبیت آن به مقدار کمتر از1، بیرون کشیدن تعدادی از عامل ها، تعریف مقیاس جدید برای متغیرهای مشاهده شده.

:در مدل سازی معادله ساختاری، محقق اغلب به حجم نمونه بسیار بزرگتری از حد معمول نیاز دارد تا با حفظ توان لازم به برآوردهای باثبات تری از پارامترها و خطاهای استاندارد دست یابد. همچنین بخشی از نیاز به حجم نمونه به وجود متغیرهای پنهان مربوط است. علاوه برمقادیر مختلفی که برای حجم نمونه پیشنهاد شده است، برخی از قاعده سرانگشتی به ازای هر متغیر 10 واحد نمونه یا به ازای هر متغیر 20 واحد نمونه استفاده کنند. با این حال باید توجه داشت که هرچه حجم نمونه بزرگتر باشد احتمالاً باعث می شود که فرد بتواند با استفاده از روش دو نیمه کردن به اعتبار بیشتری برای مدل ها دست یابد.

منبع: مقدمه ای بر مدل سازی معادله ساختاری ، انتشارات جامعه شناسان.
نویسندگان : رندال ای ، شوماخر و ریچارد جی لومکس. ترجمه : دکتر وحید قاسمی.

حسابدار

پایان نامه،مقاله،پروژه های کارورزی،ترجمه،تایپ و. (رشته های علوم انسانی و فنی)

انواع ضرایب همبستگی

محاسبه ضرایب همبستگی تا حدود زیادی متاثر از مقیاس اندازه گیری متغیر ها است،.

انواع ضرایب همبستگی

استنباط آمار ی :

استنباط آماری که در واقع یک نوع نتیجه گیری کلی از جزء به کل است، در معرض آزمایش و خطاست. یک جنبه از استنباط آماری محاسبه برآوردهایی (Estimates ) از پارمترهای جامعه مانند میانگین جامعه از طریق آماره های نمونه ها مانند میانگین نمونه است.

فرضیه (hypothesis) :

فرضیه آماری نقطه آغاز آزمون فرض است. فرضیه آماری یک بیان مقداری در باره پارامترهای جامعه است و اصولا بدون داشتن فرضیه آماری امکان انجام یک آزمون دشوار است.فرضیه آماری به دو دسته فرض صفر (H0) و فرض خلاف (H1) بیان می‌شود . اغلب فرضیه بیانگر این مطلب است که یک ارتباط علیتی بین دو متغیر وجود دارد به شکلی که میزان یکی (متغیر مستقل یاIndependent ) تا حدودی تعیین کننده دیگری متغیر وابسته یا (Dependent) است.

انواع داده :

1) داده های کمی (فاصله ای) Interval اعدادی هستند که بیانگر کمیت به صورت واحدهای عددی و بر اساس یک مقیاس مستقل است .قد و وزن مثالهای بارز دادههای کمی هستند.

2) دادههای رتبه ای Ordinal مشتمل بر رتبه ها، تعلق داشتن به گروههای رتبه بندی شده یا اطلاعات ترتیبی است. به عنوان مثال اگر دو داور به یک مجموعه 10 تایی از نقاشی رتبه یک (برای بهترین) تا رتبه 10 (برای بدترین) بدهند. مجموعه داده ها مشتمل بر 10 جفت رتبه خواهد بود. که هر جفت برای یک نقاشی است.

3) دادههای اسمی (nomial ) که مربوط به متغیر یا خواص کیفی مانند جنس یا گروه خونی است و بیانگر عضویت در یک گروه خاص می باشد.

محاسبه ضرایب همبستگی تا حدود زیادی متاثر از مقیاس اندازه گیری متغیر ها است، بعنوان مثال برای متغیر­های اسمی جهت رابطه اصلا معنی ندارد، بین جنس و معدل تنها می­توان گفت که شدت وابستگی چه مقدار است اما افزایش یا کاهش جنس معنی ندارد.

با توجه به نوع متغیر ها ضریب همبستگی می­تواند یکی از حالت­های زیر را داشته باشد.

1- دو متغیر اسمی

2- دو متغیر رتبه­ای

3- دو متغیر فاصله­ای- نسبی

4- متغیر اسمی و متغیر رتبه ای

5- متغیر اسمی و متغیر فاصله­ای - نسبی

6- متغیر معادله ضریب همبستگی رتبه­ای و متغیر فاصله­ای – نسبی

برای هر کدام از حالت­های بالا ضرایب همبستگی متفاوتی وجود دارند و محاسبه آنها در نرم افزار های spss ، lisrel و R امکان پذیراست.

از آنجا که انتخاب ضریب همبستگی مناسب برای بررسی روابط بین متغیرها تحت تاثیر مقیاس اندازه گیری متغیرهای مورد بررسی است لذا تناسب بین سطوح اندازه گیری و ضریب همبستگی سازگار از این جدول برای تصمیم گیری مناسب است

علمی و پژوهشی با نرم افزار های آماری

ضریب همبستگی شاخصی است ریاضی که جهت و مقدار رابطه ی بین دو متغیر را توصیف میکند.

ضریب همبستگی درمورد توزیع های دویا چند متغیره به کار مي رود .

اگر مقادیر دو متغیر شبیه هم تغییر کند یعنی با کم یا زیاد شدن یکی دیگری هم کم یا زیا د شود به گونه ای که بتوان رابطه آنها را به صورت یک معادله بیان کرد گوییم بین این دو متغیرهمبستگی وجود دارد.

نمودار پراکنش یا دیاگرام پراکندگی بهترین تصویر برای نشان دادن همبستگی بین دو متغیر است .

برای سنجش همبستگی ضرایب گوناگون به کار می رود که مهمترین آنها ضریب همبستگی ساده پیرسون ، ضریب همبستگی اسپیرمن و ضریب همبستگی کندال است:

1 -اگر هر دو متغیر با مقیاس رتبه ای باشند از شاخص تاو- کندال استفاده می کنیم.

2-اگر هر دو متغیر با مقیاس نسبتی و پیوسته باشند از ضریب همبستگی پیرسون استفاده می شود .

3- اگر هر دو متغیر با مقیاس نسبتی و گسسته باشند از ضریب همبستگی اسپیرمن استفاده می کنیم.

برای ترکیبی از انواع متغیرها از هر دو نوع شاخص همبستگی استفاده می کنیم در صورت عدم تفاوت فاحش بین آن دو شاخص می توان مقدار گزارش شده را پذیرفت ، اگر تفاوت چشمگیر بود مقداری که قدر مطلقش کوچکتر است را می پذیریم.

ضریب همبستگی به عنوان معیاری برای سنجش تغییرات y,x نسبت به هم دارای خواص مطلوبی است:

( 1 به مبدا و واحد اندازه گیری متکی نیست.

اگر ρ به 1یا 1- نزدیکباشدیافته های y و x اطراف یک خط راست می باشند و اگر 0= ρ باشد متغیرها ناهمبسته اند.

معادله ضریب همبستگی

تیم متفکران نوین مالی با سرپرستی دکتر تفتیان در مسیر موفقیت مالی و حسابداری، در ارتقای سطح دانش و مهارت مالی و حسابداری در سطوح مختلف جامعه سهیم است.

- رسالت و هدف تیم متفکران نوین مالی

- مشارکت تیم متفکران نوین مالی

- بیوگرافی دکتر تفتیان

  • جدیدترین مطالب
  • پر بازدیدترین
  • پربازدیدترین اخبار

چرا از مدلسازی معادله ساختاری استفاده می کنیم؟

چرا مدلسازی معادله ساختاری عمومیت یافته است؟ حداقل چهار دلیل اصلی برای چنین عمومیتی وجود دارد. دلیل اول اینکه محققان در نیاز به کاربرد متغییرهای مشاهده شده چندگانه برای درک بهتر از حوزه علمی پژوهشی خود آگاه تر شده اند.

اشتباهات رایج در استفاده از مدلسازی معادلات ساختاری

برخی اشتباهات معادله ضریب همبستگی رایج در استفاده از مدلسازی معادلات ساختاری در ادامه بیان شده است.

آزمون ها سنجش رابطه و سنجش همبستگی

آزمون های سنجش رابطه: در این آزمون جهت و شدت رابطه مورد آزمون قرار نمی گیرد. زمانیکه مقیاس سنجش متغیرهای پژوهش هر دو اسمی است یا یکی اسمی و دیگری رتبه ای و یا نسبتی باشد، استفاده از این آزمون گزینه مناسبی خواهد بود. .

انتخاب آزمون مناسب و تحلیل کمی؛ آزمون های (مقایسه ای)

انتخاب آزمون مناسب و مرتبط برای تحلیل داده های پژوهش تنها وابسته به یک عنصر نبوده و عوامل مختلفی در آن دخالت دارند. در آزمون های سنجش تفاوت و اختلاف (مقایسه ای) گاهی نوع فرضیه شما به گونه ای است که قصد دارید مقایسه ای را بین میانگین های دو گروه یا بیشتر و یا حتی میانگین صفتی را در یک گروه با مقدار ثابتی مقایسه کنید. در این صورت از آزمون های زیر که در زیرمجموعه آزمون های پارامتریک قرار دارند، می توانید استفاده نمایید.

مراحل اجرای پژوهش پس رویدادی

هدف تحقیق پس رویدادی کشف روابط بین متغیرهای پژوهشی است. دراین روش از دو طرح علی و گروه ملاک یا علی- مقایسه ای استفاده می شود. اکنون مراحل اجرای این روش موردبحث قرارمی گیرد.

مراحل وارد کردن داده ها در نرم افزار Eviews

در این نرم افزار اگر قصد تخمین یک مدل را داشته باشید ابتدا باید یک Workfile ایجاد کنید. در هنگام ایجاد Workfile شما باید نوع داده های خود را که به صورت مقطعی و یا سری زمانی است مشخص کنید و همچنین دامنه مشاهدات خود را تعیین کنید. در نوع داده های سری زمانی انتخاب هایی همچون داده های روزانه، هفتگی، ماهانه، فصلی، 6 ماهه و سالانه وجود دارد همچنین شما می توانید از داده های ترکیبی ( Panel Data) نیز استفاده کنید.

آزمون F لیمر (چاو)

در برآورد یک مدل که داده های آن از نوع ترکیبی هست ابتدا باید نوع الگوی براورد مشخص شود. به عبارت دیگر ابتدا باید بررسی شود که مدل م,رد بررسی در کدام طبقه pool یا panel قرار می گیرد.

پایایی و آزمون ریشه واحد

پایایی و ناپایایی یک سری از داده ها می تواند تاثیر شدیدی روی رفتار و ویژگی های آن داشته باشد. اگر متغیر های مورد استفاده در برآورد مدل ناپایا باشند، در عین حال که ممکن است هیچ رابطه منطقی بین متغیرهای مستقل و وابسته وجود نداشنه باشد ضریب تعیین به دست آمده آن به اشتباه می تواند بسیار بالا باشدو موجب گمراهی محقق گردد.

فروض کلاسیک رگرسیون

باید توجه داشت که روش ols بر اساس برقراری تمام فروض کلاسیک بنا شده است. با این حال برقراری تمام فروض کلاسیک در شرایط واقعی چندان قابل دستیابی نیست. هرچند که برقراری فروض کلاسیک همواره مطلوب است، ولی .

چارکها

چارکها نقاطی بر روی مقیاس اندازه گیری هستند که کلیه مشاهدات یا نمره ها را به چهار قسمت مساوی تقسیم می کند .

اسامی اعضاء جامعه مشاوران رسمی.

اسامی اعضاء جامعه مشاوران رسمی مالیاتی ایران دارای کارت عضویت معتبر.

سواد مالی و مدیریت هزینه

مهم نیست که کجا یا چطور خرید می کنید، وسوسه ی خرید بیشتر همه جا ما را دنبال می کند. .

اصلاحیه جدول استهلاک مالیاتی

براساس بخشنامه جدید سازمان امورمالیاتی ، جدول اصلاح شده استهلاکات مالیاتی موضوع. .

آموزش ‌تعدیلات ‌سنواتی

معمولا به جای عنوان تعدیلات سنواتی در حسابداری گاها از سود و زیان انباشته یا سود و. .

ضریب همبستگی

ضریب همبستگی - کالج نوین

ضریب همبستگی : عددی بین ۱- و ۱ است که قدرت و جهت رابطه بین متغیرها را به شما می گوید. به عبارت دیگر، نشان می دهد که اندازه گیری دو یا چند متغیر در یک مجموعه داده چقدر شبیه است.

ضریب همبستگی1 : همبستگی مثبت کامل
هنگامی که یک متغیر تغییر می کند، متغیرهای دیگر در همان جهت تغییر می کنند.

ضریب همبستگی0 : همبستگی صفر هیچ رابطه ای بین متغیرها وجود ندارد.
ضریب همبستگی -1 : همبستگی منفی کامل

هنگامی که یک متغیر تغییر می کند، متغیرهای دیگر در جهت مخالف تغییر می کنند.

یک ضریب همبستگی به شما چه می گوید؟

ضرایب همبستگی داده ها را خلاصه می کند و به شما کمک می کند نتایج را بین مطالعات مقایسه کنید.

جمع بندی داده ها

ضریب همبستگی یک آمار توصیفی است. این بدان معنی است که داده های نمونه را بدون اینکه به شما اجازه دهد چیزی در مورد جامعه استنباط کنید، خلاصه می شود.

ضریب همبستگی زمانی که رابطه بین دو متغیر را خلاصه می کند یک آمار دو متغیره است و زمانی که بیش از دو متغیر دارید یک آماره چند متغیره است.

اگر ضریب همبستگی شما بر اساس داده های نمونه باشد، اگر می خواهید نتایج خود را به جامعه تعمیم دهید، به یک آمار استنباطی نیاز خواهید داشت. برای محاسبه آمار آزمونی که اهمیت آماری یافته شما را به شما می گوید، می توانید از آزمون F یا آزمون t استفاده کنید.

مقایسه مطالعات

ضریب همبستگی نیز یک اندازه گیری اندازه اثر است که اهمیت عملی یک نتیجه را به شما می گوید. ضرایب بدون واحد هستند که امکان مقایسه مستقیم ضرایب بین مطالعات را فراهم می کند.

با استفاده از ضریب همبستگی

در تحقیقات همبستگی، شما بررسی می کنید که آیا تغییرات در یک متغیر با تغییرات در متغیرهای دیگر مرتبط است یا خیر.

مثال : شما بررسی می کنید که آیا نمرات استاندارد شده از دبیرستان با نمرات تحصیلی در کالج مرتبط است یا خیر. شما پیش‌بینی می‌کنید که یک همبستگی مثبت وجود دارد: نمرات SAT بالاتر با معدل بالاتر دانشگاه مرتبط است در حالی که نمرات SAT پایین با معدل پایین‌تر دانشگاه مرتبط است.
پس از جمع‌آوری داده‌ها، می‌توانید با ترسیم یک متغیر در محور x و دیگری در محور y، داده‌های خود را با یک نمودار پراکنده تجسم کنید. فرقی نمی کند که کدام متغیر را روی هر دو محور قرار دهید.

نمودار خود را به صورت بصری برای یک الگو بررسی کنید و تصمیم بگیرید که آیا یک الگوی خطی یا غیر خطی بین متغیرها وجود دارد. یک الگوی خطی به این معنی است که شما می توانید یک خط مستقیم با بهترین تناسب بین نقاط داده قرار دهید، در حالی که یک الگوی غیر خطی یا منحنی می تواند انواع اشکال مختلف مانند U-شکل یا یک خط با منحنی را داشته باشد.

ضرایب زیادی وجود دارد که می توانید آنها را محاسبه کنید. پس از حذف هر گونه نقاط پرت، ضریب همبستگی مناسب را بر اساس شکل کلی الگوی نمودار پراکندگی انتخاب کنید.

سپس می توانید یک تحلیل همبستگی برای یافتن ضریب برای داده های خود انجام دهید. شما یک ضریب را برای خلاصه کردن رابطه بین متغیرها بدون نتیجه گیری در مورد علیت محاسبه می کنید.

تفسیر ضریب همبستگی

مقدار ضریب همبستگی همیشه بین 1 و -1 است و شما آن را به عنوان یک شاخص کلی از قدرت رابطه بین متغیرها در نظر می گیرید. علامت ضریب نشان می دهد که آیا متغیرها در جهت یکسان یا مخالف تغییر می کنند: مقدار مثبت به معنای تغییر متغیرها با هم در یک جهت است، در حالی که مقدار منفی به این معنی است که آنها با هم در جهت مخالف تغییر می کنند.

قدر مطلق یک عدد برابر است با عدد بدون علامت آن قدر مطلق یک ضریب همبستگی، بزرگی همبستگی را به شما می گوید: هر چه قدر مطلق بیشتر باشد، همبستگی قوی تر است.

دستورالعمل های مختلفی برای تفسیر ضریب همبستگی وجود دارد، زیرا یافته ها می توانند بین رشته های مورد مطالعه بسیار متفاوت باشند. می توانید از جدول زیر به عنوان یک دستورالعمل کلی برای تفسیر قدرت همبستگی از مقدار ضریب همبستگی استفاده کنید.

در حالی که این دستورالعمل به طور کلی مفید است، بسیار مهمتر است که زمینه و هدف تحقیق خود را هنگام نتیجه گیری در نظر بگیرید. برای مثال، اگر اکثر مطالعات در رشته شما دارای ضرایب همبستگی نزدیک به 0.9 هستند، ممکن است ضریب همبستگی 0.58 در آن زمینه پایین باشد.

تجسم همبستگی های خطی

ضریب همبستگی به شما می گوید که داده های شما چقدر نزدیک به یک خط قرار می گیرند. اگر یک رابطه خطی دارید، یک خط مستقیم از بهترین تناسب ترسیم خواهید کرد که تمام نقاط داده شما را در نمودار پراکنده در نظر می گیرد.

هرچه نقاط شما به این خط نزدیکتر باشد، ضریب همبستگی قدر مطلق بالاتر و همبستگی خطی شما قوی تر می شود. اگر همه نقاط کاملاً روی این خط باشند، شما یک همبستگی کامل دارید.

توجه داشته باشید که شیب یا شیب خط با مقدار ضریب ارتباطی ندارد. ضریب همبستگی به شما کمک نمی‌کند پیش‌بینی کنید که یک متغیر بر اساس یک تغییر معین در دیگری چقدر تغییر می‌کند، زیرا دو مجموعه داده با مقدار ضریب همبستگی یکسان می‌توانند خطوطی با شیب‌های بسیار متفاوت داشته باشند.

انواع ضرایب همبستگی

شما می توانید از میان ضرایب همبستگی مختلف بر اساس خطی بودن رابطه، سطح اندازه گیری متغیرهای خود و توزیع داده های خود انتخاب کنید.

برای قدرت و دقت آماری بالا، بهتر است از معادله ضریب همبستگی ضریب همبستگی که برای داده‌های شما مناسب‌تر است استفاده کنید. متداول ترین ضریب همبستگی ضریب پیرسون r است زیرا امکان استنتاج قوی را فراهم می کند. پارامتری است و روابط خطی را اندازه گیری می کند. اما اگر داده‌های شما تمام فرضیات این تست را برآورده نمی‌کند، باید به جای آن از یک تست ناپارامتریک استفاده کنید.

آزمون های ناپارامتریک ضرایب همبستگی رتبه ای، روابط غیرخطی بین متغیرها را خلاصه می کند. تاو اسپیرمن و تاو کندال شرایط یکسانی برای استفاده دارند، اما تاو کندال به طور کلی برای نمونه‌های کوچک‌تر ترجیح داده می‌شود، در حالی که rho اسپیرمن بیشتر مورد استفاده قرار می‌گیرد.

آر پیرسون

ضریب همبستگی لحظه-محصول پیرسون، همچنین به عنوان r پیرسون شناخته می شود، رابطه خطی بین دو متغیر کمی را توصیف می کند. اگر می‌خواهید از r پیرسون استفاده کنید، اینها مفروضاتی هستند که داده‌های شما باید رعایت کنند:

هر دو متغیر در یک سطح فاصله یا نسبت اندازه گیری هستند
داده های هر دو متغیر از توزیع های نرمال پیروی می کنند
داده های شما هیچ نقطه پرت ندارد
داده های شما از یک نمونه تصادفی یا نماینده است
شما انتظار یک رابطه خطی بین دو متغیر را دارید
پیرسون r یک تست پارامتریک است، بنابراین قدرت بالایی دارد. اما اگر متغیرهای شما یک رابطه غیرخطی داشته باشند، یا اگر داده‌های شما دارای نقاط پرت، توزیع‌های اریب یا از متغیرهای طبقه‌بندی شده باشند، معیار خوبی برای همبستگی نیست.

اگر هر یک از این مفروضات نقض شد، باید یک معیار همبستگی رتبه ای را در نظر بگیرید. فرمول پیرسون r پیچیده است، اما اکثر برنامه های کامپیوتری می توانند به سرعت ضریب همبستگی را از داده های شما بدست آورند. در شکل ساده تر، فرمول کوواریانس بین متغیرها را بر حاصل ضرب انحراف معیار آنها تقسیم می کند.

نمونه پیرسون در مقابل فرمول ضریب همبستگی جمعیت

هنگام استفاده از فرمول ضریب همبستگی پیرسون، باید در نظر بگیرید که آیا با داده های یک نمونه سروکار دارید یا کل جامعه. فرمول های نمونه و جمعیت در نمادها و ورودی هایشان متفاوت است. یک ضریب همبستگی نمونه r، در حالی که ضریب همبستگی جمعیتی rho، حرف یونانی ρ نامیده می شود. ضریب همبستگی نمونه از کوواریانس نمونه بین متغیرها و انحراف معیار نمونه آنها استفاده می کند.

ضریب همبستگی جمعیت از کوواریانس جامعه بین متغیرها و انحراف معیار جمعیت آنها استفاده می کند.

اسپیرمن رو

rho اسپیرمن یا ضریب همبستگی رتبه اسپیرمن رایج‌ترین جایگزین برای r پیرسون است. این یک ضریب همبستگی رتبه ای است زیرا از رتبه بندی داده ها از هر متغیر (به عنوان مثال از پایین ترین به بالاترین) به جای خود داده خام استفاده می کند.

زمانی که داده های شما با مفروضات پیرسون r مطابقت ندارند، باید از rho اسپیرمن استفاده کنید. این زمانی اتفاق می افتد که حداقل یکی از متغیرهای شما در سطح ترتیبی اندازه گیری باشد یا زمانی که داده های یک یا هر دو متغیر از توزیع های نرمال پیروی نمی کنند.

در حالی که پیرسون خطی بودن روابط را اندازه گیری می کند، ضریب اسپیرمن یکنواختی روابط را اندازه گیری می کند. در یک رابطه خطی، هر متغیر در یک جهت با سرعت یکسان در سراسر محدوده داده تغییر می کند. در یک رابطه یکنواخت، هر متغیر نیز همیشه فقط در یک جهت تغییر می‌کند، اما نه لزوماً با همان سرعت.

یکنواخت مثبت: وقتی یک متغیر افزایش می یابد، متغیر دیگر نیز افزایش می یابد.
یکنواخت منفی: وقتی یک متغیر افزایش می یابد، متغیر دیگر کاهش می یابد.
روابط یکنواخت نسبت به روابط خطی محدودیت کمتری دارند.

فرمول ضریب همبستگی رتبه اسپیرمن

نمادهای اسپیرمن rho برای ضریب جمعیت ρ و برای ضریب نمونه rs هستند. فرمول ضریب همبستگی پیرسون را بین رتبه بندی داده های متغیر محاسبه می کند.

برای استفاده از این فرمول، ابتدا داده های هر متغیر را به طور جداگانه از کم به زیاد رتبه بندی می کنید: هر نقطه داده رتبه ای از اول، دوم یا سوم و غیره می گیرد.

سپس، تفاوت های (di) بین رتبه های متغیرهای خود را برای هر جفت داده پیدا خواهید کرد و آن را به عنوان ورودی اصلی فرمول در نظر می گیرید.

اگر ضریب 1 داشته باشید، همه رتبه‌بندی‌ها برای هر متغیر برای هر جفت داده مطابقت دارند. اگر ضریب 1- داشته باشید، رتبه بندی یک متغیر دقیقا برعکس رتبه بندی متغیر دیگر است. ضریب همبستگی نزدیک به صفر به این معنی است که هیچ رابطه یکنواختی بین رتبه بندی متغیرها وجود ندارد.

سایر ضرایب

ضریب همبستگی مربوط به دو ضریب دیگر است و اینها اطلاعات بیشتری در مورد رابطه بین متغیرها به شما می دهند.معادله ضریب همبستگی

ضریب تعیین

وقتی ضریب همبستگی را مجذور می کنید، در نهایت به همبستگی تعیین (r2) می رسید. این نسبت واریانس مشترک بین متغیرها است. ضریب تعیین همیشه بین 0 و 1 است و اغلب به صورت درصد بیان می شود.

از ضریب تعیین در مدل های رگرسیونی برای اندازه گیری اینکه چقدر از واریانس یک متغیر با واریانس متغیر دیگر توضیح داده می شود استفاده می شود. تجزیه و تحلیل رگرسیون به شما کمک می کند تا معادله خط بهترین تناسب را پیدا کنید و می توانید از آن برای پیش بینی مقدار یک متغیر با توجه به مقدار متغیر دیگر استفاده کنید.

r2 بالا به این معنی است که مقدار زیادی از تغییرپذیری در یک متغیر توسط رابطه آن با متغیر دیگر تعیین می شود. r2 پایین به این معنی است که تنها بخش کوچکی از تغییرپذیری یک متغیر با رابطه آن با متغیر دیگر توضیح داده می شود.

روابط با سایر متغیرها به احتمال زیاد واریانس متغیر را محاسبه می کند. ضریب اغلب می تواند رابطه بین متغیرها را به ویژه در نمونه های کوچک بیش از حد تخمین بزند، بنابراین ضریب تعیین اغلب نشانگر بهتری از رابطه است.

ضریب بیگانگی

وقتی ضریب تعیین را از وحدت (یک) بردارید، ضریب بیگانگی را خواهید گرفت. این نسبت واریانس مشترک بین متغیرها مشترک نیست، واریانس غیرقابل توضیح بین متغیرها. ضریب بیگانگی بالا نشان می دهد که این دو متغیر واریانس بسیار کمی دارند. ضریب بیگانگی پایین به این معنی است که مقدار زیادی از واریانس توسط رابطه بین متغیرها محاسبه می شود.



اشتراک گذاری

دیدگاه شما

اولین دیدگاه را شما ارسال نمایید.