همبستگی در اکسل چگونه انجام می شود؟ تجزیه و تحلیل همبستگی-رگرسیون در اکسل: دستورالعمل اجرا

تحلیل همبستگی یک روش تحقیقاتی آماری رایج است که برای تعیین میزان وابستگی یک شاخص به شاخص دیگر استفاده می شود. مایکروسافت اکسل یک ابزار اختصاصی برای انجام این نوع تحلیل دارد. بیایید نحوه استفاده از این ویژگی را دریابیم.

ماهیت تحلیل همبستگی

هدف از تحلیل همبستگی شناسایی وجود رابطه بین عوامل مختلف است. یعنی مشخص می شود که کاهش یا افزایش یک شاخص بر تغییر شاخص دیگر تأثیر می گذارد یا خیر.

اگر رابطه برقرار شود، ضریب همبستگی تعیین می شود. بر خلاف تحلیل رگرسیون، این تنها شاخصی است که این روش تحقیق آماری محاسبه می کند. ضریب همبستگی از 1+ تا 1- متغیر است. اگر همبستگی مثبت وجود داشته باشد، افزایش یک شاخص به افزایش شاخص دوم کمک می کند. با یک همبستگی منفی، افزایش یک شاخص منجر به کاهش شاخص دیگر می شود. هرچه مدول ضریب همبستگی بیشتر باشد، تغییر در یک شاخص در تغییر شاخص دوم بیشتر قابل توجه است. با ضریب 0، رابطه بین آنها کاملاً وجود ندارد.

محاسبه ضریب همبستگی

حال بیایید سعی کنیم ضریب همبستگی را با استفاده از یک مثال خاص محاسبه کنیم. جدولی داریم که هزینه تبلیغات و میزان فروش در ستون های جداگانه به صورت ماهانه درج شده است. ما باید میزان وابستگی تعداد فروش را به میزان هزینه ای که برای تبلیغات خرج می شود، دریابیم.

روش 1: تعیین همبستگی از طریق Function Wizard

یکی از روش هایی که در آن می توانید تحلیل همبستگی را انجام دهید استفاده از تابع CORREL است. خود تابع دارای شکل کلی CORREL (array1; array2) است.

  1. سلولی را انتخاب کنید که نتیجه محاسبه باید در آن نمایش داده شود. روی دکمه "درج تابع" که در سمت چپ نوار فرمول قرار دارد کلیک کنید.
  2. در لیست ارائه شده در پنجره Function Wizard، تابع CORREL را جستجو کرده و انتخاب کنید. بر روی دکمه "OK" کلیک کنید.
  3. پنجره آرگومان های تابع باز می شود. در قسمت "Array1" مختصات محدوده سلول های یکی از مقادیر را وارد کنید که وابستگی آن باید مشخص شود. در مورد ما، این مقادیر در ستون "میزان فروش" خواهد بود. برای وارد کردن آدرس آرایه در فیلد، کافی است تمام سلول های دارای داده های ستون بالا را انتخاب کنید.

    در قسمت "Array2" باید مختصات ستون دوم را وارد کنید. برای ما اینها هزینه تبلیغات است. مانند حالت قبل، داده ها را در فیلد وارد می کنیم.

    بر روی دکمه "OK" کلیک کنید.

همانطور که می بینید، ضریب همبستگی به شکل یک عدد در سلولی که قبلا انتخاب کرده ایم ظاهر می شود. در این حالت 0.97 است که نشانگر بسیار بالایی از وابستگی یک کمیت به کمیت دیگر است.

روش 2: محاسبه همبستگی با استفاده از بسته تجزیه و تحلیل

علاوه بر این، همبستگی را می توان با استفاده از یکی از ابزارهای ارائه شده در بسته تحلیل محاسبه کرد. اما ابتدا باید این ابزار را فعال کنیم.

  1. به تب "File" بروید.
  2. در پنجره ای که باز می شود، به بخش "پارامترها" بروید.
  3. بعد، به مورد "افزونه ها" بروید.
  4. در پایین پنجره بعدی در بخش "کنترل"، سوئیچ را به موقعیت "افزونه های اکسل" منتقل کنید اگر در موقعیت دیگری قرار دارد. بر روی دکمه "OK" کلیک کنید.
  5. در پنجره افزونه‌ها، کادر کنار مورد «بسته تحلیل» را علامت بزنید. بر روی دکمه "OK" کلیک کنید.
  6. سپس بسته تجزیه و تحلیل فعال می شود. به تب "داده ها" بروید. همانطور که می بینید، یک بلوک جدید از ابزارها روی نوار ظاهر می شود - "Analysis". روی دکمه "تجزیه و تحلیل داده ها" که در آن قرار دارد کلیک کنید.
  7. لیستی با گزینه های مختلف برای تجزیه و تحلیل داده ها باز می شود. ما مورد "همبستگی" را انتخاب می کنیم. بر روی دکمه "OK" کلیک کنید.
  8. پنجره ای با پارامترهای تحلیل همبستگی باز می شود. برخلاف روش قبلی، در قسمت «فاصله ورودی»، بازه هر ستون را به طور جداگانه وارد نمی کنیم، بلکه تمام ستون هایی را که در تجزیه و تحلیل نقش دارند، وارد می کنیم. در مورد ما، این داده ها در ستون های "هزینه های تبلیغات" و "میزان فروش" است.

    پارامتر "گروه بندی" را بدون تغییر بگذارید - "By Columns"، زیرا گروه های داده ما به دو ستون تقسیم می شوند. اگر آنها خط به خط شکسته شده بودند، لازم است سوئیچ را به موقعیت "By lines" تغییر دهید.

    در پارامترهای خروجی، مورد "کاربرگ جدید" به طور پیش فرض تنظیم شده است، یعنی داده ها در برگه دیگری نمایش داده می شوند. با چرخاندن سوئیچ می توانید مکان را تغییر دهید. این می تواند برگه فعلی (سپس باید مختصات سلول ها را برای خروجی اطلاعات مشخص کنید) یا یک کتاب کار جدید (فایل) باشد.

    پس از تنظیم تمام تنظیمات، روی دکمه "OK" کلیک کنید.

از آنجایی که مکان نمایش نتایج تجزیه و تحلیل به صورت پیش فرض باقی مانده است، به یک برگه جدید می رویم. همانطور که می بینید، ضریب همبستگی در اینجا نشان داده شده است. طبیعتاً مانند روش اول است - 0.97. این به این دلیل است که هر دو گزینه محاسبات یکسانی را انجام می دهند، آنها را می توان به روش های مختلف انجام داد.

همانطور که می بینید، برنامه اکسل دو روش تحلیل همبستگی را به طور همزمان ارائه می دهد. نتیجه محاسبات، اگر همه چیز را به درستی انجام دهید، کاملاً یکسان خواهد بود. اما هر کاربر می تواند گزینه راحت تری را برای محاسبه انتخاب کند.

خوشحالیم که توانستیم به شما در حل مشکل کمک کنیم.

سوال خود را در نظرات بپرسید و اصل مشکل را توضیح دهید. کارشناسان ما سعی خواهند کرد در اسرع وقت پاسخ دهند.

آیا این مقاله به شما کمک کرد؟

رگرسیون و تحلیل همبستگی - روشهای تحقیق آماری. اینها رایج ترین راه ها برای نشان دادن اینکه چگونه یک پارامتر به یک یا چند متغیر مستقل بستگی دارد، هستند.

در زیر با استفاده از مثال های کاربردی خاص، این دو تحلیل را که در بین اقتصاددانان بسیار محبوب هستند، بررسی خواهیم کرد. و همچنین مثالی از به دست آوردن نتایج در هنگام ترکیب آنها خواهیم داد.

تحلیل رگرسیون در اکسل

تأثیر برخی از مقادیر (مستقل، مستقل) را بر روی متغیر وابسته نشان می دهد. به عنوان مثال، چگونگی تعداد جمعیت فعال اقتصادی به تعداد شرکت ها، اندازه دستمزدها و سایر پارامترها بستگی دارد. یا: سرمایه گذاری های خارجی، قیمت انرژی و غیره چگونه بر سطح تولید ناخالص داخلی تأثیر می گذارند.

نتیجه تجزیه و تحلیل به شما امکان می دهد اولویت بندی کنید. و بر اساس عوامل اصلی، پیش بینی، برنامه ریزی توسعه حوزه های اولویت دار، تصمیم گیری های مدیریتی.

رگرسیون اتفاق می افتد:

  • خطی (y = a + bx)؛
  • سهمی (y = a + bx + cx2)؛
  • نمایی (y = a * exp (bx))؛
  • توان (y = a * x ^ b)؛
  • هذلولی (y = b / x + a)؛
  • لگاریتمی (y = b * 1n (x) + a)؛
  • نمایی (y = a * b ^ x).

بیایید نمونه ای از ساخت مدل رگرسیون در اکسل و تفسیر نتایج را بررسی کنیم. بیایید یک نوع رگرسیون خطی در نظر بگیریم.

وظیفه. در 6 شرکت، میانگین حقوق ماهانه و تعداد کارکنانی که ترک کردند، تجزیه و تحلیل شد. تعیین وابستگی تعداد کارکنانی که ترک می کنند به میانگین حقوق ضروری است.

مدل رگرسیون خطی به شرح زیر است:

Y = a0 + a1x1 + ... + akhk.

جایی که a - ضرایب رگرسیون، x - متغیرهای تأثیرگذار، k - تعداد عوامل.

در مثال ما، Y نشانگر کارمندانی است که ترک می کنند. عامل تأثیرگذار دستمزد (x) است.

اکسل دارای توابع داخلی است که می توانید از آنها برای محاسبه پارامترهای یک مدل رگرسیون خطی استفاده کنید. اما افزونه Analysis Package این کار را سریعتر انجام می دهد.

ما یک ابزار تحلیلی قدرتمند را فعال می کنیم:

  1. دکمه "Office" را فشار دهید و به تب "گزینه های اکسل" بروید. "افزونه ها".
  2. در زیر، در زیر لیست کشویی، در قسمت "کنترل" کتیبه "افزونه های اکسل" وجود خواهد داشت (اگر وجود ندارد، روی کادر انتخاب سمت راست کلیک کنید و انتخاب کنید). و دکمه "برو". فشار می دهیم.
  3. لیستی از افزونه های موجود باز می شود. "پکیج تجزیه و تحلیل" را انتخاب کرده و روی OK کلیک کنید.

پس از فعال سازی، افزونه در تب Data در دسترس خواهد بود.

حالا بیایید مستقیماً به تحلیل رگرسیون برویم.

  1. منوی ابزار تحلیل داده را باز کنید. ما "رگرسیون" را انتخاب می کنیم.
  2. یک منو برای انتخاب مقادیر ورودی و پارامترهای خروجی (محل نمایش نتیجه) باز می شود. در فیلدهای مربوط به داده های اولیه، محدوده پارامتر توصیف شده (Y) و عامل مؤثر بر آن (X) را نشان می دهیم. بقیه را می توان خالی گذاشت.
  3. پس از کلیک بر روی OK، برنامه محاسبات را در یک برگه جدید نمایش می دهد (شما می توانید فاصله زمانی را برای نمایش در برگه فعلی انتخاب کنید یا خروجی را به یک کتاب جدید اختصاص دهید).

اول از همه به مربع R و ضرایب توجه کنید.

R-square ضریب تعیین است. در مثال ما - 0.755 یا 75.5٪. این بدان معناست که پارامترهای محاسبه شده مدل، رابطه بین پارامترهای مورد مطالعه را 75.5 درصد توضیح می دهد. هر چه ضریب تعیین بیشتر باشد، مدل بهتر است. خوب - بالای 0.8. بد - کمتر از 0.5 (چنین تجزیه و تحلیل به سختی می تواند معقول در نظر گرفته شود). در مثال ما - "بد نیست".

ضریب 64.1428 نشان می دهد که اگر همه متغیرهای مدل مورد نظر برابر با 0 باشند Y چه مقدار خواهد بود. یعنی عوامل دیگری که در مدل توضیح داده نشده اند نیز بر مقدار پارامتر تحلیل شده تأثیر می گذارند.

ضریب -0.16285 وزن متغیر X را بر Y نشان می دهد. یعنی میانگین حقوق ماهانه در این مدل بر تعداد کسانی که با وزن 0.16285- ترک می کنند تأثیر می گذارد (این درجه تأثیر کمی است). علامت "-" نشان دهنده تأثیر منفی است: هر چه حقوق و دستمزد بالاتر باشد، کمتر ترک می کند. که منصفانه است.

تحلیل همبستگی در اکسل

تجزیه و تحلیل همبستگی به تعیین اینکه آیا رابطه ای بین شاخص ها در یک یا دو نمونه وجود دارد کمک می کند. به عنوان مثال بین زمان کارکرد دستگاه و هزینه تعمیرات، قیمت تجهیزات و مدت زمان کارکرد، قد و وزن کودکان و غیره.

اگر یک رابطه وجود داشته باشد، پس آیا افزایش در یک پارامتر منجر به افزایش (همبستگی مثبت) یا کاهش (منفی) در پارامتر دیگر می شود. تحلیل همبستگی به تحلیلگر کمک می کند تا تعیین کند که آیا مقدار یک شاخص می تواند ارزش احتمالی شاخص دیگر را پیش بینی کند یا خیر.

ضریب همبستگی با r نشان داده می شود. از +1 تا -1 متغیر است. طبقه بندی همبستگی ها برای حوزه های مختلف متفاوت خواهد بود. وقتی ضریب 0 باشد، هیچ رابطه خطی بین نمونه ها وجود ندارد.

بیایید نگاهی به نحوه استفاده از ابزار اکسل برای یافتن ضریب همبستگی بیندازیم.

برای یافتن ضرایب زوج از تابع CORREL استفاده می شود.

هدف: تعیین اینکه آیا بین زمان کارکرد ماشین تراش و هزینه نگهداری آن رابطه وجود دارد یا خیر.

مکان نما را در هر سلولی قرار می دهیم و دکمه fx را فشار می دهیم.

  1. در دسته «آماری»، تابع CORREL را انتخاب کنید.
  2. آرگومان آرایه 1 - اولین محدوده مقادیر - زمان عملکرد ماشین: A2: A14.
  3. آرگومان آرایه 2 - محدوده دوم مقادیر - هزینه تعمیر: B2: B14. روی OK کلیک کنید.

برای تعیین نوع اتصال، باید به عدد مطلق ضریب نگاه کنید (برای هر زمینه فعالیت مقیاس خاص خود را دارد).

برای تجزیه و تحلیل همبستگی چندین پارامتر (بیش از 2)، استفاده از تجزیه و تحلیل داده ها (افزونه بسته تحلیلی) راحت تر است. در لیست، باید یک همبستگی را انتخاب کنید و یک آرایه را تعیین کنید. همه چيز.

ضرایب به دست آمده در ماتریس همبستگی نمایش داده می شود. مثل این:

تحلیل همبستگی-رگرسیون

در عمل، این دو تکنیک اغلب با هم استفاده می شوند.

  1. ما یک فیلد همبستگی ایجاد می کنیم: "Insert" - "Chart" - "Scatter chart" (به شما امکان مقایسه جفت ها را می دهد). محدوده مقادیر همه داده های عددی در جدول است.
  2. روی هر نقطه از نمودار کلیک چپ کنید. سپس راست. در منوی باز شده، گزینه "Add a trend line" را انتخاب کنید.
  3. تخصیص پارامترها به خط نوع - "خطی". پایین - "نمایش معادله در نمودار".
  4. روی "بستن" کلیک کنید.

اکنون داده های رگرسیون نیز قابل مشاهده است.

1.برنامه اکسل را باز کنید

2. ستون هایی با داده ایجاد کنید. در مثال خود، رابطه یا همبستگی بین پرخاشگری و شک به خود را در دانش آموزان کلاس اول در نظر خواهیم گرفت. این آزمایش شامل 30 کودک بود که داده ها در جدول اکسل ارائه شده است:

1 ستون - شماره موضوع

ستون 2 - پرخاشگری در نقاط

3 ستون - شک به خود در نقاط

3. سپس باید یک سلول خالی کنار جدول را انتخاب کنید و روی نماد کلیک کنید f (x)در پنل اکسل

4. منویی از توابع باز می شود، از میان دسته هایی که باید انتخاب کنید آماری، و سپس در میان لیست توابع بر اساس حروف الفبا پیدا کنید CORRELو روی OK کلیک کنید

5. سپس منویی از آرگومان های تابع باز می شود که به ما امکان می دهد ستون هایی را با داده های مورد نیاز خود انتخاب کنیم. برای انتخاب ستون اول پرخاشگریشما باید روی دکمه آبی رنگ در خط کلیک کنید آرایه 1

6. داده ها را برای آرایه 1از ستون پرخاشگریو روی دکمه آبی رنگ در کادر محاوره ای کلیک کنید

7. سپس مانند آرایه 1 روی دکمه آبی رنگ کنار خط کلیک کنید آرایه 2

8. انتخاب داده برای آرایه 2- ستون شک به خودو دوباره دکمه آبی را فشار دهید و سپس OK را فشار دهید

9. در اینجا ضریب همبستگی r-Pearson محاسبه و در سلول انتخاب شده ثبت می شود در مورد ما مثبت و تقریباً برابر است. این صحبت می کند مثبت متوسطارتباط بین پرخاشگری و شک به خود در کلاس اولی ها

بدین ترتیب، استنتاج آماریآزمایش برابر با 225/0 = r خواهد بود که رابطه مثبت متوسطی را بین متغیرها نشان داد پرخاشگریو شک به خود

در برخی از مطالعات، نشان دادن سطح معنی‌داری p ضریب همبستگی الزامی است، اما اکسل بر خلاف SPSS این گزینه را ارائه نمی‌کند. اشکالی ندارد، جداول مقادیر همبستگی بحرانی وجود دارد (A.D. Nasledov).

همچنین می توانید یک خط رگرسیون در اکسل بسازید و آن را به نتایج تحقیق پیوست کنید.

برای تعیین میزان وابستگی بین چند شاخص از ضرایب همبستگی چندگانه استفاده می شود. سپس آنها در یک جدول جداگانه خلاصه می شوند که به آن ماتریس همبستگی می گویند. نام سطرها و ستون های چنین ماتریسی نام پارامترهایی است که وابستگی آنها به یکدیگر مشخص می شود. ضرایب همبستگی مربوطه در محل تقاطع سطرها و ستون ها قرار دارند. بیایید دریابیم که چگونه می توانید یک محاسبه مشابه را با استفاده از ابزارهای اکسل انجام دهید.

برای تعیین سطح رابطه بین شاخص های مختلف بسته به ضریب همبستگی به شرح زیر پذیرفته شده است:

  • 0 - 0.3 - بدون اتصال.
  • 0.3 - 0.5 - اتصال ضعیف؛
  • 0.5 - 0.7 - باند متوسط.
  • 0.7 - 0.9 - بالا؛
  • 0.9 - 1 - بسیار قوی.

اگر ضریب همبستگی منفی باشد به این معنی است که رابطه بین پارامترها معکوس است.

به منظور ایجاد ماتریس همبستگی در اکسل، از یک ابزار موجود در بسته استفاده می شود "تحلیل داده ها"... به این می گویند - "همبستگی"... بیایید دریابیم که چگونه می توانید از آن برای محاسبه نمرات همبستگی چندگانه استفاده کنید.

مرحله 1: فعال سازی بسته تجزیه و تحلیل

بلافاصله باید گفت که به طور پیش فرض بسته است "تحلیل داده ها"معلول. بنابراین، قبل از انجام روش محاسبه مستقیم ضرایب همبستگی، باید آن را فعال کنید. متأسفانه، همه کاربران نمی دانند چگونه این کار را انجام دهند. بنابراین، ما بر روی این موضوع تمرکز خواهیم کرد.


پس از عمل مشخص شده، بسته ابزار "تحلیل داده ها"فعال خواهد شد.

مرحله 2: محاسبه ضریب

اکنون می توانید مستقیماً به محاسبه ضریب همبستگی چندگانه بروید. اجازه دهید با استفاده از مثال جدول شاخص های بهره وری نیروی کار، نسبت سرمایه به نیروی کار و نسبت توان به نیروی کار در شرکت های مختلف که در زیر ارائه شده است، ضریب همبستگی چندگانه این عوامل را محاسبه کنیم.


مرحله 3: تجزیه و تحلیل نتیجه به دست آمده

حالا بیایید بفهمیم که چگونه نتیجه ای را که در فرآیند پردازش داده ها با ابزار به دست آورده ایم، درک کنیم. "همبستگی"در اکسل

همانطور که از جدول می بینید، ضریب همبستگی نسبت سرمایه به کار است (ستون 2) و نسبت توان به وزن ( ستون 1) 0.92 است که مربوط به یک رابطه بسیار قوی است. بین بهره وری نیروی کار ( ستون 3) و نسبت توان به وزن ( ستون 1) این شاخص 0.72 است که درجه بالایی از وابستگی است. ضریب همبستگی بین بهره وری نیروی کار ( ستون 3) و نسبت سرمایه به نیروی کار ( ستون 2) برابر با 0.88 است که با درجه بالایی از وابستگی نیز مطابقت دارد. بنابراین می توان گفت که رابطه بین تمامی عوامل مورد مطالعه بسیار قوی است.

همانطور که می بینید، بسته "تحلیل داده ها"اکسل یک ابزار بسیار راحت و نسبتاً آسان برای تعیین ضرایب همبستگی چندگانه است. همچنین می توان از آن برای محاسبه همبستگی معمول بین دو عامل استفاده کرد.

"همبستگی" ترجمه شده از لاتین به معنای "نسبت"، "رابطه". مشخصه کمی رابطه را می توان با محاسبه ضریب همبستگی به دست آورد. این نسبت که در تجزیه و تحلیل های آماری رایج است، نشان می دهد که آیا پارامترهایی با یکدیگر مرتبط هستند (به عنوان مثال، قد و وزن، ضریب هوشی و عملکرد تحصیلی، تعداد آسیب ها و مدت زمان کار).

با استفاده از همبستگی

محاسبه همبستگی به طور گسترده ای در اقتصاد، تحقیقات اجتماعی، پزشکی و بیومتریک استفاده می شود - هر کجا که شما می توانید دو مجموعه از داده ها را که می توانید بین آنها رابطه پیدا کنید.

همبستگی را می توان به صورت دستی با انجام عملیات ساده حسابی محاسبه کرد. با این حال، اگر مجموعه داده بزرگ باشد، فرآیند محاسبات بسیار پر زحمت است. ویژگی روش این است که به جمع آوری مقدار زیادی از داده های اولیه نیاز دارد تا با دقت بیشتر نشان دهد که آیا ارتباطی بین ویژگی ها وجود دارد یا خیر. بنابراین، استفاده جدی از تحلیل همبستگی بدون استفاده از فناوری رایانه غیرممکن است. یکی از محبوب ترین و مقرون به صرفه ترین برنامه ها برای حل این مشکل است.

چگونه همبستگی را در اکسل انجام دهیم؟

زمان برترین مرحله در تعیین همبستگی، جمع آوری مجموعه داده است. داده هایی که باید مقایسه شوند معمولاً در دو ستون یا خط مرتب می شوند. جدول باید بدون شکاف در سلول ها ساخته شود. نسخه های مدرن اکسل (از سال 2007 و قبل از آن) به تنظیمات اضافی برای محاسبات آماری نیاز ندارند. دستکاری های لازم را می توان انجام داد:

  1. یک سلول خالی را انتخاب کنید که در آن نتیجه محاسبه نمایش داده شود.
  2. در منوی اصلی اکسل روی آیتم "Formulas" کلیک کنید.
  3. "توابع دیگر" را از دکمه های گروه بندی شده در "کتابخانه عملکرد" ​​انتخاب کنید.
  4. در لیست های کشویی تابع محاسبه همبستگی (Statistical - CORREL) را انتخاب کنید.
  5. اکسل پنل Function Arguments را باز می کند. آرایه 1 و آرایه 2 محدوده داده هایی هستند که باید مقایسه شوند. برای پر کردن خودکار این فیلدها، به سادگی می توانید سلول های جدول مورد نیاز را انتخاب کنید.
  6. روی "OK" کلیک کنید و پنجره آرگومان های تابع را ببندید. ضریب همبستگی محاسبه شده در سلول ظاهر می شود.

همبستگی می تواند مستقیم (اگر ضریب بزرگتر از صفر باشد) و معکوس (از 1- تا 0) باشد.

اولی به این معنی است که با افزایش یک پارامتر، پارامتر دیگر نیز رشد می کند. همبستگی معکوس (منفی) نشان دهنده این واقعیت است که با افزایش یک متغیر، متغیر دیگر کاهش می یابد.

همبستگی می تواند نزدیک به صفر باشد. این معمولاً نشان می دهد که پارامترهای مورد مطالعه به یکدیگر مرتبط نیستند. اما گاهی اوقات یک همبستگی صفر رخ می دهد که نمونه ناموفقی ساخته می شود که رابطه را منعکس نمی کند، یا این رابطه پیچیده غیرخطی است.

اگر ضریب یک رابطه متوسط ​​یا قوی را نشان دهد (از 0.5 ± تا 0.99 ±)، باید به خاطر داشت که این فقط یک رابطه آماری است که تأثیر یک پارامتر بر پارامتر دیگر را تضمین نمی کند. همچنین، نمی توان رد کرد که هر دو پارامتر مستقل از یکدیگر باشند، اما تحت تأثیر عامل سومی که به حساب نیامده اند، هستند. اکسل به محاسبه فوری ضریب همبستگی کمک می کند، اما معمولاً روش های کمی به تنهایی برای ایجاد روابط علی در نمونه های همبسته کافی نیستند.

مقاله امروز بر روی چگونگی ارتباط متغیرها با یکدیگر تمرکز خواهد کرد. با کمک همبستگی می توان تعیین کرد که آیا بین متغیر اول و دوم رابطه وجود دارد یا خیر. امیدوارم این درس هم مثل درس های قبلی برای شما جالب باشد!

همبستگی قدرت و جهت رابطه بین x و y را اندازه گیری می کند. شکل، انواع مختلف همبستگی را به صورت نمودارهای پراکنده جفت مرتب شده (x، y) نشان می دهد. به طور سنتی، x بر روی محور افقی و y در محور عمودی قرار می گیرد.

نمودار A نمونه ای از همبستگی خطی مثبت است: با افزایش x، y نیز افزایش می یابد و به صورت خطی. نمودار B مثالی از همبستگی خطی منفی را به ما نشان می دهد که در آن با افزایش x، y به صورت خطی کاهش می یابد. در نمودار C، شاهد عدم همبستگی بین x و y هستیم. این متغیرها به هیچ وجه بر یکدیگر تأثیر نمی گذارند.

در نهایت نمودار D نمونه ای از رابطه غیر خطی بین متغیرها است. با افزایش x، y ابتدا کاهش می یابد، سپس جهت تغییر می کند و افزایش می یابد.

بقیه مقاله به رابطه خطی بین متغیرهای وابسته و مستقل اختصاص دارد.

ضریب همبستگی

ضریب همبستگی r، قدرت و جهت رابطه بین متغیرهای مستقل و وابسته را در اختیار ما قرار می دهد. مقادیر R بین - 1.0 و + 1.0 متغیر است. وقتی r مثبت باشد، رابطه بین x و y مثبت است (نقاط A در شکل) و وقتی r منفی است، رابطه نیز منفی است (نقاط B). ضریب همبستگی نزدیک به صفر نشان می دهد که هیچ نمودار C) بین رابطه x و y وجود ندارد.

قدرت رابطه بین x و y با نزدیکی ضریب همبستگی به - 1.0 یا + - 1.0 تعیین می شود. شکل زیر را بررسی کنید.

نمودار A همبستگی مثبت کامل بین x و y را در r = + 1.0 نشان می دهد. نمودار B - همبستگی منفی کامل بین x و y در r = - 1.0. نمودارهای C و D نمونه هایی از روابط ضعیف تر بین متغیرهای وابسته و مستقل هستند.

ضریب همبستگی r، هم قدرت و هم جهت رابطه بین متغیرهای وابسته و مستقل را تعیین می کند. مقادیر r از - 1.0 (پیوند منفی قوی) تا + 1.0 (پیوند مثبت قوی) متغیر است. وقتی r = 0 باشد، هیچ رابطه ای بین متغیرهای x و y وجود ندارد.

با استفاده از رابطه زیر می‌توانیم ضریب همبستگی واقعی را محاسبه کنیم:

خب خب! می دانم که این معادله شبیه به هم ریختگی وحشتناکی از نمادهای نامفهوم است، اما قبل از اینکه وحشت کنیم، بیایید مثال نمره گذاری امتحان را روی آن اعمال کنیم. فرض کنید من می خواهم تعیین کنم که آیا بین تعداد ساعاتی که دانش آموز برای مطالعه آمار صرف می کند و نمره امتحان نهایی رابطه وجود دارد یا خیر. جدول زیر به ما کمک می کند تا این معادله را به چند محاسبه آسان تقسیم کنیم و آنها را قابل کنترل تر کنیم.

همانطور که می بینید، بین تعداد ساعات اختصاص داده شده به مطالعه موضوع و نمره امتحان همبستگی مثبت بسیار قوی وجود دارد. معلمان از دانستن این موضوع بسیار خوشحال خواهند شد.

ایجاد رابطه بین متغیرهای مشابه چه فایده ای دارد؟ سوال عالی اگر ارتباطی وجود داشته باشد، می توانیم نتایج امتحان را بر اساس تعداد ساعات صرف شده برای مطالعه موضوع پیش بینی کنیم. به عبارت ساده تر، هرچه اتصال قوی تر باشد، پیش بینی ما دقیق تر خواهد بود.

استفاده از اکسل برای محاسبه ضرایب همبستگی

مطمئن هستم که وقتی به این محاسبات وحشتناک ضرایب همبستگی نگاه می کنید، واقعا خوشحال خواهید شد که بدانید اکسل می تواند همه این کارها را با استفاده از تابع CORREL با ویژگی های زیر برای شما انجام دهد:

CORREL (آرایه 1؛ آرایه 2)،

آرایه 1 = محدوده داده برای اولین متغیر،

آرایه 2 = محدوده داده برای متغیر دوم.

به عنوان مثال، شکل تابع CORREL را نشان می دهد که برای محاسبه ضریب همبستگی برای مثال نمره امتحان استفاده می شود.

ضریب همبستگی (یا ضریب همبستگی خطی) با "r" (در موارد نادر به عنوان "ρ") نشان داده می شود و همبستگی خطی (یعنی رابطه ای که با مقدار و جهت داده می شود) دو یا چند متغیر را مشخص می کند. مقدار ضریب بین -1 و +1 قرار دارد، یعنی همبستگی می تواند مثبت و منفی باشد. اگر ضریب همبستگی -1 باشد، همبستگی منفی کامل وجود دارد. اگر ضریب همبستگی 1+ باشد، همبستگی مثبت کامل وجود دارد. در غیر این صورت، بین دو متغیر همبستگی مثبت وجود دارد، همبستگی منفی و یا بدون همبستگی. ضریب همبستگی را می توان به صورت دستی، با ماشین حساب های آنلاین رایگان یا با یک ماشین حساب نموداری خوب محاسبه کرد.

مراحل

محاسبه ضریب همبستگی به صورت دستی

    داده ها را جمع آوری کنید.قبل از شروع محاسبه ضریب همبستگی، این جفت اعداد را مطالعه کنید. بهتر است آنها را در جدولی بنویسید که بتوان آن را به صورت عمودی یا افقی مرتب کرد. هر سطر یا ستون را با "x" و "y" برچسب گذاری کنید.

    • به عنوان مثال، با توجه به چهار جفت مقدار (اعداد) متغیرهای "x" و "y". می توانید جدول زیر را ایجاد کنید:
      • x || y
      • 1 || 1
      • 2 || 3
      • 4 || 5
      • 5 || 7
  1. میانگین حسابی "x" را محاسبه کنید.برای انجام این کار، تمام مقادیر x را جمع کنید و سپس نتیجه را بر تعداد مقادیر تقسیم کنید.

    • در مثال ما، چهار مقدار از متغیر "x" آورده شده است. برای محاسبه میانگین حسابی "x"، این مقادیر را جمع کنید و سپس حاصل را بر 4 تقسیم کنید. محاسبات به صورت زیر نوشته می شوند:
    • μ x = (1 + 2 + 4 + 5) / 4 (\ displaystyle \ mu _ (x) = (1 + 2 + 4 + 5) / 4)
    • μ x = 12/4 (\ displaystyle \ mu _ (x) = 12/4)
    • μ x = 3 (\ displaystyle \ mu _ (x) = 3)
  2. میانگین حسابی "y" را پیدا کنید.برای انجام این کار، مراحل مشابه را دنبال کنید، یعنی تمام مقادیر y را جمع کنید و سپس مجموع را بر تعداد مقادیر تقسیم کنید.

    • در مثال ما، چهار مقدار از متغیر "y" داده شده است. این مقادیر را اضافه کنید و سپس حاصل را بر 4 تقسیم کنید. محاسبات به صورت زیر نوشته می شود:
    • μ y = (1 + 3 + 5 + 7) / 4 (\ displaystyle \ mu _ (y) = (1 + 3 + 5 + 7) / 4)
    • μ y = 16/4 (\ displaystyle \ mu _ (y) = 16/4)
    • μ y = 4 (\ displaystyle \ mu _ (y) = 4)
  3. انحراف معیار "x" را محاسبه کنید.پس از محاسبه میانگین «x» و «y»، انحراف معیار این متغیرها را بیابید. انحراف معیار با استفاده از فرمول زیر محاسبه می شود:

    • σ x = 1 n - 1 Σ (x - μ x) 2 (\ displaystyle \ sigma _ (x) = (\ sqrt ((\ frac (1) (n-1)) \ Sigma (x- \ mu _ ( x)) ^ (2))))
    • σ x = 1 4 - 1 ∗ ((1 - 3) 2 + (2 - 3) 2 + (4 - 3) 2 + (5 - 3) 2) (\ displaystyle \ sigma _ (x) = (\ sqrt ((\ frac (1) (4-1)) * ((1-3) ^ (2) + (2-3) ^ (2) + (4-3) ^ (2) + (5-3) ^ (2)))))
    • σ x = 1 3 ∗ (4 + 1 + 1 + 4) (\ displaystyle \ sigma _ (x) = (\ sqrt ((\ frac (1) (3)) * (4 + 1 + 1 + 4)) ))
    • σ x = 1 3 ∗ (10) (\ displaystyle \ sigma _ (x) = (\ sqrt ((\ frac (1) (3)) * (10))))
    • σ x = 10 3 (\ displaystyle \ sigma _ (x) = (\ sqrt (\ frac (10) (3))))
    • σ x = 1.83 (\ displaystyle \ sigma _ (x) = 1.83)
  4. انحراف معیار "y" را محاسبه کنید.مراحل ذکر شده در مرحله قبل را دنبال کنید. از همان فرمول استفاده کنید، اما مقادیر y را وارد کنید.

    • در مثال ما، محاسبات به صورت زیر نوشته می شود:
    • σ y = 1 4 - 1 ∗ ((1 - 4) 2 + (3 - 4) 2 + (5 - 4) 2 + (7 - 4) 2) (\ displaystyle \ sigma _ (y) = (\ sqrt ((\ frac (1) (4-1)) * ((1-4) ^ (2) + (3-4) ^ (2) + (5-4) ^ (2) + (7-4) ^ (2)))))
    • σ y = 1 3 ∗ (9 + 1 + 1 + 9) (\ displaystyle \ sigma _ (y) = (\ sqrt ((\ frac (1) (3)) * (9 + 1 + 1 + 9)) ))
    • σ y = 1 3 ∗ (20) (\ displaystyle \ sigma _ (y) = (\ sqrt ((\ frac (1) (3)) * (20))))
    • σ y = 20 3 (\ displaystyle \ sigma _ (y) = (\ sqrt (\ frac (20) (3))))
    • σ y = 2.58 (\ displaystyle \ sigma _ (y) = 2.58)
  5. فرمول اصلی محاسبه ضریب همبستگی را بنویسید.این فرمول شامل میانگین، انحراف استاندارد و تعداد (n) جفت اعداد برای هر دو متغیر است. ضریب همبستگی با "r" (در موارد نادر به عنوان "ρ") نشان داده می شود. این مقاله از فرمولی برای محاسبه ضریب همبستگی پیرسون استفاده می کند.

    • در اینجا و در منابع دیگر، کمیت ها را می توان به روش های مختلف نشان داد. به عنوان مثال، برخی از فرمول ها حاوی "ρ" و "σ" هستند، در حالی که برخی دیگر حاوی "r" و "s" هستند. برخی از کتاب‌های درسی فرمول‌های متفاوتی ارائه می‌دهند، اما همتای ریاضی فرمول فوق هستند.
  6. شما میانگین و انحراف معیار هر دو متغیر را محاسبه کرده اید، بنابراین می توانید از فرمول برای محاسبه ضریب همبستگی استفاده کنید. به یاد داشته باشید که "n" تعداد جفت مقادیر برای هر دو متغیر است. مقادیر دیگر قبلاً محاسبه شده است.

    • در مثال ما، محاسبات به صورت زیر نوشته می شود:
    • ρ = (1 n - 1) Σ (x - μ x σ x) ∗ (y - μ y σ y) (\ displaystyle \ rho = \ چپ ((\ frac (1) (n-1)) \ راست) \ Sigma \ left ((\ frac (x- \ mu _ (x)) (\ sigma _ (x))) \ right) * \ left ((\ frac (y- \ mu _ (y)) (\ sigma _ (y))) \ راست))
    • ρ = (1 3) ∗ (\ displaystyle \ rho = \ چپ ((\ frac (1) (3)) \ سمت راست) *)[ (1 - 3 1.83) ∗ (1 - 4 2. 58) + (2 - 3 1.83) ∗ (3 - 4 2. 58) (\ displaystyle \ چپ ((\ frac (1-3) (1.83)) \ راست) * \ چپ ((\ فرک (1-4) (2.58)) \ راست) + \ چپ ((\ فراک (2-3) (1.83)) \ راست) * \ چپ ((\ فرک (3- 4) (2.58)) \ راست))
      + (4 - 3 1.83) ∗ (5 - 4 2. 58) + (5 - 3 1.83) ∗ (7 - 4 2. 58) (\ displaystyle + \ چپ ((\ frac (4-3 ) (1.83) ) \ راست) * \ چپ ((\ فراک (5-4) (2.58)) \ راست) + \ چپ ((\ فراک (5-3) (1.83)) \ راست) * \ چپ ((\ فرک ( 7-4) (2.58)) \ راست))]
    • ρ = (1 3) ∗ (6 + 1 + 1 + 6 4.721) (\ displaystyle \ rho = \ چپ ((\ فرک (1) (3)) \ راست) * \ چپ ((\ فرک (6 + 1) + 1 + 6) (4.721)) \ راست))
    • ρ = (1 3) ∗ 2.965 (\ displaystyle \ rho = \ چپ ((\ frac (1) (3)) \ سمت راست) * 2.965)
    • ρ = (2.965 3) (\ displaystyle \ rho = \ چپ ((\ frac (2.965) (3)) \ راست))
    • ρ = 0.988 (\ displaystyle \ rho = 0.988)
  7. نتیجه را تجزیه و تحلیل کنید.در مثال ما، ضریب همبستگی 0.988 است. این مقدار به نوعی مجموعه معینی از جفت اعداد را مشخص می کند. به علامت و بزرگی مقدار توجه کنید.

    • از آنجایی که مقدار ضریب همبستگی مثبت است، بین متغیرهای "x" و "y" همبستگی مثبت وجود دارد. یعنی با افزایش مقدار "x" مقدار "y" نیز افزایش می یابد.
    • از آنجایی که مقدار ضریب همبستگی بسیار نزدیک به +1 است، مقادیر متغیرهای "x" و "y" همبستگی بالایی دارند. اگر نقاطی را روی صفحه مختصات قرار دهید، آنها نزدیک به یک خط مستقیم قرار می گیرند.

    استفاده از ماشین حساب آنلاین برای محاسبه ضریب همبستگی

    1. یک ماشین حساب در اینترنت برای محاسبه ضریب همبستگی پیدا کنید.این ضریب اغلب در آمار محاسبه می شود. اگر تعداد جفت اعداد زیاد باشد، محاسبه ضریب همبستگی به صورت دستی تقریبا غیرممکن است. بنابراین، ماشین حساب های آنلاین برای محاسبه ضریب همبستگی وجود دارد. در موتور جستجو، «محاسب ضریب همبستگی» (بدون نقل قول) را وارد کنید.

    2. داده ها را وارد کنید.دستورالعمل های وب سایت را بررسی کنید تا داده های صحیح (جفت اعداد) را وارد کنید. وارد کردن جفت اعداد مناسب ضروری است. در غیر این صورت نتیجه اشتباهی خواهید گرفت. لطفاً توجه داشته باشید که وب‌سایت‌های مختلف فرمت‌های ورودی داده‌های متفاوتی دارند.

      • به عنوان مثال، در http://ncalculators.com/statistics/correlation-coefficient-calculator.htm، مقادیر متغیرهای x و y در دو خط افقی وارد می شوند. مقادیر با کاما از هم جدا می شوند. یعنی در مثال ما مقادیر "x" به این صورت وارد می شوند: 1،2،4،5 و مقادیر "y" مانند این: 1،3،5،7.
      • در سایت دیگری، http://www.alcula.com/calculators/statistics/correlation-coefficient/، داده ها به صورت عمودی وارد می شوند. در این مورد، جفت اعداد مربوطه را اشتباه نگیرید.
    3. ضریب همبستگی را محاسبه کنید.پس از وارد کردن داده ها، کافی است بر روی دکمه «محاسبه»، «محاسبه» یا موارد مشابه کلیک کنید تا به نتیجه برسید.

      با استفاده از ماشین حساب نموداری

      1. داده ها را وارد کنید.یک ماشین حساب نموداری بگیرید، به حالت محاسبه آماری بروید و دستور "Edit" را انتخاب کنید.

        • ماشین حساب های مختلف نیاز به فشار دادن کلیدهای مختلف دارند. این مقاله در مورد ماشین حساب Texas Instruments TI-86 بحث می کند.
        • برای ورود به حالت محاسبه آماری، - Stat (بالای کلید "+") را فشار دهید. سپس F2 - Edit را فشار دهید.
      2. داده های ذخیره شده قبلی را حذف کنید.اکثر ماشین‌حساب‌ها آماری را که وارد می‌کنید تا زمانی که آن‌ها را پاک نکنید نگه می‌دارند. برای جلوگیری از اشتباه گرفتن داده های قدیمی با داده های جدید، ابتدا اطلاعات ذخیره شده را حذف کنید.

        • از کلیدهای جهت دار برای حرکت مکان نما استفاده کنید و عنوان 'xStat' را برجسته کنید. سپس Clear و Enter را فشار دهید تا تمام مقادیر وارد شده در ستون xStat پاک شوند.
        • از کلیدهای جهت دار برای برجسته کردن عنوان 'yStat' استفاده کنید. سپس Clear و Enter را فشار دهید تا تمام مقادیر وارد شده در ستون yStat پاک شود.
      3. داده های اولیه را وارد کنید.با استفاده از کلیدهای جهت دار، مکان نما را به سلول اول تحت عنوان "xStat" منتقل کنید. مقدار اول را وارد کرده و Enter را فشار دهید. در پایین صفحه، "xStat (1) = __" نمایش داده می شود که مقدار وارد شده جایگزین یک فاصله است. پس از فشار دادن Enter، مقدار وارد شده در جدول ظاهر می شود و مکان نما به خط بعدی منتقل می شود. این "xStat (2) = __" را در پایین صفحه نمایش می دهد.

        • تمام مقادیر متغیر "x" را وارد کنید.
        • پس از وارد کردن تمام مقادیر x، با استفاده از کلیدهای جهت دار به ستون yStat رفته و مقادیر y را وارد کنید.
        • پس از وارد کردن همه جفت اعداد، Exit را فشار دهید تا صفحه پاک شود و از حالت محاسبه آماری خارج شوید.
      4. ضریب همبستگی را محاسبه کنید.این مشخص می کند که داده ها چقدر به یک خط مستقیم خاص نزدیک هستند. ماشین حساب نموداری می تواند به سرعت خط مستقیم مناسب را تعیین کرده و ضریب همبستگی را محاسبه کند.

        • روی Stat - Calc کلیک کنید. در TI-86، - - را فشار دهید.
        • تابع رگرسیون خطی را انتخاب کنید. در TI-86، آن را فشار دهید که برچسب "LinR" دارد. صفحه نمایش خط "LinR _" را با مکان نما چشمک زن نشان می دهد.
        • حالا نام دو متغیر xStat و yStat را وارد کنید.
          • در TI-86، لیست اسامی را باز کنید. برای انجام این کار، - - را فشار دهید.
          • متغیرهای موجود در خط پایین صفحه نمایش داده می شوند. را انتخاب کنید (احتمالاً برای انجام این کار باید F1 یا F2 را فشار دهید)، یک کاما وارد کنید و سپس انتخاب کنید.
          • Enter را فشار دهید تا داده های وارد شده پردازش شود.
      5. نتایج خود را تجزیه و تحلیل کنیدبا فشردن Enter اطلاعات زیر نمایش داده می شود:

        • y = a + b x (\ نمایش سبک y = a + bx): این تابعی است که خط را توصیف می کند. لطفاً توجه داشته باشید که تابع به شکل استاندارد (y = kx + b) نوشته نشده است.
        • a = (\ displaystyle a =)... این مختصات y تقاطع خط مستقیم با محور y است.
        • b = (\ نمایش سبک b =)... این شیب خط است.
        • corr = (\ displaystyle (\ text (corr)) =)... این ضریب همبستگی است.
        • n = (\ نمایش سبک n =)... این تعداد جفت اعدادی است که در محاسبات استفاده شده است.