Как се прави корелацията в Excel? Корелационен и регресионен анализ в Excel: инструкции за изпълнение

Корелационният анализ е популярен метод статистическо изследване, който се използва за идентифициране на степента на зависимост на един индикатор от друг. AT Microsoft Excelна разположение специален инструмент A, който е предназначен за извършване на този тип анализ. Нека да разберем как да използваме тази функция.

Същността на корелационния анализ

предназначение корелационен анализСвежда се до идентифициране на наличието на връзка между различни фактори. Тоест, определя се дали намаляването или увеличаването на един индикатор влияе върху промяната на друг.

Ако се установи зависимостта, тогава се определя коефициентът на корелация. За разлика от регресионния анализ, това е единственият индикатор, който този метод на статистическо изследване изчислява. Коефициентът на корелация варира от +1 до -1. Ако има положителна корелация, увеличаването на един индикатор допринася за увеличаване на втория. При отрицателна корелация увеличаването на един индикатор води до намаляване на другия. Колкото по-голям е модулът на коефициента на корелация, толкова по-забележима промяната в един индикатор се отразява в промяната във втория. При коефициент, равен на 0, зависимостта между тях напълно отсъства.

Изчисляване на коефициента на корелация

Сега нека се опитаме да изчислим коефициента на корелация на конкретен пример. Имаме таблица, в която разходите за реклама и размера на продажбите са ежемесечно боядисани в отделни колони. Трябва да установим степента на зависимост на броя на продажбите от сумата Парикоито бяха похарчени за реклама.

Метод 1: Определяне на корелация чрез съветника за функции

Един от начините, по които можете да извършите корелационен анализ, е да използвате функцията CORREL. Самата функция има обща форма CORREL(масив1, масив2).

  1. Изберете клетката, в която трябва да се покаже резултатът от изчислението. Кликнете върху бутона „Вмъкване на функция“, който се намира вляво от лентата с формули.
  2. В списъка, който е представен в прозореца на Съветника за функции, потърсете и изберете функцията CORREL. Щракнете върху бутона "OK".
  3. Отваря се прозорецът с аргументи на функцията. В полето "Array1" въведете координатите на диапазона от клетки на една от стойностите, чиято зависимост трябва да се определи. В нашия случай това ще бъдат стойностите в колоната „Сума на продажбите“. За да въведете адреса на масива в полето, просто изберете всички клетки с данни в горната колона.

    В полето "Array2" трябва да въведете координатите на втората колона. Имаме разходи за реклама. По същия начин, както в предишния случай, въвеждаме данните в полето.

    Щракнете върху бутона "OK".

Както можете да видите, коефициентът на корелация под формата на число се появява в клетката, която избрахме по-рано. В този случай той е равен на 0,97, което е много висок знак за зависимостта на една величина от друга.

Метод 2: Изчислете корелацията с помощта на пакета за анализ

В допълнение, корелацията може да бъде изчислена с помощта на един от инструментите, предоставени в пакета за анализ. Но първо трябва да активираме този инструмент.

  1. Отидете в раздела "Файл".
  2. В прозореца, който се отваря, преминете към секцията "Настройки".
  3. След това отидете на елемента "Добавки".
  4. В долната част на следващия прозорец, в секцията „Управление“, преместете превключвателя в позиция „Добавки на Excel“, ако е в различна позиция. Щракнете върху бутона "OK".
  5. В прозореца с добавки поставете отметка в квадратчето до елемента „Пакет за анализ“. Щракнете върху бутона "OK".
  6. След това пакетът за анализ се активира. Отидете в раздела "Данни". Както можете да видите, тук на лентата се появява нов блок от инструменти - "Анализ". Кликнете върху бутона "Анализ на данни", който се намира в него.
  7. Списъкът се отваря с различни опцииАнализ на данни. Изберете "Корелация". Щракнете върху бутона "OK".
  8. Отваря се прозорец с параметри за корелационен анализ. За разлика от предишния метод, в полето "Input interval" ние въвеждаме интервала не за всяка колона поотделно, а за всички колони, които участват в анализа. В нашия случай това са данните в колоните „Разходи за реклама“ и „Продажби“.

    Оставяме параметъра „Групиране“ непроменен - ​​„По колони“, тъй като нашите групи данни са разделени на две колони. Ако са били счупени ред по ред, тогава превключвателят трябва да бъде преместен в позиция „По линии“.

    По подразбиране изходните опции са зададени на "Нов работен лист", тоест данните ще се показват на друг лист. Можете да промените местоположението, като преместите превключвателя. Това може да бъде текущият лист (тогава ще трябва да посочите координатите на клетките за изход на информация) или нова работна книга (файл).

    Когато всички настройки са зададени, щракнете върху бутона "OK".

Тъй като изходното местоположение на резултатите от анализа е оставено по подразбиране, преминаваме към нов лист. Както можете да видите, ето коефициента на корелация. Естествено, той е същият като при използването на първия метод - 0,97. Това е така, защото и двете опции извършват едни и същи изчисления, просто могат да бъдат направени по различни начини.

Както можете да видите, приложението Excel предлага два метода за анализ на корелация наведнъж. Резултатът от изчисленията, ако направите всичко правилно, ще бъде напълно идентичен. Но всеки потребител може да избере по-удобна опция за изчисление за него.

Радваме се, че успяхме да ви помогнем да разрешите проблема.

Задайте въпроса си в коментарите, описвайки подробно същността на проблема. Нашите експерти ще се опитат да отговорят възможно най-бързо.

Тази статия помогна ли ви?

Регресионен и корелационен анализ - статистически методиизследвания. Това са най-често срещаните начини за показване на зависимостта на параметър от една или повече независими променливи.

По-долу за конкретни практически примериНека разгледаме тези два много популярни анализа сред икономистите. Ще дадем и пример за получаване на резултати, когато се комбинират.

Регресионен анализ в Excel

Показва влиянието на някои стойности (независими, независими) върху зависимата променлива. Например как броят на икономически активното население зависи от броя на предприятията, заплатите и други параметри. Или: как чуждите инвестиции, цените на енергията и т.н. влияят на нивото на БВП.

Резултатът от анализа ви позволява да приоритизирате. И въз основа на основните фактори, за прогнозиране, планиране на развитието на приоритетни области, вземане на управленски решения.

Регресията се случва:

  • линеен (y = a + bx);
  • параболичен (y = a + bx + cx2);
  • експоненциален (y = a * exp(bx));
  • мощност (y = a*x^b);
  • хиперболичен (y = b/x + a);
  • логаритмичен (y = b * 1n(x) + a);
  • експоненциална (y = a * b^x).

Разгледайте примера за изграждане на регресионен модел в Excel и интерпретиране на резултатите. Да вземем линеен типрегресия.

Задача. При 6 предприятия средномесеч заплатаи броя на пенсионираните служители. Необходимо е да се определи зависимостта на броя на пенсионираните служители от средната работна заплата.

Моделът на линейна регресия има следната форма:

Y \u003d a0 + a1x1 + ... + akhk.

Където a са коефициентите на регресия, x са влияещите променливи, а k е броят на факторите.

В нашия пример Y е индикаторът за напусналите работници. Влиятелният фактор е заплатите (x).

Excel има вградени функции, които могат да се използват за изчисляване на параметрите на модел на линейна регресия. Но добавката Analysis ToolPak ще го направи по-бързо.

Активирайте мощен аналитичен инструмент:

  1. Щракнете върху бутона "Office" и отидете на раздела "Опции на Excel". "Добавки".
  2. В долната част, под падащия списък, в полето „Управление“ ще има надпис „Добавки на Excel“ (ако го няма, щракнете върху квадратчето за отметка вдясно и изберете). И бутон Go. Щракнете върху.
  3. Отваря се списък с налични добавки. Изберете „Пакет за анализ“ и щракнете върху OK.

След като бъде активирана, добавката ще бъде налична в раздела Данни.

Сега ще се заемем директно с регресионния анализ.

  1. Отворете менюто на инструмента за анализ на данни. Изберете "Регресия".
  2. Ще се отвори меню за избор на входни стойности и изходни опции (къде да се покаже резултатът). В полетата за изходни данни посочваме обхвата на описания параметър (Y) и фактора, влияещ върху него (X). Останалото може или не може да бъде завършено.
  3. След като щракнете върху OK, програмата ще покаже изчисленията на нов лист (можете да изберете интервала за показване на текущия лист или да присвоите изхода на нова работна книга).

На първо място, обръщаме внимание на R-квадрата и коефициентите.

R-квадрат е коефициентът на детерминация. В нашия пример това е 0,755, или 75,5%. Означава, че конструктивни параметримоделите обясняват с 75,5% зависимостта между изследваните параметри. Колкото по-висок е коефициентът на детерминация, толкова по-добър е моделът. Добър - над 0,8. Слабо - по-малко от 0,5 (подобен анализ трудно може да се счита за разумен). В нашия пример - "не е зле".

Коефициентът 64.1428 показва какво ще бъде Y, ако всички променливи в разглеждания модел са равни на 0. Тоест други фактори, които не са описани в модела, също влияят върху стойността на анализирания параметър.

Коефициентът -0,16285 показва тежестта на променливата X върху Y. Тоест средната месечна заплата в рамките на този модел влияе върху броя на напусналите с тежест -0,16285 (това е малка степен на влияние). Знакът „-“ показва отрицателно въздействие: колкото по-висока е заплатата, толкова по-малко се напускат. Което е справедливо.

Корелационен анализ в Excel

Корелационният анализ помага да се установи дали има връзка между показателите в една или две извадки. Например между времето на работа на машината и цената на ремонта, цената на оборудването и продължителността на работа, височината и теглото на децата и т.н.

Ако има връзка, тогава дали увеличението на един параметър води до увеличение (положителна корелация) или намаляване (отрицателно) на другия. Анализът на корелацията помага на анализатора да определи дали стойността на един индикатор може да предвиди възможната стойност на друг.

Коефициентът на корелация се обозначава с r. Варира от +1 до -1. Класификация на корелациите за различни областище бъде различен. Когато стойността на коефициента е 0, няма линейна връзка между пробите.

Помислете как да използвате Excel, за да намерите коефициента на корелация.

Функцията CORREL се използва за намиране на сдвоените коефициенти.

Задача: Определете дали има връзка между работното време струги разходите за поддръжката му.

Поставете курсора във всяка клетка и натиснете бутона fx.

  1. В категорията "Статистически" изберете функцията CORREL.
  2. Аргумент "Масив 1" - първият диапазон от стойности - времето на машината: A2: A14.
  3. Аргумент "Масив 2" - вторият диапазон от стойности - цената на ремонта: B2:B14. Щракнете върху OK.

За да определите вида на връзката, трябва да погледнете абсолютния номер на коефициента (всяко поле на дейност има своя собствена скала).

За корелационен анализ на няколко параметъра (повече от 2) е по-удобно да използвате „Анализ на данни“ (добавка „Пакет за анализ“). В списъка трябва да изберете корелация и да посочите масив. Всичко.

Получените коефициенти ще бъдат показани в корелационната матрица. Като този:

Корелационно-регресионен анализ

На практика тези две техники често се използват заедно.

  1. Изграждаме корелационно поле: "Вмъкване" - "Диаграма" - "Разсейване" (позволява да сравнявате двойки). Диапазонът на стойностите е всички числови данни в таблицата.
  2. Щракнете с левия бутон върху която и да е точка от диаграмата. Тогава надясно. В менюто, което се отваря, изберете „Добавяне на линия на тренда“.
  3. Задайте параметри за линията. Тип - "Линеен". В долната част - "Показване на уравнението в диаграмата."
  4. Щракнете върху "Затвори".

Сега данните от регресионния анализ са видими.

1. Отворете програмата Excel

2. Създайте колони с данни. В нашия пример ще разгледаме връзката или корелацията между агресивността и неувереността в себе си при първокласниците. Експериментът включва 30 деца, данните са представени в таблицата на Excel:

1 колона - номер на предмета

2-ра колона - агресивност в точки

3 колона - неувереност в точки

3. След това трябва да изберете празна клетка до таблицата и да кликнете върху иконата f(x)в панела на Excel

4. Ще се отвори менюто с функции, сред категориите, които трябва да изберете Статистически, а след това в списъка с функции намерете по азбучен ред CORRELи щракнете върху OK

5. След това ще се отвори менюто с аргументи на функцията, което ще ни позволи да изберем колоните с данни, от които се нуждаем. За да изберете първата колона Агресивносттрябва да кликнете върху синия бутон до реда Масив1

6. Да изберем данните за масив1от колона Агресивности щракнете върху синия бутон в диалоговия прозорец

7. След това, подобно на масив 1, щракнете върху синия бутон до реда Масив2

8. Да изберем данните за масив2- колона Съмнение в себе сии отново натиснете синия бутон, след това OK

9. Тук в избраната клетка се изчислява и записва коефициентът на корелация r-Pearson, който в нашия случай е положителен и приблизително равен. Това говори за умерено положителенвръзки между агресивността и неувереността в себе си при първокласниците

По този начин, статистически изводиексперимент ще бъде: r = 0,225, беше разкрита умерена положителна връзка между променливите агресивности съмнение в себе си.

В някои проучвания се изисква да се посочи нивото на p-значимост на коефициента на корелация, но Excel, за разлика от SPSS, не предоставя такава възможност. Всичко е наред, има таблици с критични стойности на корелациите (А.Д. Наследов).

Можете също да изградите регресионна линия в Excel и да я прикачите към резултатите от изследването.

За определяне на степента на зависимост между няколко индикатора се използват множество коефициенти на корелация. След това те се обобщават в отделна таблица, която се нарича корелационна матрица. Имената на редовете и колоните на такава матрица са имената на параметрите, чиято зависимост един от друг е установена. Съответните коефициенти на корелация са разположени в пресечната точка на редове и колони. Нека разберем как можете да направите подобно изчисление с помощта на инструменти на Excel.

Обичайно е да се определя нивото на връзката между различните показатели, както следва, в зависимост от коефициента на корелация:

  • 0 - 0,3 - няма връзка;
  • 0,3 - 0,5 - слаба връзка;
  • 0,5 - 0,7 - средна връзка;
  • 0,7 - 0,9 - високо;
  • 0,9 - 1 - много силно.

Ако коефициентът на корелация е отрицателен, това означава, че връзката на параметрите е обратна.

За съставяне на корелационна матрица в Excel се използва един инструмент, включен в пакета "Анализ на данни". Така се казва - "корелация". Нека да видим как може да се използва за изчисляване на множество корелационни резултати.

Стъпка 1: Активирайте Analysis Pack

Трябва да се каже веднага, че пакетът по подразбиране "Анализ на данни"хора с увреждания. Следователно, преди да продължите с процедурата за директно изчисляване на коефициентите на корелация, трябва да я активирате. За съжаление, не всеки потребител знае как да направи това. Затова ще се съсредоточим върху този въпрос.


След посоченото действие, пакетът с инструменти "Анализ на данни"ще бъде активиран.

Етап 2: изчисляване на коефициента

Сега можете да продължите директно към изчисляването на коефициента на множествена корелация. Нека изчислим коефициента на множествена корелация на тези фактори, като използваме примера на таблицата с показатели за производителност на труда, съотношение капитал-труд и съотношение мощност/тегло в различни предприятия.


Етап 3: анализ на резултата

Сега нека да разберем как да разберем резултата, който получихме в процеса на обработка на данни от инструмента "корелация"в програмата Excel.

Както виждаме от таблицата, коефициентът на корелация на съотношението капитал-труд (Колона 2) и съотношение мощност/тегло ( Колона 1) е 0,92, което съответства на много силна връзка. Между производителността на труда ( Колона 3) и съотношение мощност/тегло ( Колона 1) този показател е равен на 0,72, което е висока степен на зависимост. Коефициент на корелация между производителността на труда ( Колона 3) и съотношението капитал-труд ( Колона 2) е равно на 0,88, което също съответства на висока степензависимости. По този начин можем да кажем, че връзката между всички изследвани фактори може да се проследи доста силна.

Както можете да видите, пакетът "Анализ на данни"в Excel е много удобен и доста лесен за използване инструмент за определяне на коефициента на множествена корелация. Може да се използва и за изчисляване на обичайната корелация между два фактора.

"Correlation" на латински означава "корелация", "връзка". Количествена характеристика на връзката може да се получи чрез изчисляване на коефициента на корелация. Този коефициент, популярен в статистическия анализ, показва дали някакви параметри са свързани помежду си (например височина и тегло; ниво на интелигентност и академични резултати; брой наранявания и часове на работа).

Използване на корелация

Изчисляването на корелацията е особено широко използвано в икономиката, социологическите изследвания, медицината и биометрията - навсякъде, където можете да получите два набора от данни, между които може да се намери връзка.

Можете да изчислите корелацията ръчно, като извършите прости аритметични операции. Въпреки това процесът на изчисление отнема много време, ако наборът от данни е голям. Особеността на метода е, че изисква събиране Голям бройизходни данни, за да се покаже най-точно дали има връзка между характеристиките. Следователно, сериозното използване на корелационния анализ е невъзможно без използването на компютърни технологии. Една от най-популярните и достъпни програми за решаване на този проблем е.

Как да извършим корелация в Excel?

Най-отнемащата време стъпка при определяне на корелацията е наборът от данни. Данните, които трябва да се сравняват, обикновено са подредени в две колони или реда. Таблицата трябва да бъде направена без празнини в клетките. Съвременните версии на Excel (от 2007 г. и по-млади) не изискват допълнителни настройки за статистически изчисления; могат да се направят необходимите манипулации:

  1. Изберете празна клетка, в която ще се покаже резултатът от изчислението.
  2. Щракнете върху елемента "Формули" в главното меню на Excel.
  3. Сред бутоните, групирани в "Библиотека с функции", изберете "Други функции".
  4. В падащите списъци изберете функцията за изчисление на корелацията (Статистически - CORREL).
  5. Excel отваря панела Аргументи на функцията. „Масив 1“ и „Масив 2“ са диапазоните на сравняваните данни. За да попълните тези полета автоматично, можете просто да изберете желаните клетки в таблицата.
  6. Щракнете върху OK, за да затворите прозореца с аргументи на функцията. Изчисленият коефициент на корелация ще се появи в клетката.

Корелацията може да бъде пряка (ако коефициентът е по-голям от нула) и обратна (от -1 до 0).

Първият означава, че с увеличаване на единия параметър, другият също се увеличава. Обратната (отрицателна) корелация отразява факта, че когато една променлива се увеличава, другата намалява.

Корелацията може да бъде близка до нула. Това обикновено показва, че изследваните параметри не са свързани помежду си. Но понякога се получава нулева корелация, ако се направи неуспешна извадка, която не отразява връзката, или връзката има сложна нелинейна природа.

Ако коефициентът показва средна или силна връзка (от ±0,5 до ±0,99), трябва да се помни, че това е само статистическа връзка, която изобщо не гарантира влиянието на един параметър върху друг. Също така е невъзможно да се изключи ситуацията, че и двата параметъра са независими един от друг, но те се влияят от някакъв трети неотчетен фактор. Excel ви помага незабавно да изчислите коефициента на корелация, но обикновено само количествените методи не са достатъчни за установяване на причинно-следствени връзки в корелирани проби.

В днешната статия ще говорим за това как променливите могат да бъдат свързани помежду си. С помощта на корелация ще можем да определим дали има връзка между първата и втората променлива. Надявам се този урок да ви е толкова вълнуващ, колкото и предишните!

Корелацията измерва силата и посоката на връзката между x и y. Фигурата показва Различни видовекорелации под формата на диаграми на разсейване на подредени двойки (x, y). Традиционно x се поставя върху хоризонталната ос, а y върху вертикалната.

Графика А е пример за положителна линейна корелация: с увеличаване на x, y също нараства, и то линейно. График B ни показва пример за отрицателна линейна корелация, където с увеличаване на x, y намалява линейно. В графика C не виждаме корелация между x и y. Тези променливи не си влияят по никакъв начин.

И накрая, графика D е пример за нелинейни връзки между променливи. С увеличаване на x, y първо намалява, след това променя посоката и се увеличава.

Останалата част от статията е посветена на линейните връзки между зависимите и независимите променливи.

Коефициент на корелация

Коефициентът на корелация, r, ни осигурява както силата, така и посоката на връзката между независимите и зависими променливи. Стойностите на r са между -1.0 и +1.0. Когато r е положително, връзката между x и y е положителна (графика A на фигурата), а когато r е отрицателна, връзката също е отрицателна (графика B). Коефициент на корелация, близък до нула, показва, че няма графика C между x и y.

Силата на връзката между x и y се определя от близостта на коефициента на корелация до - 1,0 или + - 1,0. Проучете следната фигура.

Графика А показва перфектна положителна корелация между x и y при r = + 1.0. Графика B е перфектна отрицателна корелация между x и y при r = -1.0. Графики C и D са примери за по-слаби връзки между зависимите и независимите променливи.

Коефициентът на корелация, r, определя както силата, така и посоката на връзката между зависимите и независимите променливи. Стойностите на r варират от -1.0 (силна отрицателна асоциация) до +1.0 (силна положителна асоциация). За r=0 няма връзка между x и y.

Можем да изчислим действителния коефициент на корелация, използвайки следното уравнение:

Добре добре! Знам, че това уравнение изглежда като ужасна смесица от неясни символи, но преди да се паникьосваме, нека приложим примера за оценка от изпита към него. Да кажем, че искам да определя дали има връзка между броя на часовете, които студентът прекарва в изучаване на статистика и оценката на последния изпит. Таблицата по-долу ще ни помогне да разделим това уравнение на няколко прости изчисления и да ги направим по-управляеми.

Както можете да видите, има много силна положителна връзка между броя на часовете, прекарани в изучаване на даден предмет, и оценката от изпита. Учителите ще се радват да научат за това.

Каква е ползата от установяване на връзка между подобни променливи? Страхотен въпрос. Ако се установи, че съществува връзка, можем да предвидим резултатите от изпитите въз основа на определен брой часове, прекарани в изучаване на темата. Казано по-просто, колкото по-силна е връзката, толкова по-точна ще бъде нашата прогноза.

Използване на Excel за изчисляване на корелационни коефициенти

Сигурен съм, че след като разгледате тези ужасни изчисления на коефициента на корелация, ще изпитате истинска радост да разберете, че Excel може да свърши цялата тази работа вместо вас, използвайки функцията CORREL със следните характеристики:

CORREL(масив 1; масив 2),

масив 1 = диапазон от данни за първата променлива,

масив 2 = диапазон от данни за втората променлива.

Например, фигурата показва функцията CORREL, използвана при изчисляване на коефициента на корелация за примера за оценка на изпита.

Коефициентът на корелация (или коефициентът на линейна корелация) се обозначава като "r" (в редки случаи като "ρ") и характеризира линейната корелация (тоест връзката, която се дава от някаква стойност и посока) на две или повече променливи . Стойността на коефициента е между -1 и +1, тоест корелацията може да бъде както положителна, така и отрицателна. Ако коефициентът на корелация е -1, има перфектна отрицателна корелация; ако коефициентът на корелация е +1, има перфектна положителна корелация. В други случаи има положителна корелация, отрицателна корелация или липса на корелация между двете променливи. Коефициентът на корелация може да бъде изчислен ръчно, с безплатни онлайн калкулатори или с добър графичен калкулатор.

Стъпки

Ръчно изчисляване на коефициента на корелация

    Съберете данни.Преди да започнете да изчислявате коефициента на корелация, разгледайте дадената двойка числа. По-добре е да ги запишете в таблица, която може да бъде подредена вертикално или хоризонтално. Етикетирайте всеки ред или колона като "x" и "y".

    • Например, дадени са четири двойки стойности (числа) на променливите "x" и "y". Можете да създадете следната таблица:
      • x || г
      • 1 || 1
      • 2 || 3
      • 4 || 5
      • 5 || 7
  1. Изчислете средното аритметично "x".За да направите това, добавете всички стойности на "x" и след това разделете резултата на броя на стойностите.

    • В нашия пример са ни дадени четири стойности за променливата "x". За да изчислите средноаритметичното "x", добавете тези стойности и след това разделете сумата на 4. Изчисленията ще бъдат написани по следния начин:
    • μ x = (1 + 2 + 4 + 5) / 4 (\displaystyle \mu _(x)=(1+2+4+5)/4)
    • μ x = 12 / 4 (\displaystyle \mu _(x)=12/4)
    • μ x = 3 (\displaystyle \mu _(x)=3)
  2. Намерете средното аритметично "y".За да направите това, следвайте същите стъпки, тоест съберете всички стойности на "y" и след това разделете сумата на броя на стойностите.

    • В нашия пример са ни дадени четири стойности за променливата "y". Добавете тези стойности и след това разделете сумата на 4. Изчисленията ще бъдат записани, както следва:
    • μ y = (1 + 3 + 5 + 7) / 4 (\displaystyle \mu _(y)=(1+3+5+7)/4)
    • μ y = 16 / 4 (\displaystyle \mu _(y)=16/4)
    • μ y = 4 (\displaystyle \mu _(y)=4)
  3. Изчислете стандартното отклонение на "x".След като изчислите средните стойности на "x" и "y", намерете стандартни отклонениятези променливи. Стандартното отклонение се изчислява по следната формула:

    • σ x = 1 n − 1 Σ (x − μ x) 2 (\displaystyle \sigma _(x)=(\sqrt ((\frac (1)(n-1))\Sigma (x-\mu _( x)))^(2))))
    • σ x = 1 4 − 1 ∗ ((1 − 3) 2 + (2 − 3) 2 + (4 − 3) 2 + (5 − 3) 2) (\displaystyle \sigma _(x)=(\sqrt ((\frac (1)(4-1))*((1-3)^(2)+(2-3)^(2)+(4-3)^(2)+(5-3) ^(2))))
    • σ x = 1 3 ∗ (4 + 1 + 1 + 4) (\displaystyle \sigma _(x)=(\sqrt ((\frac (1)(3))*(4+1+1+4)) ))
    • σ x = 1 3 ∗ (10) (\displaystyle \sigma _(x)=(\sqrt ((\frac (1)(3))*(10))))
    • σ x = 10 3 (\displaystyle \sigma _(x)=(\sqrt (\frac (10)(3))))
    • σ x = 1 , 83 (\displaystyle \sigma _(x)=1,83)
  4. Изчислете стандартното отклонение "y".Следвайте стъпките в предишната стъпка. Използвайте същата формула, но заменете стойностите на "y" в нея.

    • В нашия пример изчисленията ще бъдат записани, както следва:
    • σ y = 1 4 − 1 ∗ ((1 − 4) 2 + (3 − 4) 2 + (5 − 4) 2 + (7 − 4) 2) (\displaystyle \sigma _(y)=(\sqrt ((\frac (1)(4-1))*((1-4)^(2)+(3-4)^(2)+(5-4)^(2)+(7-4) ^(2))))
    • σ y = 1 3 ∗ (9 + 1 + 1 + 9) (\displaystyle \sigma _(y)=(\sqrt ((\frac (1)(3))*(9+1+1+9)) ))
    • σ y = 1 3 ∗ (20) (\displaystyle \sigma _(y)=(\sqrt ((\frac (1)(3))*(20))))
    • σ y = 20 3 (\displaystyle \sigma _(y)=(\sqrt (\frac (20)(3))))
    • σ y = 2 , 58 (\displaystyle \sigma _(y)=2,58)
  5. Запишете основната формула за изчисляване на коефициента на корелация.Тази формула включва средни стойности, стандартни отклонения и броя (n) двойки числа на двете променливи. Коефициентът на корелация се обозначава като "r" (в редки случаи като "ρ"). Тази статия използва формулата за изчисляване на коефициента на корелация на Пиърсън.

    • Тук и в други източници количествата могат да бъдат обозначени по различни начини. Например в някои формули има "ρ" и "σ", а в други "r" и "s". Някои учебници дават други формули, но те са математически еквивалент на формулата по-горе.
  6. Изчислили сте средните стойности и стандартните отклонения на двете променливи, така че можете да използвате формулата за изчисляване на коефициента на корелация. Припомнете си, че "n" е броят на двойките стойности на двете променливи. Стойността на другите количества е изчислена по-рано.

    • В нашия пример изчисленията ще бъдат записани, както следва:
    • ρ = (1 n − 1) Σ (x − μ x σ x) ∗ (y − μ y σ y) (\displaystyle \rho =\left((\frac (1)(n-1))\right) \Sigma \left((\frac (x-\mu _(x))(\sigma _(x)))\right)*\left((\frac (y-\mu _(y))(\sigma _(y)))\вдясно))
    • ρ = (1 3) ∗ (\displaystyle \rho =\left((\frac (1)(3))\right)*)[ (1 − 3 1 , 83) ∗ (1 − 4 2 , 58) + (2 − 3 1 , 83) ∗ (3 − 4 2 , 58) (\displaystyle \left((\frac (1-3)( 1,83))\вдясно)*\ляво((\frac (1-4)(2,58))\вдясно)+\left((\frac (2-3)(1,83))\вдясно) *\left((\ frac (3-4)(2,58))\вдясно))
      + (4 − 3 1 , 83) ∗ (5 − 4 2 , 58) + (5 − 3 1 , 83) ∗ (7 − 4 2 , 58) (\displaystyle +\left((\frac (4-3) )(1,83))\вдясно)*\ляво((\frac (5-4)(2,58))\вдясно)+\left((\frac (5-3)(1,83))\ вдясно)*\left( (\frac (7-4)(2,58))\вдясно))]
    • ρ = (1 3) ∗ (6 + 1 + 1 + 6 4 , 721) (\displaystyle \rho =\left((\frac (1)(3))\right)*\left((\frac (6) +1+1+6)(4721))\вдясно))
    • ρ = (1 3) ∗ 2 , 965 (\displaystyle \rho =\left((\frac (1)(3))\right)*2,965)
    • ρ = (2, 965 3) (\displaystyle \rho =\left((\frac (2,965)(3))\right))
    • ρ = 0.988 (\displaystyle \rho =0.988)
  7. Анализирайте резултата.В нашия пример коефициентът на корелация е 0,988. Тази стойност характеризира по някакъв начин този комплектдвойки числа. Обърнете внимание на знака и величината на стойността.

    • Тъй като стойността на коефициента на корелация е положителна, има положителна корелация между променливите "x" и "y". Тоест, когато стойността на "x" се увеличава, стойността на "y" също се увеличава.
    • Тъй като стойността на коефициента на корелация е много близка до +1, стойностите на променливите x и y са силно корелирани. Ако поставите точки в координатната равнина, те ще бъдат разположени близо до някаква права линия.

    Използване на онлайн калкулатори за изчисляване на коефициента на корелация

    1. Намерете калкулатор в интернет, за да изчислите коефициента на корелация.Този коефициент често се изчислява в статистиката. Ако има много двойки числа, практически е невъзможно да се изчисли ръчно коефициентът на корелация. Затова има онлайн калкулатори за изчисляване на коефициента на корелация. В търсачката въведете "калкулатор на коефициента на корелация" (без кавички).

    2. Въвеждане на данни.Прочетете инструкциите на сайта, за да въведете правилно данните (двойки числа). Изключително важно е да въведете подходящите двойки числа; в противен случай ще получите грешен резултат. Имайте предвид, че различните уебсайтове имат различни формати за въвеждане на данни.

      • Например, на сайта http://ncalculators.com/statistics/correlation-coefficient-calculator.htm, стойностите на променливите "x" и "y" се въвеждат в два хоризонтални реда. Стойностите са разделени със запетаи. Тоест в нашия пример стойностите на "x" се въвеждат така: 1,2,4,5, а стойностите на "y" са така: 1,3,5,7.
      • На друг сайт, http://www.alcula.com/calculators/statistics/correlation-coefficient/, данните се въвеждат вертикално; в този случай не бъркайте съответните двойки числа.
    3. Изчислете коефициента на корелация.След като въведете данните, просто кликнете върху бутона "Изчисли", "Изчисли" или подобен бутон, за да получите резултата.

      Използване на графичен калкулатор

      1. Въвеждане на данни.Вземете графичен калкулатор, превключете в режим на статистическо изчисление и изберете командата Редактиране.

        • На различни калкулатори трябва да натиснете различни клавиши. Тази статия се фокусира върху калкулатора на Texas Instruments TI-86.
        • За да преминете към режим на статистическо изчисление, натиснете - Stat (над клавиша "+"). След това натиснете F2 - Редактиране (Редактиране).
      2. Изтриване на предишни запазени данни.Повечето калкулатори запазват въведените от вас статистически данни, докато не ги изчистите. За да избегнете объркването на стари данни с нови, първо изтрийте всяка съхранена информация.

        • Използвайте клавишите със стрелки, за да преместите курсора и да маркирате заглавието "xStat". След това натиснете Clear и Enter, за да изчистите всички стойности, въведени в колоната xStat.
        • Използвайте клавишите със стрелки, за да маркирате заглавието "yStat". След това натиснете Clear и Enter, за да изчистите всички стойности, въведени в колоната yStat.
      3. Въведете първоначални данни.Използвайте клавишите със стрелки, за да преместите курсора до първата клетка под заглавието "xStat". Въведете първата стойност и натиснете Enter. "xStat (1) = __" ще се покаже в долната част на екрана с въведената стойност вместо интервал. След като натиснете Enter, въведената стойност ще се появи в таблицата и курсорът ще се премести на следващия ред; това ще покаже "xStat(2) = __" в долната част на екрана.

        • Въведете всички стойности на променливата "x".
        • След като сте въвели всички стойности за променливата x, използвайте клавишите със стрелки, за да се придвижите до колоната yStat и въведете стойностите за променливата y.
        • След като въведете всички двойки числа, натиснете Exit, за да изчистите екрана и да излезете от режима на агрегиране.
      4. Изчислете коефициента на корелация.Той характеризира колко близки са данните до някаква права линия. Графичният калкулатор може бързо да определи подходящата права линия и да изчисли коефициента на корелация.

        • Щракнете върху Статистика (Статистика) - Изчисляване (Изчисления). На TI-86 натиснете - - .
        • Изберете функцията "Линейна регресия". На TI-86 натиснете , който е обозначен с "LinR". Редът “LinR _” ще се покаже на екрана с мигащ курсор.
        • Сега въведете имената на две променливи: xStat и yStat.
          • На TI-86 отворете списъка с имена; за да направите това, натиснете – – .
          • Наличните променливи се показват в долния ред на екрана. Изберете (най-вероятно чрез натискане на F1 или F2), въведете запетая и след това изберете .
          • Натиснете Enter, за да обработите въведените данни.
      5. Анализирайте резултатите.С натискане на Enter на екрана ще се покаже следната информация:

        • y = a + b x (\displaystyle y=a+bx): е функция, която описва права линия. Имайте предвид, че функцията не е написана в стандартна форма (y = kx + b).
        • a = (\displaystyle a=). Това е y-координата на точката, където линията се пресича с оста y.
        • b = (\displaystyle b=). Това е наклонправ.
        • кор = (\displaystyle (\text(corr))=). Това е коефициентът на корелация.
        • n = (\displaystyle n=). Това е броят на двойките числа, използвани при изчисленията.