Ранг корелация и коефициент на корелация на ранг на Спирман. Коефициент на корелация на ранга на Спирман

Методът на корелация на ранг на Спирман ви позволява да определите плътността (силата) и посоката на корелацията между две характеристики или два профила (йерархии) на характеристиките.

За да се изчисли корелацията на ранга, е необходимо да има две серии от стойности,

които могат да бъдат класирани. Тези диапазони от стойности могат да бъдат:

1) два признака, измерени в една и съща група субекти;

2) две индивидуални йерархии от черти, идентифицирани в два субекта за един и същ набор от черти;

3) две групови йерархии от характеристики,

4) индивидуални и групови йерархии от характеристики.

Първо, индикаторите се класират отделно за всяка от характеристиките.

По правило на по-ниска стойност на даден признак се присвоява по-нисък ранг.

В първия случай (две характеристики) се класират индивидуалните стойности за първия признак, получени от различни субекти, а след това индивидуалните стойности за втория признак.

Ако два атрибута са положително свързани, тогава субектите с нисък ранг в единия от тях ще имат нисък ранг в другия, а субектите с високи рангове в

една от чертите също ще има висок ранг на другата черта. За да се изчисли rs, е необходимо да се определи разликата (d) между ранговете, получени от даден субект и по двата признака. След това тези показатели d се трансформират по определен начин и се изваждат от 1. Отколкото

колкото по-малка е разликата между ранговете, толкова по-голям ще бъде rs, толкова по-близо ще бъде до +1.

Ако няма корелация, тогава всички рангове ще бъдат смесени и няма да има

няма съвпадение. Формулата е проектирана така, че в този случай rs ще бъде близо до 0.

В случай на отрицателна корелация, ниските рангове на субектите по един признак

ще съответства на високи рангове на друг атрибут и обратно. Колкото по-голямо е несъответствието между ранговете на субектите по две променливи, толкова по-близо е rs до -1.

Във втория случай (два индивидуални профила), индивидуално

стойностите, получени от всеки от 2-та субекта според определен (еднакъв и за двамата) набор от характеристики. Първият ранг ще получи чертата с най-ниска стойност; вторият ранг е характеристика с по-висока стойност и т.н. Очевидно всички характеристики трябва да се измерват в едни и същи единици, в противен случай класирането е невъзможно. Например, не е възможно да се класират показателите във въпросника за личността на Cattell (16PF), ако те са изразени в „сурови“ резултати, тъй като диапазоните на стойностите за различните фактори са различни: от 0 до 13, от 0 до

20 и от 0 до 26. Не можем да кажем кой от факторите ще заеме първо място по тежест, докато не приведем всички стойности в една скала (най-често това е скалата на стената).

Ако индивидуалните йерархии на два субекта са положително свързани, тогава характеристиките, които имат нисък ранг за един от тях, ще имат нисък ранг за другия и обратно. Например, ако за един субект факторът E (доминация) има най-нисък ранг, то за друг предмет той трябва да има нисък ранг, ако един субект има фактор C

(емоционална стабилност) има най-висок ранг, то трябва да има и другият субект

този фактор има висок ранг и т.н.

В третия случай (два групови профила), средните групови стойности, получени в 2 групи субекти, се класират според определен набор от характеристики, който е еднакъв за две групи. По-нататък линията на разсъждения е същата като в предишните два случая.

В случай на 4-ти (индивидуални и групови профили), индивидуалните стойности на субекта и средните групови стойности се класират отделно според същия набор от характеристики, които се получават като правило чрез изключване на този индивид субект - той не участва в средния групов профил, с който ще се сравнява индивидуален профил. Ранговата корелация ще ви позволи да проверите колко последователни са индивидуалните и груповите профили.

И в четирите случая значимостта на получения коефициент на корелация се определя от броя на класираните стойности N. В първия случай това число ще съвпада с размера на извадката n. Във втория случай броят на наблюденията ще бъде броят на характеристиките, които съставляват йерархията. В третия и четвъртия случай N също е броят на сравняваните признаци, а не броят на субектите в групите. Подробни обяснения са дадени в примерите. Ако абсолютната стойност на rs достигне или надвиши критична стойност, корелацията е значителна.

Хипотези.

Има две възможни хипотези. Първият се отнася за случай 1, вторият за останалите три случая.

Първата версия на хипотези

H0: Корелацията между променливи A и B не е различна от нула.

H1: Корелацията между променливи A и B е значително различна от нула.

Втората версия на хипотезите

H0: Корелацията между йерархии A и B не е различна от нула.

H1: Корелацията между йерархии A и B е значително различна от нула.

Ограничения на ранговия коефициент на корелация

1. За всяка променлива трябва да бъдат представени поне 5 наблюдения. Горната граница на пробата се определя от наличните таблици с критични стойности.

2. Коефициент на корелация на ранг на Спиърман rs at в големи количестваравни ранги за една или и двете сравнявани променливи дава груби стойности. В идеалния случай и двете корелирани серии трябва да бъдат две поредици от несъответстващи стойности. Ако това условие не е изпълнено, е необходимо да се направи корекция за същите рангове.

Коефициентът на корелация на ранга на Спиърман се изчислява по формулата:

Ако и в двете сравнявани рангови серии има групи от един и същи ранг, преди да се изчисли коефициентът на корелация на ранга, е необходимо да се направят корекции за едни и същи рангове Ta и Tv:

Ta \u003d Σ (a3 - a) / 12,

TV \u003d Σ (v3 - c) / 12,

където a е обемът на всяка група от еднакви рангове в ранговия ред A, c е обемът на всеки

групи с еднакъв ранг в ранговата серия B.

За да изчислите емпиричната стойност на rs, използвайте формулата:

Изчисляване на коефициента на корелация на ранг на Спирман rs

1. Определете в кои две характеристики или две характеристични йерархии ще участват

сравнение като променливи A и B.

2. Подредете стойностите на променливата A, като присвоите ранг 1 на най-малката стойност, в съответствие с правилата за класиране (вижте A.2.3). Въведете ранговете в първата колона на таблицата по реда на номерата на субектите или знаците.

3. Подредете стойностите на променливата B, в съответствие със същите правила. Въведете ранговете във втората колона на таблицата по реда на номерата на субектите или знаците.

5. Квадратирайте всяка разлика: d2. Въведете тези стойности в четвъртата колона на таблицата.

Ta \u003d Σ (a3 - a) / 12,

TV \u003d Σ (v3 - c) / 12,

където a е обемът на всяка група от еднакви рангове в рангов ред A; в - обемът на всяка група

същите се нареждат в класационната серия B.

а) при липса на еднакви звания

rs  1 − 6 ⋅

б) при наличие на същите чинове

Σd 2  T  T

r  1 − 6 ⋅ a in,

където Σd2 е сумата от квадратите на разликите между ранговете; Ta и TV са корекции за същото

N е броят на субектите или характеристиките, участвали в класирането.

9. Определете от таблицата (вижте допълнение 4.3) критичните стойности на rs за даден N. Ако rs е по-голям или поне равен на критичната стойност, корелацията е значително различна от 0.

Пример 4.1 При определяне на степента на зависимост на реакцията на пиене на алкохол от окуломоторната реакция в тестовата група бяха получени данни преди пиене на алкохол и след пиене. Зависи ли реакцията на субекта от състоянието на интоксикация?

Резултати от експеримента:

Преди: 16, 13, 14, 9, 10, 13, 14, 14, 18, 20, 15, 10, 9, 10, 16, 17, 18. След: 24, 9, 10, 23, 20, 11, 12, 19, 18, 13, 14, 12, 14, 7, 9, 14. Нека формулираме хипотези:

H0: корелацията между степента на зависимост на реакцията преди пиене на алкохол и след пиене не се различава от нула.

H1: корелацията между степента на зависимост на реакцията преди пиене на алкохол и след пиене е значително различна от нула.

Таблица 4.1. Изчисляване на d2 за коефициента на корелация на ранг на Спирман rs при сравняване на параметрите на окуломоторната реакция преди и след експеримента (N=17)

стойности

стойности

Тъй като имаме дублиращи се рангове, в този случай ще приложим формулата, коригирана за същите рангове:

Ta= ((23-2)+(33-3)+(23-2)+(33-3)+(23-2)+(23-2))/12=6

Tb =((23-2)+(23-2)+(33-3))/12=3

Намерете емпиричната стойност на коефициента на Спиърман:

rs = 1- 6*((767,75+6+3)/(17*(172-1)))=0,05

Според таблицата (Приложение 4.3) намираме критичните стойности на коефициента на корелация

0,48 (p ≤ 0,05)

0,62 (p ≤ 0,01)

Получаваме

rs=0,05∠rcr(0,05)=0,48

Заключение: хипотезата H1 се отхвърля и H0 се приема. Тези. корелация между степента

зависимостта на реакцията преди консумация на алкохол и след не се различава от нула.

В случаите, когато измерванията на изследваните характеристики се извършват по порядков мащаб или формата на връзката се различава от линейната, изследването на връзката между двете случайни променливиосъществено с помощта на коефициенти на рангова корелация. Помислете за коефициента на корелация на ранг на Спиърман. При изчисляването му е необходимо да се класират (подредят) примерните опции. Класирането е групирането на експериментални данни в определен ред, възходящ или низходящ.

Операцията по класиране се извършва по следния алгоритъм:

1. На по-ниска стойност се присвоява по-нисък ранг. На най-високата стойност се присвоява ранг, съответстващ на броя на класираните стойности. На най-малката стойност се присвоява ранг, равен на 1. Например, ако n=7, тогава най-висока стойностще получи ранг номер 7, освен ако не е предвидено във второто правило.

2. Ако няколко стойности са равни, тогава им се присвоява ранг, който е средната стойност на тези рангове, които биха получили, ако не бяха равни. Като пример, разгледайте възходяща извадка, състояща се от 7 елемента: 22, 23, 25, 25, 25, 28, 30. Стойностите 22 и 23 се появяват веднъж, така че техните рангове са съответно равни на R22=1 и R23 =2 . Стойността 25 се среща 3 пъти. Ако тези стойности не се повтарят, тогава техните рангове биха били равни на 3, 4, 5. Следователно техният ранг R25 е равен на средноаритметичната стойност на 3, 4 и 5: . Стойностите 28 и 30 не се повтарят, така че техните рангове са съответно R28=6 и R30=7. Накрая имаме следната кореспонденция:

3. Общият брой на ранговете трябва да съответства на изчисления, който се определя по формулата:

където n е общият брой на класираните стойности.

Несъответствието между действителните и изчислените суми на ранговете ще показва грешка, допусната при изчисляването на ранговете или тяхното сумиране. В този случай трябва да намерите и коригирате грешката.

Коефициентът на корелация на ранга на Спирман е метод, който ви позволява да определите силата и посоката на връзката между две характеристики или две йерархии на характеристики. Използването на коефициента на корелация на ранга има редица ограничения:

  • а) Очакваната корелация трябва да бъде монотонна.
  • б) Обемът на всяка от пробите трябва да бъде по-голям или равен на 5. За определяне на горната граница на пробата се използват таблици с критични стойности (Таблица 3 от приложението). Максималната стойност на n в таблицата е 40.
  • в) По време на анализа е вероятно да се появят голям брой идентични рангове. В този случай е необходимо да се направи поправка. Най-благоприятният случай е, когато и двете изследвани проби представляват две последователности от несъответстващи стойности.

За да проведе корелационен анализ, изследователят трябва да има две извадки, които могат да бъдат класирани, например:

  • - два признака, измерени в една и съща група субекти;
  • - две индивидуални йерархии на черти, идентифицирани в два субекта за един и същ набор от черти;
  • - две групови йерархии от атрибути;
  • - индивидуални и групови йерархии от характеристики.

Започваме изчислението с класиране на изследваните показатели поотделно за всеки от признаците.

Нека анализираме случай с две характеристики, измерени в една и съща група субекти. Първо, отделните стойности се класират според първия атрибут, получен от различни субекти, а след това индивидуалните стойности според втория атрибут. Ако по-ниските рангове на един индикатор съответстват на по-ниските рангове на друг индикатор, а по-високите рангове на един индикатор съответстват на по-високите рангове на друг индикатор, тогава двете характеристики са положително свързани. Ако по-високите рангове на един индикатор съответстват на по-ниските рангове на друг индикатор, тогава двата знака са отрицателно свързани. За да намерим rs, ние определяме разликите между ранговете (d) за всеки субект. Колкото по-малка е разликата между ранговете, толкова по-близък ще бъде коефициентът на корелация на ранга rs до "+1". Ако няма връзка, тогава няма да има съответствие между тях, следователно rs ще бъде близо до нула. Колкото по-голяма е разликата между ранговете на субектите в две променливи, толкова по-близо до "-1" ще бъде стойността на коефициента rs. По този начин коефициентът на корелация на ранга на Спирман е мярка за всяка монотонна връзка между двете изследвани характеристики.

Помислете за случая с две отделни йерархии на характеристики, идентифицирани в два субекта за един и същ набор от характеристики. В тази ситуация се класират индивидуалните стойности, получени от всеки от двата субекта според определен набор от характеристики. Характеристиката с най-ниска стойност трябва да получи първи ранг; атрибутът с по-висока стойност - втори ранг и т.н. Трябва да се плати Специално вниманиеза да се гарантира, че всички характеристики се измерват в едни и същи единици. Например, не е възможно да се класират показателите, ако те са изразени в точки с различна „цена“, тъй като е невъзможно да се определи кой от факторите ще заеме първо място по тежест, докато всички стойности не бъдат приведени в една мащаб. Ако характеристиките, които имат нисък ранг в един от предметите, имат и нисък ранг в другия, и обратно, тогава отделните йерархии са положително свързани.

В случай на две групови йерархии от характеристики, средните групови стойности, получени в две групи субекти, се класират според същия набор от характеристики за изследваните групи. След това следваме алгоритъма, даден в предишните случаи.

Нека анализираме случая с индивидуална и групова йерархия от характеристики. Те започват с класиране поотделно на индивидуалните стойности на субекта и средните групови стойности според същия набор от характеристики, които са получени, с изключение на субекта, който не участва в средната групова йерархия, тъй като неговият индивид йерархията ще бъде сравнена с него. Ранговата корелация дава възможност да се оцени степента на съгласуваност между индивидуалната и груповата йерархия на характеристиките.

Нека разгледаме как се определя значимостта на коефициента на корелация в изброените по-горе случаи. В случай на две характеристики, той ще се определя от размера на извадката. В случай на две отделни йерархии на характеристиките, значимостта зависи от броя на характеристиките, включени в йерархията. В последните два случая значимостта се определя от броя на изследваните черти, а не от размера на групите. По този начин, значимостта на rs във всички случаи се определя от броя на класираните стойности n.

При проверка статистическа значимост rs използва таблици с критични стойности на коефициента на корелация на ранга, съставени за различен брой класирани стойности и различни нивазначение. Ако абсолютната стойност на rs достигне критична стойност или я надвиши, тогава корелацията е значителна.

При разглеждане на първия вариант (случай с два признака, измерени в една и съща група субекти), са възможни следните хипотези.

H0: Корелацията между променливите x и y не е различна от нула.

H1: Корелацията между променливите x и y е значително различна от нула.

Ако работим с някой от трите оставащи случая, тогава трябва да изложим още една двойка хипотези:

H0: Корелацията между йерархиите x и y е различна от нула.

H1: Корелацията между йерархиите x и y е значително различна от нула.

Последователността на действията при изчисляване на коефициента на корелация на ранга на Спирман rs е както следва.

  • - Определете кои две характеристики или две йерархии на характеристики ще участват в съпоставянето като променливи x и y.
  • - Подредете стойностите на променливата x, като присвоите ранг 1 на най-малката стойност, според правилата за класиране. Поставете ранговете в първата колона на таблицата по реда на номерата на субектите или знаците.
  • - Подредете стойностите на променливата y. Поставете ранговете във втората колона на таблицата по реда на номерата на субектите или знаците.
  • - Изчислете разликите d между ранговете x и y за всеки ред от таблицата. Резултатите се поставят в следващата колона на таблицата.
  • - Изчислете квадратните разлики (d2). Поставете получените стойности в четвъртата колона на таблицата.
  • - Изчислете сумата от квадратите на разликите? d2.
  • - Ако се появят същите ранги, изчислете корекциите:

където tx е обемът на всяка група от равни ранги в извадката x;

ty е размерът на всяка група от равни ранги в извадката y.

Изчислете коефициента на корелация на ранга в зависимост от наличието или отсъствието на идентични рангове. При липса на идентични ранги, коефициентът на корелация на ранга rs се изчислява по формулата:

При наличието на едни и същи ранги коефициентът на корелация на ранга rs се изчислява по формулата:

където?d2 е сумата от квадратите на разликите между ранговете;

Tx и Ty - корекции за същите рангове;

n е броят на субектите или характеристиките, участвали в класирането.

Определете критичните стойности на rs от таблица 3 на приложението за даден брой субекти n. Ще се наблюдава значителна разлика от нула на коефициента на корелация при условие, че rs е не по-малко от критичната стойност.

Коефициент на корелация на Пиърсън

Коефициент р- Pearson се използва за изследване на връзката на две метрични променливи, измерени в една и съща извадка. Има много ситуации, в които е подходящо да го използвате. Влияе ли интелигентността върху постиженията на студентите? Свързана ли е заплатата на служителя с добронамереността му към колегите? Влияе ли настроението на ученика върху успеха при решаването на сложна аритметична задача? За да отговори на такива въпроси, изследователят трябва да измери два показателя, представляващи интерес за всеки член от извадката.

Стойността на коефициента на корелация не се влияе от единиците, в които са представени характеристиките. Следователно всякакви линейни трансформации на характеристики (умножение по константа, добавяне на константа) не променят стойността на коефициента на корелация. Изключение е умножението на един от знаците с отрицателна константа: коефициентът на корелация променя знака си на противоположния.

Приложение на корелацията на Спиърман и Пиърсън.

Корелацията на Пиърсън е мярка за линейната връзка между две променливи. Тя ви позволява да определите колко пропорционална е променливостта на две променливи. Ако променливите са пропорционални една на друга, тогава графично връзката между тях може да бъде представена като права линия с положителен (пряка пропорция) или отрицателен (обратна пропорционална) наклон.

На практика връзката между две променливи, ако има такива, е вероятностна и графично изглежда като елипсоидален разпръснат облак. Този елипсоид обаче може да бъде представен (приблизително) като права линия или регресионна линия. Линията на регресия е права линия, конструирана по метода най-малките квадрати: Сумата от квадратите на разстоянията (изчислени по оста Y) от всяка точка на диаграмата на разсейване до правата линия е минималната.

От особено значение за оценка на точността на прогнозата е дисперсията на оценките на зависимата променлива. По същество дисперсията на оценките на зависимата променлива Y е тази част от нейната обща дисперсия, която се дължи на влиянието на независимата променлива X. С други думи, съотношението на дисперсията на оценките на зависимата променлива към нейната истинска дисперсия е равно на квадрата на коефициента на корелация.

Квадратът на коефициента на корелация на зависимата и независимата променлива представлява пропорцията на дисперсията на зависимата променлива, дължаща се на влиянието на независимата променлива, и се нарича коефициент на детерминация. Следователно коефициентът на детерминация показва степента, до която променливостта на една променлива се дължи (определя) от влиянието на друга променлива.

Коефициентът на детерминация има важно предимствов сравнение с коефициента на корелация. Корелацията не е линейна функция на връзката между две променливи. Следователно, средноаритметичната стойност на коефициентите на корелация за няколко проби не съвпада с корелацията, изчислена незабавно за всички субекти от тези проби (т.е. коефициентът на корелация не е адитивен). Напротив, коефициентът на детерминация отразява връзката линейно и следователно е адитивен: може да бъде осреднен за няколко проби.

Допълнителна информация за силата на връзката се дава от стойността на коефициента на корелация на квадрат - коефициента на детерминация: това е частта от дисперсията на една променлива, която може да се обясни с влиянието на друга променлива. За разлика от коефициента на корелация, коефициентът на детерминация нараства линейно с увеличаване на силата на връзката.

Коефициентите на корелация на Спирман и τ - Кендъл (рангови корелации )

Ако и двете променливи, между които се изучава връзката, са представени в порядкова скала, или една от тях е в порядкова скала, а другата е в метрична скала, тогава се прилагат коефициентите на корелация на ранга: Spearman или τ - Кендъл. И двата коефициента изискват предварително класиране на двете променливи за тяхното приложение.

Коефициентът на корелация на ранг на Спирман е непараметричен метод, който се използва за статистическо изследване на връзката между явленията. В този случай се определя действителната степен на паралелизъм между двете количествени серии на изследваните признаци и се дава оценка на стегнатостта на установената връзка с помощта на количествено изразен коефициент.

Ако членовете на групата са били класирани първо по променливата x, след това по променливата y, тогава корелацията между променливите x и y може да бъде получена чрез просто изчисляване на коефициента на Пиърсън за двете рангови серии. При условие, че няма връзки в ранговете (т.е. няма повтарящи се рангове) за нито една променлива, формулата за Пиърсън може да бъде значително опростена изчислително и преобразувана във формулата, известна като Спирман.

Силата на коефициента на корелация на ранга на Спирман е малко по-ниска от мощността на параметричния коефициент на корелация.

Препоръчително е да се използва коефициентът на ранкова корелация при наличие на малък брой наблюдения. Този метод може да се използва не само за количествено определени данни, но и в случаите, когато записаните стойности се определят от описателни характеристики с различна интензивност.

Коефициентът на корелация на ранг на Спирман с голям брой идентични рангове за една или и двете сравнявани променливи дава загрубени стойности. В идеалния случай и двете корелирани серии трябва да бъдат две поредици от несъответстващи стойности

Алтернатива на корелацията на Спиърман за рангове е корелацията τ - Кендъл. Корелацията, предложена от М. Кендъл, се основава на идеята, че посоката на връзката може да се прецени чрез сравняване на субектите по двойки: ако една двойка субекти има промяна в x, която съвпада по посока с промяна в y, тогава това показва положителна връзка, ако не съвпада - нещо за отрицателна връзка.

Коефициентите на корелация са специално разработени за числено определяне на силата и посоката на връзката между две свойства, измерени в числови скали (метрични или рангови). Както вече беше споменато, корелационните стойности +1 (строга пряка или пряко пропорционална връзка) и -1 (строга обратна или обратно пропорционална връзка) съответстват на максималната сила на връзката, корелацията, равна на нула, съответства на отсъствието на връзка. Допълнителна информация за силата на връзката се предоставя от стойността на коефициента на детерминация: това е частта от дисперсията на една променлива, която може да се обясни с влиянието на друга променлива.

9. Параметрични методи за сравнение на данни

Методите за параметрично сравнение се прилагат, ако вашите променливи са измерени в метрична скала.

Сравнение на вариациите 2- x проби от теста на Фишер .


Този метод ви позволява да тествате хипотезата, че вариациите на 2 общи съвкупности, от които са извлечени сравнените проби, се различават една от друга. Ограничения на метода - разпределението на признака и в двете проби не трябва да се различава от нормалното.

Алтернатива на сравняването на вариациите е тестът на Lieven, за който няма нужда да се тества за нормално разпределение. Този метод може да се използва за тестване на допускането за равенство (хомогенност) на дисперсиите, преди да се провери значимостта на разликата в средните чрез t-теста на Студент за независими пробиразлични числа.

Студент-психолог (социолог, мениджър, изпълнителен директор и др.) често се интересува как два или голямо количествопроменливи в една или повече изследователски групи.

В математиката, за да се опишат връзките между променливите, се използва концепцията за функция F, която свързва всяка конкретна стойност на независимата променлива X със специфична стойност на зависимата променлива Y. Получената зависимост се обозначава като Y=F(X ).

В същото време видовете корелации между измерените характеристики могат да бъдат различни: например корелацията може да бъде линейна и нелинейна, положителна и отрицателна. Тя е линейна - ако с увеличаване или намаляване на една променлива X, втората променлива Y средно също се увеличава или намалява. Нелинейно е, ако с увеличаване на една стойност естеството на промяната във втората не е линейно, а се описва от други закони.

Корелацията ще бъде положителна, ако средно с увеличаване на променливата X променливата Y също се увеличава и ако средно променливата Y има тенденция да намалява с увеличаване на X, тогава те казват, че има отрицателно корелация. Възможна е ситуация, когато е невъзможно да се установи някаква зависимост между променливите. В този случай казваме, че няма корелация.

Задачата на корелационния анализ се свежда до установяване на посоката (положителна или отрицателна) и формата (линейна, нелинейна) на връзката между различни характеристики, измерване на нейната плътност и накрая, проверка на нивото на значимост на получените корелационни коефициенти .

Коефициентът на корелация на ранговете, предложен от К. Спиърман, се отнася до непараметрични показатели на връзката между променливите, измерени по рангова скала. При изчисляване на този коефициент не се изискват предположения относно естеството на разпределението на характеристиките в общата съвкупност. Този коефициент определя степента на близост на връзката на редните признаци, които в този случай представляват ранговете на сравняваните стойности.

Ранговият коефициент на линейна корелация на Спиърман се изчислява по формулата:

където n е броят на класираните признаци (индикатори, субекти);
D е разликата между ранговете в две променливи за всеки предмет;
D2 е сумата от квадратите на разликите в ранговете.

Критичните стойности на коефициента на корелация на ранга на Спирман са представени по-долу:

Стойността на коефициента на линейна корелация на Спирман е в диапазона от +1 и -1. Коефициентът на линейна корелация на Спиърман може да бъде положителен или отрицателен, характеризиращ посоката на връзката между две характеристики, измерени по рангова скала.

Ако коефициентът на корелация по модул е ​​близо до 1, тогава това съответства на високо нивовръзки между променливи. Така че, по-специално, когато една променлива е корелирана със себе си, стойността на коефициента на корелация ще бъде равна на +1. Такава връзка характеризира пряко пропорционална връзка. Ако стойностите на променливата X са подредени във възходящ ред и същите стойности (сега обозначени като променлива Y) са подредени в низходящ ред, тогава в този случай корелацията между променливите X и Y ще бъде точно -1. Тази стойност на коефициента на корелация характеризира обратно пропорционалната зависимост.

Знакът на коефициента на корелация е много важен за интерпретацията на получената връзка. Ако знакът на линейния коефициент на корелация е плюс, тогава връзката между корелираните характеристики е такава, че по-голяма стойност на един признак (променлива) съответства на по-голяма стойност на друг признак (друга променлива). С други думи, ако единият индикатор (променлива) се увеличава, тогава другият индикатор (променлива) се увеличава съответно. Тази връзка се нарича правопропорционална връзка.

Ако се получи знакът минус, тогава по-голямата стойност на единия атрибут съответства на по-малката стойност на другия. С други думи, ако има знак минус, увеличението на една променлива (атрибут, стойност) съответства на намаляване на друга променлива. Тази връзка се нарича обратна връзка. В този случай изборът на променливата, на която се приписва характерът (тенденцията) на увеличението, е произволен. Това може да бъде променливата X или променливата Y. Въпреки това, ако се счита, че променливата X се увеличава, тогава променливата Y ще намалее съответно и обратно.

Помислете за примера на корелацията на Спирман.

Психологът установява как са взаимосвързани индивидуалните показатели за готовност за училище, получени преди началото на училище за 11 първокласници и средното им представяне в края на учебната година.

За да разрешим този проблем, ние класирахме, първо, стойностите на показателите за училищна готовност, получени при постъпване в училище, и второ, средно крайните показатели за представяне в края на годината за същите тези ученици. Резултатите са представени в таблицата:

Заместваме получените данни в горната формула и изчисляваме. Получаваме:

За да намерим нивото на значимост, се обръщаме към таблицата „Критични стойности на коефициента на корелация на ранга на Спирман“, която показва критичните стойности за коефициентите на корелация на ранга.

Изграждаме съответната "ос на значимост":

Полученият коефициент на корелация съвпада с критичната стойност за ниво на значимост от 1%. Следователно може да се твърди, че показателите за училищна готовност и крайните оценки на първокласниците са положително свързани – с други думи, колкото по-висок е индикаторът за училищна готовност, толкова по-добре учи първокласникът. По отношение на статистическите хипотези, психологът трябва да отхвърли нулевата (H0) хипотеза за сходство и да приеме алтернативата (H1) на разликите, която казва, че връзката между готовността за училище и средното представяне е ненулева.

Корелация на Спиърман. Корелационен анализпо метода на копиеносца. Спиърман редици. Коефициент на корелация на Спирман. Ранговата корелация на Спирман

Корелацията на Пиърсън е мярка за линейната връзка между две променливи. Тя ви позволява да определите колко пропорционална е променливостта на две променливи. Ако променливите са пропорционални една на друга, тогава графично връзката между тях може да бъде представена като права линия с положителен (пряка пропорция) или отрицателен (обратна пропорционална) наклон.

На практика връзката между две променливи, ако има такива, е вероятностна и графично изглежда като елипсоидален разпръснат облак. Този елипсоид обаче може да бъде представен (приблизително) като права линия или регресионна линия. Линията на регресия е права линия, конструирана по метода на най-малките квадрати: сумата от квадратите на разстоянията (изчислени по оста y) от всяка точка на диаграмата на разсейване до линията е минималната

От особено значение за оценка на точността на прогнозата е дисперсията на оценките на зависимата променлива. По същество дисперсията на оценките на зависимата променлива Y е тази част от нейната обща дисперсия, която се дължи на влиянието на независимата променлива X. С други думи, съотношението на дисперсията на оценките на зависимата променлива към нейната истинска дисперсия е равно на квадрата на коефициента на корелация.

Квадратът на коефициента на корелация на зависимата и независимата променлива представлява пропорцията на дисперсията на зависимата променлива, дължаща се на влиянието на независимата променлива, и се нарича коефициент на детерминация. Следователно коефициентът на детерминация показва степента, до която променливостта на една променлива се дължи (определя) от влиянието на друга променлива.

Коефициентът на детерминация има важно предимство пред коефициента на корелация. Корелацията __________ не е линейна функция на връзката между две променливи. Следователно, средноаритметичната стойност на коефициентите на корелация за няколко проби не съвпада с корелацията, изчислена незабавно за всички субекти от тези проби (т.е. коефициентът на корелация не е адитивен). Напротив, коефициентът на детерминация отразява връзката линейно и следователно е адитивен: може да бъде осреднен за няколко проби.

Допълнителна информация за силата на връзката се дава от стойността на коефициента на корелация на квадрат - коефициента на детерминация: това е частта от дисперсията на една променлива, която може да се обясни с влиянието на друга променлива. За разлика от коефициента на корелация, коефициентът на детерминация нараства линейно с увеличаване на силата на връзката.

Коефициенти на корелация на Спиърман и τ-Кендал (корелация на ранг)

Ако и двете променливи, между които се изучава връзката, са представени в порядкова скала, или една от тях е в порядкова скала, а другата е в метрична, тогава се прилагат коефициенти на корелация на ранг: Spearman или τ-Kendell. И двата коефициента изискват предварително класиране на двете променливи за тяхното приложение.

Коефициентът на корелация на ранг на Спирман е непараметричен метод, който се използва за статистическо изследване на връзката между явленията. В този случай се определя действителната степен на паралелизъм между двете количествени серии на изследваните признаци и се оценява плътността на установената връзка с помощта на количествено изразен коефициент.

Ако членовете на групата са класирани първо по променливата x и след това по променливата y, тогава корелацията между променливите x и y може да бъде получена чрез просто изчисляване на коефициента на Пиърсън за двете рангови серии. При условие, че няма връзки в ранговете (т.е. няма повтарящи се рангове) за нито една променлива, формулата за Пиърсън може да бъде значително опростена изчислително и преобразувана във формулата, известна като Спирман.

Силата на коефициента на корелация на ранга на Спирман е малко по-ниска от мощността на параметричния коефициент на корелация.

Препоръчително е да се използва коефициентът на ранкова корелация при наличие на малък брой наблюдения. Този метод може да се използва не само за количествено определени данни, но и в случаите, когато записаните стойности се определят от описателни характеристики с различна интензивност.

Коефициентът на корелация на ранг на Спирман с голям брой идентични рангове за една или и двете сравнявани променливи дава загрубени стойности. В идеалния случай и двете корелирани серии трябва да бъдат две поредици от несъответстващи стойности.

Алтернатива на корелацията на Спиърман за рангове е корелацията τ-Кендал. Корелацията, предложена от М. Кендъл, се основава на идеята, че посоката на връзката може да се прецени чрез сравняване на субектите по двойки: ако една двойка субекти има промяна в x, която съвпада по посока с промяна в y, тогава това показва положителна връзка, ако не съвпада - нещо за отрицателна връзка.