Корелационен анализ на Спирман

Коефициент на корелация на Пиърсън

Коефициент р- Pearson се използва за изследване на връзката на две метрични променливи, измерени в една и съща извадка. Има много ситуации, в които е подходящо да го използвате. Влияе ли интелигентността върху постиженията на студентите? Свързана ли е заплатата на служителя с добронамереността му към колегите? Влияе ли настроението на ученика върху успеха при решаването на сложна аритметична задача? За да отговори на такива въпроси, изследователят трябва да измери два показателя, представляващи интерес за всеки член от извадката.

Стойността на коефициента на корелация не се влияе от единиците, в които са представени характеристиките. Следователно всякакви линейни трансформации на характеристики (умножение по константа, добавяне на константа) не променят стойността на коефициента на корелация. Изключение е умножението на един от знаците с отрицателна константа: коефициентът на корелация променя знака си на противоположния.

Приложение на корелацията на Спиърман и Пиърсън.

Корелацията на Пиърсън е мярка за линейната връзка между две променливи. Тя ви позволява да определите колко пропорционална е променливостта на две променливи. Ако променливите са пропорционални една на друга, тогава графично връзката между тях може да бъде представена като права линия с положителен (пряка пропорция) или отрицателен (обратна пропорционална) наклон.

На практика връзката между две променливи, ако има такива, е вероятностна и графично изглежда като елипсоидален разпръснат облак. Този елипсоид обаче може да бъде представен (приблизително) като права линия или регресионна линия. Линията на регресия е права линия, конструирана по метода най-малките квадрати: Сумата от разстоянията на квадрат (изчислени по оста Y) от всяка точка на диаграмата на разсейване до правата линия е минималната.

От особено значение за оценка на точността на прогнозата е дисперсията на оценките на зависимата променлива. По същество дисперсията на оценките на зависимата променлива Y е тази част от нейната обща дисперсия, която се дължи на влиянието на независимата променлива X. С други думи, съотношението на дисперсията на оценките на зависимата променлива към нейната истинска дисперсия е равно на квадрата на коефициента на корелация.

Квадратът на коефициента на корелация на зависимата и независимата променлива представлява пропорцията на дисперсията на зависимата променлива, дължаща се на влиянието на независимата променлива, и се нарича коефициент на детерминация. Следователно коефициентът на детерминация показва степента, до която променливостта на една променлива се дължи (определя) от влиянието на друга променлива.

Коефициентът на детерминация има важно предимствов сравнение с коефициента на корелация. Корелацията не е линейна функция на връзката между две променливи. Следователно, средноаритметичната стойност на коефициентите на корелация за няколко проби не съвпада с корелацията, изчислена незабавно за всички субекти от тези проби (т.е. коефициентът на корелация не е адитивен). Напротив, коефициентът на детерминация отразява връзката линейно и следователно е адитивен: може да бъде осреднен за няколко проби.

Допълнителна информация за силата на връзката се дава от стойността на коефициента на корелация на квадрат - коефициента на детерминация: това е частта от дисперсията на една променлива, която може да се обясни с влиянието на друга променлива. За разлика от коефициента на корелация, коефициентът на детерминация нараства линейно с увеличаване на силата на връзката.

Коефициентите на корелация на Спирман и τ - Кендъл (рангови корелации )

Ако и двете променливи, между които се изучава връзката, са представени в порядкова скала, или една от тях е в порядкова скала, а другата е в метрична скала, тогава се прилагат коефициентите на корелация на ранга: Spearman или τ - Кендъл. И двата коефициента изискват предварително класиране на двете променливи за тяхното приложение.

Коефициентът на корелация на ранг на Спирман е непараметричен метод, който се използва за статистическо изследване на връзката между явленията. В този случай се определя действителната степен на паралелизъм между двете количествени серии на изследваните признаци и се дава оценка на стегнатостта на установената връзка с помощта на количествено изразен коефициент.

Ако членовете на групата са класирани първо по променливата x, след това по променливата y, тогава корелацията между променливите x и y може да бъде получена чрез просто изчисляване на коефициента на Пиърсън за двете рангови серии. При условие, че няма връзки в ранговете (т.е. няма повтарящи се рангове) за нито една променлива, формулата за Пиърсън може да бъде значително опростена изчислително и преобразувана във формулата, известна като Спирман.

Силата на коефициента на корелация на ранга на Спирман е малко по-ниска от мощността на параметричния коефициент на корелация.

Препоръчително е да се използва коефициентът на ранкова корелация при наличие на малък брой наблюдения. Този метод може да се използва не само за количествено определени данни, но и в случаите, когато записаните стойности се определят от описателни характеристики с различна интензивност.

Коефициент на корелация на ранг на Спирман при в големи количестваравни ранги за една или и двете сравнявани променливи дава груби стойности. В идеалния случай и двете корелирани серии трябва да бъдат две поредици от несъответстващи стойности

Алтернатива на корелацията на Спиърман за рангове е корелацията τ - Кендъл. Корелацията, предложена от М. Кендъл, се основава на идеята, че посоката на връзката може да се прецени чрез сравняване на субектите по двойки: ако една двойка субекти има промяна в x, която съвпада по посока с промяна в y, тогава това показва положителна връзка, ако не съвпада - нещо за отрицателна връзка.

Коефициентите на корелация са специално разработени за числено определяне на силата и посоката на връзката между две свойства, измерени в числови скали (метрични или рангови). Както вече беше споменато, корелационните стойности +1 (строга пряка или пряко пропорционална връзка) и -1 (строга обратна или обратно пропорционална връзка) съответстват на максималната сила на връзката, корелацията, равна на нула, съответства на отсъствието на връзка. Допълнителна информация за силата на връзката се дава от стойността на коефициента на детерминация: това е частта от дисперсията на една променлива, която може да се обясни с влиянието на друга променлива.

9. Параметрични методи за сравнение на данни

Методите за параметрично сравнение се прилагат, ако вашите променливи са измерени в метрична скала.

Сравнение на вариациите 2- x проби от теста на Фишер .


Този метод ви позволява да тествате хипотезата, че вариациите на 2 общи съвкупности, от които са извлечени сравнените проби, се различават една от друга. Ограничения на метода - разпределението на признака и в двете проби не трябва да се различава от нормалното.

Алтернатива на сравняването на вариациите е тестът на Ливен, за който няма нужда да се тества за нормално разпределение. Този метод може да се използва за тестване на допускането за равенство (хомогенност) на дисперсиите, преди да се провери значимостта на разликата в средните чрез t-теста на Студент за независими пробиразлични числа.

Студент-психолог (социолог, мениджър, изпълнителен директор и др.) често се интересува как два или голямо количествопроменливи в една или повече изследователски групи.

В математиката, за да се опишат връзките между променливите, се използва концепцията за функция F, която свързва всяка конкретна стойност на независимата променлива X със специфична стойност на зависимата променлива Y. Получената зависимост се обозначава като Y=F(X ).

В същото време видовете корелации между измерените характеристики могат да бъдат различни: например корелацията може да бъде линейна и нелинейна, положителна и отрицателна. Тя е линейна - ако с увеличаване или намаляване на една променлива X, втората променлива Y средно също се увеличава или намалява. Нелинейно е, ако с увеличаване на една стойност естеството на промяната във втората не е линейно, а се описва от други закони.

Корелацията ще бъде положителна, ако средно с увеличаване на променливата X променливата Y също се увеличава и ако средно променливата Y има тенденция да намалява с увеличаване на X, тогава те казват, че има отрицателно корелация. Възможна е ситуация, когато е невъзможно да се установи някаква зависимост между променливите. В този случай казваме, че няма корелация.

Задачата на корелационния анализ се свежда до установяване на посоката (положителна или отрицателна) и формата (линейна, нелинейна) на връзката между различни характеристики, измерване на нейната плътност и накрая, проверка на нивото на значимост на получената корелация коефициенти.

Коефициентът на корелация на ранговете, предложен от К. Спиърман, се отнася до непараметрични показатели на връзката между променливите, измерени по рангова скала. При изчисляването на този коефициент не се изискват предположения относно естеството на разпределението на характеристиките в общата съвкупност. Този коефициент определя степента на близост на връзката на редните признаци, които в този случай представляват редиците на сравняваните стойности.

Ранговият коефициент на линейна корелация на Спиърман се изчислява по формулата:

където n е броят на класираните признаци (индикатори, субекти);
D е разликата между ранговете в две променливи за всеки предмет;
D2 е сумата от квадратите на разликите в ранговете.

Критичните стойности на коефициента на корелация на ранга на Спирман са представени по-долу:

Стойността на коефициента на линейна корелация на Спирман е в диапазона от +1 и -1. Коефициентът на линейна корелация на Спиърман може да бъде положителен или отрицателен, характеризиращ посоката на връзката между две характеристики, измерени по рангова скала.

Ако коефициентът на корелация по модул е ​​близо до 1, тогава това съответства на високо нивовръзки между променливи. Така че, по-специално, когато една променлива е корелирана със себе си, стойността на коефициента на корелация ще бъде равна на +1. Такава връзка характеризира пряко пропорционална връзка. Ако стойностите на променливата X са подредени във възходящ ред и същите стойности (сега обозначени като променлива Y) са подредени в низходящ ред, тогава в този случай корелацията между променливите X и Y ще бъде точно -1. Тази стойност на коефициента на корелация характеризира обратно пропорционалната зависимост.

Знакът на коефициента на корелация е много важен за интерпретацията на получената връзка. Ако знакът на линейния коефициент на корелация е плюс, тогава връзката между корелираните характеристики е такава, че по-голяма стойност на един признак (променлива) съответства на по-голяма стойност на друг признак (друга променлива). С други думи, ако единият индикатор (променлива) се увеличава, тогава другият индикатор (променлива) се увеличава съответно. Тази връзка се нарича правопропорционална връзка.

Ако се получи знакът минус, тогава по-голямата стойност на единия атрибут съответства на по-малката стойност на другия. С други думи, ако има знак минус, увеличението на една променлива (атрибут, стойност) съответства на намаляване на друга променлива. Тази връзка се нарича обратна връзка. В този случай изборът на променливата, на която се приписва характерът (тенденцията) на увеличението, е произволен. Това може да бъде променлива X или променлива Y. Въпреки това, ако се счита, че променливата X се увеличава, тогава променливата Y ще намалее съответно и обратно.

Помислете за примера на корелацията на Спирман.

Психологът установява как са взаимосвързани индивидуалните показатели за готовност за училище, получени преди началото на училище за 11 първокласници и средното им представяне в края на учебната година.

За да разрешим този проблем, ние класирахме, първо, стойностите на показателите за училищна готовност, получени при постъпване в училище, и второ, средно крайните показатели за представяне в края на годината за същите тези ученици. Резултатите са представени в таблицата:

Заместваме получените данни в горната формула и изчисляваме. Получаваме:

За да намерим нивото на значимост, се обръщаме към таблицата „Критични стойности на коефициента на корелация на ранга на Спирман“, която показва критичните стойности за коефициентите на корелация на ранга.

Изграждаме съответната "ос на значимост":

Полученият коефициент на корелация съвпада с критичната стойност за ниво на значимост от 1%. Следователно може да се твърди, че показателите за училищна готовност и крайните оценки на първокласниците са положително свързани – с други думи, колкото по-висок е индикаторът за училищна готовност, толкова по-добре учи първокласникът. По отношение на статистическите хипотези, психологът трябва да отхвърли нулевата (H0) хипотеза за сходство и да приеме алтернативата (H1) на разликите, която казва, че връзката между готовността за училище и средното представяне е ненулева.

Корелация на Спиърман. Корелационен анализпо метода на копиеносца. Спиърман редици. Коефициент на корелация на Спирман. Ранговата корелация на Спирман

Ранговата корелация на Спирман(рангова корелация). Ранговата корелация на Спирман е най-простият начин да се определи степента на връзка между факторите. Името на метода показва, че връзката се определя между ранговете, тоест поредицата от получени количествени стойности, подредени в низходящ или нарастващ ред. Трябва да се има предвид, че първо, корелацията на ранга не се препоръчва, ако връзката на двойки е по-малко от четири и повече от двадесет; второ, корелацията на ранга ви позволява да определите връзката в друг случай, ако стойностите са полуколичествени, тоест нямат числов израз, те отразяват ясна последователност от тези стойности; трето, препоръчително е да се използва рангова корелация в случаите, когато е достатъчно да се получат приблизителни данни. Пример за изчисляване на коефициента на корелация на ранга за определяне на въпроса: въпросникът измерва X и Y сходни личностни качества на субектите. С помощта на два въпросника (X и Y), които изискват алтернативни отговори "да" или "не", бяха получени първичните резултати - отговорите на 15 субекта (N = 10). Резултатите бяха представени като сбор от утвърдителни отговори поотделно за Въпросник X и Въпросник B. Тези резултати са обобщени в Таблица 1. 5.19.

Таблица 5.19. Таблица на първичните резултати за изчисляване на коефициента на корелация на ранга на Спиърман (p) *

Анализ на обобщената корелационна матрица. Метод на корелационни плеяди.

Пример. В табл. 6.18 показва интерпретацията на единадесет променливи, които са тествани съгласно метода на Wechsler. Данните са получени върху хомогенна проба на възраст от 18 до 25 години (n = 800).

Преди стратификацията е препоръчително да се класира корелационната матрица. За да направите това, в оригиналната матрица се изчисляват средните стойности на коефициентите на корелация на всяка променлива с всички останали.

След това според таблицата. 5.20 определят допустимите нива на стратификация на корелационната матрица за дадена доверителна вероятност от 0,95 и n - числото

Таблица 6.20. Възходяща корелационна матрица

Променливи 1 2 3 4 би се 0 7 8 0 10 11 М (риж) Ранг
1 1 0,637 0,488 0,623 0,282 0,647 0,371 0,485 0,371 0,365 0,336 0,454 1
2 1 0,810 0,557 0,291 0,508 0,173 0,486 0,371 0,273 0,273 0,363 4
3 1 0,346 0,291 0,406 0,360 0,818 0,346 0,291 0,282 0,336 7
4 1 0,273 0,572 0,318 0,442 0,310 0,318 0,291 0,414 3
5 1 0,354 0,254 0,216 0,236 0,207 0,149 0,264 11
6 1 0,365 0,405 0,336 0,345 0,282 0,430 2
7 1 0,310 0,388 0,264 0,266 0,310 9
8 1 0,897 0,363 0,388 0,363 5
9 1 0,388 0,430 0,846 6
10 1 0,336 0,310 8
11 1 0,300 10

Обозначения: 1 - обща осведоменост; 2 - концептуалност; 3 - внимание; 4 - vdatnist K обобщение; б - директно запаметяване (в числа) 6 - ниво на овладяване на родния език; 7 - скорост на овладяване на сензомоторни умения (кодиране със символи);8 - наблюдение; 9 - комбинаторни способности (за анализ и синтез);10 - способност за организиране на части в смислено цяло; 11 - способност за евристичен синтез; M (rij) - средната стойност на коефициентите на корелация на променливата с останалите променливи за наблюдение (в нашия случай n = 800): r (0) - стойността на нулевата равнина "Срязване" - минималната значима абсолютна стойност на коефициента на корелация (n - 120, r (0) = 0,236, n = 40, r(0) = 0,407) | Δr | - допустима стъпка на разделяне (n = 40, | Δr | = 0,558) c - допустим брой нива на разделяне (n = 40, s = 1; n = 120, s = 2); r(1), r(2), ..., r(9) е абсолютната стойност на сечещата равнина (n=40, r(1)=0,965).

За n = 800 намираме стойността на rtype и границите ri, след което Стратифицирането подрежда корелационната матрица, подчертавайки корелационните плеяди вътре в слоевете, или разделяме частите на корелационната матрица, рисувайки съюзите на корелационните плеяди за горните слоеве (фиг. 5.5).

Смисловият анализ на получените плеяди надхвърля математическа статистика. Трябва да се отбележат два формални индикатора, които помагат за смисленото тълкуване на Плеядите. Един важен индикатор е степента на върха, тоест броят на ръбовете, съседни на върха. Променлива с най-голямото число edges е "ядрото" на галактиката и може да се разглежда като индикатор за останалите променливи на тази галактика. Друг важен показател е плътността на комуникацията. Една променлива може да има по-малко връзки в една галактика, но по-близо, и повече връзки в друга галактика, но по-малко близки.

Прогнози и оценки. Уравнението y = b1x + b0 се нарича общо уравнениеправ. Показва, че двойки точки (x, y), които

Ориз. 5.5. Корелационни плеяди, получени чрез матрично разделяне

лежат на някаква права линия, свързана по такъв начин, че за всяка стойност на x стойността in, която е сдвоена с нея, може да бъде намерена чрез умножаване на x по някакво число b1, добавяйки второто, числото b0 към това произведение.

Коефициентът на регресия ви позволява да определите степента на промяна в разследващия фактор, когато причинният фактор се промени с една единица. Абсолютните стойности характеризират връзката между променливите фактори чрез техните абсолютни стойности. Коефициентът на регресия се изчислява по формулата:

Планиране и анализ на експериментите. Планирането и анализът на експериментите е третият важен клон статистически методи, предназначени за намиране и тестване на причинно-следствени връзки между променливи.

За изучаване на многофакторни зависимости в Напоследъквсе по-често се използват методи за математическо планиране на експеримента.

Възможността за едновременно изменение от всички фактори позволява: а) да се намали броят на експериментите;

б) намаляване на експерименталната грешка до минимум;

в) опростяване на обработката на получените данни;

г) осигуряват яснота и лесно сравнение на резултатите.

Всеки фактор може да придобие съответен брой различни стойности, които се наричат ​​нива и означават -1, 0 и 1. Фиксиран набор от нива на фактор определя условията на един от възможните експерименти.

Съвкупността от всички възможни комбинации се изчислява по формулата:

Пълен факторен експеримент е експеримент, в който всички възможни комбинациинива на фактор. Пълните факториални експерименти могат да имат свойството на ортогоналност. При ортогонално планиране факторите в експеримента не са корелирани, регресионните коефициенти, които се изчисляват в резултат, се определят независимо един от друг.

Важно предимство на метода за математическо планиране на експеримент е неговата гъвкавост и пригодност в много области на изследване.

Нека разгледаме пример за сравняване на влиянието на определени фактори върху формирането на нивото на психическо напрежение в цветните телевизионни контролери.

Експериментът се основава на ортогоналния план 2 три (три фактора се променят на две нива).

Експериментът беше проведен с пълна част 2+3 с трикратно повторение.

Ортогоналното планиране се основава на конструирането на регресионно уравнение. За три фактора това изглежда така:

Обработката на резултатите в този пример включва:

а) построяване на ортогонален план 2+3 таблица за изчисление;

б) изчисляване на регресионни коефициенти;

в) проверка на тяхната значимост;

г) интерпретация на получените данни.

За коефициентите на регресия на споменатото уравнение беше необходимо да се поставят N = 2 3 = 8 опции, за да може да се оцени значимостта на коефициентите, при които броят на повторенията K е 3.

Съставената матрица за планиране на експеримента изглеждаше така.

е количествена оценка на статистическото изследване на връзката между явленията, използвано в непараметричните методи.

Индикаторът показва как наблюдаваната сума на квадратните разлики между ранговете се различава от случая на липса на връзка.

Възлагане на услугата. С този онлайн калкулатор можете:

  • изчисляване на коефициента на корелация на ранг на Спиърман;
  • изчисление доверителен интервалза коефициента и оценка на неговата значимост;

Коефициент на корелация на ранга на Спирмансе отнася до показателите за оценка на близостта на комуникацията. Качествена характеристикаплътността на връзката на коефициента на корелация на ранга, както и други коефициенти на корелация, могат да бъдат оценени с помощта на скалата на Чадок.

Изчисляване на коефициентасе състои от следните стъпки:

Свойства на ранговия коефициент на корелация на Спирман

Област на приложение. Коефициент на корелация на рангаизползва се за оценка на качеството на комуникацията между две групи. Освен това неговата статистическа значимостизползвани при анализ на данни за хетероскедастичност.

Пример. На извадка от данни от наблюдавани променливи X и Y:

  1. направете таблица за класиране;
  2. намерете коефициента на корелация на ранга на Спиърман и тествайте неговата значимост на ниво 2а
  3. оцени естеството на пристрастяването
Решение. Присвоете рангове на характеристиката Y и фактора X.
хЙранг X, dxранг Y, d y
28 21 1 1
30 25 2 2
36 29 4 3
40 31 5 4
30 32 3 5
46 34 6 6
56 35 8 7
54 38 7 8
60 39 10 9
56 41 9 10
60 42 11 11
68 44 12 12
70 46 13 13
76 50 14 14

Рангова матрица.
ранг X, dxранг Y, d y(dx - dy) 2
1 1 0
2 2 0
4 3 1
5 4 1
3 5 4
6 6 0
8 7 1
7 8 1
10 9 1
9 10 1
11 11 0
12 12 0
13 13 0
14 14 0
105 105 10

Проверка на коректността на компилацията на матрицата въз основа на изчисляването на контролната сума:

Сумата по колоните на матрицата са равни една на друга и на контролната сума, което означава, че матрицата е съставена правилно.
Използвайки формулата, изчисляваме коефициента на корелация на ранга на Спирман.


Връзката между черта Y и фактор X е силна и пряка
Значение на коефициента на корелация на ранга на Спирман
За да се тества нулевата хипотеза на ниво на значимост α за равенството на общия коефициент на корелация на ранг на Спирман към нула при конкуриращата хипотеза H i . p ≠ 0, е необходимо да се изчисли критичната точка:

където n е размерът на извадката; ρ е коефициентът на корелация на ранга на извадката на Спиърман: t(α, k) е критичната точка на двустранната критична област, която се намира от таблицата с критичните точки на разпределението на Студент, според нивото на значимост α и броя на степени на свобода k = n-2.
Ако |p|< Т kp - нет оснований отвергнуть нулевую гипотезу. Ранговая корреляционная связь между качественными признаками не значима. Если |p| >T kp - нулевата хипотеза се отхвърля. Между качествените характеристики има значителна степен на корелация.
Според таблицата на Студент намираме t(α/2, k) = (0.1/2;12) = 1.782

Тъй като T kp< ρ , то отклоняем гипотезу о равенстве 0 коэффициента ранговой корреляции Спирмена. Другими словами, коэффициент ранговой корреляции статистически - значим и ранговая корреляционная связь между оценками по двум тестам значимая.

Методът на корелация на ранг на Спирман ви позволява да определите плътността (силата) и посоката на корелацията между две характеристики или два профила (йерархии) на характеристиките.

За да се изчисли корелацията на ранга, е необходимо да има две серии от стойности,

които могат да бъдат класирани. Тези диапазони от стойности могат да бъдат:

1) два признака, измерени в една и съща група субекти;

2) две индивидуални йерархии на черти, идентифицирани в два субекта за един и същ набор от черти;

3) две групови йерархии от характеристики,

4) индивидуални и групови йерархии от характеристики.

Първо, индикаторите се класират отделно за всяка от характеристиките.

По правило на по-ниска стойност на даден признак се присвоява по-нисък ранг.

В първия случай (две характеристики) се класират индивидуалните стойности за първия признак, получени от различни субекти, а след това индивидуалните стойности за втория признак.

Ако два атрибута са положително свързани, тогава субектите с нисък ранг в единия от тях ще имат нисък ранг в другия, а субектите с висок ранг в

една от чертите също ще има висок ранг на другата черта. За да се изчисли rs, е необходимо да се определи разликата (d) между ранговете, получени от този субект за двете характеристики. След това тези показатели d се трансформират по определен начин и се изваждат от 1. Отколкото

колкото по-малка е разликата между ранговете, толкова по-голям ще бъде rs, толкова по-близо ще бъде до +1.

Ако няма корелация, тогава всички рангове ще бъдат смесени и няма да има

няма съвпадение. Формулата е проектирана така, че в този случай rs ще бъде близо до 0.

В случай на отрицателна корелация, ниските рангове на субектите по един признак

ще съответства на високи рангове на друг атрибут и обратно. Колкото по-голямо е несъответствието между ранговете на субектите по две променливи, толкова по-близо е rs до -1.

Във втория случай (два индивидуални профила), индивидуално

стойностите, получени от всеки от 2-та субекта според определен (еднакъв и за двамата) набор от характеристики. Първият ранг ще получи чертата с най-ниска стойност; вторият ранг е характеристика с по-висока стойност и т.н. Очевидно всички характеристики трябва да се измерват в едни и същи единици, в противен случай класирането е невъзможно. Например, не е възможно да се класират показателите във въпросника за личността на Cattell (16PF), ако те са изразени в „сурови“ резултати, тъй като диапазоните на стойностите за различните фактори са различни: от 0 до 13, от 0 до

20 и от 0 до 26. Не можем да кажем кой от факторите ще заеме първо място по тежест, докато не приведем всички стойности в една скала (най-често това е скалата на стената).

Ако индивидуалните йерархии на два субекта са положително свързани, тогава знаците, които имат нисък ранг за един от тях, ще имат нисък ранг за другия и обратно. Например, ако за един субект факторът E (доминация) има най-нисък ранг, то за друг предмет той трябва да има нисък ранг, ако един субект има фактор C

(емоционална стабилност) има най-висок ранг, то трябва да има и другият субект

този фактор има висок ранг и т.н.

В третия случай (два групови профила), средните групови стойности, получени в 2 групи субекти, се класират според определен, идентичен за две групи, набор от характеристики. По-нататък линията на разсъждения е същата като в предишните два случая.

В случай на 4-ти (индивидуални и групови профили), индивидуалните стойности на субекта и средните групови стойности се класират отделно според същия набор от характеристики, които се получават като правило чрез изключване на този индивид субект - той не участва в средния групов профил, с който ще се сравнява индивидуален профил. Ранговата корелация ще ви позволи да проверите колко последователни са индивидуалните и груповите профили.

И в четирите случая значимостта на получения коефициент на корелация се определя от броя на класираните стойности N. В първия случай това число ще съвпада с размера на извадката n. Във втория случай броят на наблюденията ще бъде броят на характеристиките, които съставляват йерархията. В третия и четвъртия случай N също е броят на сравняваните признаци, а не броят на субектите в групите. Подробни обяснения са дадени в примерите. Ако абсолютната стойност на rs достигне критична стойност или я надвиши, корелацията е значителна.

Хипотези.

Има две възможни хипотези. Първият се отнася за случай 1, вторият за останалите три случая.

Първата версия на хипотези

H0: Корелацията между променливи A и B не е различна от нула.

H1: Корелацията между променливи A и B е значително различна от нула.

Втората версия на хипотезите

H0: Корелацията между йерархии A и B не е различна от нула.

H1: Корелацията между йерархии A и B е значително различна от нула.

Ограничения на ранговия коефициент на корелация

1. За всяка променлива трябва да бъдат представени поне 5 наблюдения. Горната граница на пробата се определя от наличните таблици с критични стойности.

2. Коефициентът на корелация на ранг на Спирман rs с голям брой идентични рангове за една или и двете сравнявани променливи дава загрубени стойности. В идеалния случай и двете корелирани серии трябва да бъдат две поредици от несъвпадащи стойности. Ако това условие не е изпълнено, е необходимо да се направи корекция за същите рангове.

Коефициентът на корелация на ранга на Спиърман се изчислява по формулата:

Ако и в двете сравнявани рангови серии има групи от един и същи ранг, преди да се изчисли коефициентът на корелация на ранга, е необходимо да се направят корекции за едни и същи рангове Ta и Tv:

Ta \u003d Σ (a3 - a) / 12,

TV \u003d Σ (v3 - c) / 12,

където a е обемът на всяка група от еднакви рангове в ранговия ред A, c е обемът на всеки

групи с еднакъв ранг в ранговата серия B.

За да изчислите емпиричната стойност на rs, използвайте формулата:

Изчисляване на коефициента на корелация на ранг на Спирман rs

1. Определете в кои две характеристики или две характеристични йерархии ще участват

сравнение като променливи A и B.

2. Подредете стойностите на променливата A, като присвоите ранг 1 на най-малката стойност, в съответствие с правилата за класиране (вижте A.2.3). Въведете ранговете в първата колона на таблицата по реда на номерата на субектите или знаците.

3. Подредете стойностите на променливата B, в съответствие със същите правила. Въведете ранговете във втората колона на таблицата по реда на номерата на субектите или знаците.

5. Квадратирайте всяка разлика: d2. Въведете тези стойности в четвъртата колона на таблицата.

Ta \u003d Σ (a3 - a) / 12,

TV \u003d Σ (v3 - c) / 12,

където a е обемът на всяка група от еднакви рангове в рангов ред A; в - обемът на всяка група

същите се нареждат в класационната серия B.

а) при липса на еднакви звания

rs  1 − 6 ⋅

б) при наличие на същите чинове

Σd 2  T  T

r  1 − 6 ⋅ a in,

където Σd2 е сумата от квадратите на разликите между ранговете; Ta и TV са корекции за същото

N е броят на субектите или характеристиките, участвали в класирането.

9. Определете от таблицата (вижте допълнение 4.3) критичните стойности на rs за даден N. Ако rs е по-голям или поне равен на критичната стойност, корелацията е значително различна от 0.

Пример 4.1 При определяне на степента на зависимост на реакцията на пиене на алкохол от окуломоторната реакция в тестовата група бяха получени данни преди пиене на алкохол и след пиене. Зависи ли реакцията на субекта от състоянието на интоксикация?

Резултати от експеримента:

Преди: 16, 13, 14, 9, 10, 13, 14, 14, 18, 20, 15, 10, 9, 10, 16, 17, 18. След: 24, 9, 10, 23, 20, 11, 12, 19, 18, 13, 14, 12, 14, 7, 9, 14. Нека формулираме хипотези:

H0: корелацията между степента на зависимост на реакцията преди пиене на алкохол и след пиене не се различава от нула.

H1: корелацията между степента на зависимост на реакцията преди пиене на алкохол и след пиене е значително различна от нула.

Таблица 4.1. Изчисление d2 за рангов коефициентКорелации на Spearman rs при сравняване на параметрите на окуломоторния отговор преди и след експеримента (N=17)

стойности

стойности

Тъй като имаме повтарящи се рангове, в този случай ще приложим формулата, коригирана за същите рангове:

Ta= ((23-2)+(33-3)+(23-2)+(33-3)+(23-2)+(23-2))/12=6

Tb =((23-2)+(23-2)+(33-3))/12=3

Намерете емпиричната стойност на коефициента на Спиърман:

rs = 1- 6*((767,75+6+3)/(17*(172-1)))=0,05

Според таблицата (Приложение 4.3) намираме критичните стойности на коефициента на корелация

0,48 (p ≤ 0,05)

0,62 (p ≤ 0,01)

Получаваме

rs=0,05∠rcr(0,05)=0,48

Заключение: хипотезата H1 се отхвърля и H0 се приема. Тези. корелация между степента

зависимостта на реакцията преди консумация на алкохол и след не се различава от нула.