Rango koreliacija ir Spearmano rango koreliacijos koeficientas. Spearmano rango koreliacijos koeficientas

Spearmano rangų koreliacijos metodas leidžia nustatyti dviejų požymių arba dviejų savybių profilių (hierarchijų) koreliacijos sandarumą (stiprumą) ir kryptį.

Norint apskaičiuoti rango koreliaciją, reikia turėti dvi verčių eilutes,

kuriuos galima reitinguoti. Šios verčių serijos gali būti:

1) du bruožai, išmatuoti toje pačioje tiriamųjų grupėje;

2) dvi atskiros požymių hierarchijos, identifikuotos dviejuose dalykuose tam pačiam požymių rinkiniui;

3) dvi grupinės požymių hierarchijos,

4) individualios ir grupinės atributų hierarchijos.

Iš pradžių kiekvienos charakteristikos rodikliai reitinguojami atskirai.

Paprastai žemesnei atributo reikšmei priskiriamas žemesnis rangas.

Pirmuoju atveju (dvi požymiai) pagal pirmąjį požymį išrikiuojamos atskiros reikšmės, kurias gauna skirtingi subjektai, o vėliau – pagal antrą požymį.

Jei du ženklai yra teigiamai susiję, tada tiriamieji, kurių vieno iš jų reitingai yra žemi, kitame bus žemi, o subjektai, turintys aukštus rangus

vienas iš ženklų taip pat turės aukštus rangus kitame. Norint apskaičiuoti rs, būtina nustatyti skirtumus (d) tarp rangų, gautų tam tikro dalyko pagal abu kriterijus. Tada šie rodikliai d transformuojami tam tikru būdu ir atimami iš 1. Nei

kuo mažesnis skirtumas tarp rangų, tuo didesnis rs, tuo arčiau +1.

Jei koreliacijos nėra, tada visos eilės bus sumaišytos ir nebus

nesutampa. Formulė sukurta taip, kad šiuo atveju rs bus artimas 0.

Esant neigiamai koreliacijai, žemos tiriamųjų eilės viename požymyje

skirtingu pagrindu atitiks aukštus rangus ir atvirkščiai. Kuo didesnis neatitikimas tarp tiriamųjų rangų dviejuose kintamuosiuose, tuo rs artimesnis -1.

Antruoju atveju (du individualūs profiliai) asmuo

kiekvieno iš 2 tiriamųjų gautos vertės pagal tam tikrą (abiem vienodą) požymių rinkinį. Pirmas rangas gaus mažiausią reikšmę turintį požymį; antrasis rangas yra didesnės vertės požymis ir pan. Akivaizdu, kad visi požymiai turi būti matuojami tais pačiais vienetais, kitaip reitinguoti neįmanoma. Pavyzdžiui, neįmanoma surikiuoti rodiklių pagal Cattell asmenybės klausimyną (16PF), jei jie išreikšti „neapdorotais“ taškais, nes skirtingų veiksnių verčių diapazonai skiriasi: nuo 0 iki 13, nuo 0 į

20 ir nuo 0 iki 26. Negalime pasakyti, kuris iš veiksnių užims pirmąją vietą pagal sunkumą, kol nesukelsime visų verčių į vieną skalę (dažniausiai tai yra sieninė skalė).

Jei dviejų subjektų individualios hierarchijos yra teigiamai susijusios, tai ženklai, kurių vieno iš jų lygiai yra žemi, kito žemesnio rango, ir atvirkščiai. Pavyzdžiui, jei faktorius E (dominavimas) turi žemiausią reitingą vienam dalykui, tai kitam dalykui jis turėtų būti žemesnis, jei vienas subjektas turi faktorių C

(emocinis stabilumas) turi aukščiausią rangą, tada kitas tiriamasis taip pat turėtų turėti

šis veiksnys turi aukštą rangą ir kt.

Trečiuoju atveju (dviejų grupių profiliai) vidutinės grupių reikšmės, gautos 2 tiriamųjų grupėse, yra suskirstytos pagal tam tikrą charakteristikų rinkinį, tas pats abiem grupėms. Toliau samprotavimo linija yra tokia pati kaip ir ankstesniais dviem atvejais.

4-ojo (individualaus ir grupinio profilio) atveju individualios tiriamojo vertės ir vidutinės grupės reikšmės yra reitinguojamos atskirai pagal tą patį požymių rinkinį, kuris paprastai gaunamas, kai šis individualus subjektas neįtraukiamas – jis nedalyvauja vidutiniame grupės profilyje, su kuriuo bus lyginamas individualus profilis. Rango koreliacija patikrins, kiek nuoseklūs yra asmens ir grupės profiliai.

Visais keturiais atvejais gauto koreliacijos koeficiento reikšmingumą lemia reitinguotų verčių skaičius N. Pirmuoju atveju šis skaičius sutaps su imties dydžiu n. Antruoju atveju stebėjimų skaičius bus elementų, sudarančių hierarchiją, skaičius. Trečiuoju ir ketvirtuoju atveju N taip pat yra palyginamų požymių skaičius, o ne tiriamųjų skaičius grupėse. Išsamūs paaiškinimai pateikti pavyzdžiuose. Jei absoliuti rs reikšmė pasiekia arba viršija kritinę reikšmę, koreliacija yra patikima.

Hipotezės.

Galimos dvi hipotezės. Pirmasis nurodo 1 atvejį, antrasis – kitus tris atvejus.

Pirmas hipotezių variantas

H0: Koreliacija tarp kintamųjų A ir B nesiskiria nuo nulio.

H1: Koreliacija tarp kintamųjų A ir B labai skiriasi nuo nulio.

Antrasis hipotezių variantas

H0: koreliacija tarp hierarchijų A ir B nesiskiria nuo nulio.

H1: koreliacija tarp hierarchijų A ir B labai skiriasi nuo nulio.

Rangų koreliacijos koeficiento apribojimai

1. Kiekvienam kintamajam turi būti pateiktos bent 5 pastabos. Viršutinė mėginio riba nustatoma pagal turimas kritinių verčių lenteles.

2. Spearman'o rango koreliacijos koeficientas rs daugeliui vienodų rangų vienam arba abiem lyginamiesiems kintamiesiems suteikia apytiksles reikšmes. Idealiu atveju abi susijusios eilutės turėtų būti dvi nesutampančių verčių sekos. Jei ši sąlyga neįvykdoma, būtina padaryti pataisą tiems patiems rangams.

Spearmano rango koreliacijos koeficientas apskaičiuojamas pagal formulę:

Jei abiejose lyginamosiose rangų eilutėse yra vienodų rangų grupių, prieš skaičiuojant rango koreliacijos koeficientą, reikia atlikti tų pačių rangų Ta ir Tv pataisymus:

Ta = Σ (a3 - a) / 12,

TV = Σ (v3 – v) / 12,

kur a yra kiekvienos A rangų serijos tos pačios eilės grupės tūris, b yra kiekvienos grupės tūris

to paties rango grupės B reitinge.

Norėdami apskaičiuoti empirinę rs reikšmę, naudokite formulę:

Spearmano rango koreliacijos koeficiento rs apskaičiavimas

1. Nustatykite, kurios dvi savybės ar dvi charakteristikų hierarchijos dalyvaus

palyginimas su kintamaisiais A ir B.

2. Surikiuoti kintamojo A reikšmes, 1 rangą priskiriant mažiausiai reikšmei, vadovaujantis reitingavimo taisyklėmis (žr. 2.3 skyrių). Įveskite eiles pirmajame lentelės stulpelyje dalykų ar ženklų skaičių tvarka.

3. Surikiuoti kintamojo B reikšmes pagal tas pačias taisykles. Antrame lentelės stulpelyje įrašykite eiles tiriamųjų skaičių arba ženklų tvarka.

5. Palyginkite kiekvieną skirtumą kvadratu: d2. Įveskite šias reikšmes į ketvirtą lentelės stulpelį.

Ta = Σ (a3 - a) / 12,

TV = Σ (v3 – v) / 12,

čia a yra kiekvienos A eilės tų pačių eilučių grupės tūris; c - kiekvienos grupės tūris

tos pačios kategorijos B reitinge.

a) nesant tų pačių rangų

rs  1 - 6 ⋅

b) esant toms pačioms eilėms

Σd 2  T  T

r  1 - 6 ⋅ a c,

čia Σd2 – skirtumų tarp eilučių kvadratų suma; Ta ir TV – pataisos už tą patį

N yra reitinge dalyvaujančių dalykų arba savybių skaičius.

9. Iš lentelės (žr. 4.3 priedą) nustatykite kritines rs reikšmes tam tikram N. Jei rs viršija kritinę reikšmę arba yra bent jai lygi, koreliacija žymiai skiriasi nuo 0.

4.1 pavyzdys Tiriamojoje grupėje nustatant alkoholio vartojimo reakcijos priklausomybės nuo okulomotorinės reakcijos laipsnį, gauti duomenys prieš gėrimą ir po gėrimo. Ar tiriamojo reakcija priklauso nuo apsvaigimo būklės?

Eksperimento rezultatai:

Prieš: 16, 13, 14, 9, 10, 13, 14, 14, 18, 20, 15, 10, 9, 10, 16, 17, 18. Po: 24, 9, 10, 23, 20, 11, 12, 19, 18, 13, 14, 12, 14, 7, 9, 14. Suformuluokime hipotezes:

H0: koreliacija tarp reakcijos priklausomybės laipsnio prieš ir po alkoholio vartojimo nesiskiria nuo nulio.

H1: koreliacija tarp reakcijos priklausomybės laipsnio prieš ir po alkoholio vartojimo gerokai skiriasi nuo nulio.

4.1 lentelė. Spearmano rango koreliacijos koeficiento rs d2 apskaičiavimas lyginant akies motorinės reakcijos rodiklius prieš ir po eksperimento (N = 17)

prasmė

prasmė

Kadangi turime pasikartojančius rangus, tokiu atveju taikysime formulę, pritaikytą tiems patiems rangams:

Ta = ((23-2) + (33-3) + (23-2) + (33-3) + (23-2) + (23-2)) / 12 = 6

Tb = ((23-2) + (23-2) + (33-3)) / 12 = 3

Raskime Spearman koeficiento empirinę reikšmę:

rs = 1-6 * ((767,75 + 6 + 3) / (17 * (172-1))) = 0,05

Pagal lentelę (4.3 priedas) randame koreliacijos koeficiento kritines reikšmes

0,48 (p ≤ 0,05)

0,62 (p ≤ 0,01)

Mes gauname

rs = 0,05∠rcr (0,05) = 0,48

Išvada: H1 hipotezė atmetama, o H0 priimta. Tie. laipsnio koreliacija

reakcijos priklausomybė prieš ir po alkoholio vartojimo nesiskiria nuo nulio.

Tais atvejais, kai tiriamų požymių matavimai atliekami eilės skalėje arba ryšio forma skiriasi nuo tiesinės, dviejų atsitiktinių dydžių ryšio tyrimas atliekamas naudojant rangų koreliacijos koeficientus. Apsvarstykite Spearman rango koreliacijos koeficientą. Jį skaičiuojant būtina surikiuoti (išskirstyti) imties variantus. Reitingavimas reiškia eksperimentinių duomenų grupavimą tam tikra tvarka, didėjančia arba mažėjančia tvarka.

Reitingavimo operacija atliekama pagal šį algoritmą:

1. Mažesnei reikšmei priskiriamas žemesnis rangas. Didžiausiai reikšmei priskiriamas reitingas, atitinkantis reitinguotų reikšmių skaičių. Mažiausiai reikšmei priskiriamas lygis, lygus 1. Pavyzdžiui, jei n = 7, tai didžiausiai reikšmei bus suteiktas 7 rangas, išskyrus antroje taisyklėje numatytus atvejus.

2. Jei kelios reikšmės yra lygios, tada joms priskiriamas rangas, kuris yra vidutinė tų rangų vertė, kurią jie būtų gavę, jei nebūtų lygūs. Kaip pavyzdį apsvarstykite 7 elementų pasirinkimą didėjančia tvarka: 22, 23, 25, 25, 25, 28, 30. 22 ir 23 reikšmės pasitaiko vieną kartą, todėl jų eilės yra atitinkamai R22 = 1 ir R23 = 2 ... 25 reikšmė atsiranda 3 kartus. Jei šios reikšmės nebūtų kartojamos, jų eilės būtų lygios 3, 4, 5. Todėl jų rangas R25 yra lygus 3, 4 ir 5: aritmetiniam vidurkiui. 28 ir 30 reikšmės nesikartoja, todėl jų eilės yra atitinkamai R28 = 6 ir R30 = 7. Galiausiai turime tokią korespondenciją:

3. Bendra rangų suma turi sutapti su apskaičiuota, kuri nustatoma pagal formulę:

čia n yra bendras reitinguotų verčių skaičius.

Realių ir apskaičiuotų rangų neatitikimas parodys klaidą, padarytą skaičiuojant rangus ar juos sumuojant. Tokiu atveju turite rasti ir ištaisyti klaidą.

Spearmano rango koreliacijos koeficientas – tai metodas, leidžiantis nustatyti dviejų požymių ar dviejų požymių hierarchijų ryšio stiprumą ir kryptį. Rango koreliacijos koeficiento naudojimas turi keletą apribojimų:

  • a) Tariama koreliacijos priklausomybė turėtų būti monotoniška.
  • b) Kiekvieno mėginio dydis turi būti didesnis arba lygus 5. Norėdami nustatyti viršutinę mėginio ribą, naudokite kritinių verčių lenteles (priedo 3 lentelė). Didžiausia n reikšmė lentelėje yra 40.
  • c) Analizės metu tikėtina, kad atsiras daug vienodų rangų. Tokiu atveju turi būti padaryta pataisa. Palankiausias atvejis yra tada, kai abu tiriami mėginiai atspindi dvi nesutampančių verčių sekas.

Norėdamas atlikti koreliacinę analizę, tyrėjas turi turėti du pavyzdžius, kuriuos galima reitinguoti, pavyzdžiui:

  • - du bruožai, išmatuoti toje pačioje tiriamųjų grupėje;
  • - dvi atskiros požymių hierarchijos, nustatytos dviejuose subjektuose tam pačiam bruožų rinkiniui;
  • - dvi grupinės požymių hierarchijos;
  • - individualios ir grupinės atributų hierarchijos.

Skaičiavimą pradedame reitinguodami tiriamus rodiklius atskirai kiekvienai charakteristikai.

Išanalizuokime atvejį su dviem charakteristikomis, išmatuotomis toje pačioje tiriamųjų grupėje. Pirma, atskiros reikšmės yra suskirstytos pagal pirmąjį požymį, gautą skirtingų dalykų, o tada atskiros reikšmės pagal antrąjį požymį. Jei vieno rodiklio žemesni rangai atitinka kito rodiklio žemesnius rangus, o dideli vieno rodiklio rangai – dideles kito rodiklio eiles, tai šie du požymiai yra teigiamai susiję. Tačiau jei vieno rodiklio didesnės eilės atitinka kito rodiklio mažesnes eiles, tai šie du požymiai yra neigiamai susiję. Norėdami rasti rs, nustatome skirtumą tarp kiekvieno dalyko eilių (d). Kuo mažesnis skirtumas tarp rangų, tuo rango koreliacijos koeficientas rs bus artimesnis „+1“. Jei santykio nėra, tai tarp jų nebus ir susirašinėjimo, todėl rs bus artimas nuliui. Kuo didesnis skirtumas tarp tiriamųjų rangų dviejuose kintamuosiuose, tuo arčiau „-1“ bus koeficiento rs reikšmė. Taigi Spearmano rango koreliacijos koeficientas yra bet kokio monotoniško ryšio tarp dviejų tiriamų požymių matas.

Apsvarstykite atvejį, kai dvi atskiros bruožų hierarchijos, nustatytos dviejuose tiriamuosiuose tam pačiam bruožų rinkiniui. Esant tokiai situacijai, kiekvieno iš dviejų tiriamųjų gautos individualios vertės yra suskirstytos pagal tam tikrą savybių rinkinį. Požymiui, turinčiam mažiausią reikšmę, turi būti suteiktas pirmasis rangas; atributas, turintis didesnę reikšmę – antrasis rangas ir kt. Ypatingas dėmesys turėtų būti skiriamas tam, kad visos charakteristikos būtų matuojamos tais pačiais vienetais. Pavyzdžiui, neįmanoma reitinguoti rodiklių, jei jie išreikšti skirtingais „kainos“ taškais, nes neįmanoma nustatyti, kuris iš veiksnių užims pirmąją vietą pagal sunkumą, kol visos vertės nebus suvestos į vieną skalę. . Jei ženklai, turintys žemus rangus viename iš dalykų, taip pat turi žemus rangus kitame, ir atvirkščiai, tada atskiros hierarchijos yra teigiamai susijusios.

Dviejų grupių atributų hierarchijų atveju vidutinės grupių reikšmės, gautos dviejose tiriamųjų grupėse, reitinguojamos pagal tą patį atributų rinkinį tiriamoms grupėms. Toliau vadovaujamės ankstesniais atvejais pateiktu algoritmu.

Panagrinėkime atvejį su individualia ir grupine požymių hierarchija. Jie pradedami atskirai reitinguojant individualias subjekto vertes ir vidutines grupės vertes pagal tą patį atributų rinkinį, kuris buvo gautas, išskyrus tiriamąjį, kuris nedalyvauja vidutinėje grupės hierarchijoje, nes jo individas hierarchija bus lyginama su ja. Rango koreliacija leidžia įvertinti individualios ir grupės požymių hierarchijos nuoseklumo laipsnį.

Panagrinėkime, kaip aukščiau išvardintais atvejais nustatoma koreliacijos koeficiento reikšmė. Dviejų charakteristikų atveju jis bus nustatomas pagal imties dydį. Dviejų individualių charakteristikų hierarchijų atveju reikšmingumas priklauso nuo į hierarchiją įtrauktų savybių skaičiaus. Paskutiniais dviem atvejais reikšmingumą lemia tirtų charakteristikų skaičius, o ne grupių skaičius. Taigi rs reikšmę visais atvejais lemia reitinguotų verčių skaičius n.

Tikrinant rs statistinį reikšmingumą, naudojamos rango koreliacijos koeficiento kritinių verčių lentelės, sudarytos įvairiems reitinguotų verčių skaičiams ir skirtingiems reikšmingumo lygiams. Jei absoliuti rs reikšmė pasiekia kritinę reikšmę arba ją viršija, tai koreliacija patikima.

Svarstant pirmąjį variantą (atvejis su dviem požymiais, išmatuotais toje pačioje tiriamųjų grupėje), galimos šios hipotezės.

H0: Koreliacija tarp kintamųjų x ir y nesiskiria nuo nulio.

H1: Koreliacija tarp kintamųjų x ir y labai skiriasi nuo nulio.

Jei dirbame su bet kuriuo iš trijų likusių atvejų, būtina pateikti dar vieną hipotezių porą:

H0: Koreliacija tarp x ir y hierarchijų nesiskiria nuo nulio.

H1: Koreliacija tarp x ir y hierarchijų labai skiriasi nuo nulio.

Veiksmų seka skaičiuojant Spearmano rango koreliacijos koeficientą rs yra tokia.

  • - Nustatykite, kurios dvi charakteristikos arba dvi charakteristikų hierarchijos dalyvaus palyginime kaip kintamieji x ir y.
  • - Įvertinkite kintamojo x reikšmes, priskirdami 1 rangą mažiausiai reikšmei pagal reitingavimo taisykles. Pirmajame lentelės stulpelyje išdėstykite eiles tiriamųjų skaičių arba ženklų tvarka.
  • - Įvertinkite kintamojo y reikšmes. Antrame lentelės stulpelyje išdėstykite eiles tiriamųjų skaičių arba ženklų tvarka.
  • - Apskaičiuokite skirtumą d tarp eilių x ir y kiekvienai lentelės eilutei. Įdėkite rezultatus į kitą lentelės stulpelį.
  • - Apskaičiuokite skirtumų kvadratus (d2). Įdėkite gautas reikšmes į ketvirtą lentelės stulpelį.
  • - Apskaičiuoti skirtumų kvadratų sumą? d2.
  • - Jei yra tos pačios eilės, apskaičiuokite pataisymus:

čia tx yra kiekvienos lygių eilių grupės imtyje x tūris;

ty – kiekvienos lygių eilių grupės y imtyje tūris.

Apskaičiuokite rango koreliacijos koeficientą, priklausomai nuo tų pačių rangų buvimo ar nebuvimo. Jei nėra identiškų rangų, rango koreliacijos koeficientas rs apskaičiuojamas pagal formulę:

Esant tiems patiems rangams, rango koreliacijos koeficientas rs apskaičiuojamas pagal formulę:

kur d2 - skirtumų tarp eilučių kvadratų suma;

Tx ir Ty – tų pačių rangų pataisos;

n yra reitinge dalyvaujančių dalykų arba savybių skaičius.

Pagal priedo 3 lentelę nustatykite kritines rs reikšmes tam tikram tiriamųjų skaičiui n. Reikšmingas koreliacijos koeficiento skirtumas nuo nulio bus stebimas, jei rs yra ne mažesnis už kritinę vertę.

Pirsono koreliacijos koeficientas

Koeficientas r- Pearsonas naudojamas dviejų metrinių kintamųjų, išmatuotų toje pačioje imtyje, ryšiui tirti. Yra daug situacijų, kai jo taikymas yra tinkamas. Ar intelektas turi įtakos rezultatams vyresniųjų universiteto studijų metais? Ar darbuotojo atlyginimas susijęs su jo draugiškumu kolegoms? Ar mokinio nuotaika turi įtakos sudėtingo aritmetinio uždavinio sprendimo sėkmei? Norėdamas atsakyti į tokius klausimus, tyrėjas turi išmatuoti po du jį dominančius rodiklius kiekviename imties naryje.

Koreliacijos koeficiento reikšmei įtakos neturi vienetai, kuriais pateikiami požymiai. Vadinasi, bet kokios linijinės požymių transformacijos (daugyba iš konstantos, konstantos pridėjimas) nekeičia koreliacijos koeficiento reikšmės. Išimtis yra vieno iš ženklų dauginimas iš neigiamos konstantos: koreliacijos koeficientas keičia savo ženklą į priešingą.

Spearman ir Pearson koreliacijos taikymas.

Pirsono koreliacija yra tiesinio ryšio tarp dviejų kintamųjų matas. Tai leidžia nustatyti, kiek proporcingas yra dviejų kintamųjų kintamumas. Jei kintamieji yra proporcingi vienas kitam, tai grafiškai ryšį tarp jų galima pavaizduoti kaip tiesią liniją su teigiamu (tiesioginė proporcija) arba neigiama (atvirkštine proporcija) nuolydžiu.

Praktiškai ryšys tarp dviejų kintamųjų, jei tokių yra, yra tikimybinis ir grafiškai atrodo kaip elipsoidinis sklaidantis debesis. Tačiau šis elipsoidas gali būti pavaizduotas (apytiksliai) kaip tiesi linija arba regresijos linija. Regresijos linija yra tiesė, sudaryta mažiausių kvadratų metodu: atstumų (apskaičiuotų išilgai y ašies) nuo kiekvieno sklaidos taško iki tiesės kvadratų suma yra mažiausia.

Priklausomo kintamojo įverčių dispersija yra ypač svarbi vertinant prognozės tikslumą. Tiesą sakant, priklausomo kintamojo Y įverčių dispersija yra ta visos jo dispersijos dalis, kurią lemia nepriklausomo kintamojo X įtaka. Kitaip tariant, priklausomo kintamojo įverčių dispersijos ir tikrojo kintamojo dispersijos santykis. dispersija lygi koreliacijos koeficiento kvadratui.

Priklausomų ir nepriklausomų kintamųjų koreliacijos koeficiento kvadratas parodo priklausomo kintamojo dispersijos proporciją dėl nepriklausomo kintamojo įtakos ir vadinamas determinacijos koeficientu. Taigi determinacijos koeficientas parodo, kiek vieno kintamojo kintamumą sukelia (nustato) kito kintamojo įtaka.

Determinacijos koeficientas turi svarbų pranašumą prieš koreliacijos koeficientą. Koreliacija nėra tiesinė dviejų kintamųjų ryšio funkcija. Todėl kelių imčių koreliacijos koeficientų aritmetinis vidurkis nesutampa su koreliacija, apskaičiuota visiems tiriamiesiems iš šių imčių iš karto (t. y. koreliacijos koeficientas nėra adityvus). Priešingai, determinacijos koeficientas atspindi ryšį tiesiškai, todėl yra adityvus: jį galima apskaičiuoti kelių imčių vidurkiu.

Papildomos informacijos apie ryšio stiprumą suteikia koreliacijos koeficiento kvadrato reikšmė – determinacijos koeficientas: tai vieno kintamojo dispersijos dalis, kurią galima paaiškinti kito kintamojo įtaka. Priešingai nei koreliacijos koeficientas, determinacijos koeficientas didėja tiesiškai didėjant jungties stiprumui.

Spearmano koreliacijos koeficientai ir τ - Kendall ( rango koreliacijos )

Jei abu kintamieji, tarp kurių tiriamas ryšys, pateikiami eilės skalėje arba vienas iš jų eilės skalėje, o kitas metrinėje, tai taikomi rango koreliacijos koeficientai: Spearmano arba τ. - Kendell. Tiek vienam, tiek kitam koeficientui taikyti reikalingas preliminarus abiejų kintamųjų reitingavimas.

Spearmano rango koreliacijos koeficientas yra neparametrinis metodas, naudojamas statistiškai tirti ryšį tarp reiškinių. Šiuo atveju, naudojant kiekybiškai išreikštą koeficientą, nustatomas faktinis lygiagretumo laipsnis tarp dviejų kiekybinių tirtų požymių eilučių ir pateikiamas nustatyto ryšio sandarumo įvertinimas.

Jei grupės nariai buvo pirmi reitinguojami pagal kintamąjį x, po to pagal kintamąjį y, tai koreliaciją tarp x ir y kintamųjų galima gauti tiesiog apskaičiavus Pirsono koeficientą dviem eilėms. Jei nė viename kintamajame nėra grandžių (ty nėra pasikartojančių eilių), Pirsono formulė gali būti labai supaprastinta skaičiavimo būdu ir paversta formule, žinoma kaip Spearman.

Spearmano rango koreliacijos koeficiento galia yra šiek tiek prastesnė už parametrinės koreliacijos koeficiento galią.

Esant nedideliam stebėjimų skaičiui, patartina naudoti rango koreliacijos koeficientą. Šis metodas gali būti taikomas ne tik kiekybiškai išreikštiems duomenims, bet ir tais atvejais, kai įrašytas vertes lemia įvairaus intensyvumo aprašomieji požymiai.

Spearmano rango koreliacijos koeficientas su daugybe vienodų rangų vienam arba abiem lyginamiesiems kintamiesiems suteikia apytiksles reikšmes. Idealiu atveju abi susijusios eilutės turėtų būti dvi nesutampančių verčių sekos

Alternatyva Spearman koreliacijai pagal rangus yra koreliacija τ - Kendall. M. Kendall pasiūlyta koreliacija paremta mintimi, kad ryšio kryptį galima spręsti poromis lyginant tiriamuosius tarpusavyje: jei tiriamųjų poroje yra x pokytis, kuris sutampa su y pokyčiu, tada tai rodo teigiamus santykius, jei nesutampa - kažką apie neigiamus santykius.

Koreliacijos koeficientai buvo specialiai sukurti, siekiant skaitiniu būdu nustatyti dviejų savybių ryšio stiprumą ir kryptį, išmatuotą skaitinėmis skalėmis (metrine arba rangu). Kaip jau minėta, maksimalus ryšio stiprumas atitinka koreliacijos reikšmes +1 (griežtas tiesioginis arba tiesiogiai proporcingas ryšys) ir -1 (griežtas atvirkštinis arba atvirkščiai proporcingas ryšys), o ryšio nebuvimas atitinka koreliaciją, lygią nulis. Papildomos informacijos apie ryšio stiprumą suteikia determinacijos koeficiento reikšmė: tai vieno kintamojo dispersijos dalis, kurią galima paaiškinti kito kintamojo įtaka.

9. Parametrinių duomenų palyginimo metodai

Parametriniai palyginimo metodai naudojami, jei jūsų kintamieji buvo matuojami metrinėje skalėje.

Dispersijų palyginimas 2- x pavyzdžiai pagal Fisherio kriterijų .


Šis metodas leidžia patikrinti hipotezę, kad 2 bendrųjų populiacijų, iš kurių gaunami lyginami mėginiai, dispersijos skiriasi viena nuo kitos. Metodo apribojimai – charakteristikos pasiskirstymas abiejuose mėginiuose neturi skirtis nuo įprasto.

Alternatyva dispersijų palyginimui yra Lieven testas, kurio normaliojo skirstinio tikrinti nereikia. Šiuo metodu galima patikrinti dispersijų lygybės (homogeniškumo) prielaidą prieš patikrinant vidurkio skirtumo patikimumą Stjudento testu skirtingoms skirtingo dydžio nepriklausomoms imtims.

Psichologijos studentas (sociologas, vadovas, vadybininkas ir kt.) dažnai domisi, kaip du ar daugiau kintamųjų vienoje ar keliose tiriamose grupėse yra susiję vienas su kitu.

Matematikoje kintamųjų santykiams apibūdinti naudojama funkcijos F sąvoka, kuri kiekvienai konkrečiai nepriklausomo kintamojo X reikšmei priskiria konkrečią priklausomo kintamojo Y reikšmę. Gauta priklausomybė žymima Y = F (X) .

Šiuo atveju koreliacijų tipai tarp išmatuotų požymių gali būti skirtingi: pavyzdžiui, koreliacija yra tiesinė ir netiesinė, teigiama ir neigiama. Jis yra tiesinis - jei didėja arba sumažėja vienas kintamasis X, antrasis kintamasis Y vidutiniškai taip pat didėja arba mažėja. Jis yra netiesinis, jei, padidėjus vienam kiekiui, antrojo pokyčio pobūdis nėra tiesinis, o apibūdinamas kitais dėsniais.

Koreliacija bus teigiama, jei, padidėjus X kintamajam, Y kintamasis vidutiniškai taip pat didėja, o jei, padidėjus X, Y kintamasis turi tendenciją vidutiniškai mažėti, tada kalbama apie neigiamą koreliaciją. . Galima situacija, kai neįmanoma nustatyti jokios priklausomybės tarp kintamųjų. Šiuo atveju jie sako, kad nėra koreliacijos.

Koreliacinės analizės uždavinys susiaurinamas iki ryšio tarp kintančių ženklų krypties (teigiamos arba neigiamos) ir formos (tiesinės, netiesinės) nustatymo, jo sandarumo matavimo ir, galiausiai, gautų koreliacijos koeficientų reikšmingumo lygio patikrinimo.

K. Spearman pasiūlytas rangų koreliacijos koeficientas reiškia neparametrinius kintamųjų ryšio rodiklius, išmatuotus rangų skalėje. Skaičiuojant šį koeficientą, nereikia daryti prielaidų dėl charakteristikų pasiskirstymo bendrojoje aibėje. Šis koeficientas lemia eilinių požymių, šiuo atveju reprezentuojančių lyginamų reikšmių eiles, ryšio artumo laipsnį.

Spearmano rango tiesinės koreliacijos koeficientas apskaičiuojamas pagal formulę:

čia n – reitinguotų požymių (rodiklių, dalykų) skaičius;
D yra skirtumas tarp dviejų kiekvieno dalyko kintamųjų rangų;
D2 yra rangų skirtumų kvadratų suma.

Žemiau pateikiamos kritinės Spearman rango koreliacijos koeficiento reikšmės:

Spearmano tiesinės koreliacijos koeficientas yra nuo +1 iki -1. Spearmano tiesinės koreliacijos koeficientas gali būti teigiamas arba neigiamas, apibūdinantis dviejų požymių santykio kryptingumą, išmatuotą rangų skalėje.

Jei koreliacijos koeficiento modulis yra artimas 1, tai atitinka aukštą ryšio tarp kintamųjų lygį. Taigi, ypač kai kintamasis yra koreliuojamas su savimi, koreliacijos koeficiento reikšmė bus lygi +1. Toks santykis apibūdina tiesiogiai proporcingą santykį. Jei X kintamojo reikšmės yra išdėstytos didėjančia tvarka, o tos pačios reikšmės (dabar vadinamos Y kintamuoju) yra išdėstytos mažėjančia tvarka, tai šiuo atveju koreliacija tarp X ir Y kintamųjų bus tiksliai -1. Ši koreliacijos koeficiento reikšmė apibūdina atvirkščiai proporcingą ryšį.

Gauto ryšio aiškinimui labai svarbus koreliacijos koeficiento ženklas. Jei tiesinės koreliacijos koeficiento ženklas yra pliusas, tai ryšys tarp koreliuojančių požymių yra toks, kad didesnė vieno požymio (kintamojo) reikšmė atitinka didesnę kito požymio (kito kintamojo) reikšmę. Kitaip tariant, jei vienas rodiklis (kintamasis) didėja, tai atitinkamai didėja ir kitas rodiklis (kintamasis). Ši priklausomybė vadinama tiesiogiai proporcinga priklausomybe.

Jei gaunamas minuso ženklas, tai didesnė vienos savybės reikšmė atitinka mažesnę kitos. Kitaip tariant, esant minuso ženklui, vieno kintamojo (ypatybės, reikšmės) padidėjimas atitinka kito kintamojo sumažėjimą. Ši priklausomybė vadinama atvirkščiai proporcinga priklausomybe. Šiuo atveju kintamojo, kuriam priskiriamas didėjimo požymis (tendencija), pasirinkimas yra savavališkas. Tai gali būti arba kintamasis X, arba kintamasis Y. Tačiau jei manoma, kad X kintamasis didėja, tai kintamasis Y atitinkamai mažės ir atvirkščiai.

Apsvarstykite Spearmano koreliacijos pavyzdį.

Psichologė išsiaiškina, kaip yra susiję 11 pirmokų individualūs pasirengimo mokyklai rodikliai, gauti prieš pradedant lankyti mokyklą, ir jų vidutiniai rezultatai mokslo metų pabaigoje.

Norėdami išspręsti šią problemą, reitingavome, pirma, pasirengimo mokyklai rodiklių reikšmes, gautas priimant į mokyklą, ir, antra, galutinius tų pačių mokinių akademinių rezultatų rodiklius metų pabaigoje. Rezultatai pateikti lentelėje:

Gautus duomenis pakeičiame aukščiau pateikta formule ir atliekame skaičiavimą. Mes gauname:

Norėdami sužinoti reikšmingumo lygį, žr. lentelę „Spirmeno rangų koreliacijos koeficiento kritinės vertės“, kurioje pateikiamos kritinės rango koreliacijos koeficientų vertės.

Mes sukuriame atitinkamą „reikšmingumo ašį“:

Gautas koreliacijos koeficientas sutapo su 1% reikšmingumo lygio kritine reikšme. Todėl galima teigti, kad pirmos klasės mokinių pasirengimo mokyklai rodiklius ir baigiamuosius pažymius sieja teigiama koreliacinė priklausomybė – kitaip tariant, kuo aukštesnis pasirengimo mokyklai rodiklis, tuo geriau sekasi pirmaklasiui. Kalbant apie statistines hipotezes, psichologas turėtų atmesti nulinę (H0) panašumo hipotezę ir priimti alternatyvią (H1) skirtumo hipotezę, kuri rodo, kad ryšys tarp pasirengimo mokyklai rodiklių ir vidutinių akademinių rezultatų yra nulinis.

Spearmano koreliacija. Koreliacinė analizė Spearmano metodu. Spearman gretas. Spearmano koreliacijos koeficientas. Spearmano rango koreliacija

Pirsono koreliacija yra tiesinio ryšio tarp dviejų kintamųjų matas. Tai leidžia nustatyti, kiek proporcingas yra dviejų kintamųjų kintamumas. Jei kintamieji yra proporcingi vienas kitam, tai grafiškai ryšį tarp jų galima pavaizduoti kaip tiesią liniją su teigiamu (tiesioginė proporcija) arba neigiama (atvirkštine proporcija) nuolydžiu.

Praktiškai ryšys tarp dviejų kintamųjų, jei tokių yra, yra tikimybinis ir grafiškai atrodo kaip elipsoidinis sklaidantis debesis. Tačiau šis elipsoidas gali būti pavaizduotas (apytiksliai) kaip tiesi linija arba regresijos linija. Regresijos linija yra tiesė, sudaryta mažiausių kvadratų metodu: atstumų (apskaičiuotų išilgai y ašies) nuo kiekvieno sklaidos diagramos taško iki linijos kvadratų suma yra mažiausia.

Priklausomo kintamojo įverčių dispersija yra ypač svarbi vertinant prognozės tikslumą. Tiesą sakant, priklausomo kintamojo Y įverčių dispersija yra ta visos jo dispersijos dalis, kurią lemia nepriklausomo kintamojo X įtaka. Kitaip tariant, priklausomo kintamojo įverčių dispersijos ir tikrojo kintamojo dispersijos santykis. dispersija lygi koreliacijos koeficiento kvadratui.

Priklausomų ir nepriklausomų kintamųjų koreliacijos koeficiento kvadratas parodo priklausomo kintamojo dispersijos proporciją dėl nepriklausomo kintamojo įtakos ir vadinamas determinacijos koeficientu. Taigi determinacijos koeficientas parodo, kiek vieno kintamojo kintamumą sukelia (nustato) kito kintamojo įtaka.

Determinacijos koeficientas turi svarbų pranašumą prieš koreliacijos koeficientą. __________ koreliacija nėra tiesinio ryšio tarp dviejų kintamųjų funkcija. Todėl kelių imčių koreliacijos koeficientų aritmetinis vidurkis nesutampa su koreliacija, apskaičiuota visiems tiriamiesiems iš šių imčių iš karto (t. y. koreliacijos koeficientas nėra adityvus). Priešingai, determinacijos koeficientas atspindi ryšį tiesiškai, todėl yra adityvus: jį galima apskaičiuoti kelių imčių vidurkiu.

Papildomą informaciją apie ryšio stiprumą suteikia koreliacijos koeficiento kvadrato reikšmė – determinacijos koeficientas: tai vieno kintamojo dispersijos dalis, kurią galima paaiškinti kito kintamojo įtaka. Priešingai nei koreliacijos koeficientas, determinacijos koeficientas didėja tiesiškai didėjant jungties stiprumui.

Spearman ir τ-Kendall koreliacijos koeficientai (rangų koreliacijos)

Jei abu kintamieji, tarp kurių tiriamas ryšys, pateikiami eilės skalėje arba vienas iš jų eilės skalėje, o kitas metrinėje, tai taikomi rango koreliacijos koeficientai: Spearman arba τ-Kendall. Tiek vienam, tiek kitam koeficientui taikyti reikalingas preliminarus abiejų kintamųjų reitingavimas.

Spearmano rango koreliacijos koeficientas yra neparametrinis metodas, naudojamas statistiškai tirti ryšį tarp reiškinių. Šiuo atveju, naudojant kiekybiškai išreikštą koeficientą, nustatomas faktinis lygiagretumo laipsnis tarp dviejų kiekybinių tirtų požymių eilučių ir pateikiamas nustatyto ryšio sandarumo įvertinimas.

Jei grupės nariai buvo pirmi reitinguojami pagal kintamąjį x, po to pagal kintamąjį y, tai koreliaciją tarp x ir y kintamųjų galima gauti tiesiog apskaičiavus Pirsono koeficientą dviem eilėms. Jei nė viename kintamajame nėra grandžių (t. y. nėra pasikartojančių eilių), Pirsono formulę galima žymiai supaprastinti skaičiavimo būdu ir paversti formule, vadinama Spearman.

Spearmano rango koreliacijos koeficiento galia yra šiek tiek prastesnė už parametrinės koreliacijos koeficiento galią.

Esant nedideliam stebėjimų skaičiui, patartina naudoti rango koreliacijos koeficientą. Šis metodas gali būti taikomas ne tik kiekybiškai išreikštiems duomenims, bet ir tais atvejais, kai įrašytas vertes lemia įvairaus intensyvumo aprašomieji požymiai.

Spearmano rango koreliacijos koeficientas su daugybe vienodų rangų vienam arba abiem lyginamiesiems kintamiesiems suteikia apytiksles reikšmes. Idealiu atveju abi susijusios eilutės turėtų būti dvi nesutampančių verčių sekos.

Alternatyva Spearman koreliacijai pagal rangus yra τ-Kendall koreliacija. M. Kendall pasiūlyta koreliacija paremta mintimi, kad ryšio kryptį galima spręsti poromis lyginant tiriamuosius tarpusavyje: jei tiriamųjų poroje yra x pokytis, kuris sutampa su y pokyčiu, tada tai rodo teigiamus santykius, jei nesutampa - kažką apie neigiamus santykius.