Kaip koreliacija atliekama „Excel“? Koreliacinė ir regresinė analizė programoje Excel: vykdymo instrukcijos

Koreliacinė analizė yra populiarus metodas statistiniai tyrimai, kuris naudojamas nustatyti vieno rodiklio priklausomybės nuo kito laipsnį. AT Microsoft Excel prieinama specialus įrankis A, kuri skirta tokio tipo analizei atlikti. Sužinokime, kaip naudotis šia funkcija.

Koreliacinės analizės esmė

tikslas koreliacinė analizė Tai reiškia, kad reikia nustatyti ryšį tarp įvairių veiksnių. Tai yra, nustatoma, ar vieno rodiklio sumažėjimas ar padidėjimas turi įtakos kito rodiklio pokyčiui.

Jei priklausomybė nustatoma, tada nustatomas koreliacijos koeficientas. Skirtingai nuo regresinės analizės, tai yra vienintelis rodiklis, kurį apskaičiuoja šis statistinio tyrimo metodas. Koreliacijos koeficientas svyruoja nuo +1 iki -1. Jei yra teigiama koreliacija, vieno rodiklio padidėjimas prisideda prie antrojo padidėjimo. Esant neigiamai koreliacijai, padidėjus vienam rodikliui, sumažėja kitas. Kuo didesnis koreliacijos koeficiento modulis, tuo labiau pastebimas vieno rodiklio pokytis atsispindi antrojo pokytyje. Kai koeficientas lygus 0, priklausomybė tarp jų visiškai nėra.

Koreliacijos koeficiento apskaičiavimas

Dabar pabandykime apskaičiuoti koreliacijos koeficientą konkretus pavyzdys. Turime lentelę, kurioje atskirais stulpeliais kas mėnesį nupieštos reklamos išlaidos ir pardavimų suma. Turime išsiaiškinti pardavimų skaičiaus priklausomybės nuo sumos laipsnį Pinigai kuri buvo išleista reklamai.

1 būdas: koreliacijos nustatymas naudojant funkcijų vedlį

Vienas iš būdų, kaip atlikti koreliacijos analizę, yra CORREL funkcijos naudojimas. Pati funkcija turi bendra forma CORREL(masyvas1, masyvas2).

Pasirinkite langelį, kuriame turėtų būti rodomas skaičiavimo rezultatas. Spustelėkite mygtuką „Įterpti funkciją“, esantį formulės juostos kairėje.
Sąraše, kuris pateikiamas Funkcijų vedlio lange, suraskite ir pasirinkite funkciją CORREL. Spustelėkite mygtuką „Gerai“.
Atsidaro funkcijų argumentų langas. Lauke „Array1“ įveskite vienos iš reikšmių langelių diapazono koordinates, kurių priklausomybę reikia nustatyti. Mūsų atveju tai bus reikšmės stulpelyje „Pardavimo suma“. Norėdami įvesti masyvo adresą į lauką, aukščiau esančiame stulpelyje tiesiog pažymėkite visus langelius su duomenimis.
Lauke „Array2“ reikia įvesti antrojo stulpelio koordinates. Turime reklamos išlaidų. Taip pat, kaip ir ankstesniu atveju, duomenis įvedame į lauką.

Spustelėkite mygtuką „Gerai“.

Kaip matote, koreliacijos koeficientas skaičiaus pavidalu pasirodo langelyje, kurį anksčiau pasirinkome. Šiuo atveju jis lygus 0,97, o tai yra labai didelis vieno kiekio priklausomybės nuo kito ženklas.

2 būdas: apskaičiuokite koreliaciją naudodami analizės paketą

Be to, koreliaciją galima apskaičiuoti naudojant vieną iš analizės pakete pateiktų įrankių. Bet pirmiausia turime suaktyvinti šį įrankį.

Eikite į skirtuką „Failas“.
Atsidariusiame lange eikite į skyrių „Nustatymai“.
Tada eikite į elementą „Priedai“.
Kito lango apačioje, skiltyje „Valdymas“, perkelkite jungiklį į „Excel“ priedų padėtį, jei jis yra kitoje padėtyje. Spustelėkite mygtuką „Gerai“.
Priedų lange pažymėkite langelį šalia elemento „Analytics Package“. Spustelėkite mygtuką „Gerai“.
Po to suaktyvinamas analizės paketas. Eikite į skirtuką „Duomenys“. Kaip matote, čia ant juostelės atsiranda naujas įrankių blokas – „Analizė“. Spustelėkite jame esantį mygtuką „Duomenų analizė“.
Sąrašas atidaromas su įvairių variantų duomenų analizė. Pasirinkite „Koreliacija“. Spustelėkite mygtuką „Gerai“.
Atsidaro langas su koreliacinės analizės parametrais. Skirtingai nuo ankstesnio metodo, laukelyje „Įvesties intervalas“ intervalą įrašome ne kiekvienam stulpeliui atskirai, o visiems stulpeliams, kurie dalyvauja analizėje. Mūsų atveju tai yra stulpeliuose „Reklamos išlaidos“ ir „Pardavimas“ esantys duomenys.
Parametrą „Grupavimas“ paliekame nepakeistą - „Pagal stulpelius“, nes mūsų duomenų grupės suskirstytos į du stulpelius. Jei jie buvo sulaužyti eilutė po eilutės, jungiklis turi būti perkeltas į padėtį „Pagal eilutes“.

Pagal numatytuosius nustatymus išvesties parinktys nustatomos į „Naujas darbalapis“, ty duomenys bus rodomi kitame lape. Vietą galite pakeisti perjungdami jungiklį. Tai gali būti dabartinis lapas (tada reikės nurodyti informacijos išvesties langelių koordinates) arba nauja darbaknygė (failas).

Kai nustatyti visi nustatymai, spustelėkite mygtuką „Gerai“.

Kadangi pagal numatytuosius nustatymus buvo palikta analizės rezultatų išvesties vieta, pereiname prie naujas lapas. Kaip matote, čia yra koreliacijos koeficientas. Natūralu, kad jis yra toks pat, kaip ir naudojant pirmąjį metodą - 0,97. Taip yra todėl, kad abi parinktys atlieka tuos pačius skaičiavimus, tiesiog juos galima atlikti skirtingais būdais.

Kaip matote, programa „Excel“ vienu metu siūlo du koreliacijos analizės metodus. Jei viską padarysite teisingai, skaičiavimų rezultatas bus visiškai identiškas. Tačiau kiekvienas vartotojas gali pasirinkti jam patogesnį skaičiavimo variantą.

Džiaugiamės, kad galėjome padėti išspręsti problemą.

Užduokite klausimą komentaruose, išsamiai apibūdindami problemos esmę. Mūsų ekspertai pasistengs atsakyti kuo greičiau.

Ar šis straipsnis jums padėjo?

Regresinė ir koreliacinė analizė - statistiniais metodais tyrimai. Tai yra dažniausiai pasitaikantys būdai parodyti parametro priklausomybę nuo vieno ar kelių nepriklausomų kintamųjų.

Žemiau apie konkretų praktinių pavyzdžių Panagrinėkime šias dvi labai populiarias ekonomistų analizes. Taip pat pateiksime pavyzdį, kaip gauti rezultatus, kai jie sujungiami.

Regresinė analizė programoje Excel

Rodo kai kurių reikšmių (nepriklausomų, nepriklausomų) įtaką priklausomam kintamajam. Pavyzdžiui, kaip ekonomiškai aktyvių gyventojų skaičius priklauso nuo įmonių skaičiaus, darbo užmokesčio ir kitų parametrų. Arba: kaip BVP lygį veikia užsienio investicijos, energijos kainos ir pan.

Analizės rezultatas leidžia nustatyti prioritetus. O remiantis pagrindiniais veiksniais numatyti, planuoti prioritetinių sričių plėtrą, priimti valdymo sprendimus.

Regresija vyksta:

tiesinis (y = a + bx);
parabolinis (y = a + bx + cx2);
eksponentinis (y = a * exp(bx));
galia (y = a*x^b);
hiperbolinis (y = b/x + a);
logaritminis (y = b * 1n(x) + a);
eksponentinis (y = a * b^x).

Apsvarstykite regresijos modelio kūrimo Excel programoje ir rezultatų interpretavimo pavyzdį. Paimkime linijinis tipas regresija.

Užduotis. 6 įmonėse vidutinis mėn darbo užmokestis ir į pensiją išėjusių darbuotojų skaičius. Būtina nustatyti išėjusių į pensiją darbuotojų skaičiaus priklausomybę nuo vidutinio darbo užmokesčio.

Linijinės regresijos modelis turi tokią formą:

Y \u003d a0 + a1x1 + ... + akhk.

Kur a yra regresijos koeficientai, x yra įtakojantys kintamieji, o k yra veiksnių skaičius.

Mūsų pavyzdyje Y yra pasitraukusių darbuotojų rodiklis. Įtakos veiksnys yra darbo užmokestis (x).

„Excel“ turi integruotas funkcijas, kurios gali būti naudojamos tiesinės regresijos modelio parametrams apskaičiuoti. Tačiau „Analysis ToolPak“ priedas tai padarys greičiau.

Suaktyvinkite galingą analizės įrankį:

Spustelėkite mygtuką „Office“ ir eikite į skirtuką „Excel“ parinktys. "Priedai".
Apačioje, po išskleidžiamuoju sąrašu, laukelyje „Tvarkyti“ bus užrašas „Excel Add-ins“ (jei jo nėra, spustelėkite dešinėje esantį žymimąjį laukelį ir pasirinkite). Ir mygtukas Eiti. Spustelėkite.
Atidaromas galimų priedų sąrašas. Pasirinkite „Analysis Package“ ir spustelėkite Gerai.

Suaktyvintas priedas bus pasiekiamas skirtuke Duomenys.

Dabar mes tiesiogiai užsiimsime regresine analize.

Atidarykite duomenų analizės įrankių meniu. Pasirinkite „Regresija“.
Atsidarys meniu, kuriame galėsite pasirinkti įvesties vertes ir išvesties parinktis (kur rodyti rezultatą). Pradinių duomenų laukeliuose nurodome aprašomo parametro diapazoną (Y) ir jį įtakojantį veiksnį (X). Likusi dalis gali būti baigta arba ne.
Paspaudus Gerai, programa pateiks skaičiavimus naujame lape (galite pasirinkti intervalą, kurį rodyti esamame lape arba priskirti išvestį naujai darbaknygei).

Pirmiausia atkreipiame dėmesį į R kvadratą ir koeficientus.

R kvadratas yra determinacijos koeficientas. Mūsų pavyzdyje tai yra 0,755 arba 75,5%. Tai reiškia kad projektavimo parametrai modeliai 75,5% paaiškina priklausomybę tarp tiriamų parametrų. Kuo didesnis determinacijos koeficientas, tuo geresnis modelis. Gerai – virš 0,8. Prastas – mažiau nei 0,5 (tokia analizė vargu ar gali būti laikoma pagrįsta). Mūsų pavyzdyje – „neblogai“.

Koeficientas 64,1428 parodo, koks bus Y, jei visi nagrinėjamo modelio kintamieji yra lygūs 0. Tai yra, kiti faktoriai, kurie modelyje neaprašyti, taip pat turi įtakos analizuojamo parametro reikšmei.

Koeficientas -0,16285 parodo kintamojo X svorį Y. Tai reiškia, kad vidutinis mėnesinis atlyginimas pagal šį modelį įtakoja metusių rūkyti skaičių, kurio svoris yra -0,16285 (tai yra nedidelis įtakos laipsnis). „-“ ženklas rodo neigiamą poveikį: kuo didesnis atlyginimas, tuo mažiau mesti. Kas yra sąžininga.

Koreliacijos analizė programoje Excel

Koreliacinė analizė padeda nustatyti, ar yra ryšys tarp rodiklių vienoje ar dviejose imtyse. Pavyzdžiui, tarp mašinos veikimo laiko ir remonto išlaidų, įrangos kainos ir eksploatacijos trukmės, vaikų ūgio ir svorio ir kt.

Jei ryšys yra, tai ar vieno parametro padidėjimas lemia kito padidėjimą (teigiama koreliacija), ar sumažėjimą (neigiamą). Koreliacinė analizė padeda analitikui nustatyti, ar vieno rodiklio reikšmė gali numatyti galimą kito rodiklio reikšmę.

Koreliacijos koeficientas žymimas r. Varijuoja nuo +1 iki -1. Koreliacijų klasifikacija už skirtingos sritys bus kitoks. Kai koeficiento reikšmė yra 0, tarp imčių nėra tiesinio ryšio.

Apsvarstykite, kaip naudoti „Excel“ koreliacijos koeficientui rasti.

Funkcija CORREL naudojama poriniams koeficientams rasti.

Užduotis: Nustatykite, ar yra ryšys tarp darbo laiko tekinimo staklės ir jo priežiūros kaina.

Įveskite žymeklį į bet kurį langelį ir paspauskite fx mygtuką.

Kategorijoje „Statistika“ pasirinkite funkciją CORREL.
Argumentas "1 masyvas" - pirmasis reikšmių diapazonas - mašinos laikas: A2: A14.
Argumentas „Array 2“ - antrasis verčių diapazonas - remonto kaina: B2:B14. Spustelėkite Gerai.

Norint nustatyti ryšio tipą, reikia pažvelgti į absoliutų koeficiento skaičių (kiekviena veiklos sritis turi savo skalę).

Kelių parametrų (daugiau nei 2) koreliacinei analizei patogiau naudoti „Duomenų analizę“ („Analysis Package“ priedas). Sąraše turite pasirinkti koreliaciją ir nurodyti masyvą. Visi.

Gauti koeficientai bus rodomi koreliacijos matricoje. Kaip šis:

Koreliacinė-regresinė analizė

Praktikoje šie du būdai dažnai naudojami kartu.

Sudarome koreliacijos lauką: „Įterpti“ – „Diagrama“ – „Sklaidos diagrama“ (leidžia palyginti poras). Vertės diapazonas yra visi skaitiniai lentelės duomenys.
Kairiuoju pelės mygtuku spustelėkite bet kurį diagramos tašką. Tada teisingai. Atsidariusiame meniu pasirinkite „Pridėti tendencijų liniją“.
Priskirkite eilutės parametrus. Tipas - "Linijinis". Apačioje – „Rodyti lygtį diagramoje“.
Spustelėkite „Uždaryti“.

Dabar matomi regresinės analizės duomenys.

1. Atidarykite „Excel“ programą

2. Sukurkite stulpelius su duomenimis. Savo pavyzdyje nagrinėsime pirmos klasės mokinių agresyvumo ir nepasitikėjimo savimi ryšį arba koreliaciją. Eksperimente dalyvavo 30 vaikų, duomenys pateikti Excel lentelėje:

1 stulpelis - dalyko numeris

2 stulpelis – agresyvumas taškais

3 stulpelis – nepasitikėjimas savimi taškais

3. Tada reikia pasirinkti tuščią langelį šalia lentelės ir spustelėti piktogramą f(x)„Excel“ skydelyje

4. Atsidarys funkcijų meniu tarp kategorijų, kurias turite pasirinkti Statistiniai, tada tarp funkcijų sąrašo abėcėlės tvarka raskite CORREL ir spustelėkite Gerai

5. Tada atsidarys funkcijų argumentų meniu, kuriame galėsime pasirinkti mums reikalingus duomenų stulpelius. Norėdami pasirinkti pirmąjį stulpelį Agresyvumas reikia spustelėti mėlyną mygtuką šalia eilutės Masyvas1

6. Parinkime duomenis masyvas1 iš kolonos Agresyvumas ir dialogo lange spustelėkite mėlyną mygtuką

7. Tada, panašiai kaip 1 masyve, spustelėkite šalia eilutės esantį mėlyną mygtuką Masyvas2

8. Parinkime duomenis masyvas2- stulpelis Nepasitikėjimas savimi ir dar kartą paspauskite mėlyną mygtuką, tada OK

9.Čia apskaičiuojamas ir į pasirinktą langelį įrašomas r-Pearson koreliacijos koeficientas.Mūsų atveju jis yra teigiamas ir apytiksliai lygus. Tai kalba apie vidutiniškai teigiamas ryšiai tarp pirmokų agresyvumo ir nepasitikėjimo savimi

Taigi, statistinė išvada eksperimentas bus: r = 0,225, buvo atskleistas vidutinis teigiamas ryšys tarp kintamųjų agresyvumas ir nepasitikėjimas savimi.

Kai kuriuose tyrimuose reikalaujama nurodyti koreliacijos koeficiento p reikšmingumo lygį, tačiau Excel, skirtingai nei SPSS, tokios galimybės nesuteikia. Viskas gerai, yra kritinių koreliacijų verčių lentelės (A.D. Nasledovas).

Taip pat galite sukurti regresijos liniją programoje Excel ir pridėti ją prie tyrimo rezultatų.

Kelių rodiklių priklausomybės laipsniui nustatyti naudojami keli koreliacijos koeficientai. Tada jie apibendrinami atskiroje lentelėje, kuri vadinama koreliacijos matrica. Tokios matricos eilučių ir stulpelių pavadinimai yra parametrų, kurių priklausomybė viena nuo kitos nustatoma, pavadinimai. Atitinkami koreliacijos koeficientai yra eilučių ir stulpelių sankirtoje. Išsiaiškinkime, kaip galite atlikti panašų skaičiavimą naudodami „Excel“ įrankius.

Įvairių rodiklių ryšio lygį įprasta nustatyti taip, atsižvelgiant į koreliacijos koeficientą:

0 - 0,3 - nėra ryšio;
0,3 - 0,5 - silpnas ryšys;
0,5 - 0,7 - vidutinis ryšys;
0,7 - 0,9 - aukštas;
0,9 - 1 - labai stiprus.

Jei koreliacijos koeficientas yra neigiamas, tai reiškia, kad parametrų ryšys yra atvirkštinis.

Norint sudaryti koreliacijos matricą Excel, naudojamas vienas įrankis, įtrauktas į paketą "Duomenų analizė". Taip tai vadinasi - "Koreliacija". Pažiūrėkime, kaip jį galima naudoti norint apskaičiuoti kelis koreliacijos balus.

1 veiksmas: suaktyvinkite analizės paketą

Iš karto reikia pasakyti, kad numatytasis paketas "Duomenų analizė" neįgalus. Todėl prieš pradėdami tiesioginio koreliacijos koeficientų skaičiavimo procedūrą, turite ją suaktyvinti. Deja, ne kiekvienas vartotojas žino, kaip tai padaryti. Todėl mes sutelksime dėmesį į šią problemą.

Atlikus nurodytą veiksmą, įrankių paketas "Duomenų analizė" bus suaktyvintas.

2 etapas: koeficiento skaičiavimas

Dabar galite pereiti tiesiai prie daugialypės koreliacijos koeficiento skaičiavimo. Apskaičiuokime šių veiksnių daugkartinį koreliacijos koeficientą, naudodami įvairių įmonių darbo našumo, kapitalo ir darbo santykio bei galios ir svorio santykio rodiklių lentelės pavyzdį.

3 etapas: rezultato analizė

Dabar išsiaiškinkime, kaip suprasti rezultatą, kurį gavome apdorojant duomenis naudojant įrankį "Koreliacija" programoje Excel.

Kaip matome iš lentelės, kapitalo ir darbo santykio koreliacijos koeficientas (2 stulpelis) ir galios ir svorio santykį ( 1 stulpelis) yra 0,92, o tai atitinka labai stiprų ryšį. Tarp darbo našumo ( 3 stulpelis) ir galios ir svorio santykį ( 1 stulpelis) šis rodiklis yra lygus 0,72, o tai yra didelis priklausomybės laipsnis. Koreliacijos koeficientas tarp darbo našumo ( 3 stulpelis) ir kapitalo ir darbo santykio ( 2 stulpelis) yra lygus 0,88, o tai taip pat atitinka aukštas laipsnis priklausomybės. Taigi galima teigti, kad ryšys tarp visų tirtų veiksnių gali būti gana stiprus.

Kaip matote, pakuotė "Duomenų analizė" programoje Excel yra labai patogus ir gana paprastas naudoti daugialypės koreliacijos koeficiento nustatymo įrankis. Jis taip pat gali būti naudojamas įprastai dviejų veiksnių koreliacijai apskaičiuoti.

„Koreliacija“ lotyniškai reiškia „koreliacija“, „santykis“. Kiekybinę ryšio charakteristiką galima gauti apskaičiavus koreliacijos koeficientą. Šis statistinėje analizėje populiarus koeficientas parodo, ar kokie nors parametrai yra tarpusavyje susiję (pavyzdžiui, ūgis ir svoris; intelekto lygis ir akademiniai pasiekimai; traumų skaičius ir darbo valandos).

Naudojant koreliaciją

Koreliacijos skaičiavimas ypač plačiai naudojamas ekonomikoje, sociologiniuose tyrimuose, medicinoje ir biometrijoje – visur, kur galima gauti du duomenų rinkinius, tarp kurių galima rasti ryšį.

Koreliaciją galite apskaičiuoti rankiniu būdu, atlikdami paprastas aritmetines operacijas. Tačiau skaičiavimo procesas yra labai daug laiko, jei duomenų rinkinys yra didelis. Metodo ypatumas yra tas, kad jį reikia surinkti didelis skaičiusšaltinio duomenis, kad tiksliausiai parodytų, ar yra ryšys tarp funkcijų. Todėl rimtai panaudoti koreliacinę analizę neįmanoma be kompiuterinių technologijų. Viena iš populiariausių ir prieinamiausių šios problemos sprendimo programų yra.

Kaip atlikti koreliaciją „Excel“?

Daugiausiai laiko reikalaujantis veiksmas nustatant koreliaciją yra duomenų rinkinys. Palygintini duomenys paprastai išdėstomi dviem stulpeliais arba eilutėmis. Lentelė turi būti padaryta be tarpų ląstelėse. Šiuolaikinės Excel versijos (nuo 2007 m. ir jaunesnės) nereikalauja papildomų nustatymų statistiniams skaičiavimams; Galima atlikti būtinas manipuliacijas:

Pasirinkite tuščią langelį, kuriame bus rodomas skaičiavimo rezultatas.
Pagrindiniame „Excel“ meniu spustelėkite elementą „Formulės“.
Tarp mygtukų, sugrupuotų „Funkcijų bibliotekoje“, pasirinkite „Kitos funkcijos“.
Išskleidžiamuose sąrašuose pasirinkite koreliacijos skaičiavimo funkciją (Statistical – CORREL).
„Excel“ atidaro skydelį Funkcijos argumentai. „1 masyvas“ ir „2 masyvas“ yra lyginamų duomenų diapazonai. Norėdami automatiškai užpildyti šiuos laukus, galite tiesiog pasirinkti norimus lentelės langelius.
Spustelėkite Gerai, kad uždarytumėte funkcijos argumentų langą. Apskaičiuotas koreliacijos koeficientas bus rodomas langelyje.

Koreliacija gali būti tiesioginė (jei koeficientas didesnis už nulį) ir atvirkštinė (nuo -1 iki 0).

Pirmasis reiškia, kad didėjant vienam parametrui, didėja ir kitas. Atvirkštinė (neigiama) koreliacija atspindi tai, kad vienam kintamajam didėjant, kitas mažėja.

Koreliacija gali būti artima nuliui. Paprastai tai rodo, kad tiriami parametrai nėra tarpusavyje susiję. Tačiau kartais nulinė koreliacija atsiranda, jei sudaroma nesėkminga imtis, kuri neatspindi ryšio, arba ryšys yra sudėtingas nelinijinis.

Jei koeficientas rodo vidutinį arba stiprų ryšį (nuo ±0,5 iki ±0,99), reikia atminti, kad tai tik statistinis ryšys, kuris visiškai negarantuoja vieno parametro įtakos kitam. Taip pat negalima atmesti situacijos, kad abu parametrai yra nepriklausomi vienas nuo kito, tačiau juos veikia koks nors trečias neįvertintas veiksnys. „Excel“ padeda akimirksniu apskaičiuoti koreliacijos koeficientą, tačiau dažniausiai vien kiekybinių metodų nepakanka, kad būtų galima nustatyti priežastinius ryšius koreliuojamose imtyse.

Šiandienos straipsnyje kalbėsime apie tai, kaip kintamieji gali būti susiję vienas su kitu. Koreliacijos pagalba galėsime nustatyti, ar yra ryšys tarp pirmojo ir antrojo kintamųjų. Tikiuosi, kad ši pamoka bus tokia pat įdomi kaip ir ankstesnės!

Koreliacija matuoja ryšio tarp x ir y stiprumą ir kryptį. Paveikslėlyje parodyta Įvairių tipų koreliacijos tvarkingų porų (x, y) sklaidos diagramų pavidalu. Tradiciškai x yra horizontalioje ašyje, o y – vertikalioje.

Grafikas A yra teigiamos tiesinės koreliacijos pavyzdys: x didėjant, y taip pat didėja ir tiesiškai. B diagrama rodo neigiamos tiesinės koreliacijos pavyzdį, kai x didėjant, y tiesiškai mažėja. Grafike C nematome koreliacijos tarp x ir y. Šie kintamieji niekaip neveikia vienas kito.

Galiausiai, diagrama D yra netiesinių ryšių tarp kintamųjų pavyzdys. Kai x didėja, y pirmiausia mažėja, tada keičia kryptį ir didėja.

Likusi straipsnio dalis skirta tiesiniams priklausomų ir nepriklausomų kintamųjų ryšiams.

Koreliacijos koeficientas

Koreliacijos koeficientas r suteikia mums ryšio tarp nepriklausomų ir priklausomų kintamųjų stiprumą ir kryptį. R reikšmės yra nuo -1,0 iki +1,0. Kai r yra teigiamas, ryšys tarp x ir y yra teigiamas (paveiksle A brėžinys), o kai r yra neigiamas, ryšys taip pat yra neigiamas (brėžinys B). Koreliacijos koeficientas, artimas nuliui, rodo, kad tarp x ir y nėra grafiko C.

Ryšio tarp x ir y stiprumas nustatomas pagal koreliacijos koeficiento artumą - 1,0 arba + - 1,0. Išstudijuokite toliau pateiktą paveikslą.

A diagrama rodo tobulą teigiamą koreliaciją tarp x ir y, kai r = + 1,0. B diagrama yra tobula neigiama koreliacija tarp x ir y, kai r = -1,0. C ir D grafikai yra silpnesnių priklausomų ir nepriklausomų kintamųjų ryšių pavyzdžiai.

Koreliacijos koeficientas, r, lemia priklausomo ir nepriklausomo kintamųjų ryšio stiprumą ir kryptį. r reikšmės svyruoja nuo -1,0 (stipri neigiama asociacija) iki +1,0 (stipri teigiama asociacija). Jei r = 0, nėra ryšio tarp x ir y.

Faktinį koreliacijos koeficientą galime apskaičiuoti naudodami šią lygtį:

Na gerai! Žinau, kad ši lygtis atrodo kaip baisus neaiškių simbolių kratinys, bet kol nepanikuojame, pritaikykime jai egzamino pažymio pavyzdį. Tarkime, noriu nustatyti, ar yra ryšys tarp valandų, kurias studentas praleidžia studijuodamas statistiką, ir baigiamojo egzamino pažymio. Toliau pateikta lentelė padės mums suskaidyti šią lygtį į kelis paprastus skaičiavimus ir padaryti juos lengviau valdomus.

Kaip matote, tarp valandų, praleistų studijuojant dalyką, ir egzamino pažymio yra labai stipri teigiama koreliacija. Mokytojams bus labai malonu apie tai sužinoti.

Kuo naudingas ryšys tarp panašių kintamųjų? Puikus klausimas. Jei nustatomas ryšys, galime numatyti egzaminų balus pagal tam tikrą valandų skaičių, praleistų studijuojant dalyką. Paprasčiau tariant, kuo stipresni santykiai, tuo tikslesnės bus mūsų prognozės.

„Excel“ naudojimas koreliacijos koeficientams apskaičiuoti

Esu tikras, kad pažvelgę į šiuos siaubingus koreliacijos koeficiento skaičiavimus patirsite tikrą džiaugsmą žinodami, kad „Excel“ gali atlikti visą šį darbą už jus naudodama CORREL funkciją, pasižyminčią šiomis savybėmis:

CORREL(masyvas 1; masyvas 2),

1 masyvas = pirmojo kintamojo duomenų diapazonas,

masyvas 2 = antrojo kintamojo duomenų diapazonas.

Pavyzdžiui, paveikslėlyje parodyta funkcija CORREL, naudojama skaičiuojant egzamino pažymio pavyzdžio koreliacijos koeficientą.

Koreliacijos koeficientas (arba tiesinės koreliacijos koeficientas) žymimas "r" (retais atvejais - "ρ") ir apibūdina dviejų ar daugiau kintamųjų tiesinę koreliaciją (ty ryšį, kurį suteikia tam tikra reikšmė ir kryptis). . Koeficiento reikšmė yra nuo -1 iki +1, tai yra, koreliacija gali būti ir teigiama, ir neigiama. Jei koreliacijos koeficientas yra -1, yra tobula neigiama koreliacija; jei koreliacijos koeficientas yra +1, yra tobula teigiama koreliacija. Kitais atvejais tarp dviejų kintamųjų yra teigiama koreliacija, neigiama koreliacija arba jos nėra. Koreliacijos koeficientą galima apskaičiuoti rankiniu būdu, naudojant nemokamus internetinius skaičiuotuvus arba naudojant gerą grafinį skaičiuotuvą.

Žingsniai

Koreliacijos koeficiento apskaičiavimas rankiniu būdu

Surinkite duomenis. Prieš pradėdami skaičiuoti koreliacijos koeficientą, išnagrinėkite pateiktą skaičių porą. Juos geriau surašyti į lentelę, kurią galima išdėstyti vertikaliai arba horizontaliai. Pažymėkite kiekvieną eilutę ar stulpelį „x“ ir „y“.

Pavyzdžiui, pateiktos keturios kintamųjų „x“ ir „y“ verčių (skaičių) poros. Galite sukurti tokią lentelę:
- x || y
- 1 || 1
- 2 || 3
- 4 || 5
- 5 || 7

Apskaičiuokite aritmetinį vidurkį „x“. Norėdami tai padaryti, sudėkite visas „x“ reikšmes ir padalykite rezultatą iš reikšmių skaičiaus.
- Mūsų pavyzdyje mums pateikiamos keturios kintamojo "x" reikšmės. Norėdami apskaičiuoti aritmetinį vidurkį "x", pridėkite šias reikšmes ir padalykite sumą iš 4. Skaičiavimai bus parašyti taip:
- μ x = (1 + 2 + 4 + 5) / 4 (\displaystyle \mu _(x)=(1+2+4+5)/4)
- μ x = 12 / 4 (\displaystyle \mu _(x) = 12/4)
- μ x = 3 (\displaystyle \mu _(x) = 3)
Raskite aritmetinį vidurkį „y“. Norėdami tai padaryti, atlikite tuos pačius veiksmus, tai yra, sudėkite visas „y“ reikšmes ir padalykite sumą iš reikšmių skaičiaus.
- Mūsų pavyzdyje mums pateikiamos keturios kintamojo "y" reikšmės. Sudėkite šias reikšmes ir padalykite sumą iš 4. Skaičiavimai bus parašyti taip:
- μ y = (1 + 3 + 5 + 7) / 4 (\displaystyle \mu _(y)=(1+3+5+7)/4)
- μ y = 16 / 4 (\displaystyle \mu _(y) = 16/4)
- μ y = 4 (\displaystyle \mu _(y) = 4)
Apskaičiuokite standartinį „x“ nuokrypį. Apskaičiavę „x“ ir „y“ vidurkius, raskite standartiniai nuokrypiaišiuos kintamuosius. Standartinis nuokrypis apskaičiuojamas pagal šią formulę:
- σ x = 1 n − 1 Σ (x − μ x) 2 (\displaystyle \sigma _(x)=(\sqrt ((\frac (1)(n-1))\Sigma (x-\mu _( x))^(2))))
- σ x = 1 4 − 1 ∗ ((1 − 3) 2 + (2 − 3) 2 + (4 − 3) 2 + (5 − 3) 2) (\displaystyle \sigma _(x)=(\sqrt ((\frac (1)(4-1))*((1-3)^(2)+(2-3)^(2)+(4-3)^(2)+(5-3) ^(2))))
- σ x = 1 3 ∗ (4 + 1 + 1 + 4) (\displaystyle \sigma _(x)=(\sqrt ((\frac (1)(3))*(4+1+1+4)) ))
- σ x = 1 3 ∗ (10) (\displaystyle \sigma _(x)=(\sqrt ((\frac (1)(3))*(10))))
- σ x = 10 3 (\displaystyle \sigma _(x)=(\sqrt (\frac (10)(3))))
- σ x = 1 , 83 (\displaystyle \sigma _(x) = 1,83)
Apskaičiuokite standartinį nuokrypį "y". Atlikite ankstesniame žingsnyje nurodytus veiksmus. Naudokite tą pačią formulę, bet pakeiskite ja "y" reikšmes.
- Mūsų pavyzdyje skaičiavimai bus parašyti taip:
- σ y = 1 4 − 1 ∗ ((1 − 4) 2 + (3 − 4) 2 + (5 − 4) 2 + (7 − 4) 2) (\displaystyle \sigma _(y)=(\sqrt ((\frac (1)(4-1))*((1-4)^(2)+(3-4)^(2)+(5-4)^(2)+(7-4) ^(2))))
- σ y = 1 3 ∗ (9 + 1 + 1 + 9) (\displaystyle \sigma _(y)=(\sqrt ((\frac (1)(3))*(9+1+1+9)) ))
- σ y = 1 3 ∗ (20) (\displaystyle \sigma _(y)=(\sqrt ((\frac (1)(3))*(20))))
- σ y = 20 3 (\displaystyle \sigma _(y)=(\sqrt (\frac (20)(3))))
- σ y = 2 , 58 (\displaystyle \sigma _(y) = 2,58)
Užrašykite pagrindinę koreliacijos koeficiento skaičiavimo formulę.Ši formulė apima vidurkius, standartinius nuokrypius ir abiejų kintamųjų skaičių porų skaičių (n). Koreliacijos koeficientas žymimas "r" (retais atvejais - "ρ"). Šiame straipsnyje naudojama formulė Pirsono koreliacijos koeficientui apskaičiuoti.
- Čia ir kituose šaltiniuose kiekiai gali būti žymimi įvairiai. Pavyzdžiui, kai kurios formulės turi „ρ“ ir „σ“, o kitos – „r“ ir „s“. Kai kuriuose vadovėliuose pateikiamos kitos formulės, tačiau jos yra matematinis aukščiau pateiktos formulės atitikmuo.
Apskaičiavote abiejų kintamųjų vidurkius ir standartinius nuokrypius, todėl koreliacijos koeficientui apskaičiuoti galite naudoti formulę. Prisiminkite, kad „n“ yra abiejų kintamųjų verčių porų skaičius. Kitų dydžių vertė buvo apskaičiuota anksčiau.
- Mūsų pavyzdyje skaičiavimai bus parašyti taip:
- ρ = (1 n − 1) Σ (x − μ x σ x) ∗ (y − μ y σ y) (\displaystyle \rho =\left((\frac (1)(n-1))\right) \Sigma \left((\frac (x-\mu _(x))(\sigma _(x)))\right)*\left((\frac (y-\mu _(y))(\sigma _(y)))\right))
- ρ = (1 3) ∗ (\displaystyle \rho =\left((\frac (1)(3))\right)*)[ (1 − 3 1 , 83) ∗ (1 − 4 2 , 58) + (2 − 3 1 , 83) ∗ (3 − 4 2, 58) (\displaystyle \left((\frac (1-3)) 1.83))\right)*\left((\frac (1-4)(2.58))\right)+\left((\frac (2-3)(1.83))\right) *\left((\ Frac (3-4)(2,58))\right))
  + (4 − 3 1, 83) ∗ (5 − 4 2, 58) + (5 − 3 1, 83) ∗ (7 − 4 2, 58) (\displaystyle +\left((\frac (4-3) )(1.83))\right)*\left((\frac (5-4)(2.58))\right)+\left((\frac (5-3)(1.83))\right)*\left( (\frac (7-4)(2,58))\right))]
- ρ = (1 3) ∗ (6 + 1 + 1 + 6 4 , 721) (\displaystyle \rho =\left((\frac (1)(3))\right)*\left((\frac (6) +1+1+6)(4 721))\dešinė))
- ρ = (1 3) ∗ 2 , 965 (\displaystyle \rho =\left((\frac (1)(3))\right)*2,965)
- ρ = (2 , 965 3) (\displaystyle \rho =\left((\frac (2,965)(3))\right))
- ρ = 0 . 988 (\displaystyle \rho = 0,988)
Išanalizuokite rezultatą. Mūsų pavyzdyje koreliacijos koeficientas yra 0,988. Ši vertė tam tikru būdu apibūdina šis rinkinys skaičių poros. Atkreipkite dėmesį į vertės ženklą ir dydį.
- Kadangi koreliacijos koeficiento reikšmė yra teigiama, tarp kintamųjų „x“ ir „y“ yra teigiama koreliacija. Tai yra, kai „x“ reikšmė didėja, „y“ reikšmė taip pat didėja.
- Kadangi koreliacijos koeficiento reikšmė yra labai artima +1, x ir y kintamųjų reikšmės labai koreliuoja. Jei įdėsite taškus į koordinačių plokštumą, jie bus arti tiesios linijos.
Internetinių skaičiuoklių naudojimas koreliacijos koeficientui apskaičiuoti
1. Internete susiraskite skaičiuotuvą koreliacijos koeficientui apskaičiuoti.Šis koeficientas dažnai skaičiuojamas statistikoje. Jei skaičių porų yra daug, koreliacijos koeficiento rankiniu būdu apskaičiuoti praktiškai neįmanoma. Todėl yra internetiniai skaičiuotuvai koreliacijos koeficientui apskaičiuoti. Paieškos sistemoje įveskite „koreliacijos koeficiento skaičiuoklė“ (be kabučių).
2. Įveskite duomenis. Norėdami teisingai įvesti duomenis (skaičių poras), perskaitykite instrukcijas svetainėje. Labai svarbu įvesti atitinkamas skaičių poras; kitaip gausite neteisingą rezultatą. Atminkite, kad skirtingose svetainėse yra skirtingi duomenų įvedimo formatai.
  - Pavyzdžiui, svetainėje http://ncalculators.com/statistics/correlation-coefficient-calculator.htm kintamųjų „x“ ir „y“ reikšmės įvedamos į dvi horizontalias eilutes. Reikšmės atskiriamos kableliais. Tai yra, mūsų pavyzdyje „x“ reikšmės įvedamos taip: 1,2,4,5, o „y“ reikšmės yra tokios: 1,3,5,7.
  - Kitoje svetainėje, http://www.alcula.com/calculators/statistics/correlation-coefficient/ , duomenys įvedami vertikaliai; šiuo atveju nepainiokite atitinkamų skaičių porų.
3. Apskaičiuokite koreliacijos koeficientą.Įvedę duomenis, tiesiog spustelėkite mygtuką „Apskaičiuoti“, „Apskaičiuoti“ ar panašų mygtuką, kad gautumėte rezultatą.
  
  Grafinės skaičiuoklės naudojimas
  1. Įveskite duomenis. Paimkite grafinį skaičiuotuvą, perjunkite į statistinio skaičiavimo režimą ir pasirinkite komandą Redaguoti.
    - Skirtinguose skaičiuotuvuose reikia paspausti skirtingus klavišus. Šiame straipsnyje dėmesys sutelkiamas į Texas Instruments TI-86 skaičiuotuvą.
    - Norėdami perjungti į statistinio skaičiavimo režimą, paspauskite - Stat (virš „+“ klavišo). Tada paspauskite F2 - Redaguoti (Redaguoti).
  2. Ištrinkite ankstesnius išsaugotus duomenis. Daugelis skaičiuotuvų saugo įvestą statistiką, kol ją išvalysite. Kad nesupainiotumėte senų ir naujų duomenų, pirmiausia ištrinkite visą saugomą informaciją.
    - Rodyklių klavišais perkelkite žymeklį ir pažymėkite antraštę „xStat“. Tada paspauskite Clear ir Enter, kad išvalytumėte visas stulpelyje xStat įvestas reikšmes.
    - Rodyklių klavišais pažymėkite antraštę „yStat“. Tada paspauskite Clear ir Enter, kad išvalytumėte visas yStat stulpelyje įvestas reikšmes.
  3. Įveskite pradinius duomenis. Rodyklių klavišais perkelkite žymeklį į pirmą langelį po antrašte „xStat“. Įveskite pirmąją reikšmę ir paspauskite Enter. Ekrano apačioje bus rodoma "xStat (1) = __", o įvesta vertė vietoj tarpo. Paspaudus Enter, įvesta reikšmė atsiras lentelėje, o žymeklis pereis į kitą eilutę; ekrano apačioje bus rodoma „xStat(2) = __“.
    - Įveskite visas kintamojo "x" reikšmes.
    - Įvedę visas x kintamojo reikšmes, rodyklių klavišais pereikite į stulpelį yStat ir įveskite y kintamojo reikšmes.
    - Įvedę visas skaičių poras, paspauskite Exit, kad išvalytumėte ekraną ir išeitumėte iš agregavimo režimo.
  4. Apskaičiuokite koreliacijos koeficientą. Jis apibūdina, kaip arti duomenys yra prie kokios nors tiesios linijos. Grafikos skaičiuotuvas gali greitai nustatyti tinkamą tiesę ir apskaičiuoti koreliacijos koeficientą.
    - Spustelėkite Stat (Statistika) – Skaičiavimas (Skaičiavimai). TI-86 paspauskite - - .
    - Pasirinkite funkciją „Tiesinė regresija“. TI-86 paspauskite , kuris pažymėtas "LinR". Ekrane bus rodoma eilutė „LinR _“ su mirksinčiu žymekliu.
    - Dabar įveskite dviejų kintamųjų pavadinimus: xStat ir yStat.
      - TI-86 atidarykite vardų sąrašą; tai padaryti paspauskite – – .
      - Galimi kintamieji rodomi apatinėje ekrano eilutėje. Pasirinkite (greičiausiai paspausdami F1 arba F2), įveskite kablelį ir pasirinkite .
      - Paspauskite Enter, kad apdorotumėte įvestus duomenis.
  5. Išanalizuokite rezultatus. Paspaudus Enter, ekrane bus rodoma ši informacija:
    - y = a + b x (\displaystyle y=a+bx): yra funkcija, apibūdinanti tiesią liniją. Atkreipkite dėmesį, kad funkcija nėra parašyta standartine forma (y = kx + b).
    - a = (\displaystyle a=). Tai taško, kuriame linija kertasi su y ašimi, y koordinatė.
    - b = (\displaystyle b=). Tai yra nuolydis tiesiai.
    - corr = (\displaystyle (\text(corr))=). Tai yra koreliacijos koeficientas.
    - n = (\displaystyle n=). Tai yra skaičių porų, kurios buvo naudojamos skaičiavimuose, skaičius.