Odredite 1 varijansu. Stope apsolutne varijacije

Disperzija u statistici nalazi se kao pojedinačne vrijednosti obilježja u kvadratu od . Ovisno o početnim podacima, određuje se jednostavnim i ponderiranim formulama varijanse:

1. (za negrupirane podatke) se izračunava po formuli:

2. Ponderirana varijansa (za seriju varijacija):

gdje je n frekvencija (faktor ponovljivosti X)

Primjer pronalaženja varijanse

Ova stranica opisuje standardni primjer pronalaženja varijanse, možete pogledati i druge zadatke za njeno pronalaženje

Primjer 1. Za grupu od 20 učenika imamo sljedeće podatke dopisni odjel. Treba izgraditi intervalne serije distribuciju karakteristike, izračunati srednju vrijednost karakteristike i proučiti njenu varijansu

Hajde da napravimo intervalno grupisanje. Odredimo raspon intervala po formuli:

gdje je X max maksimalna vrijednost obilježja grupisanja;
X min je minimalna vrijednost obilježja grupisanja;
n je broj intervala:

Prihvatamo n=5. Korak je: h = (192 - 159) / 5 = 6,6

Napravimo intervalno grupiranje

Za dalje proračune napravićemo pomoćnu tabelu:

X'i je sredina intervala. (na primjer, sredina intervala 159 - 165,6 = 162,3)

Prosječan rast učenika određen je formulom aritmetičkog ponderisanog prosjeka:

Određujemo disperziju po formuli:

Formula varijanse se može pretvoriti na sljedeći način:

Iz ove formule slijedi da varijansa je razlika između srednje vrijednosti kvadrata opcija i kvadrata i srednje vrijednosti.

Disperzija u varijantne serije sa jednakim intervalima prema metodi momenata može se izračunati na sljedeći način korištenjem drugog svojstva disperzije (dijeleći sve opcije vrijednošću intervala). Definicija varijanse, izračunato metodom momenata, prema sljedećoj formuli je manje dugotrajno:

gdje je i vrijednost intervala;
A - uslovna nula, što je pogodno za korištenje sredine intervala s najvećom frekvencijom;
m1 je kvadrat momenta prvog reda;
m2 - trenutak drugog reda

(ako se u statističkoj populaciji atribut mijenja na način da postoje samo dvije međusobno isključive opcije, tada se takva varijabilnost naziva alternativa) može se izračunati po formuli:

Zamena u ovu formulu disperzija q \u003d 1- p, dobijamo:

Vrste disperzije

Ukupna varijansa mjeri varijaciju osobine u cijeloj populaciji kao cjelini pod utjecajem svih faktora koji uzrokuju ovu varijaciju. Jednaka je srednjem kvadratu odstupanja pojedinačnih vrijednosti atributa x od ukupne prosječne vrijednosti x i može se definirati kao jednostavna varijansa ili ponderirana varijansa.

karakterizira slučajnu varijaciju, tj. dio varijacije, koji je posljedica utjecaja neuračunatih faktora i ne zavisi od faktora znaka koji leži u osnovi grupisanja. Ova varijansa je jednaka srednjem kvadratu odstupanja pojedinačnih vrijednosti atributa unutar X grupe od aritmetičke sredine grupe i može se izračunati kao jednostavna varijansa ili kao ponderisana varijansa.

Na ovaj način, mjere varijance unutar grupe varijacija osobine unutar grupe i određena je formulom:

gdje je xi - prosjek grupe;
ni je broj jedinica u grupi.

Na primjer, unutargrupne varijanse, koje se moraju utvrditi u zadatku proučavanja uticaja kvalifikacija radnika na nivo produktivnosti rada u radnji, pokazuju varijacije u proizvodnji u svakoj grupi, uzrokovane svim mogući faktori (tehničkom stanju opreme, dostupnosti alata i materijala, starosti radnika, intenziteta rada itd.), osim razlika u kvalifikacionoj kategoriji (unutar grupe svi radnici imaju iste kvalifikacije).

Prosjek varijansi unutar grupe odražava slučajni, odnosno onaj dio varijacije koji je nastao pod utjecajem svih ostalih faktora, osim faktora grupisanja. Izračunava se po formuli:

Karakteriše sistematsku varijaciju rezultujuće osobine, koja je posledica uticaja faktora osobine koji leži u osnovi grupisanja. Jednaka je srednjem kvadratu odstupanja grupnih srednjih vrijednosti od ukupne srednje vrijednosti. Međugrupna varijansa se izračunava po formuli:

Pravilo dodavanja varijanse u statistici

Prema pravilo dodavanja varijanse totalna varijansa jednak je zbroju prosjeka unutargrupne i međugrupne disperzije:

Značenje ovog pravila je da je ukupna varijansa koja nastaje pod uticajem svih faktora jednaka zbiru varijansi koje nastaju pod uticajem svih ostalih faktora, i varijanse koja nastaje usled faktora grupisanja.

Koristeći formulu za sabiranje varijansi, moguće je odrediti treću nepoznatu iz dvije poznate varijanse, kao i procijeniti jačinu uticaja atributa grupisanja.

Svojstva disperzije

1. Ako se sve vrijednosti atributa smanje (povećaju) za istu konstantnu vrijednost, tada se varijansa neće promijeniti od ovoga.
2. Ako se sve vrijednosti atributa smanje (povećaju) za isti broj puta n, tada će se varijansa shodno tome smanjiti (povećati) za n^2 puta.

Disperzijaslučajna varijabla- mjera disperzije datog slučajna varijabla, odnosno nju odstupanja od matematičko očekivanje. U statistici, notacija (sigma na kvadrat) se često koristi za označavanje varijanse. Kvadratni korijen varijanse se naziva standardna devijacija ili standardni namaz. Standardna devijacija se mjeri u istim jedinicama kao i slučajna vrijednost, a varijansa se mjeri u kvadratima te jedinice.

Iako je vrlo zgodno koristiti samo jednu vrijednost (kao što je srednja vrijednost ili mod i medijan) za procjenu cijelog uzorka, ovaj pristup može lako dovesti do pogrešnih zaključaka. Razlog za ovu situaciju nije u samoj vrijednosti, već u činjenici da jedna vrijednost ni na koji način ne odražava širenje vrijednosti podataka.

Na primjer, u uzorku:

prosek je 5.

Međutim, u samom uzorku nema elementa sa vrijednošću 5. Možda ćete morati znati koliko je svaki element uzorka blizak svojoj srednjoj vrijednosti. Ili, drugim riječima, morate znati varijansu vrijednosti. Znajući u kojoj mjeri su se podaci promijenili, možete bolje tumačiti znači, medijana i moda. Stepen promjene vrijednosti uzorka određuje se izračunavanjem njihove varijanse i standardne devijacije.



disperzija i Kvadratni korijen varijanse, nazvane standardnom devijacijom, karakteriziraju srednju devijaciju od srednje vrijednosti uzorka. Među ove dvije veličine najvažnija je standardna devijacija . Ova vrijednost se može predstaviti kao prosječna udaljenost na kojoj se elementi nalaze od srednjeg elementa uzorka.

Disperziju je teško smisleno protumačiti. Međutim, kvadratni korijen ove vrijednosti je standardna devijacija i dobro se tumači.

Standardna devijacija se izračunava tako što se prvo odredi varijansa, a zatim izračunava kvadratni korijen varijanse.

Na primjer, za niz podataka prikazan na slici, dobiće se sljedeće vrijednosti:

Slika 1

Ovdje je srednja vrijednost kvadrata razlika 717,43. Da biste dobili standardnu ​​devijaciju, ostaje samo uzeti kvadratni korijen ovog broja.

Rezultat će biti otprilike 26,78.

Treba imati na umu da se standardna devijacija tumači kao prosječna udaljenost na kojoj se elementi nalaze od srednje vrijednosti uzorka.

Standardna devijacija pokazuje koliko dobro srednja vrijednost opisuje cijeli uzorak.

Recimo da ste menadžer odeljenje proizvodnje PC sklop. Kvartalni izvještaj kaže da je proizvodnja za posljednji kvartal bila 2500 računara. Da li je to loše ili dobro? Tražili ste (ili već postoji ova kolona u izvještaju) da se u izvještaju prikaže standardna devijacija za ove podatke. Broj standardne devijacije, na primjer, je 2000. Vama, kao šefu odjeljenja, postaje jasno da je proizvodnoj liniji potrebna bolja kontrola (prevelika odstupanja u broju računara koji se sklapaju).

Podsjetimo: kada velika veličina Ako je standardna devijacija preniska, podaci su široko rasuti oko srednje vrijednosti, a ako je standardna devijacija niska, grupišu se blizu srednje vrijednosti.

Četiri statističke funkcije VAR(), VAR(), STDEV() i STDEV() su dizajnirane da izračunaju varijansu i standardnu ​​devijaciju brojeva u rasponu ćelija. Prije nego što možete izračunati varijansu i standardnu ​​devijaciju skupa podataka, morate odrediti da li podaci predstavljaju populaciju ili uzorak populacije. U slučaju uzorka iz opće populacije, treba koristiti funkcije VARP() i STDEV(), a u slučaju opće populacije, VARP() i STDEV() funkcije:

Populacija Funkcija

VARP()

STDLONG()
Uzorak

VARI()

STDEV()

Disperzija (kao i standardna devijacija), kao što smo primetili, ukazuje na stepen do kojeg su vrednosti uključene u skup podataka raspršene oko aritmetičke sredine.

Mala vrijednost varijanse ili standardne devijacije ukazuje da su svi podaci centrirani oko aritmetičke sredine, i veliki značaj ove vrijednosti - da su podaci rasuti u širokom rasponu vrijednosti.

Varijancu je prilično teško smisleno protumačiti (šta znači mala vrijednost, a velika vrijednost?). Performanse Zadaci 3će vam omogućiti da vizuelno, na grafikonu, pokažete značenje varijanse za skup podataka.

Zadaci

· Vježba 1.

· 2.1. Navedite pojmove: varijansa i standardna devijacija; njihovo simbolično označavanje u statističkoj obradi podataka.

· 2.2. Nacrtajte radni list u skladu sa slikom 1 i izvršite potrebne proračune.

· 2.3. Navedite osnovne formule korištene u proračunima

· 2.4. Objasni sve oznake ( , , )

· 2.5. objasniti praktična vrijednost koncepte varijanse i standardne devijacije.

Zadatak 2.

1.1. Navedite pojmove: opća populacija i uzorak; matematičko očekivanje i aritmetička sredina njihovog simboličkog označavanja u statističkoj obradi podataka.

1.2. U skladu sa slikom 2, sastavite radni list i izvršite proračune.

1.3. Navedite osnovne formule korištene u proračunima (za opću populaciju i uzorak).

Slika 2

1.4. Objasnite zašto je moguće dobiti takve srednje aritmetičke vrijednosti u uzorcima kao što su 46,43 i 48,78 (pogledajte datoteku Dodatka). Izvucite zaključke.

Zadatak 3.

Postoje dva uzorka sa drugačiji set podataka, ali prosjek za njih će biti isti:

Slika 3

3.1. Nacrtajte radni list u skladu sa slikom 3 i izvršite potrebne proračune.

3.2. Navedite osnovne formule za proračun.

3.3. Napravite grafikone u skladu sa slikama 4, 5.

3.4. Objasnite nastale zavisnosti.

3.5. Izvršite slične proračune za ova dva uzorka.

Početni uzorak 11119999

Odaberite vrijednosti drugog uzorka tako da aritmetička sredina za drugi uzorak bude ista, na primjer:

Sami odaberite vrijednosti za drugi uzorak. Rasporedite proračune i crtanje kao na slikama 3, 4, 5. Prikažite glavne formule koje su korištene u proračunima.

Izvucite odgovarajuće zaključke.

Svi zadaci trebaju biti predstavljeni u obliku izvještaja sa svim potrebnim brojkama, grafikonima, formulama i kratkim objašnjenjima.

Napomena: konstrukcija grafikona mora biti objašnjena slikama i kratkim objašnjenjima.

Među brojnim indikatorima koji se koriste u statistici, potrebno je izdvojiti obračun varijanse. Treba napomenuti da je ručno izvođenje ovog proračuna prilično naporan zadatak. Srećom, u Excelu postoje funkcije koje vam omogućavaju automatizaciju postupka izračunavanja. Hajde da saznamo algoritam za rad sa ovim alatima.

Disperzija je indikator varijacije, što je prosječni kvadrat odstupanja od matematičkog očekivanja. Dakle, izražava širenje brojeva oko srednje vrijednosti. Proračun disperzije može se izvršiti i za opću populaciju i za uzorak.

Metoda 1: obračun na opštoj populaciji

Za izračunavanje ovog pokazatelja u Excelu za opću populaciju koristi se funkcija DISP.G. Sintaksa za ovaj izraz je sljedeća:

DISP.G(Broj1;Broj2;…)

Ukupno se može primijeniti od 1 do 255 argumenata. Argumenti mogu biti i numeričke vrijednosti i reference na ćelije u kojima se nalaze.

Pogledajmo kako izračunati ovu vrijednost za raspon numeričkih podataka.


Metoda 2: proračun uzorka

Za razliku od izračunavanja vrijednosti za opštu populaciju, u proračunu za uzorak imenilac nije ukupan broj brojeva, već jedan manje. Ovo se radi kako bi se ispravila greška. Excel uzima u obzir ovu nijansu u posebnoj funkciji koja je dizajnirana za ovu vrstu proračuna - DISP.V. Njegova sintaksa je predstavljena sljedećom formulom:

VAR.B(Broj1;Broj2;…)

Broj argumenata, kao iu prethodnoj funkciji, također može biti u rasponu od 1 do 255.


Kao što vidite, Excel program može uvelike olakšati izračunavanje varijanse. Ova statistika se može izračunati aplikacijom i za populaciju i za uzorak. U ovom slučaju, sve radnje korisnika se zapravo svode samo na određivanje raspona brojeva koji će se obraditi, a Excel sam obavlja glavni posao. Naravno, ovo će korisnicima značajno uštedjeti vrijeme.

Disperzija je mjera disperzije koja opisuje relativno odstupanje između vrijednosti podataka i srednje vrijednosti. To je najčešće korištena mjera disperzije u statistici, izračunata zbrajanjem, kvadratom, odstupanja svake vrijednosti podataka od srednja veličina. Formula za izračunavanje varijanse prikazana je u nastavku:

s 2 - varijansa uzorka;

x cf je srednja vrijednost uzorka;

n veličina uzorka (broj vrijednosti podataka),

(x i – x cf) je odstupanje od srednje vrijednosti za svaku vrijednost skupa podataka.

Da bismo bolje razumjeli formulu, pogledajmo primjer. Ne volim baš da kuvam, pa to retko radim. Međutim, da ne bih umrla od gladi, s vremena na vrijeme moram ići do štednjaka kako bih ostvarila plan za zasićenje tijela proteinima, mastima i ugljikohidratima. Donji skup podataka pokazuje koliko puta Renat kuha hranu svakog mjeseca:

Prvi korak u izračunavanju varijanse je određivanje srednje vrijednosti uzorka, koja je u našem primjeru 7,8 puta mjesečno. Preostali proračuni se mogu olakšati uz pomoć sljedeće tabele.

Završna faza izračunavanja varijanse izgleda ovako:

Za one koji vole da sve proračune rade u jednom potezu, jednadžba će izgledati ovako:

Korištenje metode sirovog brojanja (primjer kuhanja)

Ima još efikasan metod izračunavanje varijanse, poznato kao metoda "sirovog brojanja". Iako na prvi pogled jednačina može izgledati prilično glomazna, u stvari nije toliko strašna. Možete to provjeriti, a zatim odlučiti koja vam se metoda najviše sviđa.

je zbir svake vrijednosti podataka nakon kvadriranja,

je kvadrat zbira svih vrijednosti podataka.

Ne gubi razum sada. Hajde da sve to stavimo u obliku tabele, a onda ćete videti da je ovde manje proračuna nego u prethodnom primeru.

Kao što vidite, rezultat je isti kao pri korištenju prethodne metode. Prednosti ove metode postaju očigledne kako veličina uzorka (n) raste.

Izračunavanje varijanse u Excel-u

Kao što ste verovatno već pretpostavili, Excel ima formulu koja vam omogućava da izračunate varijansu. Štaviše, počevši od Excel 2010, možete pronaći 4 varijante formule disperzije:

1) VAR.V - Vraća varijansu uzorka. Booleove vrijednosti i tekst se zanemaruju.

2) VAR.G - Vraća varijansu populacije. Booleove vrijednosti i tekst se zanemaruju.

3) VASP - Vraća varijansu uzorka, uzimajući u obzir logičke i tekstualne vrijednosti.

4) VARP - Vraća varijansu populacije, uzimajući u obzir logičke i tekstualne vrijednosti.

Prvo, pogledajmo razliku između uzorka i populacije. Svrha deskriptivne statistike je da sumira ili prikaže podatke na takav način da se brzo dobije velika slika, da tako kažemo, pregled. Statističko zaključivanje vam omogućava da napravite zaključke o populaciji na osnovu uzorka podataka iz ove populacije. Populacija predstavlja sve moguće ishode ili mjerenja koja nas zanimaju. Uzorak je podskup populacije.

Na primjer, zanima nas ukupnost grupe učenika jednog od ruski univerziteti i moramo odrediti prosječan rezultat grupe. Možemo izračunati prosječan učinak učenika, a onda će dobijena cifra biti parametar, jer će cijela populacija biti uključena u naše proračune. Međutim, ako želimo da izračunamo GPA svih učenika u našoj zemlji, onda će ova grupa biti naš uzorak.

Razlika u formuli za izračunavanje varijanse između uzorka i populacije je u nazivniku. Pri čemu će za uzorak biti jednako (n-1), a za opštu populaciju samo n.

Sada se pozabavimo funkcijama izračunavanja varijanse sa završetcima A, u čijem opisu se kaže da se u proračunu uzimaju u obzir tekstualne i logičke vrijednosti. U ovom slučaju, kada izračunava varijansu određenog skupa podataka u kojem se pojavljuju nenumeričke vrijednosti, Excel će tumačiti tekst i lažne logičke vrijednosti kao 0, a prave logičke vrijednosti kao 1.

Dakle, ako imate niz podataka, neće biti teško izračunati njegovu varijansu pomoću jedne od gore navedenih Excel funkcija.

.

Obrnuto, ako je nenegativna a.e. funkcija takva da , tada postoji apsolutno neprekidna mjera vjerovatnoće na takvom što je njegova gustina.

    Promjena mjere u Lebesgueovom integralu:

,

gdje je bilo koja Borelova funkcija integrabilna s obzirom na mjeru vjerovatnoće .

Disperzija, vrste i svojstva disperzije Pojam disperzije

Disperzija u statistici nalazi se kao standardna devijacija pojedinačnih vrijednosti osobine na kvadrat od aritmetičke sredine. Ovisno o početnim podacima, određuje se jednostavnim i ponderiranim formulama varijanse:

1. jednostavna varijansa(za negrupirane podatke) se izračunava po formuli:

2. Ponderirana varijansa (za seriju varijacija):

gdje je n - frekvencija (faktor ponovljivosti X)

Primjer pronalaženja varijanse

Ova stranica opisuje standardni primjer pronalaženja varijanse, možete pogledati i druge zadatke za njeno pronalaženje

Primjer 1. Određivanje grupe, prosjeka grupe, između grupe i ukupne varijanse

Primjer 2. Pronalaženje varijanse i koeficijenta varijacije u tabeli grupisanja

Primjer 3. Pronalaženje varijanse u diskretnom nizu

Primjer 4. Za grupu od 20 dopisnih studenata imamo sljedeće podatke. Potrebno je izgraditi intervalnu seriju distribucije obeležja, izračunati srednju vrednost obeležja i proučiti njegovu varijansu

Hajde da napravimo intervalno grupisanje. Odredimo raspon intervala po formuli:

gdje je X max maksimalna vrijednost obilježja grupisanja; X min je minimalna vrijednost obilježja grupisanja; n je broj intervala:

Prihvatamo n=5. Korak je: h = (192 - 159) / 5 = 6,6

Napravimo intervalno grupiranje

Za dalje proračune napravićemo pomoćnu tabelu:

X "i - sredina intervala. (na primjer, sredina intervala 159 - 165,6 \u003d 162,3)

Prosječan rast učenika određen je formulom aritmetičkog ponderisanog prosjeka:

Određujemo disperziju po formuli:

Formula se može pretvoriti na sljedeći način:

Iz ove formule slijedi da varijansa je razlika između srednje vrijednosti kvadrata opcija i kvadrata i srednje vrijednosti.

Varijanca u serijama varijacija sa jednakim intervalima prema metodi momenata može se izračunati na sljedeći način korištenjem drugog svojstva disperzije (dijeleći sve opcije vrijednošću intervala). Definicija varijanse, izračunato metodom momenata, prema sljedećoj formuli je manje dugotrajno:

gdje je i vrijednost intervala; A - uslovna nula, što je pogodno za korištenje sredine intervala s najvećom frekvencijom; m1 je kvadrat momenta prvog reda; m2 - trenutak drugog reda

Varijanca karakteristika (ako se u statističkoj populaciji atribut mijenja na način da postoje samo dvije međusobno isključive opcije, tada se takva varijabilnost naziva alternativa) može se izračunati po formuli:

Zamjenom u ovoj formuli disperzije q = 1- p, dobijamo:

Vrste disperzije

Ukupna varijansa mjeri varijaciju osobine u cijeloj populaciji kao cjelini pod utjecajem svih faktora koji uzrokuju ovu varijaciju. Jednaka je srednjem kvadratu odstupanja pojedinačnih vrijednosti atributa x od ukupne prosječne vrijednosti x i može se definirati kao jednostavna varijansa ili ponderirana varijansa.

Unutargrupna varijansa karakterizira slučajnu varijaciju, tj. dio varijacije, koji je posljedica utjecaja neuračunatih faktora i ne zavisi od faktora znaka koji leži u osnovi grupisanja. Ova varijansa je jednaka srednjem kvadratu odstupanja pojedinačnih vrijednosti atributa unutar X grupe od aritmetičke sredine grupe i može se izračunati kao jednostavna varijansa ili kao ponderisana varijansa.

Na ovaj način, mjere varijance unutar grupe varijacija osobine unutar grupe i određena je formulom:

gdje je xi - prosjek grupe; ni je broj jedinica u grupi.

Na primjer, unutargrupne varijanse koje je potrebno utvrditi u zadatku proučavanja uticaja kvalifikacija radnika na nivo produktivnosti rada u radnji pokazuju varijacije u proizvodnji u svakoj grupi uzrokovane svim mogućim faktorima (tehničko stanje opreme, dostupnost alata i materijala, starost radnika, intenzitet rada itd.), osim razlika u kvalifikacionoj kategoriji (unutar grupe svi radnici imaju istu kvalifikaciju).

Prosjek varijansi unutar grupe odražava slučajnu varijaciju, odnosno onaj dio varijacije koji je nastao pod utjecajem svih ostalih faktora, osim faktora grupisanja. Izračunava se po formuli:

Međugrupna varijansa karakteriše sistematsku varijaciju rezultujuće osobine, koja je posledica uticaja faktora osobine koji leži u osnovi grupisanja. Jednaka je srednjem kvadratu odstupanja grupnih srednjih vrijednosti od ukupne srednje vrijednosti. Međugrupna varijansa se izračunava po formuli: