Izgradnja distribucijske serije. Statistički sažetak i grupisanje. Statističke distribucijske serije. Primjeri rješavanja problema

2. Koncept distributivnih serija. Diskretne i intervalne distribucijske serije

redovi distribucije nazivaju se grupacije posebnog tipa u kojima je za svaki atribut, grupu atributa ili klasu atributa poznat broj jedinica u grupi, ili specifična gravitacija ovaj broj ukupno. One. distribucijske serije– uređeni skup vrijednosti atributa raspoređenih u rastućem ili opadajućem redoslijedu s njihovim odgovarajućim težinama. Redovi distribucije mogu se graditi bilo kvantitativno ili po atributu.

Redovi distribucije izgrađeni na kvantitativnoj osnovi nazivaju se varijacionim serijama. Oni su diskretno i intervalno. Serija distribucije može se izgraditi na kontinuirano promjenljivoj osobini (kada obilježje može poprimiti bilo koju vrijednost unutar intervala) i na diskretno promjenljivoj osobini (uzima strogo definirane cjelobrojne vrijednosti).

diskretno varijaciona serija distribucije je raspoređeni skup varijanti sa njihovim odgovarajućim frekvencijama ili pojedinostima. Varijante diskretnog niza su diskretno diskretno mijenjanje vrijednosti znaka, obično je to rezultat brojanja.

Diskretno

varijacijski nizovi se obično grade ako se vrijednosti ispitivane osobine mogu razlikovati jedna od druge za barem neku konačnu vrijednost. U diskretnim serijama specificiraju se bodovne vrijednosti neke karakteristike. Primjer : Distribucija muških odijela koji se prodaju po trgovinama mjesečno po veličini.

interval

varijacijski niz je uređen skup intervala varijacije vrijednosti slučajna varijabla s odgovarajućim frekvencijama ili frekvencijama vrijednosti veličine koje pogađaju svaku od njih. Intervalne serije su dizajnirane da analiziraju distribuciju svojstva koja se kontinuirano mijenjaju, čija se vrijednost najčešće bilježi mjerenjem ili ponderisanjem. Varijanta takvog reda je grupisanje.

Primjer : Distribucija nabavki u Prodavnica po iznosu.

Ako se u diskretnim varijacionim serijama frekvencijski odziv odnosi direktno na varijantu serije, onda u intervalnim na grupu varijanti.

Pogodno je analizirati nizove distribucije uz pomoć njihovog grafičkog prikaza, što omogućava prosuđivanje i oblika distribucije i obrazaca. Diskretna serija je prikazana na grafikonu kao isprekidana linija - područje distribucije. Da bi se izgradio u pravokutnom koordinatnom sistemu, rangirane (uređene) vrijednosti promjenjivog obilježja iscrtavaju se na apscisi na istoj skali, a skala za izražavanje frekvencija iscrtava se duž ordinate.

Intervalne serije su prikazane kao histogrami distribucije(tj. trakasti grafikoni).

Prilikom konstruiranja histograma, vrijednosti intervala su iscrtane na osi apscise, a frekvencije su prikazane pravokutnicima izgrađenim na odgovarajućim intervalima. Visina stubova u slučaju jednakih intervala treba da bude proporcionalna frekvencijama.

Bilo koji histogram se može pretvoriti u poligon distribucija, a za to je potrebno povezati vrhove njegovih pravokutnika s ravnim segmentima.

2. Metoda indeksa za analizu uticaja prosječne proizvodnje i prosečan broj zaposlenih na promjene u obimu proizvodnje

Metoda indeksa koristi se za analizu dinamike i poređenje opštih indikatora, kao i faktora koji utiču na promjenu nivoa ovih indikatora. Uz pomoć indeksa moguće je otkriti uticaj prosječne proizvodnje i prosječnog broja zaposlenih na promjene obima proizvodnje. Ovaj problem se rešava konstruisanjem sistema analitičkih indeksa.

Indeks obima proizvodnje sa indeksom prosječnog broja zaposlenih i indeksom prosječne proizvodnje povezani su na isti način kao što je output (Q) povezan sa outputom ( w) i broj ( r) .

Možemo zaključiti da će obim proizvodnje biti jednak proizvodu prosječne proizvodnje i prosječnog broja zaposlenih:

Q = w r, gdje je Q obim proizvodnje,

w - prosječna proizvodnja,

r je prosječan broj zaposlenih.

kao što se vidi, mi pričamo o odnosu pojava u statici: proizvod dva faktora daje ukupan volumen nastale pojave. Također je očito da je ova veza funkcionalna, pa se dinamika ove veze proučava uz pomoć indeksa. Za dati primjer, ovo je sljedeći sistem:

J w × J r = J wr .

Na primjer, indeks obima proizvodnje Jwr, kao indeks rezultirajuće pojave, može se razložiti na dva faktora indeksa: indeks prosječne proizvodnje (Jw) i indeks prosječnog broja zaposlenih (Jr):

Indeks Indeks Indeks

volumen prosjeka

snaga proizvodnje

gdje J w- indeks produktivnosti rada izračunat po Laspeyresovoj formuli;

J r- indeks broja zaposlenih, izračunat prema Paascheovoj formuli.

Indeksni sistemi se koriste za određivanje uticaja pojedinačnih faktora na formiranje nivoa indikatora performansi, omogućavaju 2 poznate vrednosti indeksi određuju vrijednost nepoznate.

Na osnovu datog sistema indeksa može se naći i apsolutni porast obima proizvodnje, dekomponovan na uticaj faktora.

1. Ukupno povećanje obima proizvodnje:

∆wr = ∑w 1 r 1 - ∑w 0 r 0 .

2. Rast zbog djelovanja indikatora prosječne proizvodnje:

∆wr/w = ∑w 1 r 1 - ∑w 0 r 1 .

3. Rast zbog djelovanja indikatora prosječnog broja zaposlenih:

∆wr/r = ∑w 0 r 1 - ∑w 0 r 0

∆wr = ∆wr/w + ∆wr/r.

Primjer. Poznate su sljedeće informacije

Možemo utvrditi kako se promijenio obim proizvodnje u relativnom i apsolutnom smislu i kako su pojedinačni faktori utjecali na tu promjenu.

Obim proizvodnje iznosio je:

u baznom periodu

w 0 * r 0 \u003d 2000 * 90 \u003d 180000,

iu izvještavanju

w 1 * r 1 = 2100 * 100 = 210 000.

Posljedično, obim proizvodnje je povećan za 30.000 ili 1,16%.

∆wr=∑w 1 r 1 -∑w 0 r 0= (210000-180000)=30000

ili (210000:180000)*100%=1,16%.

Ova promjena u obimu proizvodnje nastala je zbog:

1) povećanje prosječnog broja zaposlenih za 10 ljudi ili za 111,1%

r 1 / r 0 = 100 / 90 = 1,11 ili 111,1%.

U apsolutnom iznosu, zahvaljujući ovom faktoru, obim proizvodnje je povećan za 20.000:

w 0 r 1 - w 0 r 0 \u003d w 0 (r 1 -r 0) = 2000 (100-90) = 20000.

2) povećanje prosječne proizvodnje za 105% ili za 10.000:

w 1 r 1 / w 0 r 1 = 2100 * 100 / 2000 * 100 \u003d 1,05 ili 105%.

U apsolutnom iznosu, povećanje je:

w 1 r 1 - w 0 r 1 = (w 1 -w 0) r 1 = (2100-2000) * 100 \u003d 10000.

Dakle, kombinovani uticaj faktora je bio:

1. U apsolutnom smislu

10000 + 20000 = 30000

2. U relativnom smislu

1,11 * 1,05 = 1,16 (116%)

Dakle, povećanje je 1,16%. Oba rezultata su prethodno dobijena.

Riječ "indeks" u prijevodu znači pokazivač, indikator. Indeks se u statistici tumači kao relativni indikator koji karakteriše promjenu neke pojave u vremenu, prostoru ili u poređenju sa planom. Pošto je indeks relativna vrijednost, nazivi indeksa su u skladu s nazivima relativnih vrijednosti.

U slučajevima kada analiziramo promjenu proizvoda koji se uspoređuje tokom vremena, možemo postaviti pitanje kako ući raznim uslovima(u različitim oblastima) komponente indeksa se mijenjaju (cijena, fizički obim, struktura proizvodnje ili prodaje pojedinih vrsta proizvoda). U tom smislu grade se indeksi konstantnog sastava, varijabilnog sastava i strukturnih pomaka.

Trajni (fiksni) indeks sastava - ovo je indeks koji karakteriše dinamiku prosječne vrijednosti sa istom fiksnom strukturom stanovništva.

Princip konstruisanja indeksa konstantnog sastava je da se eliminiše uticaj promena u strukturi pondera na indeksiranu vrednost izračunavanjem ponderisanog prosečnog nivoa indeksiranog indikatora sa istim ponderima.

Indeks konstantnog sastava je po svom obliku identičan agregatnom indeksu. Agregatni oblik je najčešći.

Indeks konstantne kompozicije izračunava se sa ponderima fiksiranim na nivou jednog od bilo kojeg perioda i prikazuje promjenu samo indeksirane vrijednosti. Indeks konstantne kompozicije eliminiše uticaj promena u strukturi pondera na indeksiranu vrednost tako što se izračunava ponderisani prosečni nivo indeksiranog indikatora sa istim ponderima. U indeksima konstantnog sastava upoređuju se pokazatelji izračunati na osnovu konstantne strukture pojava.

Predmet matematičke statistike. Opća i uzorkovana populacija.

— Math statistics- grana matematike koja proučava metode selekcije, grupisanja, sistematizacije i analize statističkih podataka u cilju dobijanja naučno utemeljenih zaključaka.

— Statistički podaci- numeričke vrijednosti razmatrane karakteristike proučavanih objekata, dobivene kao rezultat slučajnog eksperimenta.

Matematička statistika je usko povezana sa teorijom verovatnoće, ali za razliku od teorije verovatnoće, matematički model eksperimenta je nepoznat. U matematičkoj statistici, prema statističkim podacima, potrebno je uspostaviti nepoznatu distribuciju vjerovatnoće ili objektivno procijeniti parametre distribucije.

Metode matematičke statistike omogućavaju izgradnju optimalnih matematičkih modela masovnih pojava koje se ponavljaju. Veza između teorije vjerovatnoće i matematičke statistike su granične teoreme teorije vjerovatnoće.

Trenutno statističke metode koriste se u gotovo svim granama nacionalne privrede.

— Populacija– statistički podaci svih proučavanih objekata (ponekad - samih objekata). Često se opća populacija smatra RV X.

— Uzorak(uzorak populacije) - statistički podaci nasumično odabranih objekata iz opće populacije.

— Veličina uzorka n(obim opće populacije N) - broj objekata odabranih za proučavanje iz opšte populacije (broj objekata u opštoj populaciji).

Primjeri.

a) Statistički podaci može biti: rast učenika; broj glagola (ili drugih dijelova govora) u odlomku teksta određene dužine; prosječna ocjena certifikata; nivo inteligencije; broj grešaka koje je napravio dispečer itd.

b) Opća populacija možda: visina svih ljudi, činovi svih fabričkih radnika, učestalost upotrebe određenog dijela govora u svim radovima autora koji se proučava, prosječna ocjena svedočanstva svih diplomaca itd.



u) uzorak možda: - visina 20 učenika, broj glagola u nasumično odabranih 50 homogenih odlomaka teksta dužine 500 upotrebe riječi, prosječna ocjena svjedočanstva 100 nasumično odabranih maturanata iz škola u gradu itd.

Uzorak se zove predstavnik, ako ispravno odražava imovinu opće populacije. Reprezentativnost uzorka postiže se slučajnim odabirom, kada svi objekti opšte populacije imaju istu vjerovatnoću da budu odabrani.

Da bi uzorak bio reprezentativan, razne načine izbor predmeta proučavanja.

Vrste odabira: jednostavan, mehanički, serijski, tipičan.

Jednostavno. Elementi se nasumično biraju iz cijele populacije.

Mehanička selekcija. Odaberite svakih 10 (25, 30, itd.) objekata iz opće populacije.

Serial. U svakoj seriji se provodi studija (na primjer, iz teksta se bira 10 pasusa od 500 upotrebe riječi - 10 serija).

Tipično. Opća populacija je podijeljena u tipične grupe prema određenom atributu. Broj serija izdvojenih iz svake takve grupe određen je udjelom ove grupe u općoj populaciji.

Statistička distribucija uzorka i njegova grafička slika.

Neka se SV X (generalna populacija) proučava u odnosu na neku osobinu. U toku je niz nezavisnih testova. Kao rezultat eksperimenata, SV X poprima neke vrijednosti. Skup dobijenih vrijednosti je uzorak, a same vrijednosti su statistički podaci.

U početku se vrši rangiranje uzorka – slaganje statističkih podataka uzorka u neopadajućem redoslijedu. Dobijamo seriju varijacija.

Varijacijska serija- rangirani uzorak.

Diskretne statističke serije

Ako je populacija diskretna RV, konstruiše se diskretna statistička serija (statistička distribucija).

Neka se vrijednost pojavi u vremenima uzorka,

Vrijeme, …, - vrijeme.

I-thaya opcija uzorci; - frekvencija i-ta opcija Frekvencija pokazuje koliko se puta ova opcija pojavila u uzorku.

- relativna frekvencija i-ta opcija

(pokazuje koji je dio uzorka ).

Statistička distribucija je korespondencija između opcija uzorka i njihovih frekvencija ili relativnih frekvencija.

Za DSV, statistička distribucija se može prikazati u obliku tabele – statističke serije učestalosti ili statističke serije relativnih frekvencija.

Statističke serije frekvencija Statističke serije

relativne frekvencije

........
........
........
........

Radi jasnoće prezentacije statistička distribucija uzorci grade "grafove" statističke distribucije: poligon i histogram.

Frekvencijski poligon(relativne frekvencije) - grafički prikaz diskretne statističke serije - isprekidana linija koja sekvencijalno povezuje tačke [za poligon relativnih frekvencija].

Primjer. Istraživača zanimaju znanja kandidata iz matematike. Izabrano je 10 kandidata i evidentiraju se njihove školske ocjene iz ovog predmeta. Primljen je sljedeći uzorak: 5;4;4;3;2;5;4;3;4;5.

a) Predstavite uzorak u obrascu varijantne serije;

b) izgraditi statističku seriju frekvencija i relativnih frekvencija;

c) nacrtati poligon relativnih frekvencija za rezultirajući niz.

a) Rangirajmo uzorak, tj. Rasporedite članove uzorka u neopadajućem redoslijedu. Dobijamo varijacioni niz: 2; 3; 3; 4; 4; 4; 4; 5; 5;5.

b) Konstruiramo statističku seriju frekvencija (podudarnost između opcija uzorka i njihovih frekvencija) i statističku seriju relativnih frekvencija (podudarnost između opcija uzorka i njihovih relativnih frekvencija)

0,1 0,2 0,4 0,3

Statističke serije frekvencija statističke serije rel. frekvencije

1+2+4+3=10=n 0,1+0,2+0,4+0,3=1.

Poligon relativnih frekvencija.


Supreme stručno obrazovanje

„RUSKA AKADEMIJA NARODNE EKONOMIJE I

DRŽAVNA SLUŽBA KOD PREDSJEDNIKA

RUSKA FEDERACIJA"

(filijala Kaluga)

Odsjek za prirodno-matematičke discipline

TEST

Predmet "Statistika"

Student ___ Mayboroda Galina Yurievna ______

Dopisni odjel Državni fakultet i opštinske vlasti grupa G-12-V

Predavač ____________________ Hamer G.V.

dr, vanredni profesor

Kaluga-2013

Zadatak 1.

Zadatak 1.1. 4

Zadatak 1.2. šesnaest

Zadatak 1.3. 24

Zadatak 1.4. 33

Zadatak 2.

Zadatak 2.1. 43

Zadatak 2.2. 48

Zadatak 2.3. 53

Zadatak 2.4. 58

Zadatak 3.

Zadatak 3.1. 63

Zadatak 3.2. 68

Zadatak 3.3. 73

Zadatak 3.4. 79

Zadatak 4.

Problem 4.1. 85

Zadatak 4.2. 88

Zadatak 4.3. 90

Zadatak 4.4. 93

Spisak korištenih izvora. 96

Zadatak 1.

Zadatak 1.1.

Podaci o proizvodu i visini dobiti po preduzećima regiona su sledeći (tabela 1).

Tabela 1

Podaci o proizvodnji i visini dobiti po preduzećima

broj kompanije Izlaz, milion rubalja Dobit, milion rubalja broj kompanije Izlaz, milion rubalja Dobit, milion rubalja
63,0 6,7 56,0 7,2
48,0 6,2 81,0 9,6
39,0 6,5 55,0 6,3
28,0 3,0 76,0 9,1
72,0 8,2 54,0 6,0
61,0 7,6 53,0 6,4
47,0 5,9 68,0 8,5
37,0 4,2 52,0 6,5
25,0 2,8 44,0 5,0
60,0 7,9 51,0 6,4
46,0 5,5 50,0 5,8
34,0 3,8 65,0 6,7
21,0 2,1 49,0 6,1
58,0 8,0 42,0 4,8
45,0 5,7 32,0 4,6

Prema originalnim podacima:

1. Izgraditi statističku seriju distribucije preduzeća po proizvodnji, formirajući pet grupa u jednakim intervalima.

Izgradite grafikone serija distribucije: poligon, histogram, kumulacija. Grafički odredite vrijednost moda i medijana.

2. Izračunati karakteristike serije distribucije preduzeća prema outputu: aritmetička sredina, disperzija, standardna devijacija, koeficijent varijacije.

Napravite zaključak.

3. Metodom analitičkog grupisanja utvrditi prisustvo i prirodu korelacije između cijene proizvedenih proizvoda i visine dobiti po preduzeću.

4. Izmjerite čvrstoću korelacije između troškova proizvodnje i iznosa profita empirijskom korelacijom.

Izvucite opšte zaključke.

Odluka:

Napravimo statističku seriju distribucije

Da bi se konstruisao intervalni varijacioni niz koji karakteriše distribuciju preduzeća u smislu proizvodnje, potrebno je izračunati vrednost i granice intervala serije.

Kada se konstruiše niz sa jednakim intervalima, vrednost intervala h određuje se formulom:

x max i x min- najveća i najmanja vrijednost atributa u proučavanom skupu preduzeća;

k- broj grupa intervalnih serija.

Broj grupa k navedeno u zadatku. k= 5.

x max= 81 milion rubalja, x min= 21 milion rubalja

Izračunavanje vrijednosti intervala:

miliona rubalja

Uzastopnim dodavanjem vrijednosti intervala h = 12 miliona rubalja. do donje granice intervala dobijamo sledeće grupe:

1 grupa: 21 - 33 miliona rubalja.

2 grupa: 33 - 45 miliona rubalja;

Grupa 3: 45 - 57 miliona rubalja.

Grupa 4: 57 - 69 miliona rubalja.

Grupa 5: 69 - 81 milion rubalja.

Za konstruiranje intervalne serije potrebno je izračunati broj preduzeća uključenih u svaku grupu ( grupne frekvencije).

Proces grupisanja preduzeća po obimu proizvodnje prikazan je u pomoćnoj tabeli 2. Kolona 4 ove tabele je neophodna za izgradnju analitičkog grupisanja (stav 3 zadatka).

tabela 2

Tablica za konstruiranje intervalne serije raspodjele i

analitičko grupisanje

Grupe preduzeća po proizvodnji, milioni rubalja broj kompanije Izlaz, milion rubalja Dobit, milion rubalja
21-33 21,0 2,1
25,0 2,8
28,0 3,0
32,0 4,6
Ukupno 106,0 12,5
33-45 34,0 3,8
37,0 4,2
39,0 6,5
42,0 4,8
44,0 5,0
Ukupno 196,0 24,3
45-57 45,0 5,7
46,0 5,5
47,0 5,9
48,0 6,2
49,0 6,1
50,0 5,8
51,0 6,4
52,0 6,5
53,0 6,4
54,0 6,0
55,0 6,3
56,0 7,2
Ukupno 606,0 74,0
57-69 58,0 8,0
60,0 7,9
61,0 7,6
63,0 6,7
65,0 6,7
68,0 8,5
Ukupno 375,0 45,4
69-81 72,0 8,2
76,0 9,1
81,0 9,6
Ukupno 229,0 26,9
Ukupno 183,1

Na osnovu redova grupnog sumiranja tabele „Ukupno“ 3, formira se konačna tabela 3, koja predstavlja intervalnu seriju distribucije preduzeća po proizvodnji.

Tabela 3

Broj distribucije preduzeća prema obimu proizvodnje

Zaključak. Konstruisano grupisanje pokazuje da distribucija preduzeća u smislu outputa nije ujednačena. Najčešća preduzeća sa obimom proizvodnje od 45 do 57 miliona rubalja. (12 preduzeća). Najrjeđe su preduzeća sa proizvodnjom od 69 do 81 milion rubalja. (3 preduzeća).

Napravimo grafove serije distribucije.

Poligon češće se koristi za slike diskretne serije. Da bi se konstruirao poligon u pravokutnom koordinatnom sistemu, vrijednosti argumenta su iscrtane na osi apscise, odnosno opcije (za intervalne varijacione serije, sredina intervala se uzima kao argument) i na osi ordinata - frekvencija vrijednosti. Dalje, u ovom koordinatnom sistemu se grade tačke čije su koordinate parovi odgovarajućih brojeva iz varijacionog niza. Rezultirajuće tačke su povezane u seriju pravim segmentima. Poligon je prikazan na slici 1.

bar grafikona - trakasti grafikon. Omogućava vam da procenite simetriju distribucije. Histogram je prikazan na slici 2.

Slika 1 - Poligonska distribucija preduzeća po obimu

izlaz

Moda

Slika 2 – Histogram distribucije preduzeća po obimu

izlaz

Moda- vrijednost osobine koja se najčešće javlja u ispitivanoj populaciji.

Za intervalnu seriju, mod se može grafički odrediti iz histograma (slika 2). Za to je odabran najviši pravougaonik, koji je u ovom slučaju modalni (45–57 miliona rubalja). Tada je desni vrh modalnog pravougaonika povezan sa gornjim desnim uglom prethodnog pravougaonika. I lijevi vrh modalnog pravougaonika je sa gornjim levim uglom sledećeg pravougaonika. Nadalje, od točke njihovog presjeka, okomita se spušta na osu apscise. Apscisa tačke preseka ovih linija biće način distribucije.

Milion rub.

Zaključak. U razmatranom skupu preduzeća najčešća su preduzeća sa proizvodnjom od 52 miliona rubalja.

Kumulirati - slomljena krivina. Izgrađen je na osnovu akumuliranih frekvencija (izračunatih u tabeli 4). Kumulat počinje od donje granice prvog intervala (21 milion rubalja), akumulirana frekvencija se taloži na gornjoj granici intervala. Kumulat je prikazan na slici 3.

Medijan

Slika 3 - Kumulativna distribucija preduzeća po obimu

izlaz

Median Me je vrijednost karakteristike koja se nalazi u sredini rangirane serije. Na obje strane medijane nalazi se isti broj populacijskih jedinica.

U intervalnoj seriji, medijan se može odrediti grafički iz kumulativne krive. Da bi se odredila medijana iz tačke na kumulativnoj skali frekvencija koja odgovara 50% (30:2 = 15), ravna linija se povlači paralelno sa osom apscise dok se ne siječe sa kumulatom. Zatim, od točke presjeka navedene ravne linije sa kumulatom, okomica se spušta na osu apscise. Apscisa tačke preseka je medijana.

Milion rub.

Zaključak. U razmatranom skupu preduzeća, polovina preduzeća ima obim proizvodnje ne veći od 52 miliona rubalja, a druga polovina - ne manje od 52 miliona rubalja.


Slične informacije.


Statističke distribucijske serije- ovo je uređena distribucija jedinica stanovništva u grupe prema određenom varijabilnom atributu.
Ovisno o osobinama na kojima se formira niz distribucije, postoje atributne i varijacijske distribucijske serije.

Prisustvo zajedničkog obeležja je osnova za formiranje statističke populacije, koja je rezultat opisa ili merenja zajedničkih karakteristika objekata proučavanja.

Predmet proučavanja u statistici su promjenljive (varijabilne) karakteristike ili statističke karakteristike.

Vrste statističkih karakteristika.

Redovi distribucije se nazivaju nizovi atributa. izgrađena na kvalitetnim osnovama. Atributivno- ovo je znak koji ima ime (na primjer, profesija: krojačica, učiteljica, itd.).
Uobičajeno je rasporediti distributivne serije u obliku tabela. U tabeli. 2.8 prikazuje niz atributa distribucije.
Tabela 2.8 - Rasprostranjenost vrsta pravna pomoć koje advokati pružaju građanima jedne od regija Ruske Federacije.

Varijacijska serija su vrijednosti karakteristika (ili rasponi vrijednosti) i njihove frekvencije.
Varijabilne serije su distribucijske serije izgrađen na kvantitativnoj osnovi. Bilo koji varijacioni niz sastoji se od dva elementa: varijanti i frekvencije.
Varijante su pojedinačne vrijednosti karakteristike koje uzima u nizu varijacija.
Učestalosti su brojevi pojedinačnih varijanti ili svake grupe varijantnog niza, tj. ovo su brojevi koji pokazuju koliko se često određene opcije pojavljuju u seriji distribucije. Zbir svih frekvencija određuje veličinu cjelokupne populacije, njen volumen.
Frekvencije se nazivaju frekvencijama, izražene u dijelovima jedinice ili kao postotak od ukupne vrijednosti. Prema tome, zbir frekvencija je jednak 1 ili 100%. Varijaciona serija nam omogućava da procenimo oblik zakona raspodele na osnovu stvarnih podataka.

U zavisnosti od prirode varijacije osobine, postoje diskretne i intervalne varijacione serije.
Primjer diskretne varijacione serije dat je u tabeli. 2.9.
Tabela 2.9 - Raspodjela porodica prema broju soba u pojedinačnim stanovima 1989. godine u Ruskoj Federaciji.

Prva kolona tabele predstavlja varijante diskretnog varijantnog niza, druga kolona sadrži frekvencije varijantne serije, a treća kolona sadrži indikatore učestalosti.

Varijacijska serija

U opštoj populaciji istražuje se određena kvantitativna osobina. Iz njega se nasumično izdvaja uzorak zapremine n, odnosno broj elemenata u uzorku je n. U prvoj fazi statističke obrade, rasponu uzorci, tj. redosled brojeva x 1 , x 2 , …, x n Uzlazno. Svaka posmatrana vrednost x i pozvao opcija. Frekvencija m i je broj zapažanja vrijednosti x i u uzorku. Relativna frekvencija (frekvencija) w i je omjer frekvencija m i na veličinu uzorka n: .
Prilikom proučavanja varijacione serije koriste se i koncepti kumulativne frekvencije i kumulativne frekvencije. Neka bude x neki broj. Zatim broj opcija , čije su vrijednosti manje x, naziva se akumulirana frekvencija: za x i n naziva se akumulirana frekvencija w i max .
Atribut se naziva diskretno varijabilnim ako se njegove pojedinačne vrijednosti (varijante) razlikuju jedna od druge za neki konačni iznos (obično cijeli broj). Varijacijski niz takve karakteristike naziva se diskretni varijacioni niz.

Tabela 1. Opšti prikaz diskretnih varijacionih serija frekvencija

Vrijednosti karakteristikax i x 1 x2 x n
Frekvencijem i m 1 m2 m n

Atribut se naziva kontinuirano promjenjivim ako se njegove vrijednosti razlikuju jedna od druge za proizvoljno mali iznos, tj. znak može uzeti bilo koju vrijednost u određenom intervalu. Kontinuirani niz varijacija za takvu osobinu naziva se intervalni niz.

Tabela 2. Opšti prikaz intervalnih varijacionih serija frekvencija

Tabela 3. Grafičke slike serije varijacija

RedPoligon ili histogramEmpirijska funkcija distribucije
Diskretno
interval
Gledajući rezultate promatranja, utvrđuje se koliko je vrijednosti opcija palo u svaki određeni interval. Pretpostavlja se da svaki interval pripada jednom od svojih krajeva: ili u svim slučajevima lijevo (češće), ili u svim slučajevima desno, a frekvencije ili frekvencije pokazuju broj opcija sadržanih u naznačenim granicama. Razlike a i – a i +1 nazivaju se parcijalni intervali. Da bi se pojednostavili naknadni proračuni, niz intervalnih varijacija može se zamijeniti uslovno diskretnim. U ovom slučaju, srednja vrijednost i-th interval se uzima kao opcija x i, i odgovarajuću frekvenciju intervala m i- za frekvenciju ovog intervala.
Za grafički prikaz varijacionih serija najčešće se koriste poligon, histogram, kumulativna kriva i empirijska funkcija raspodjele.

U tabeli. 2.3 (Grupiranje stanovništva Rusije prema veličini prosječnog dohotka po glavi stanovnika u aprilu 1994.) intervalne varijacione serije.
Pogodno je analizirati seriju distribucije koristeći grafički prikaz, koji također omogućava prosuđivanje oblika distribucije. Vizuelni prikaz prirode promjene frekvencija varijacionih serija je dat pomoću poligon i histogram.
Poligon se koristi kada se prikazuje diskretna varijantna serija.
Prikažimo, na primjer, grafički raspored stambenog fonda po vrstama stanova (tabela 2.10).
Tabela 2.10 - Raspodjela stambenog fonda urbanog područja prema tipovima stanova (uslovni podaci).


Rice. Stambeni distributivni poligon


Na y-osi se mogu ucrtati ne samo vrijednosti frekvencija, već i frekvencije niza varijacija.
Histogram se uzima za prikaz serije intervalnih varijacija. Prilikom konstruiranja histograma, vrijednosti intervala su iscrtane na osi apscise, a frekvencije su prikazane pravokutnicima izgrađenim na odgovarajućim intervalima. Visina stubova u slučaju jednakih intervala treba da bude proporcionalna frekvencijama. Histogram je graf u kojem je niz prikazan u obliku šipki jedna uz drugu.
Hajde da grafički prikažemo niz intervalne distribucije date u tabeli. 2.11.
Tabela 2.11 - Raspodjela porodica prema veličini stambenog prostora po osobi (uslovne brojke).
N p / p Grupe porodica prema veličini stambenog prostora po osobi Broj porodica sa datom veličinom stambenog prostora Akumulirani broj porodica
1 3 – 5 10 10
2 5 – 7 20 30
3 7 – 9 40 70
4 9 – 11 30 100
5 11 – 13 15 115
TOTAL 115 ----


Rice. 2.2. Histogram distribucije porodica prema veličini stambenog prostora po osobi


Koristeći podatke akumulirane serije (tabela 2.11), konstruišemo distribucija kumulativna.


Rice. 2.3. Kumulativna distribucija porodica prema veličini stambenog prostora po osobi


Reprezentacija varijacionog niza u obliku kumulata posebno je efikasna za varijacione serije, čije su frekvencije izražene kao razlomci ili procenti zbira frekvencija serije.
Ako promijenimo osi u grafičkom prikazu varijacionog niza u obliku kumulata, onda ćemo dobiti ogivu. Na sl. 2.4 prikazuje ožicu izgrađenu na osnovu podataka u tabeli. 2.11.
Histogram se može pretvoriti u poligon distribucije pronalaženjem središta stranica pravougaonika i zatim povezivanjem ovih tačaka pravim linijama. Rezultirajući poligon distribucije prikazan je na sl. 2.2 isprekidana linija.
Prilikom konstruisanja histograma distribucije varijacione serije sa nejednakim intervalima, duž ordinatne ose, ne crtaju se frekvencije, već gustina distribucije karakteristike u odgovarajućim intervalima.
Gustina distribucije je frekvencija izračunata po jedinici širine intervala, tj. koliko je jedinica u svakoj grupi po vrijednosti intervala jedinice. Primjer izračunavanja gustine distribucije prikazan je u tabeli. 2.12.
Tabela 2.12 - Distribucija preduzeća po broju zaposlenih (cifre su uslovne)
N p / p Grupe preduzeća prema broju zaposlenih, osoba. Broj preduzeća Veličina intervala, pers. Gustina distribucije
ALI 1 2 3=1/2
1 do 20 15 20 0,75
2 20 – 80 27 60 0,25
3 80 – 150 35 70 0,5
4 150 – 300 60 150 0,4
5 300 – 500 10 200 0,05
TOTAL 147 ---- ----

Za grafički prikaz varijacionih serija se također može koristiti kumulativna kriva. Uz pomoć kumulata (krivulja suma) prikazuje se niz akumuliranih frekvencija. Kumulativne frekvencije se određuju sukcesivnim zbrajanjem učestalosti po grupama i pokazuju koliko jedinica populacije ima vrijednosti osobina koje nisu veće od razmatrane vrijednosti.


Rice. 2.4. Ogiva raspodjela porodica prema veličini stambenog prostora po osobi

Prilikom konstruiranja kumulata intervalne varijacione serije, varijante niza se crtaju duž apscisne ose, a akumulirane frekvencije duž ose ordinata.

Laboratorijski rad №1. Primarna obrada statističkih podataka

Konstrukcija distributivnih serija

Zove se uređena raspodjela jedinica stanovništva u grupe prema bilo kojem atributu blizu distribucije . U ovom slučaju, znak može biti i kvantitativan, tada se naziva serija varijacijski , i kvalitativno, tada se serija zove atributivno . Tako se, na primjer, stanovništvo grada može rasporediti prema starosnim grupama u nizu varijacija, ili prema profesionalnoj pripadnosti u nizu atributa (naravno, mnogo više kvalitativnih i kvantitativnih karakteristika može se predložiti za konstruiranje distribucijskih serija, tj. izbor obeležja određen je zadatkom statističkog istraživanja).

Bilo koju distribucijsku seriju karakteriziraju dva elementa:

- opcija(x i) - ovo su pojedinačne vrijednosti atributa jedinica populacije uzorka. Za varijacioni niz, varijanta uzima numeričke vrijednosti, za atributivni niz - kvalitativne (na primjer, x = "državni službenik");

- frekvencija(n i) je broj koji pokazuje koliko puta se pojavljuje ova ili ona vrijednost značajke. Ako je učestalost izražena kao relativan broj (tj. udio elemenata populacije koji odgovaraju datoj vrijednosti opcija u ukupnom obimu populacije), onda se naziva relativna frekvencija ili frekvencija.

Varijacijska serija može biti:

- diskretno kada je osobina koja se proučava karakterizirana određenim brojem (obično cijelim).

- interval kada su granice "od" i "do" definirane za kontinuirano promjenjivu karakteristiku. Intervalni niz se također gradi ako je skup vrijednosti diskretno varijabilne karakteristike velik.

Intervalni niz se može graditi i sa intervalima jednake dužine (jednaki intervalni niz) i sa nejednakim intervalima, ako to nalažu uslovi statističke studije. Na primjer, može se razmotriti niz distribucije prihoda stanovništva sa sljedećim intervalima:<5тыс р., 5-10 тыс р., 10-20 тыс.р., 20-50 тыс р., и т.д. Если цель исследования не определяет способ построения интервального ряда, то строится равноинтервальный ряд, число интервалов в котором определяется по формуле Стерджесса:



gdje je k broj intervala, n je veličina uzorka. (Naravno, formula obično daje razlomak, a kao broj intervala bira se najbliži cijeli broj rezultirajućem broju.) Dužina intervala u ovom slučaju određena je formulom

.

Grafički, varijacioni nizovi se mogu predstaviti kao histogrami("stupac" visine koji odgovara frekvenciji u ovom intervalu je izgrađen iznad svakog intervala serije intervala), područje distribucije(isprekidana linija koja povezuje tačke ( x i;n i) ili kumulira(konstruisano prema akumuliranim frekvencijama, tj. za svaku vrijednost atributa uzima se učestalost pojavljivanja u skupu objekata čija je vrijednost atributa manja od zadate).

Kada radite u Excelu, sljedeće funkcije se mogu koristiti za izgradnju varijacionih serija:

PROVJERI ( niz podataka) – za određivanje veličine uzorka. Argument je raspon ćelija koji sadrži uzorke podataka.

COUNTIF( domet; kriterijum) - može se koristiti za izgradnju atributa ili serije varijacija. Argumenti su raspon niza vrijednosti uzorka atributa i kriterij - numerička ili tekstualna vrijednost atributa ili broj ćelije u kojoj se nalazi. Rezultat je učestalost pojavljivanja te vrijednosti u uzorku.

FREKVENCIJA( niz podataka; intervalni niz) – za izgradnju varijacione serije. Argumenti su raspon uzorka niza podataka i stupac intervala. Ako je potrebno izgraditi diskretnu seriju, tada su ovdje navedene vrijednosti opcija, ako je interval, onda gornje granice intervala (oni se također nazivaju "džepovi"). Pošto je rezultat kolona frekvencija, uvođenje funkcije mora se završiti pritiskom na kombinaciju tipki CTRL+SHIFT+ENTER. Imajte na umu da prilikom postavljanja niza intervala prilikom uvođenja funkcije posljednja vrijednost u njoj može biti izostavljena - sve vrijednosti koje nisu ušle u prethodne "džepove" bit će smještene u odgovarajući "džep". Ovo ponekad pomaže da se izbjegne greška da se najveća vrijednost uzorka ne stavlja automatski u posljednji "džep".

Pored toga, za složena grupisanja (prema nekoliko kriterijuma) koristi se alat „zaokretne tabele“. Mogu se koristiti i za pravljenje niza atributa i varijacija, ali to nepotrebno komplikuje zadatak. Također, da biste napravili niz varijacija i histogram, postoji procedura „histograma“ iz dodatka „Paket analize“ (da biste koristili dodatke u Excelu, prvo ih morate preuzeti, oni nisu instalirani prema zadanim postavkama)

Proces primarne obrade podataka ilustrujemo sledećim primerima.

Primjer 1.1. postoje podaci o kvantitativnom sastavu 60 porodica.

Izgradite seriju varijacija i poligon distribucije

Odluka.

Otvorimo Excel tabele. Unesite niz podataka u rasponu A1:L5. Ako proučavate dokument u elektronskom obliku (u Word formatu, na primjer), sve što trebate učiniti je odabrati tabelu s podacima i kopirati je u međuspremnik, zatim odabrati ćeliju A1 i zalijepiti podatke - oni će automatski zauzeti odgovarajući raspon. Izračunajmo veličinu uzorka n - broj uzoraka podataka, za to u ćeliju B7 unesite formulu = COUNT (A1: L5). Imajte na umu da za unos željenog raspona u formulu nije potrebno unositi njegovu oznaku s tastature, dovoljno je odabrati ga. Odredimo minimalne i maksimalne vrijednosti u uzorku unosom formule =MIN(A1:L5) u ćeliju B8, a u ćeliju B9: =MAX(A1:L5).

Sl.1.1 Primjer 1. Primarna obrada statističkih podataka u Excel tabelama

Zatim, pripremimo tabelu za pravljenje niza varijacija unosom imena za kolonu intervala (vrijednosti varijante) i kolonu frekvencije. U kolonu intervala unesite vrijednosti atributa od minimalnog (1) do maksimuma (6), koji zauzima raspon B12:B17. Odaberite kolonu frekvencije, unesite formulu =FREQUENCY(A1:L5;B12:B17) i pritisnite kombinaciju tipki CTRL+SHIFT+ENTER

Sl.1.2 Primjer 1. Konstrukcija varijacione serije

Za kontrolu izračunavamo zbir frekvencija pomoću funkcije SUM (ikona funkcije S u grupi Uređivanje na kartici Početna), izračunati zbir mora odgovarati prethodno izračunatoj veličini uzorka u ćeliji B7.

Sada napravimo poligon: nakon odabira rezultirajućeg frekvencijskog raspona, odaberite naredbu "Graf" na kartici "Umetanje". Prema zadanim postavkama, vrijednosti na horizontalnoj osi će biti redni brojevi - u našem slučaju, od 1 do 6, što se poklapa sa vrijednostima opcija (brojevi tarifnih kategorija).

Naziv serije grafikona “series 1” može se ili promijeniti koristeći istu opciju “odaberi podatke” na kartici “Dizajner” ili jednostavno izbrisati.

Sl.1.3. Primjer 1. Izgradnja frekvencijskog poligona

Primjer 1.2. Dostupni su podaci o emisijama zagađivača iz 50 izvora:

10,4 18,6 10,3 26,0 45,0 18,2 17,3 19,2 25,8 18,7
28,2 25,2 18,4 17,5 41,8 14,6 10,0 37,8 10,5 16,0
18,1 16,8 38,5 37,7 17,9 29,0 10,1 28,0 12,0 14,0
14,2 20,8 13,5 42,4 15,5 17,9 19, 10,8 12,1 12,4
12,9 12,6 16,8 19,7 18,3 36,8 15,0 37,0 13,0 19,5

Sastavite niz jednakih intervala, napravite histogram

Odluka

Dodajmo niz podataka u Excel list, on će zauzeti raspon A1:J5 Kao iu prethodnom zadatku, odredit ćemo veličinu uzorka n, minimalne i maksimalne vrijednosti u uzorku. Pošto sada ne trebamo diskretni, već intervalni niz, a broj intervala u zadatku nije preciziran, izračunavamo broj intervala k koristeći Sturgessovu formulu. Da biste to učinili, u ćeliju B10 unesite formulu =1+3,322*LOG10(B7).

Sl.1.4. Primjer 2. Konstrukcija serije jednakog intervala

Rezultirajuća vrijednost nije cijeli broj, ona je otprilike 6,64. Kako će za k=7 dužina intervala biti izražena kao cijeli broj (za razliku od slučaja k=6), mi ćemo izabrati k=7 unosom ove vrijednosti u ćeliju C10. Izračunavamo dužinu intervala d u ćeliji B11 unosom formule = (B9-B8) / C10.

Hajde da definiramo niz intervala, specificirajući gornju granicu za svaki od 7 intervala. Da biste to učinili, u ćeliji E8 izračunajte gornju granicu prvog intervala unosom formule =B8+B11; u ćeliju E9 gornju granicu drugog intervala unosom formule =E8+B11. Da bismo izračunali preostale vrijednosti gornjih granica intervala, fiksiramo broj ćelije B11 u unesenoj formuli pomoću znaka $, tako da formula u ćeliji E9 postane =E8+B$11, i kopiramo sadržaj ćelije E9 do ćelija E10-E14. Posljednja dobivena vrijednost jednaka je maksimalnoj vrijednosti u uzorku izračunatoj ranije u ćeliji B9.

Sl.1.5. Primjer 2. Konstrukcija serije jednakog intervala


Sada popunimo niz "džepova" koristeći funkciju FREQUENCY, kao što je urađeno u primjeru 1.

Sl.1.6. Primjer 2. Konstrukcija serije jednakog intervala

Na osnovu rezultirajuće varijacione serije napravićemo histogram: odaberite kolonu frekvencije i odaberite "Histogram" na kartici "Umetanje". Nakon što smo primili histogram, promijenit ćemo oznake horizontalne ose u njemu na vrijednosti u rasponu intervala, za to biramo opciju "Odaberi podatke" na kartici "Dizajner". U prozoru koji se pojavi odaberite naredbu "Promijeni" za odjeljak "Oznake horizontalne osi" i unesite raspon varijanti vrijednosti odabirom "miša".

Sl.1.7. Primjer 2. Izgradnja histograma

Sl.1.8. Primjer 2. Izgradnja histograma