Paskirstymo serijos statyba. Statistinė santrauka ir grupavimas. Statistinio pasiskirstymo eilutės. Problemų sprendimo pavyzdžiai

2. Paskirstymo serijų samprata. Diskrečiosios ir intervalinės skirstymo eilutės

paskirstymo eilutės vadinamos specialaus tipo grupės, kuriose kiekvienam atributui, atributų grupei ar atributų klasei yra žinomas vienetų skaičius grupėje arba specifinė gravitacijašis skaičius iš viso. Tie. platinimo serija– sutvarkytas atributų reikšmių rinkinys, išdėstytas didėjančia arba mažėjančia tvarka su atitinkamais svoriais. Paskirstymo serijos gali būti sudarytos pagal kiekybinius arba atributus.

Kiekybiniu pagrindu sudarytos paskirstymo serijos vadinamos variacijų serijomis. Jie yra diskretiškas ir intervalas. Paskirstymo serija gali būti sudaryta remiantis nuolat kintančiomis savybėmis (kai ypatybė per intervalą gali įgyti bet kokias reikšmes) ir diskretiškai kintančiomis savybėmis (priima griežtai apibrėžtas sveikųjų skaičių reikšmes).

diskretus variacijų pasiskirstymo serija yra diapazonas variantų su atitinkamais dažniais arba detalėmis. Atskiros serijos variantai yra diskretiškai nepertraukiamai besikeičiančios ženklo reikšmės, dažniausiai tai yra skaičiavimo rezultatas.

Diskretus

Variacinės serijos paprastai sudaromos, jei tiriamo požymio reikšmės gali skirtis viena nuo kitos bent jau baigtine verte. Diskrečiose serijose nurodomos ypatybės taško reikšmės. Pavyzdys : Parduotuvių parduodamų vyriškų kostiumų pasiskirstymas per mėnesį pagal dydį.

intervalas

variacijų serija yra sutvarkyta reikšmių kitimo intervalų rinkinys atsitiktinis kintamasis su atitinkamais dažniais arba dažnių dydžių reikšmėmis, kurios pasiekia kiekvieną iš jų. Intervalų serijos skirtos analizuoti nuolat kintančio požymio pasiskirstymą, kurio reikšmė dažniausiai fiksuojama matavimo ar svorio būdu. Tokios eilutės variantai yra grupavimas.

Pavyzdys : pirkinių paskirstymas maisto prekių parduotuvė pagal sumą.

Jei diskrečiųjų variacijų serijose dažnio atsakas tiesiogiai nurodo serijos variantą, tai intervaluose į variantų grupę.

Paskirstymo eilutes patogu analizuoti naudojant jų grafinį atvaizdavimą, leidžiantį spręsti tiek apie pasiskirstymo formą, tiek apie modelius. Atskira serija diagramoje rodoma kaip trūkinė linija - platinimo plotas. Norint jį sukurti stačiakampėje koordinačių sistemoje, kintamos savybės reitinguotos (sutvarkytos) reikšmės brėžiamos ant abscisės toje pačioje skalėje, o dažnių išreiškimo skalė – išilgai ordinatės.

Intervalų serijos rodomos kaip pasiskirstymo histogramos(t. y. stulpelių diagramos).

Kuriant histogramą, intervalų reikšmės brėžiamos ant abscisių ašies, o dažniai pavaizduoti stačiakampiais, pastatytais ant atitinkamų intervalų. Stulpelių aukštis esant vienodiems intervalams turi būti proporcingas dažniams.

Bet kurią histogramą galima paversti skirstinių daugiakampiu, tam reikia sujungti jos stačiakampių viršūnes su tiesiomis atkarpomis.

2. Indekso metodas vidutinės produkcijos įtakai analizuoti ir vidutinis darbuotojų skaičiusį gamybos apimties pokyčius

Indekso metodas naudojama analizuojant dinamiką ir lyginant bendruosius rodiklius bei veiksnius, įtakojančius šių rodiklių lygių kitimą. Indeksų pagalba galima atskleisti vidutinės produkcijos ir vidutinio darbuotojų skaičiaus įtaką produkcijos apimties pokyčiams. Ši problema išspręsta sukūrus analitinių indeksų sistemą.

Gamybos apimties indeksas su vidutinio darbuotojų skaičiaus indeksu ir vidutinės produkcijos indeksu yra susijęs taip pat, kaip produkcija (Q) yra susijusi su produkcija ( w) ir skaičius ( r) .

Galime daryti išvadą, kad produkcijos apimtis bus lygi vidutinės produkcijos ir vidutinio darbuotojų skaičiaus sandaugai:

Q = w r, kur Q yra gamybos apimtis,

w - vidutinė išeiga,

r yra vidutinis darbuotojų skaičius.

Kaip matyta, Mes kalbame apie reiškinių ryšį statikoje: dviejų veiksnių sandauga duoda bendrą gauto reiškinio tūrį. Taip pat akivaizdu, kad šis ryšys yra funkcinis, todėl šio ryšio dinamika tiriama indeksų pagalba. Pateiktame pavyzdyje tai yra tokia sistema:

J w × J r = J wr .

Pavyzdžiui, gamybos apimties indeksas Jwr, kaip rezultatinio reiškinio indeksas, gali būti suskaidytas į du indekso veiksnius: vidutinės produkcijos indeksą (Jw) ir vidutinio darbuotojų skaičiaus indeksą (Jr):

Indeksas Indeksas Indeksas

vidurkio apimtis

gamybos išėjimo stiprumas

kur J w- darbo našumo indeksas, apskaičiuotas pagal Laspeireso formulę;

J r- darbuotojų skaičiaus indeksas, apskaičiuotas pagal Paasche formulę.

Individualių veiksnių įtakai veiklos rodiklio lygio formavimuisi nustatyti naudojamos indeksų sistemos, leidžiančios 2 žinomos vertės indeksai nustato nežinomojo reikšmę.

Remiantis minėta indeksų sistema, galima rasti ir absoliutų gamybos apimties padidėjimą, išskaidytą į veiksnių įtaką.

1. Bendras gamybos apimties padidėjimas:

∆wr = ∑w 1 r 1 - ∑w 0 r 0 .

2. Augimas dėl vidutinio produkcijos rodiklio veikimo:

∆wr/w = ∑w 1 r 1 - ∑w 0 r 1 .

3. Augimas dėl vidutinio darbuotojų skaičiaus rodiklio veikimo:

∆wr/r = ∑w 0 r 1 - ∑w 0 r 0

∆wr = ∆wr/w + ∆wr/r.

Pavyzdys. Yra žinoma tokia informacija

Galime nustatyti, kaip pasikeitė gamybos apimtis santykiniais ir absoliučiais dydžiais ir kaip atskiri veiksniai turėjo įtakos šiam pokyčiui.

Gamybos apimtis siekė:

baziniu laikotarpiu

w 0 * r 0 \u003d 2000 * 90 \u003d 180000,

ir ataskaitoje

w 1 * r 1 \u003d 2100 * 100 \u003d 210 000.

Vadinasi, produkcijos apimtys išaugo 30.000 arba 1,16 proc.

∆wr=∑w 1 r 1 -∑w 0 r 0= (210000-180000)=30000

arba (210000:180000)*100%=1,16%.

Tokį gamybos apimties pokytį lėmė:

1) vidutinis darbuotojų skaičius padidės 10 žmonių arba 111,1 proc.

r 1 / r 0 \u003d 100 / 90 \u003d 1,11 arba 111,1%.

Absoliučiais skaičiais dėl šio veiksnio gamybos apimtis padidėjo 20 000:

w 0 r 1 - w 0 r 0 \u003d w 0 (r 1 -r 0) \u003d 2000 (100-90) \u003d 20000.

2) vidutinės produkcijos padidėjimas 105% arba 10 000:

w 1 r 1 / w 0 r 1 \u003d 2100 * 100 / 2000 * 100 = 1,05 arba 105%.

Absoliučiais skaičiais padidėjimas yra toks:

w 1 r 1 - w 0 r 1 \u003d (w 1 - w 0) r 1 \u003d (2100-2000) * 100 \u003d 10 000.

Taigi bendra veiksnių įtaka buvo:

1. Absoliučiais dydžiais

10000 + 20000 = 30000

2. Santykine prasme

1,11 * 1,05 = 1,16 (116%)

Todėl padidėjimas siekia 1,16 proc. Abu rezultatai buvo gauti anksčiau.

Žodis „indeksas“ vertime reiškia rodyklę, indikatorių. Statistikoje indeksas interpretuojamas kaip santykinis rodiklis, apibūdinantis reiškinio kitimą laike, erdvėje arba lyginant su planu. Kadangi indeksas yra santykinė reikšmė, indeksų pavadinimai sutampa su santykinių reikšmių pavadinimais.

Tais atvejais, kai analizuojame palyginamo produkto pokyčius laikui bėgant, galime užduoti klausimą, kaip įvairios sąlygos(skirtingose ​​srityse) keičiasi indekso dedamosios (kaina, fizinė apimtis, tam tikrų rūšių produktų gamybos ar pardavimo struktūra). Šiuo atžvilgiu sudaromi pastovios sudėties, kintamos sudėties ir struktūrinių poslinkių indeksai.

Nuolatinės (fiksuotos) sudėties indeksas – tai indeksas, apibūdinantis vidutinės reikšmės dinamiką esant tokiai pačiai fiksuotai populiacijos struktūrai.

Pastovios sudėties indekso sudarymo principas yra eliminuoti svorių struktūros pokyčių įtaką indeksuojamai reikšmei, apskaičiuojant indeksuojamo rodiklio svertinį vidutinį lygį tais pačiais svoriais.

Pastovios sudėties indeksas savo forma yra identiškas suvestiniam indeksui. Suvestinė forma yra labiausiai paplitusi.

Pastovios sudėties indeksas skaičiuojamas su svoriais, fiksuotais bet kurio laikotarpio vieno lygyje, ir parodo tik indeksuotos vertės pokytį. Pastovios sudėties indeksas eliminuoja svorių struktūros pokyčių įtaką indeksuojamai reikšmei, skaičiuojant indeksuojamo rodiklio svertinį vidutinį lygį tais pačiais svoriais. Pastovios sudėties indeksuose lyginami rodikliai, apskaičiuoti remiantis pastovia reiškinių struktūra.

Matematinės statistikos dalykas. Bendroji ir imtinė populiacija.

— Matematinė statistika- matematikos šaka, tirianti statistinių duomenų atrankos, grupavimo, sisteminimo ir analizės metodus, siekiant gauti moksliškai pagrįstas išvadas.

— Statistiniai duomenys- tiriamų objektų nagrinėjamo požymio skaitinės vertės, gautos atsitiktinio eksperimento metu.

Matematinė statistika glaudžiai susijusi su tikimybių teorija, tačiau skirtingai nei tikimybių teorija, matematinis eksperimento modelis nežinomas. Matematinė statistika, remiantis statistiniais duomenimis, būtina nustatyti nežinomą tikimybių skirstinį arba objektyviai įvertinti skirstinio parametrus.

Matematinės statistikos metodai leidžia sukurti optimalius matematinius masės, pasikartojančių reiškinių modelius. Ryšys tarp tikimybių teorijos ir matematinė statistika yra tikimybių teorijos ribinės teoremos.

Šiuo metu statistiniais metodais yra naudojami beveik visose šalies ūkio šakose.

— Gyventojų skaičius– visų tiriamų objektų (kartais – pačių objektų) statistiniai duomenys. Dažnai bendra populiacija laikoma RV X.

— Pavyzdys(imties populiacija) – statistiniai objektų, atsitiktinai atrinktų iš bendrosios visumos, duomenys.

— Mėginio dydis n(visų gyventojų skaičius N) - objektų, atrinktų tirti iš bendrosios visumos, skaičius (objektų skaičius bendrojoje aibėje).

Pavyzdžiai.

a) Statistiniai duomenys gali būti: mokinių augimas; veiksmažodžių (ar kitų kalbos dalių) skaičius tam tikros trukmės teksto ištraukoje; vidutinis atestato balas; intelekto lygis; dispečerio padarytų klaidų skaičius ir kt.

b) Bendra populiacija galbūt: visų žmonių ūgis, visų gamyklos darbuotojų gretos, tam tikros kalbos dalies vartojimo dažnumas visuose tiriamo autoriaus darbuose, visų absolventų pažymėjimo balų vidurkis ir kt.



in) mėginys gali: - 20 mokinių ūgis, veiksmažodžių skaičius atsitiktinai atrinktose 50 vienarūšių teksto ištraukų, kurių ilgis 500 vartosenų, 100 abiturientų, atsitiktinai atrinktų iš miesto mokyklų, atestato balų vidurkis ir kt.

Mėginys vadinamas atstovas, jeigu jis teisingai atspindi bendrosios populiacijos nuosavybę. Imties reprezentatyvumas pasiekiamas atsitiktinės atrankos būdu, kai visi bendrosios visumos objektai turi vienodą tikimybę būti atrinkti.

Kad pavyzdys būtų reprezentatyvus, įvairių būdų studijų objektų parinkimas.

Pasirinkimo tipai: paprastas, mechaninis, serijinis, tipinis.

Paprasta. Elementai parenkami atsitiktinai iš visos populiacijos.

Mechaninis pasirinkimas. Pasirinkite kas 10 (25, 30 ir tt) objektų iš bendrosios populiacijos.

Serijinis. Kiekvienoje serijoje atliekamas tyrimas (pvz., iš teksto atrenkama 10 ištraukų iš 500 žodžių vartosenų – 10 serijų).

Tipiškas. Bendroji populiacija skirstoma į tipines grupes pagal tam tikrą požymį. Iš kiekvienos tokios grupės išskirtų serijų skaičius nustatomas pagal šios grupės dalį bendroje populiacijoje.

Imties ir jos statistinis pasiskirstymas grafinis vaizdas.

Tegul SV X (bendra populiacija) tiriama atsižvelgiant į kurią nors savybę. Atliekama nemažai nepriklausomų bandymų. Dėl eksperimentų SV X įgauna tam tikras vertes. Gautų verčių rinkinys yra pavyzdys, o pačios reikšmės yra statistiniai duomenys.

Iš pradžių imtis reitinguojama – imties statistinių duomenų išdėstymas ne mažėjančia tvarka. Gauname variacijų seriją.

Variacijų serija- reitinguotas pavyzdys.

Diskrečiosios statistinės eilutės

Jei visuma yra atskiras CV, sudaroma atskira statistinė eilutė (statistinis skirstinys).

Leiskite vertei pasirodyti imties laikuose,

Laikas,…, – laikas.

Aš-thaya variantas pavyzdžiai; - dažnis i-oji parinktis Dažnis parodo, kiek kartų ši parinktis buvo parodyta pavyzdyje.

- santykinis dažnis i-tas variantas

(rodo, kokia yra imties dalis).

Statistinis skirstinys – tai imties parinkčių ir jų dažnių arba santykinių dažnių atitikimas.

DSV atveju statistinis pasiskirstymas gali būti pateiktas lentelės forma – statistine dažnių eilute arba statistine santykinių dažnių eilute.

Statistinės dažnių eilutės Statistinės eilutės

santykiniai dažniai

........
........
........
........

Pateikimo aiškumo dėlei statistinis pasiskirstymas imtys sudaro statistinio pasiskirstymo "grafikus": daugiakampį ir histogramą.

Dažnio daugiakampis(santykiniai dažniai) – grafinis diskrečiųjų statistinių eilučių vaizdas – laužta linija, kuri nuosekliai jungia taškus [ santykinių dažnių daugiakampiui].

Pavyzdys. Mokslininką domina stojančiųjų matematikos žinios. Atrenkama 10 pretendentų ir įrašomi jų mokykliniai šio dalyko pažymiai. Gautas toks pavyzdys: 5;4;4;3;2;5;4;3;4;5.

a) Pateikite pavyzdį formoje variacijų serija;

b) sudaryti statistines dažnių ir santykinių dažnių eilutes;

c) nubrėžkite gautos serijos santykinių dažnių daugiakampį.

a) Surikiuokime imtį, t.y. Išdėstykite imties narius nemažėjančia tvarka. Gauname variacinę eilutę: 2; 3; 3; 4; 4; 4; 4; 5; 5;5.

b) Sudarome statistinę dažnių eilutę (atitiktis tarp imties variantų ir jų dažnių) ir santykinių dažnių statistinę eilutę (atitiktis tarp imties variantų ir jų santykinių dažnių)

0,1 0,2 0,4 0,3

Statistinės dažnių eilutės statistinės eilutės rel. dažniai

1+2+4+3=10=n 0,1+0,2+0,4+0,3=1.

Santykinių dažnių daugiakampis.


Aukščiausias profesinis išsilavinimas

„RUSIJOS LIAUDIES EKONOMIKOS AKADEMIJA IR

VALSTYBĖS TARNYBA PRIE PREZIDENTO

RUSIJOS FEDERACIJA"

(Kalugos filialas)

Gamtos mokslų ir matematinių disciplinų katedra

TESTAS

Tema "Statistika"

Studentė ___ Mayboroda Galina Jurievna ______

Korespondencijos skyrius Valstybės fakultetas ir savivaldybės valdžia grupė G-12-V

Lektorius ____________________ Hamer G.V.

PhD, docentas

Kaluga-2013

1 užduotis.

1.1 užduotis. 4

1.2 užduotis. šešiolika

1.3 užduotis. 24

1.4 užduotis. 33

2 užduotis.

2.1 užduotis. 43

2.2 užduotis. 48

2.3 užduotis. 53

2.4 užduotis. 58

3 užduotis.

3.1 užduotis. 63

3.2 užduotis. 68

3.3 užduotis. 73

3.4 užduotis. 79

4 užduotis.

4.1 problema. 85

4.2 užduotis. 88

4.3 užduotis. 90

4.4 užduotis. 93

Naudotų šaltinių sąrašas. 96

1 užduotis.

1.1 užduotis.

Pateikiami šie duomenys apie regiono įmonių produkciją ir pelno dydį (1 lentelė).

1 lentelė

Duomenys apie produkcijos produkciją ir pelno dydį pagal įmones

įmonės numeris Išeiga, milijonai rublių Pelnas, milijonai rublių įmonės numeris Išeiga, milijonai rublių Pelnas, milijonai rublių
63,0 6,7 56,0 7,2
48,0 6,2 81,0 9,6
39,0 6,5 55,0 6,3
28,0 3,0 76,0 9,1
72,0 8,2 54,0 6,0
61,0 7,6 53,0 6,4
47,0 5,9 68,0 8,5
37,0 4,2 52,0 6,5
25,0 2,8 44,0 5,0
60,0 7,9 51,0 6,4
46,0 5,5 50,0 5,8
34,0 3,8 65,0 6,7
21,0 2,1 49,0 6,1
58,0 8,0 42,0 4,8
45,0 5,7 32,0 4,6

Pagal pirminius duomenis:

1. Sudarykite įmonių pasiskirstymo pagal produkciją statistinę eilutę, vienodais intervalais suformuodami penkias grupes.

Sukurkite paskirstymo serijų grafikus: daugiakampį, histogramą, kaupimą. Grafiškai nustatykite režimo ir medianos reikšmę.

2. Apskaičiuokite įmonių pasiskirstymo pagal produkciją eilės charakteristikas: aritmetinį vidurkį, dispersiją, standartinį nuokrypį, variacijos koeficientą.

Padarykite išvadą.

3. Analitinio grupavimo metodu nustatyti koreliacijos tarp pagamintos produkcijos savikainos ir vienos įmonės pelno dydžio buvimą ir pobūdį.

4. Empirine koreliacija išmatuokite gamybos savikainos ir pelno dydžio koreliacijos sandarumą.

Padarykite bendras išvadas.

Sprendimas:

Sukurkime statistinę pasiskirstymo eilutę

Norint sudaryti intervalų variacijų eilutę, apibūdinančią įmonių pasiskirstymą pagal produkciją, reikia apskaičiuoti eilučių intervalų reikšmę ir ribas.

Statant seriją su vienodais intervalais, intervalo reikšmė h nustatoma pagal formulę:

x maks ir x min- didžiausia ir mažiausia atributo reikšmės tiriamame įmonių rinkinyje;

k- intervalų serijų grupių skaičius.

Grupių skaičius k nurodytas užduotyje. k= 5.

x maks= 81 milijonas rublių, x min= 21 milijonas rublių

Intervalo reikšmės apskaičiavimas:

milijonų rublių

Iš eilės pridedant intervalo vertę h = 12 milijonų rublių. iki apatinės intervalo ribos gauname tokias grupes:

1 grupė: 21–33 milijonai rublių.

2 grupė: 33 - 45 milijonai rublių;

3 grupė: 45–57 milijonai rublių.

4 grupė: 57–69 milijonai rublių.

5 grupė: 69–81 milijonas rublių.

Norint sudaryti intervalų eilutę, reikia apskaičiuoti įmonių, įtrauktų į kiekvieną grupę, skaičių ( grupės dažniai).

Įmonių grupavimo pagal produkcijos apimtį procesas pateiktas 2 pagalbinėje lentelėje. Šios lentelės 4 stulpelis reikalingas analitinės grupės sudarymui (užduoties 3 punktas).

2 lentelė

Lentelė intervalų pasiskirstymo eilutėms sudaryti ir

analitinis grupavimas

Įmonių grupės pagal produkciją, milijonai rublių įmonės numeris Išeiga, milijonai rublių Pelnas, milijonai rublių
21-33 21,0 2,1
25,0 2,8
28,0 3,0
32,0 4,6
Iš viso 106,0 12,5
33-45 34,0 3,8
37,0 4,2
39,0 6,5
42,0 4,8
44,0 5,0
Iš viso 196,0 24,3
45-57 45,0 5,7
46,0 5,5
47,0 5,9
48,0 6,2
49,0 6,1
50,0 5,8
51,0 6,4
52,0 6,5
53,0 6,4
54,0 6,0
55,0 6,3
56,0 7,2
Iš viso 606,0 74,0
57-69 58,0 8,0
60,0 7,9
61,0 7,6
63,0 6,7
65,0 6,7
68,0 8,5
Iš viso 375,0 45,4
69-81 72,0 8,2
76,0 9,1
81,0 9,6
Iš viso 229,0 26,9
Iš viso 183,1

Remiantis 3 lentelės „Iš viso“ grupinių suvestinių eilučių, sudaroma galutinė lentelė 3, vaizduojanti įmonių pasiskirstymo pagal produkciją intervalų eilutę.

3 lentelė

Įmonių pasiskirstymas pagal produkcijos apimtį

Išvada. Sudaryta grupuotė rodo, kad įmonių pasiskirstymas pagal produkciją nėra vienodas. Labiausiai paplitusios įmonės, kurių gamybos apimtis yra nuo 45 iki 57 milijonų rublių. (12 įmonių). Mažiausiai paplitusios įmonės, kurių produkcija svyruoja nuo 69 iki 81 milijono rublių. (3 įmonės).

Sukurkime pasiskirstymo serijų grafikus.

Poligonas dažniau naudojami vaizdams atskiros serijos. Norint sukurti daugiakampį stačiakampėje koordinačių sistemoje, argumento reikšmės brėžiamos ant abscisių ašies, t. vertybes. Be to, šioje koordinačių sistemoje sudaromi taškai, kurių koordinatės yra atitinkamų skaičių poros iš variacijų serijos. Gauti taškai nuosekliai sujungiami tiesiomis atkarpomis. Daugiakampis parodytas 1 paveiksle.

juostos diagrama - Juostinė diagrama. Tai leidžia įvertinti pasiskirstymo simetriją. Histograma parodyta 2 paveiksle.

1 pav. Įmonių daugiakampis pasiskirstymas pagal apimtį

išvestis

Mada

2 pav. Įmonių pasiskirstymo pagal apimtį histograma

išvestis

Mada- požymio, kuris dažniausiai pasireiškia tiriamojoje populiacijoje, reikšmė.

Intervalų serijoms režimą galima grafiškai nustatyti pagal histogramą (2 pav.). Tam parenkamas aukščiausias stačiakampis, kuris šiuo atveju yra modalinis (45–57 mln. rublių). Tada dešinioji modalinio stačiakampio viršūnė yra sujungta su ankstesnio stačiakampio viršutiniu dešiniuoju kampu. Modalinio stačiakampio kairioji viršūnė yra su tolesnio stačiakampio viršutiniu kairiuoju kampu. Be to, nuo jų susikirtimo taško statmenas nuleidžiamas į abscisių ašį. Šių linijų susikirtimo taško abscisė bus paskirstymo režimas.

Milijonas patrinti.

Išvada. Nagrinėjamoje įmonių grupėje dažniausiai yra įmonės, kurių produkcija siekia 52 milijonus rublių.

Sukaupti - sulaužyta kreivė. Jis pagrįstas sukauptais dažniais (apskaičiuota 4 lentelėje). Kumuliatas prasideda nuo apatinės pirmojo intervalo ribos (21 milijonas rublių), sukauptas dažnis nusėda ties viršutine intervalo riba. Kumuliatas parodytas 3 paveiksle.

Mediana

3 pav. Kaupiamasis įmonių pasiskirstymas pagal apimtį

išvestis

Mediana aš yra funkcijos, kuri patenka į reitinguojamos serijos vidurį, vertė. Abiejose medianos pusėse yra tiek pat gyventojų vienetų.

Intervalų serijoje mediana gali būti nustatyta grafiškai pagal kaupiamąją kreivę. Norint nustatyti medianą nuo kaupiamojo dažnio skalės taško, atitinkančio 50 % (30:2 = 15), lygiagreti abscisių ašiai tiesi linija brėžiama tol, kol ji susikerta su kumuliacija. Tada nuo nurodytos tiesės ir kumuliacijos susikirtimo taško statmenas nuleidžiamas į abscisių ašį. Susikirtimo taško abscisė yra mediana.

Milijonas patrinti.

Išvada. Nagrinėjamoje įmonių grupėje pusės įmonių gamybos apimtis yra ne didesnė kaip 52 milijonai rublių, o kitos pusės - ne mažesnė kaip 52 milijonai rublių.


Panaši informacija.


Statistinio pasiskirstymo eilutės- tai tvarkingas gyventojų vienetų pasiskirstymas į grupes pagal tam tikrą kintantį požymį.
Priklausomai nuo bruožo, kuriuo grindžiama pasiskirstymo serijos formavimas, yra atributų ir variacijų pasiskirstymo eilutės.

Bendro požymio buvimas yra pagrindas formuoti statistinę populiaciją, kuri yra tyrimo objektų bendrų požymių aprašymo ar matavimo rezultatai.

Statistikos tyrimo objektas yra kintantys (kintantys) bruožai arba statistiniai ypatumai.

Statistinių požymių rūšys.

Paskirstymo serijos vadinamos atributų serijomis. pastatytas kokybiškai. Atributika- tai ženklas, turintis pavadinimą (pavyzdžiui, profesija: siuvėja, mokytojas ir pan.).
Paskirstymo serijas įprasta išdėstyti lentelių pavidalu. Lentelėje. 2.8 rodo paskirstymo atributų seriją.
2.8 lentelė. Rūšių pasiskirstymas teisinė pagalba advokatai teikia vieno iš Rusijos Federacijos regionų piliečiams.

Variacijų serija yra savybių reikšmės (arba reikšmių diapazonai) ir jų dažniai.
Variacijų serijos yra paskirstymo serijos pastatytas kiekybiniu pagrindu. Bet kuri variacijų serija susideda iš dviejų elementų: variantų ir dažnių.
Variantai yra individualios funkcijos reikšmės, kurias ji naudoja variantų serijoje.
Dažniai – tai atskirų variantų arba kiekvienos variacijų serijos grupės skaičiai, t.y. tai skaičiai, rodantys, kaip dažnai paskirstymo serijoje atsiranda tam tikrų parinkčių. Visų dažnių suma lemia visos populiacijos dydį, jos apimtį.
Dažniai vadinami dažniais, išreikšti vieneto dalimis arba procentais nuo bendros sumos. Atitinkamai, dažnių suma yra lygi 1 arba 100%. Variacinė eilutė leidžia įvertinti pasiskirstymo dėsnio formą remiantis faktiniais duomenimis.

Atsižvelgiant į požymio kitimo pobūdį, yra diskrečiųjų ir intervalų variacijų serijos.
Diskrečių variacijų serijos pavyzdys pateiktas lentelėje. 2.9.
2.9 lentelė. Šeimų pasiskirstymas pagal atskiruose butuose užimtų kambarių skaičių 1989 m. Rusijos Federacijoje.

Pirmajame lentelės stulpelyje pateikiami diskrečiųjų variacijų eilučių variantai, antrame stulpelyje – variacijų eilučių dažniai, trečiame – dažnio rodikliai.

Variacijų serija

Bendrojoje populiacijoje tiriamas tam tikras kiekybinis požymis. Iš jo atsitiktinai paimamas tūrio mėginys n, tai yra elementų skaičius imtyje yra n. Pirmajame statistinio apdorojimo etape diapazonas mėginių, t.y. numerių užsakymas x 1 , x 2 , …, x n Kylantis. Kiekviena pastebėta vertė x i paskambino variantas. Dažnis m i yra vertės stebėjimų skaičius x i pavyzdyje. Santykinis dažnis (dažnis) w i yra dažnio santykis m iį mėginio dydį n: .
Tiriant variacinę eilutę taip pat vartojamos kaupiamojo dažnio ir kaupiamojo dažnio sąvokos. Leisti būti x kažkoks skaičius. Tada parinkčių skaičius , kurių vertės mažesnės x, vadinamas kaupiamuoju dažniu: x i n vadinamas kaupiamuoju dažniu w i max .
Atributas vadinamas diskretišku kintamuoju, jei jo atskiros reikšmės (variantai) skiriasi viena nuo kitos tam tikru baigtiniu dydžiu (dažniausiai sveikuoju skaičiumi). Tokio požymio variacinė serija vadinama diskrečiąja variacijų serija.

1 lentelė. Bendras diskrečiųjų dažnių variacinių eilučių vaizdas

Funkcijos vertėsx i x 1 x2 x n
Dažniaim i m 1 m2 m n

Atributas vadinamas nuolat kintančiu, jei jo reikšmės viena nuo kitos skiriasi savavališkai mažai, t.y. tam tikrame intervale ženklas gali įgauti bet kokią reikšmę. Tokio požymio nuolatinė variacijų eilutė vadinama intervalų seka.

2 lentelė. Bendras dažnių intervalų kitimo eilučių vaizdas

3 lentelė. Variacijų serijų grafiniai vaizdai

EilėDaugiakampis arba histogramaEmpirinė pasiskirstymo funkcija
Diskretus
intervalas
Žvelgiant į stebėjimų rezultatus, nustatoma, kiek variantų verčių pateko į kiekvieną konkretų intervalą. Daroma prielaida, kad kiekvienas intervalas priklauso vienam iš jo galų: arba visais atvejais kairiajam (dažniau), arba visais atvejais dešiniajam, o dažniai arba dažniai parodo pasirinkimų skaičių nurodytose ribose. Skirtumai a i – a i +1 vadinami daliniais intervalais. Siekiant supaprastinti tolesnius skaičiavimus, intervalo variacijų eilutes galima pakeisti sąlyginai diskrečiąja. Šiuo atveju vidutinė vertė i-asis intervalas yra pasirenkamas x i, ir atitinkamą intervalo dažnį m i- šio intervalo dažnumui.
Variacinių eilučių grafiniam vaizdui dažniausiai naudojamas daugiakampis, histograma, kumuliacinė kreivė ir empirinio skirstinio funkcija.

Lentelėje. 2.3 (Rusijos gyventojų grupavimas pagal vidutinių pajamų vienam gyventojui dydį 1994 m. balandžio mėn.) intervalų variacijų serija.
Paskirstymo eilutes patogu analizuoti naudojant grafinį vaizdą, kuris taip pat leidžia spręsti apie skirstinio formą. Variacijų serijų dažnių kitimo pobūdį vaizdžiai pavaizduoja daugiakampis ir histograma.
Daugiakampis naudojamas rodant atskiras variacijų serijas.
Pavaizduokime, pavyzdžiui, grafiškai būsto fondo pasiskirstymą pagal butų tipus (2.10 lentelė).
2.10 lentelė. Miesto teritorijos būsto fondo pasiskirstymas pagal butų tipus (sąlyginiai skaičiai).


Ryžiai. Būsto paskirstymo daugiakampis


Y ašyje galima nubraižyti ne tik dažnių reikšmes, bet ir variacijų eilučių dažnius.
Histograma paimama norint parodyti intervalų variacijų serijas. Kuriant histogramą, intervalų reikšmės brėžiamos ant abscisių ašies, o dažniai pavaizduoti stačiakampiais, pastatytais ant atitinkamų intervalų. Stulpelių aukštis esant vienodiems intervalams turi būti proporcingas dažniams. Histograma yra grafikas, kuriame serija rodoma kaip viena šalia kitos esančios juostos.
Grafiškai pavaizduokime lentelėje pateiktą intervalų pasiskirstymo eilutę. 2.11.
2.11 lentelė. Šeimų pasiskirstymas pagal gyvenamojo ploto dydį vienam asmeniui (sąlyginiai skaičiai).
N p / p Šeimų grupės pagal gyvenamojo ploto dydį vienam asmeniui Šeimų, turinčių tam tikrą gyvenamojo ploto dydį, skaičius Sukauptas šeimų skaičius
1 3 – 5 10 10
2 5 – 7 20 30
3 7 – 9 40 70
4 9 – 11 30 100
5 11 – 13 15 115
IŠ VISO 115 ----


Ryžiai. 2.2. Šeimų pasiskirstymo pagal vienam asmeniui tenkančio gyvenamojo ploto dydį histograma


Naudodamiesi kaupiamųjų eilučių duomenimis (2.11 lentelė), konstruojame paskirstymas kaupiamasis.


Ryžiai. 2.3. Suminis šeimų pasiskirstymas pagal gyvenamojo ploto dydį vienam asmeniui


Variacinės eilutės vaizdavimas kumuliaciniu pavidalu ypač efektyvus variacinėms eilutėms, kurių dažniai išreiškiami serijų dažnių sumos trupmenomis arba procentais.
Jei pakeisime ašis variacijų serijos grafiniame vaizde kumuliacijos pavidalu, gausime ogivu. Ant pav. 2.4 parodyta lentelė, sukurta remiantis lentelės duomenimis. 2.11.
Histogramą galima paversti pasiskirstymo daugiakampiu, surandant stačiakampių kraštinių vidurio taškus ir sujungiant šiuos taškus tiesiomis linijomis. Gautas pasiskirstymo daugiakampis parodytas fig. 2.2 punktyrinė linija.
Konstruojant variacinių eilučių su nelygiais intervalais skirstinio histogramą, išilgai ordinačių ašies, braižomi ne dažniai, o požymio pasiskirstymo tankis atitinkamuose intervaluose.
Pasiskirstymo tankis yra dažnis, skaičiuojamas intervalo pločio vienetui, t.y. kiek vienetų kiekvienoje grupėje yra vieneto intervalo reikšmėje. Pasiskirstymo tankio apskaičiavimo pavyzdys pateiktas lentelėje. 2.12.
2.12 lentelė. Įmonių pasiskirstymas pagal darbuotojų skaičių (skaičiai sąlyginiai)
N p / p Įmonių grupės pagal darbuotojų skaičių, gyv. Įmonių skaičius Intervalo dydis, asm. Pasiskirstymo tankis
BET 1 2 3=1/2
1 iki 20 15 20 0,75
2 20 – 80 27 60 0,25
3 80 – 150 35 70 0,5
4 150 – 300 60 150 0,4
5 300 – 500 10 200 0,05
IŠ VISO 147 ---- ----

Taip pat galima naudoti variacijų serijų grafinį atvaizdavimą kumuliacinė kreivė. Sukaupimo (sumų kreivės) pagalba rodoma sukauptų dažnių serija. Suminiai dažniai nustatomi iš eilės sumuojant dažnius pagal grupes ir parodoma, kiek populiacijos vienetų turi požymių, ne didesnių už nagrinėjamą reikšmę.


Ryžiai. 2.4. Ogiva šeimų pasiskirstymas pagal gyvenamojo ploto dydį vienam žmogui

Konstruojant intervalų variacijų eilučių kumuliaciją, sekų variantai brėžiami išilgai abscisių ašies, o kaupiami dažniai – išilgai ordinačių ašies.

Laboratorinis darbas №1. Pirminis statistinių duomenų apdorojimas

Paskirstymo serijos konstrukcija

Vadinamas tvarkingas gyventojų vienetų pasiskirstymas į grupes pagal bet kurį požymį netoli platinimo . Šiuo atveju ženklas gali būti tiek kiekybinis, tada serija vadinama variacinis , ir kokybinis, tada serija vadinama atributinė . Taigi, pavyzdžiui, miesto gyventojų skaičius gali būti paskirstytas pagal amžiaus grupes variacijų serijoje arba pagal profesinę priklausomybę atributų serijoje (žinoma, pasiskirstymo eilui sudaryti galima pasiūlyti daug daugiau kokybinių ir kiekybinių požymių, požymio pasirinkimą lemia statistinio tyrimo uždavinys).

Bet kuriai platinimo serijai būdingi du elementai:

- variantas(x i) - tai individualios imties visumos vienetų požymio reikšmės. Variantų serijai variantas įgauna skaitines reikšmes, atributinei – kokybines (pvz., x = "valstybės tarnautojas");

- dažnis(n i) yra skaičius, rodantis, kiek kartų atsiranda ta ar kita funkcijos reikšmė. Jei dažnis išreiškiamas santykiniu skaičiumi (t. y. populiacijos elementų, atitinkančių tam tikrą opcionų reikšmę, dalis bendroje populiacijos apimtyje), tada jis vadinamas santykinis dažnis arba dažnis.

Variacijų serijos gali būti:

- diskretus kai tiriamam požymiui būdingas tam tikras skaičius (dažniausiai sveikasis skaičius).

- intervalas kai nuolat kintamo požymio ribos "nuo" ir "iki". Intervalų serija taip pat sudaroma, jei diskretiškai kintamo požymio reikšmių rinkinys yra didelis.

Intervalų serija gali būti sudaryta tiek su vienodo ilgio intervalais (vienodo intervalo eilutė), tiek su nevienodais intervalais, jei tai diktuoja statistinio tyrimo sąlygos. Pavyzdžiui, galima atsižvelgti į gyventojų pajamų pasiskirstymo seką tokiais intervalais:<5тыс р., 5-10 тыс р., 10-20 тыс.р., 20-50 тыс р., и т.д. Если цель исследования не определяет способ построения интервального ряда, то строится равноинтервальный ряд, число интервалов в котором определяется по формуле Стерджесса:



kur k yra intervalų skaičius, n yra imties dydis. (Žinoma, formulė dažniausiai duoda trupmeninį skaičių, o intervalų skaičiumi pasirenkamas artimiausias sveikasis skaičius gautam skaičiui.) Intervalo ilgis šiuo atveju nustatomas pagal formulę.

.

Grafiškai variacinės serijos gali būti pavaizduotos kaip histogramos(virš kiekvieno intervalo serijos intervalo pastatyta aukščio "stulpelis", atitinkantis šio intervalo dažnį), platinimo plotas(nutrūkusi linija, jungianti taškus ( x i;n i) arba kaupiasi(sudaryta pagal sukauptus dažnius, t. y. kiekvienai atributo reikšmei imamas pasireiškimo dažnis objektų, kurių atributo reikšmė mažesnė už duotąją, aibėje).

Dirbant su „Excel“, kuriant variacines serijas galima naudoti šias funkcijas:

PATIKRINTI( duomenų masyvas) – imties dydžiui nustatyti. Argumentas yra langelių diapazonas, kuriame yra pavyzdiniai duomenys.

COUNTIF( diapazonas; kriterijus) – gali būti naudojamas kuriant atributų arba variantų serijas. Argumentai yra atributo pavyzdžių verčių masyvo diapazonas ir kriterijus - skaitmeninė arba tekstinė atributo reikšmė arba langelio, kuriame jis yra, numeris. Rezultatas yra tos vertės atsiradimo imtyje dažnis.

DAŽNIS( duomenų masyvas; intervalų masyvas) – sukurti variacinę seriją. Argumentai yra pavyzdinių duomenų masyvo diapazonas ir intervalų stulpelis. Jei reikia sudaryti diskrečią seriją, čia nurodomos parinkčių reikšmės, jei tai yra intervalas, tada viršutinės intervalų ribos (jos taip pat vadinamos "kišenėmis"). Kadangi rezultatas yra dažnių stulpelis, funkcijos įvedimas turi būti baigtas paspaudus klavišų kombinaciją CTRL+SHIFT+ENTER. Atkreipkite dėmesį, kad nustatant intervalų masyvą įvedant funkciją, paskutinė joje esanti reikšmė gali būti praleista - visos reikšmės, kurios nepateko į ankstesnes „kišenes“, bus dedamos į atitinkamą „kišenę“. Tai kartais padeda išvengti klaidos, kad didžiausia imties reikšmė automatiškai neįdedama į paskutinę „kišenę“.

Be to, sudėtingoms grupėms (pagal keletą kriterijų) naudojamas „pivot table“ įrankis. Jie taip pat gali būti naudojami kuriant atributų ir variantų serijas, tačiau tai be reikalo apsunkina užduotį. Be to, norint sukurti variantų seriją ir histogramą, yra „histogramos“ procedūra iš „Analysis Package“ papildinio (norėdami naudoti priedus „Excel“, pirmiausia turite juos atsisiųsti, jie nėra įdiegti pagal numatytuosius nustatymus)

Pirminio duomenų apdorojimo procesą iliustruojame šiais pavyzdžiais.

1.1 pavyzdys. yra duomenų apie 60 šeimų kiekybinę sudėtį.

Sukurkite variacijų seriją ir paskirstymo daugiakampį

Sprendimas.

Atidarykime „Excel“ skaičiuokles. Įveskime duomenų masyvą diapazone A1:L5. Jei studijuojate dokumentą elektronine forma (pvz., Word formatu), tereikia pasirinkti lentelę su duomenimis ir nukopijuoti į mainų sritį, tada pasirinkti langelį A1 ir įklijuoti duomenis – jie automatiškai užims atitinkamą diapazoną. Apskaičiuokime imties dydį n – imties duomenų skaičių, tam langelyje B7 įveskite formulę = COUNT (A1: L5). Atkreipkite dėmesį, kad norint į formulę įvesti norimą diapazoną, nebūtina įvesti jo žymėjimo iš klaviatūros, pakanka jį pasirinkti. Nustatykime minimalias ir didžiausias imties vertes, įvesdami formulę =MIN(A1:L5) į langelį B8, o į langelį B9: =MAX(A1:L5).

1.1 pav. 1 pavyzdys. Pirminis statistinių duomenų apdorojimas Excel lentelėse

Toliau paruošime lentelę variacijų serijai sudaryti, įvesdami intervalo stulpelio (variantų reikšmių) ir dažnio stulpelio pavadinimus. Intervalų stulpelyje įveskite atributo reikšmes nuo minimalios (1) iki didžiausios (6), užimančias diapazoną B12:B17. Pasirinkite dažnio stulpelį, įveskite formulę =FREQUENCY(A1:L5;B12:B17) ir paspauskite klavišų kombinaciją CTRL+SHIFT+ENTER

1.2 pav. 1 pavyzdys. Variacijų serijos konstravimas

Kontrolei dažnių sumą apskaičiuojame naudodami funkciją SUM (funkcijos piktograma S, esančioje Redagavimo grupėje skirtuke Pagrindinis), apskaičiuota suma turi atitikti anksčiau apskaičiuotą imties dydį langelyje B7.

Dabar sukurkime daugiakampį: pasirinkę gautą dažnių diapazoną, skirtuke „Įterpti“ pasirinkite komandą „Grafas“. Pagal numatytuosius nustatymus horizontalios ašies reikšmės bus eilės skaičiai - mūsų atveju nuo 1 iki 6, o tai sutampa su parinkčių reikšmėmis (tarifų kategorijų skaičiais).

Diagramos serijos pavadinimą „1 serija“ galima pakeisti naudojant tą pačią parinktį „Pasirinkti duomenis“ skirtuke „Dizaineris“ arba tiesiog ištrinti.

1.3 pav. 1 pavyzdys. Dažnio daugiakampio sudarymas

1.2 pavyzdys. Yra duomenų apie teršalų išmetimą iš 50 šaltinių:

10,4 18,6 10,3 26,0 45,0 18,2 17,3 19,2 25,8 18,7
28,2 25,2 18,4 17,5 41,8 14,6 10,0 37,8 10,5 16,0
18,1 16,8 38,5 37,7 17,9 29,0 10,1 28,0 12,0 14,0
14,2 20,8 13,5 42,4 15,5 17,9 19, 10,8 12,1 12,4
12,9 12,6 16,8 19,7 18,3 36,8 15,0 37,0 13,0 19,5

Sudarykite vienodo intervalo eilutę, sukurkite histogramą

Sprendimas

Į Excel lapą įtraukime duomenų masyvą, jis užims diapazoną A1:J5 Kaip ir ankstesnėje užduotyje, nustatysime imties dydį n, pavyzdyje esančias minimalias ir didžiausias reikšmes. Kadangi dabar mums reikia ne diskrečios, o intervalų serijos, o užduotyje esančių intervalų skaičius nenurodytas, intervalų skaičių k apskaičiuojame naudodami Sturgesso formulę. Norėdami tai padaryti, langelyje B10 įveskite formulę =1+3.322*LOG10(B7).

1.4 pav. 2 pavyzdys. Lygių intervalų serijos sudarymas

Gauta reikšmė nėra sveikasis skaičius, ji yra maždaug 6,64. Kadangi k=7 intervalų ilgis bus išreikštas sveikuoju skaičiumi (priešingai nei k=6 atveju), pasirinksime k=7, įvesdami šią reikšmę į langelį C10. Apskaičiuojame intervalo d ilgį langelyje B11, įvesdami formulę = (B9-B8) / C10.

Apibrėžkime intervalų masyvą, nurodydami viršutinę kiekvieno iš 7 intervalų ribą. Norėdami tai padaryti, langelyje E8 apskaičiuokite pirmojo intervalo viršutinę ribą, įvesdami formulę =B8+B11; langelyje E9 viršutinė antrojo intervalo riba, įvedant formulę =E8+B11. Norėdami apskaičiuoti likusias viršutinių intervalų ribų reikšmes, įvestoje formulėje fiksuojame langelio B11 skaičių naudodami $ ženklą, kad E9 langelio formulė taptų =E8+B$11, ir nukopijuojame ląstelės E9 į ląsteles E10-E14. Paskutinė gauta vertė yra lygi didžiausiai imties vertei, apskaičiuotai anksčiau langelyje B9.

1.5 pav. 2 pavyzdys. Lygių intervalų serijos sudarymas


Dabar užpildykime „kišenių“ masyvą naudodami FREQUENCY funkciją, kaip buvo padaryta 1 pavyzdyje.

1.6 pav. 2 pavyzdys. Lygių intervalų serijos sudarymas

Remdamiesi gautomis variacijų serijomis, sudarysime histogramą: pasirinkite dažnio stulpelį ir skirtuke „Įterpti“ pasirinkite „Histograma“. Gavę histogramą, pakeisime joje esančias horizontaliosios ašies etiketes į vertes intervalų diapazone, tam skirtuke „Dizaineris“ pasirenkame parinktį „Pasirinkti duomenis“. Pasirodžiusiame lange skiltyje „Horizontalios ašies etiketės“ ​​pasirinkite komandą „Keisti“ ir pasirinkdami „pele“ įveskite reikšmių diapazoną.

1.7 pav. 2 pavyzdys. Histogramos kūrimas

1.8 pav. 2 pavyzdys. Histogramos kūrimas