Paskirstymo ir grupavimo serijos. Diskrečių variacijų serijos konstravimas

Laboratoriniai darbai №1

Autorius matematinė statistika

Tema: Pirminis eksperimentinių duomenų apdorojimas

3. Taškais. 1

5. Kontroliniai klausimai.. 2

6. Laboratorinių darbų atlikimo metodika.. 3

Darbo tikslas

Pirminio empirinių duomenų apdorojimo, naudojant matematinės statistikos metodus, įgūdžių įgijimas.

Remdamiesi eksperimentinių duomenų visuma, atlikite šias užduotis:

1 pratimas. Sukurkite intervalų variacijų pasiskirstymo eilutę.

2 užduotis. Sukurkite intervalo variacijų serijos dažnių histogramą.

3 užduotis. Sukurkite empirinę skirstinio funkciją ir nubraižykite grafiką.

a) režimas ir mediana;

b) sąlyginiai pradiniai momentai;

c) imties vidurkis;

d) imties dispersija, koreguota populiacijos dispersija, pataisytas vidurkis standartinis nuokrypis;

e) variacijos koeficientas;

f) asimetrija;

g) kurtozė;

5 užduotis. Apibrėžkite ribas tikrosios vertybės skaitinės charakteristikos, atsitiktinis dydis tiriamas tam tikru patikimumu.

6 užduotis. Turiniu pagrįsta pirminio apdorojimo rezultatų interpretacija pagal užduoties sąlygas.

Rezultatas taškais

1-5 užduotys6 taškai

6 užduotis2 taškai

Laboratorinių darbų gynimas(žodinis pokalbis testo klausimais ir laboratorinis darbas) - 2 taškai

Darbas turi būti pateiktas raštu ant A4 formato lapų ir apima:

1) Titulinis puslapis(1 priedas)

2) Pradiniai duomenys.

3) Darbo pateikimas pagal nurodytą pavyzdį.

4) Skaičiavimo rezultatai (atliekami rankiniu būdu ir/ar naudojant MS Excel) nurodyta tvarka.

5) Išvados – prasmingas pirminio apdorojimo rezultatų interpretavimas pagal problemos sąlygas.

6) Žodinis pokalbis darbo ir kontroliniais klausimais.



5. Testo klausimai


Laboratorinių darbų atlikimo metodika

Užduotis 1. Sukurkite intervalo variacinio skirstinio eilutę

Norint pateikti statistinius duomenis variacijų eilučių pavidalu su vienodais intervalais išdėstytomis parinktimis, būtina:

1. Pradinėje duomenų lentelėje raskite mažiausią ir didžiausią reikšmes.

2. Apibrėžkite variacijos diapazonas :

3. Nustatykite intervalo h ilgį, jei imtyje yra iki 1000 duomenų, naudokite formulę: , kur n – imties dydis – duomenų kiekis imtyje; skaičiavimams imk lgn).

Apskaičiuotas santykis suapvalinamas iki patogi sveikojo skaičiaus vertė .

4. Norint nustatyti pirmojo intervalo pradžią lyginiam intervalų skaičiui, rekomenduojama imti reikšmę ; o nelyginiam intervalų skaičiui .

5. Užrašykite grupavimo intervalus ir išdėstykite juos ribų didėjimo tvarka

, ,………., ,

kur yra pirmojo intervalo apatinė riba. Paimamas patogus skaičius, kuris yra ne didesnis kaip , viršutinė paskutinio intervalo riba turi būti ne mažesnė kaip . Rekomenduojama, kad intervaluose būtų pradinės atsitiktinio dydžio reikšmės ir jie būtų atskirti nuo nuo 5 iki 20 intervalais.

6. Užsirašykite pradinius duomenis apie grupavimo intervalus, t.y. naudokite šaltinio lentelę atsitiktinių kintamųjų verčių, patenkančių į nurodytus intervalus, skaičių. Jei kai kurios reikšmės sutampa su intervalų ribomis, tada jie priskiriami arba tik ankstesniam, arba tik vėlesniam intervalui.

1 pastaba. Intervalai neturi būti vienodo ilgio. Vietose, kur reikšmės tankesnės, patogiau imti mažesnius, trumpesnius intervalus, o kur retesni – didesnius.

Užrašas 2.Jei kai kurioms reikšmėms gaunamos „nulis“ arba mažos dažnio reikšmės, tuomet reikia duomenis pergrupuoti, didinant intervalus (didinant žingsnį).

Laboratorinis darbas Nr.1. Pirminis statistinių duomenų apdorojimas

Paskirstymo serijos konstrukcija

Tvarkingas gyventojų vienetų pasiskirstymas į grupes pagal bet kurią požymį vadinamas netoli platinimo . Šiuo atveju charakteristika gali būti kiekybinė, tada vadinama serija variacinis , ir kokybinis, tada serija vadinama atributinė . Taigi, pavyzdžiui, miesto gyventojų skaičius gali būti paskirstytas pagal amžiaus grupėse variacijų serijoje arba pagal profesinę priklausomybę atributų serijoje (žinoma, pasiskirstymo serijoms sudaryti galima pasiūlyti daug daugiau kokybinių ir kiekybinių charakteristikų; charakteristikos pasirinkimą lemia užduotis statistiniai tyrimai).

Bet kuriai platinimo serijai būdingi du elementai:

- variantas(x i) – tai individualios imties visumos vienetų charakteristikos reikšmės. Variacijų serijai pasirenkamos skaitinės reikšmės, atributinės eilutės – kokybinės (pvz., x = „valstybės tarnautojas“);

- dažnis(n i) – skaičius, rodantis, kiek kartų tam tikra atributo reikšmė pasitaiko. Jei dažnis išreiškiamas santykiniu skaičiumi (t. y. visumos elementų, atitinkančių duotą opcionų reikšmę, proporcija bendroje populiacijos apimtyje), tada jis vadinamas santykinis dažnis arba dažnis.

Variacijų serija Gal būt:

- diskretus, kai tiriama charakteristika apibūdinama tam tikru skaičiumi (dažniausiai sveikuoju skaičiumi).

- intervalas, kai nuolat kintančios charakteristikos ribos „nuo“ ir „iki“. Intervalinė serija taip pat sudarytas, jei diskretiškai kintančios charakteristikos reikšmių rinkinys yra didelis.

Intervalų serija gali būti sudaryta tiek su vienodo ilgio intervalais (vienodo intervalo eilutės), tiek su nevienodais intervalais, jei tai diktuoja statistinio tyrimo sąlygos. Pavyzdžiui, galima atsižvelgti į pajamų paskirstymo seką tokiais intervalais:<5тыс р., 5-10 тыс р., 10-20 тыс.р., 20-50 тыс р., и т.д. Если цель исследования не определяет способ построения интервального ряда, то строится равноинтервальный ряд, число интервалов в котором определяется по формуле Стерджесса:



kur k yra intervalų skaičius, n yra imties dydis. (Žinoma, formulė dažniausiai duoda trupmeninį skaičių, o intervalų skaičiumi pasirenkamas artimiausias gautam skaičiui sveikasis skaičius.) Intervalo ilgis šiuo atveju nustatomas pagal formulę

.

Grafiškai variacijų serijos gali būti pateiktos formoje histogramos(virš kiekvieno intervalų serijos intervalo pastatyta aukščio „stulpelis“, atitinkantis šio intervalo dažnį), paskirstymo daugiakampis(nutrūkusi linija, jungianti taškus ( x i;n i) arba kaupiasi(pagrįsta sukauptais dažniais, t. y. kiekvienai atributo reikšmei imamas dažnis objektų, kurių atributo reikšmė yra mažesnė už nurodytąją, rinkinyje).

Dirbant su Excel, variacijų serijoms sudaryti galima naudoti šias funkcijas:

PATIKRINTI( duomenų masyvas) – imties dydžiui nustatyti. Argumentas yra langelių diapazonas, kuriame yra imties duomenys.

COUNTIF( diapazonas; kriterijus) – gali būti naudojamas atributui arba variacinei serijai sudaryti. Argumentai yra atributo pavyzdinių verčių masyvo diapazonas ir kriterijus - skaitmeninė arba tekstinė atributo reikšmė arba langelio, kuriame jis yra, numeris. Rezultatas yra tos vertės atsiradimo imtyje dažnis.

DAŽNIS( duomenų masyvas; intervalų masyvas) – variacijų serijai sudaryti. Argumentai yra pavyzdinių duomenų masyvo diapazonas ir intervalo stulpelis. Jei reikia sudaryti diskrečią seriją, čia nurodomos parinkčių reikšmės; jei tai yra intervalų serija, tada viršutinės intervalų ribos (jos taip pat vadinamos „kišenėmis“). Kadangi rezultatas yra dažnių stulpelis, funkcijos įvedimą turite užbaigti paspausdami CTRL+SHIFT+ENTER. Atkreipkite dėmesį, kad įvesdami funkciją nurodydami intervalų masyvą, jums nereikia nurodyti paskutinės reikšmės - visos reikšmės, kurios nebuvo įtrauktos į ankstesnes „kišenes“, bus patalpintos į atitinkamą „kišenę“. Tai kartais gali padėti išvengti klaidos, kai didžiausia imties reikšmė automatiškai neįdedama į paskutinę kišenę.

Be to, sudėtingoms grupėms (remiantis keliomis charakteristikomis) naudokite įrankį „pivot tables“. Jie taip pat gali būti naudojami atributų ir variantų serijoms sudaryti, tačiau tai be reikalo apsunkina užduotį. Be to, norint sukurti variantų seriją ir histogramą, yra „histogramos“ procedūra iš „Analytics Package“ papildinio (norėdami naudoti priedus „Excel“, pirmiausia turite juos atsisiųsti; jie nėra įdiegti pagal numatytuosius nustatymus)

Iliustruojame pirminio duomenų apdorojimo procesą šiais pavyzdžiais.

1.1 pavyzdys. Yra duomenų apie 60 šeimų kiekybinę sudėtį.

Sukurkite variacijų seriją ir skirstinio daugiakampį

Sprendimas.

Atidarykime Excel lenteles. Įveskime duomenų masyvą į diapazoną A1:L5. Jei studijuojate dokumentą elektronine forma (pavyzdžiui, Word formatu), norėdami tai padaryti, tiesiog pasirinkite lentelę su duomenimis ir nukopijuokite ją į mainų sritį, tada pasirinkite langelį A1 ir įklijuokite duomenis – jie automatiškai užims atitinkamą diapazoną. Apskaičiuokime mėginio tūrį n – imties duomenų skaičių, tam langelyje B7 įveskite formulę =COUNT(A1:L5). Atkreipkite dėmesį, kad norint įvesti norimą diapazoną į formulę, nereikia įvesti jo žymėjimo iš klaviatūros, pakanka jį pasirinkti. Nustatykime pavyzdžio minimalias ir didžiausias vertes, įvesdami formulę =MIN(A1:L5) langelyje B8 ir =MAX(A1:L5) langelyje B9.

1.1 pav. 1 pavyzdys. Pirminis statistinių duomenų apdorojimas Excel lentelėse

Toliau parengsime lentelę variacijų serijai sudaryti, įvesdami intervalo stulpelio (variantų reikšmių) ir dažnio stulpelio pavadinimus. Intervalų stulpelyje įveskite būdingas reikšmes nuo minimalios (1) iki didžiausios (6), užimančias diapazoną B12:B17. Pasirinkite dažnio stulpelį, įveskite formulę =FREQUENCY(A1:L5,B12:B17) ir paspauskite klavišų kombinaciją CTRL+SHIFT+ENTER

1.2 pav. 1 pavyzdys. Variacijų serijos sudarymas

Norėdami valdyti, apskaičiuokime dažnių sumą naudodami funkciją SUM (funkcijos piktograma S grupėje „Redagavimas“ skirtuke „Pagrindinis“), apskaičiuota suma turi sutapti su anksčiau apskaičiuotu mėginio tūriu langelyje B7.

Dabar sukurkime daugiakampį: pasirinkę gautą dažnių diapazoną, skirtuke „Įterpti“ pasirinkite komandą „Grafas“. Pagal numatytuosius nustatymus horizontalios ašies reikšmės bus eilės skaičiai - mūsų atveju nuo 1 iki 6, o tai sutampa su parinkčių reikšmėmis (tarifų kategorijų skaičiais).

Diagramų serijos pavadinimą „1 serija“ galima pakeisti naudojant tą pačią skirtuko „Dizainas“ parinktį „Pasirinkti duomenis“ arba tiesiog ištrinti.

1.3 pav. 1 pavyzdys. Dažnio daugiakampio konstravimas

1.2 pavyzdys. Yra duomenų apie teršalų išmetimą iš 50 šaltinių:

10,4 18,6 10,3 26,0 45,0 18,2 17,3 19,2 25,8 18,7
28,2 25,2 18,4 17,5 41,8 14,6 10,0 37,8 10,5 16,0
18,1 16,8 38,5 37,7 17,9 29,0 10,1 28,0 12,0 14,0
14,2 20,8 13,5 42,4 15,5 17,9 19, 10,8 12,1 12,4
12,9 12,6 16,8 19,7 18,3 36,8 15,0 37,0 13,0 19,5

Sukurkite vienodo intervalo eilutę, sukurkite histogramą

Sprendimas

Įveskime duomenų masyvą į Excel lapą, jis užims diapazoną A1:J5 Kaip ir ankstesnėje užduotyje, nustatysime imties dydį n, pavyzdyje esančias minimalias ir didžiausias reikšmes. Kadangi dabar mums reikia ne diskrečiųjų, o intervalų, o užduotyje esančių intervalų skaičius nenurodytas, intervalų skaičių k apskaičiuojame naudodami Sturgesso formulę. Norėdami tai padaryti, langelyje B10 įveskite formulę =1+3.322*LOG10(B7).

1.4 pav. 2 pavyzdys. Lygių intervalų serijos sudarymas

Gauta reikšmė nėra sveikasis skaičius, ji yra maždaug 6,64. Kadangi k=7 intervalų ilgis bus išreikštas sveikuoju skaičiumi (skirtingai nei k=6 atveju), pasirenkame k=7, įvesdami šią reikšmę į langelį C10. Intervalo d ilgį langelyje B11 apskaičiuojame įvedę formulę =(B9-B8)/C10.

Apibrėžkime intervalų masyvą, nurodydami viršutinę ribą kiekvienam iš 7 intervalų. Norėdami tai padaryti, langelyje E8 apskaičiuojame pirmojo intervalo viršutinę ribą, įvesdami formulę =B8+B11; langelyje E9 viršutinė antro intervalo riba, įvedant formulę =E8+B11. Norėdami apskaičiuoti likusias viršutinių intervalų ribų reikšmes, įvestoje formulėje fiksuojame langelio B11 skaičių naudodami $ ženklą, kad E9 langelio formulė būtų =E8+B$11, ir nukopijuokite ląstelės E9 turinys į E10-E14 ląsteles. Paskutinė gauta vertė yra lygi didžiausiai imties vertei, apskaičiuotai anksčiau langelyje B9.

1.5 pav. 2 pavyzdys. Lygių intervalų serijos sudarymas


Dabar užpildykime „kišenių“ masyvą naudodami FREQUENCY funkciją, kaip buvo padaryta 1 pavyzdyje.

1.6 pav. 2 pavyzdys. Lygių intervalų serijos sudarymas

Naudodamiesi gautomis variacijų serijomis, sudarysime histogramą: pasirinkite dažnio stulpelį ir skirtuke „Įterpti“ pasirinkite „Histograma“. Gavę histogramą, pakeiskime joje esančias horizontaliosios ašies etiketes į intervalų diapazono reikšmes; tam skirtuke „Dizaineris“ pasirinkite parinktį „Pasirinkti duomenis“. Pasirodžiusiame lange pasirinkite „Horizontalios ašies etiketės“ ​​komandą „Keisti“ ir įveskite parinkčių reikšmių diapazoną, pasirinkdami jį pele.

1.7 pav. 2 pavyzdys. Histogramos sudarymas

1.8 pav. 2 pavyzdys. Histogramos sudarymas

Kas yra statistinių duomenų grupavimas ir kaip jis susijęs su pasiskirstymo eilutėmis, buvo aptarta šioje paskaitoje, kurioje taip pat galite sužinoti, kas yra diskrečios ir kintamos pasiskirstymo eilutės.

Pasiskirstymo eilutės yra viena iš statistinių eilučių atmainų (be jų statistikoje naudojamos ir dinamikos eilutės), jos naudojamos duomenims apie socialinio gyvenimo reiškinius analizuoti. Variacijų serijų kūrimas yra gana įmanoma užduotis kiekvienam. Tačiau yra taisyklių, kurias reikia atsiminti.

Kaip sudaryti diskrečią variacinio skirstinio eilutę

1 pavyzdys. Yra duomenų apie vaikų skaičių 20-yje apklaustų šeimų. Sukurkite diskrečiųjų variacijų seriją šeimos pasiskirstymas pagal vaikų skaičių.

0 1 2 3 1
2 1 2 1 0
4 3 2 1 1
1 0 1 0 2

Sprendimas:

  1. Pradėkime nuo lentelės išdėstymo, į kurį vėliau įvesime duomenis. Kadangi paskirstymo eilutės turi du elementus, lentelę sudarys du stulpeliai. Pirmas stulpelis visada yra parinktis - ką mes studijuojame - jo pavadinimą paimame iš užduoties (sakinio pabaiga su užduotimi sąlygose) - pagal vaikų skaičių– tai reiškia, kad mūsų pasirinkimas yra vaikų skaičius.

Antrasis stulpelis yra dažnis - kaip dažnai mūsų variantas pasireiškia tiriamame reiškinyje - taip pat stulpelio pavadinimą paimame iš užduoties - šeimos pasiskirstymas – tai reiškia, kad mūsų dažnis yra šeimų, turinčių atitinkamą skaičių vaikų, skaičius.

  1. Dabar iš šaltinio duomenų pasirenkame tas reikšmes, kurios pasitaiko bent kartą. Mūsų atveju taip yra

Ir išdėliokime šiuos duomenis pirmajame lentelės stulpelyje logine tvarka, šiuo atveju padidindami nuo 0 iki 4. Gauname

Ir galiausiai suskaičiuokime, kiek kartų pasitaiko kiekviena varianto reikšmė.

0 1 2 3 1

2 1 2 1 0

4 3 2 1 1

1 0 1 0 2

Rezultate gauname užpildytą lentelę arba reikiamą šeimų pasiskirstymo pagal vaikų skaičių eilutę.

Pratimas . Yra duomenų apie 30 įmonės darbuotojų tarifų kategorijas. Sukurkite atskirų variacijų eilutę, skirtą darbuotojų paskirstymui pagal tarifų kategorijas. 2 3 2 4 4 5 5 4 6 3

1 4 4 5 5 6 4 3 2 3

4 5 4 5 5 6 6 3 3 4

Kaip sudaryti intervalo variacinio skirstinio eilutę

Sukurkime intervalų skirstinio seką ir pažiūrėkime, kuo jos konstrukcija skiriasi nuo diskrečiųjų eilučių.

2 pavyzdys. Yra duomenų apie 16 įmonių gautą pelno sumą, milijonus rublių. — 23 48 57 12 118 9 16 22 27 48 56 87 45 98 88 63. Sudarykite įmonių pasiskirstymo pagal pelno apimtį intervalų variacijų eilutę, identifikuodami 3 grupes vienodais intervalais.

Bendras serijos konstravimo principas, žinoma, išliks tie patys du stulpeliai, tos pačios parinktys ir dažnis, tačiau šiuo atveju variantai išsidėstys intervale ir dažniai bus skaičiuojami skirtingai.

Sprendimas:

  1. Pradėkime panašiai kaip ir ankstesnėje užduotyje, sukurdami lentelės maketą, į kurį vėliau įvesime duomenis. Kadangi paskirstymo eilutės turi du elementus, lentelę sudarys du stulpeliai. Pirmas stulpelis visada yra parinktis - ką mes tiriame - jo pavadinimą paimame iš užduoties (sakinio pabaiga su užduotimi sąlygose) - pagal pelno sumą - tai reiškia, kad mūsų pasirinkimas yra gauto pelno suma .

Antrasis stulpelis yra dažnis - kaip dažnai mūsų variantas pasireiškia tiriamame reiškinyje - taip pat stulpelio pavadinimą paimame iš užduoties - įmonių pasiskirstymas - tai reiškia, kad mūsų dažnis yra įmonių, turinčių atitinkamą pelną, skaičius, šiuo atveju patenka į intervalą.

Dėl to mūsų lentelės išdėstymas atrodys taip:

kur i yra intervalo reikšmė arba ilgis,

Xmax ir Xmin – didžiausia ir mažiausia atributo reikšmė,

n – reikiamas grupių skaičius pagal uždavinio sąlygas.

Apskaičiuokime mūsų pavyzdžio intervalo dydį. Norėdami tai padaryti, tarp pradinių duomenų rasime didžiausią ir mažiausią

23 48 57 12 118 9 16 22 27 48 56 87 45 98 88 63 – maksimali vertė 118 milijonų rublių ir minimali 9 milijonai rublių. Atlikime skaičiavimus naudodami formulę.

Skaičiuodami gavome skaičių 36, (3) periode tris, tokiose situacijose intervalo reikšmė turi būti suapvalinta taip, kad atlikus skaičiavimus nebūtų prarasti didžiausi duomenys, todėl skaičiuojant intervalas yra 36,4 milijono rublių.

  1. Dabar sukonstruokime intervalus – mūsų šios problemos galimybes. Pirmasis intervalas pradedamas statyti nuo minimalios reikšmės, prie jo pridedama intervalo reikšmė ir gaunama viršutinė pirmojo intervalo riba. Tada pirmojo intervalo viršutinė riba tampa antrojo intervalo apatine riba, prie jos pridedama intervalo reikšmė ir gaunamas antras intervalas. Ir taip tiek kartų, kiek reikia, kad būtų sudaryti intervalai pagal sąlygą.

Atkreipkime dėmesį, kad jei intervalo reikšmės nebūtume suapvalinę iki 36,4, o palikę ją ties 36,3, tada paskutinė reikšmė būtų buvusi 117,9. Norint išvengti duomenų praradimo, intervalo reikšmę reikia suapvalinti iki didesnės vertės.

  1. Suskaičiuokime įmonių, patenkančių į kiekvieną konkretų intervalą, skaičių. Apdorojant duomenis, turite atsiminti, kad į viršutinę intervalo reikšmę tam tikrame intervale neatsižvelgiama (į šį intervalą neįtraukiama), bet į ją atsižvelgiama kitame intervale (įtraukiama apatinė intervalo riba šiame intervale, o viršutinis neįtraukiamas), išskyrus paskutinį intervalą.

Apdorojant duomenis geriausia pasirinktus duomenis nurodyti simboliais arba spalvomis, kad būtų supaprastintas apdorojimas.

23 48 57 12 118 9 16 22

27 48 56 87 45 98 88 63

Pirmąjį intervalą pažymėkime geltona spalva - ir nustatykime, kiek duomenų patenka į intervalą nuo 9 iki 45,4, o į šį 45,4 bus atsižvelgta antrajame intervale (su sąlyga, kad jis yra duomenyse) - kaip rezultatas 7 įmonės per pirmąjį intervalą. Ir taip toliau visais intervalais.

  1. (papildomas veiksmas) Apskaičiuokime bendrą įmonių gauto pelno sumą kiekvienam intervalui ir apskritai. Norėdami tai padaryti, sudėkite skirtingomis spalvomis pažymėtus duomenis ir gaukite bendrą pelno vertę.

Pirmam intervalui - 23 + 12 + 9 + 16 + 22 + 27 + 45 = 154 milijonai rublių.

Už antrąjį intervalą - 48 + 57 + 48 + 56 + 63 = 272 milijonai rublių.

Už trečiąjį intervalą - 118 + 87 + 98 + 88 = 391 milijonas rublių.

Pratimas . Yra duomenų apie indėlių sumą 30 indėlininkų banke, tūkstančius rublių. 150, 120, 300, 650, 1500, 900, 450, 500, 380, 440,

600, 80, 150, 180, 250, 350, 90, 470, 1100, 800,

500, 520, 480, 630, 650, 670, 220, 140, 680, 320

Sukurti intervalų variacijų serija indėlininkų pasiskirstymas, pagal indėlio dydį, išskiriant 4 grupes vienodais intervalais. Kiekvienai grupei apskaičiuokite bendrą indėlių sumą.

Paprasčiausias būdas apibendrinti statistinę medžiagą yra sudaryti eilutes. Suvestinis statistinio tyrimo rezultatas gali būti pasiskirstymo eilutė.

Nustačius grupavimo charakteristiką, grupių skaičių ir grupavimo intervalus, suvestinės ir grupavimo duomenys pateikiami pasiskirstymo eilučių forma ir pateikiami statistinių lentelių pavidalu.

Paskirstymo serija yra viena iš grupavimo tipų.

Netoli platinimo statistikoje tvarkingas gyventojų vienetų pasiskirstymas į grupes pagal bet kurį požymį vadinamas: kokybiniu arba kiekybiniu.

  1. Paskirstymo serijų tipai

Priklausomai nuo charakteristikos, kuria grindžiama pasiskirstymo eilutės formavimas, išskiriamos atributinės ir variacinės skirstymo eilutės:

    pasiskirstymo eilutės, sudarytos pagal kokybines charakteristikas, vadinamos atributinėmis;

    Variacinės eilutės yra pasiskirstymo eilutės, sudarytos didėjančia arba mažėjančia kiekybinės charakteristikos verčių tvarka.

Paskirstymo variacijų serija susideda iš dviejų stulpelių. Pirmajame stulpelyje pateikiamos kintamos charakteristikos kiekybinės reikšmės, kurios vadinamos variantais ir yra žymimos. Diskretinė parinktis – išreiškiama sveikuoju skaičiumi. Intervalo parinktis svyruoja nuo ir iki. Priklausomai nuo parinkčių tipo, galite sudaryti atskirų arba intervalų variacijų serijas. Antrame stulpelyje yra konkrečių parinkčių skaičius, išreikštas dažniais arba dažniais:

    dažniai – tai absoliutūs skaičiai, rodantys, kiek kartų tam tikra požymio reikšmė atsiranda suvestinėje; visų dažnių suma turi būti lygi vienetų skaičiui visoje populiacijoje;

    dažniai yra dažniai, išreikšti procentais nuo bendros sumos; visų dažnių suma, išreikšta procentais, turi būti lygi 100 % vieneto trupmenomis.

Variacijų serija kuriam būdingi du elementai: variantas (X) ir dažnis (f). Variantas – atskiro populiacijos vieneto ar grupės charakteristikos atskira reikšmė. Vadinamas skaičius, parodantis, kiek kartų tam tikra charakteristikos reikšmė atsiranda dažnis. Jei dažnis išreiškiamas kaip santykinis skaičius, tada jis vadinamas dažniu.

Variacijų serija gali būti:

    intervalas, kai yra apibrėžtos ribos „nuo“ ir „iki“, intervalų pasiskirstymo eilutes galima pavaizduoti grafiškai histogramos pavidalu;

    diskretiškas, kai tiriama charakteristika apibūdinama tam tikru skaičiumi.

  1. Grafinis pasiskirstymo serijų vaizdavimas

Platinimo serijos vaizdžiai pateikiamos naudojant grafinius vaizdus.

Paskirstymo serijos pavaizduotos taip:

    sąvartynas;

    histogramos;

    kaupiasi;

Statant bandymų poligonas horizontalioje ašyje (x ašyje) brėžiamos kintamos charakteristikos reikšmės, o vertikalioje ašyje (y ašyje) – dažniai arba dažniai.

Statymui histogramos Intervalų ribų reikšmės nurodomos išilgai abscisių ašies ir jų pagrindu sudaromi stačiakampiai, kurių aukštis proporcingas dažniams (ar dažniams).

Charakteristikos pasiskirstymas variacijų serijoje per sukauptus dažnius (dažnius) vaizduojamas naudojant kumuliaciją.

Kaupiasi arba kaupiamoji kreivė, skirtingai nei daugiakampis, yra sudaryta iš sukauptų dažnių arba dažnių. Šiuo atveju charakteristikos reikšmės dedamos ant abscisių ašies, o sukaupti dažniai arba dažniai dedami ant ordinačių ašies.

Ogiva yra sukonstruotas panašiai kaip kumuliacija, vienintelis skirtumas yra tas, kad sukaupti dažniai dedami ant abscisių ašies, o charakteristikos vertės – ant ordinačių ašies.

Kumuliato tipas yra koncentracijos kreivė arba Lorenco diagrama. Koncentracijos kreivei sudaryti ant abiejų stačiakampės koordinačių sistemos ašių nubraižoma skalė procentais nuo 0 iki 100. Kartu abscisių ašyje nurodomi sukaupti dažniai, o sukauptos dalies reikšmės. (procentais) pagal charakteristikos tūrį yra nurodyti ordinačių ašyje.

Aukštasis profesinis išsilavinimas

„RUSIJOS NACIONALINĖS EKONOMIKOS AKADEMIJA IR

VALSTYBĖS TARNYBA PRIE PREZIDENTO

RUSIJOS FEDERACIJA"

(Kalugos filialas)

Gamtos mokslų ir matematikos katedra

TESTAS

„Statistikos“ disciplinoje

Studentė___Mayboroda Galina Jurievna______

Valstybės ir savivaldybių administravimo grupės G-12-B korespondencijos skyriaus fakultetas

Mokytojas ____________________ Hamer G.V.

Pedagogikos mokslų kandidatas, docentas

Kaluga-2013

1 užduotis.

1.1 užduotis. 4

1.2 problema. 16

1.3 problema. 24

1.4 problema. 33

2 užduotis.

2.1 užduotis. 43

2.2 užduotis. 48

2.3 problema. 53

2.4 problema. 58

3 užduotis.

3.1 užduotis. 63

3.2 problema. 68

3.3 problema. 73

3.4 problema. 79

4 užduotis.

4.1 problema. 85

4.2 problema. 88

4.3 problema. 90

4.4 problema. 93

Naudotų šaltinių sąrašas. 96

1 užduotis.

1.1 užduotis.

Pateikiami regioninių įmonių produktų gamybos ir pelno dydžio duomenys (1 lentelė).

1 lentelė

Duomenys apie produkcijos produkciją ir pelno dydį pagal įmones

Įmonės Nr. Produkto išeiga, milijonai rublių. Pelnas, milijonai rublių Įmonės Nr. Produkto išeiga, milijonai rublių. Pelnas, milijonai rublių
63,0 6,7 56,0 7,2
48,0 6,2 81,0 9,6
39,0 6,5 55,0 6,3
28,0 3,0 76,0 9,1
72,0 8,2 54,0 6,0
61,0 7,6 53,0 6,4
47,0 5,9 68,0 8,5
37,0 4,2 52,0 6,5
25,0 2,8 44,0 5,0
60,0 7,9 51,0 6,4
46,0 5,5 50,0 5,8
34,0 3,8 65,0 6,7
21,0 2,1 49,0 6,1
58,0 8,0 42,0 4,8
45,0 5,7 32,0 4,6

Pagal pirminius duomenis:

1. Sudarykite įmonių pasiskirstymo pagal produkciją statistinę eilutę, sudarydami penkias grupes vienodais intervalais.

Sukurkite skirstinių eilučių grafikus: daugiakampis, histograma, kumuliuoti. Grafiškai nustatykite režimo ir medianos reikšmę.

2. Apskaičiuokite įmonių pasiskirstymo eilučių pagal produkciją charakteristikas: aritmetinį vidurkį, dispersiją, standartinį nuokrypį, variacijos koeficientą.

Padarykite išvadą.

3. Analitinio grupavimo metodu nustatyti koreliacijos tarp pagamintos produkcijos savikainos ir vienos įmonės pelno dydžio buvimą ir pobūdį.

4. Išmatuokite gamybos savikainos ir pelno dydžio koreliacijos glaudumą naudodami empirinį koreliacijos koeficientą.

Padarykite bendras išvadas.

Sprendimas:

Sukurkime statistinio skirstinio eilutę

Norint sudaryti intervalų variacijų eilutę, apibūdinančią įmonių pasiskirstymą pagal gamybos apimtį, reikia apskaičiuoti eilučių intervalų reikšmę ir ribas.

Statant seriją su vienodais intervalais, intervalo dydis h nustatoma pagal formulę:

x maks Ir x min– didžiausia ir mažiausia požymio reikšmė tiriamų įmonių visumoje;

k- intervalų serijų grupių skaičius.

Grupių skaičius k nurodytas užduoties sąlygoje. k= 5.

x maks= 81 milijonas rublių, x min= 21 milijonas rublių.

Intervalo dydžio apskaičiavimas:

milijonų rublių

Iš eilės pridedant intervalo vertę h = 12 milijonų rublių. iki apatinės intervalo ribos gauname šias grupes:

1 grupė: 21–33 milijonai rublių.

2 grupė: 33–45 milijonai rublių;

3 grupė: 45–57 milijonai rublių.

4 grupė: 57–69 milijonai rublių.

5 grupė: 69–81 milijonas rublių.

Norint sudaryti intervalų eilutę, reikia suskaičiuoti į kiekvieną grupę įtrauktų įmonių skaičių ( dažnių grupės).

Įmonių grupavimo pagal gamybos apimtį procesas pateiktas 2 pagalbinėje lentelėje. Šios lentelės 4 stulpelis reikalingas analitinės grupės sudarymui (3 užduoties punktas).

2 lentelė

Lentelė intervalų skirstinių eilučių konstravimui ir

analitinė grupė

Įmonių grupės pagal gamybos apimtį, milijonai rublių. Įmonės Nr. Produkto išeiga, milijonai rublių. Pelnas, milijonai rublių
21-33 21,0 2,1
25,0 2,8
28,0 3,0
32,0 4,6
Iš viso 106,0 12,5
33-45 34,0 3,8
37,0 4,2
39,0 6,5
42,0 4,8
44,0 5,0
Iš viso 196,0 24,3
45-57 45,0 5,7
46,0 5,5
47,0 5,9
48,0 6,2
49,0 6,1
50,0 5,8
51,0 6,4
52,0 6,5
53,0 6,4
54,0 6,0
55,0 6,3
56,0 7,2
Iš viso 606,0 74,0
57-69 58,0 8,0
60,0 7,9
61,0 7,6
63,0 6,7
65,0 6,7
68,0 8,5
Iš viso 375,0 45,4
69-81 72,0 8,2
76,0 9,1
81,0 9,6
Iš viso 229,0 26,9
Iš viso 183,1

Remiantis 3 lentelės grupės sumos eilutėmis „Iš viso“, sudaroma galutinė 3 lentelė, vaizduojanti įmonių pasiskirstymo pagal gamybos apimtį intervalų eilutę.

3 lentelė

Įmonių pasiskirstymo serijos pagal gamybos apimtį

Išvada. Sudaryta grupuotė rodo, kad įmonių pasiskirstymas pagal gamybos apimtis nėra vienodas. Labiausiai paplitusios yra įmonės, kurių gamybos apimtis yra nuo 45 iki 57 milijonų rublių. (12 įmonių). Mažiausiai paplitusios įmonės, kurių gamybos apimtis yra nuo 69 iki 81 milijono rublių. (3 įmonės).

Nubraižykime pasiskirstymo eilučių grafikus.

Poligonas dažniau naudojami atskiroms serijoms vaizduoti. Norint sukurti daugiakampį stačiakampėje koordinačių sistemoje, argumento reikšmės nubraižomos x ašyje, t. yra ordinačių ašyje. Toliau šioje koordinačių sistemoje konstruojami taškai, kurių koordinatės yra atitinkamų skaičių poros iš variacijų serijos. Gauti taškai nuosekliai sujungiami tiesiomis atkarpomis. Daugiakampis parodytas 1 paveiksle.

Juostinė diagrama - Juostinė diagrama. Tai leidžia įvertinti pasiskirstymo simetriją. Histograma parodyta 2 paveiksle.

1 pav. Įmonių pasiskirstymo pagal apimtį daugiakampis

produkto išleidimas

Mada

2 pav. Įmonių pasiskirstymo pagal apimtį histograma

produkto išleidimas

Mada– dažniausiai tiriamoje populiacijoje pasitaikančio požymio reikšmė.

Intervalų serijoms režimą galima nustatyti grafiškai pagal histogramą (2 pav.). Tam pasirenkamas didžiausias stačiakampis, kuris šiuo atveju yra modalinis (45–57 milijonai rublių). Tada dešinioji modalinio stačiakampio viršūnė yra prijungta prie ankstesnio stačiakampio viršutinio dešiniojo kampo. Ir kairioji modalinio stačiakampio viršūnė - su tolesnio stačiakampio viršutiniu kairiuoju kampu. Toliau nuo jų susikirtimo taško statmenas nuleidžiamas ant abscisės ašies. Šių linijų susikirtimo taško abscisė bus paskirstymo režimas.

Milijonas patrinti.

Išvada. Nagrinėjamų įmonių rinkinyje dažniausiai yra įmonės, kurių produkcija siekia 52 milijonus rublių.

Kaupiasi – sulaužyta kreivė. Jis sukurtas naudojant sukauptus dažnius (apskaičiuota 4 lentelėje). Kumuliatas prasideda nuo apatinės pirmojo intervalo ribos (21 milijonas rublių), sukauptas dažnis deponuojamas ties viršutine intervalo riba. Kumuliatas pateiktas 3 paveiksle.

Mediana

3 pav. Kaupiamasis įmonių pasiskirstymas pagal apimtį

produkto išleidimas

Mediana aš– tai atributo reikšmė, patenkanti į reitinguotos serijos vidurį. Abiejose medianos pusėse yra tiek pat gyventojų vienetų.

Intervalų serijoje mediana gali būti nustatyta grafiškai, naudojant kumuliacinę kreivę. Norėdami nustatyti medianą nuo kaupiamojo dažnio skalės taško, atitinkančio 50 % (30:2 = 15), nubrėžkite tiesią liniją, lygiagrečią abscisių ašiai, kol ji susikirs su kumuliacija. Tada nuo nurodytos linijos susikirtimo su kumuliacija taško statmenas nuleidžiamas į abscisių ašį. Susikirtimo taško abscisė yra mediana.

Milijonas patrinti.

Išvada. Nagrinėjamų įmonių grupėje pusės įmonių gamybos apimtis yra ne didesnė kaip 52 milijonai rublių, o kitos pusės - ne mažesnė kaip 52 milijonai rublių.


Susijusi informacija.