Statistinė santrauka ir grupavimas. Statistinio pasiskirstymo eilutės. Problemų sprendimo pavyzdžiai. Intervalinio skirstinio serijos braižymas

1 praktinė pamoka

SKIRSTYMO VARIACIJAS

Variacijų serija arba netoli platinimo vadinamas tvarkingu populiacijos vienetų pasiskirstymu didinant (dažniau) arba mažinant (rečiau) požymio reikšmes ir skaičiuojant vienetų skaičių su viena ar kita požymio reikšme.

Yra 3 tokio pobūdžio platinimo serija:

1) reitinguojama eilutė- tai atskirų populiacijos vienetų sąrašas tiriamo požymio didėjimo tvarka; jei populiacijos vienetų skaičius yra pakankamai didelis, eilučių reitingavimas tampa sudėtingas ir tokiais atvejais pasiskirstymo eilutė sudaroma sugrupuojant populiacijos vienetus pagal tiriamo požymio reikšmes (jei požymis užima nedidelį skaičių reikšmes, tada sudaroma diskretinė eilutė, o kitu atveju - intervalų eilutė);

2) atskiros serijos Yra lentelė, susidedanti iš dviejų stulpelių (eilučių) - konkrečios kintamojo atributo reikšmės X i ir populiacijos vienetų skaičius su nurodyta atributo reikšme f i- dažniai; grupių skaičius atskiroje eilutėje nustatomas pagal faktiškai esamų kintamo požymio verčių skaičių;

3) intervalo serija Ar lentelė susideda iš dviejų stulpelių (eilučių) – kintamojo atributo intervalų X i ir populiacijos vienetų, patenkančių į tam tikrą intervalą, skaičių (dažnius), arba šio skaičiaus dalis bendrame populiacijų skaičiuje (dažniuose).

Iškviečiami skaičiai, rodantys, kiek kartų tam tikroje populiacijoje atsiranda atskirų variantų dažniai arba svarstyklės variantas ir žymimas lotyniškos abėcėlės mažąja raide f. Bendra variacijų eilučių dažnių suma lygi duotosios populiacijos tūriui, t.y.

kur k- grupių skaičius, n- bendras stebėjimų skaičius arba populiacijos apimtis.

Dažniai (svoriai) išreiškiami ne tik absoliučiais, bet ir santykiniais skaičiais – vieneto dalimis arba procentais nuo bendro variantų skaičiaus, sudarančio tam tikrą rinkinį. Tokiais atvejais vadinami svoriai santykiniai dažniai arba dažnas. Bendra duomenų suma lygi vienetui

arba
,

jei dažniai išreiškiami procentais nuo bendro stebėjimų skaičiaus NS. Dažnių keitimas dažniais nėra būtinas, tačiau kartais tai yra naudinga ir netgi būtina tais atvejais, kai reikia palyginti viena su kita variacijų eilutes, kurios labai skiriasi savo tūriais.

Priklausomai nuo to, kaip atributas kinta – diskretiškai ar nuolat, plačiame ar siaurame diapazone – statistinė populiacija pasiskirsto be intervalo arba intervalas variacijų serija. Pirmuoju atveju dažniai yra tiesiogiai susiję su reitinguotomis požymio reikšmėmis, kurios įgauna atskirų variacijų eilučių grupių ar klasių padėtį; antruoju – dažniai skaičiuojami pagal atskirus intervalus ar intervalus (nuo - į), į kurią bendras bruožo kitimas yra padalintas į diapazoną nuo minimalių iki didžiausių pasirinkimų tam tikrai populiacijai. Šie tarpai arba klasių tarpatramiai gali būti vienodo pločio arba ne. Iš čia jie skiriasi vienodo ir nevienodo intervalo variacijų eilutės. Nevienodo intervalo serijose dažnio pasiskirstymo pobūdis keičiasi, kai keičiasi klasių intervalų plotis. Nevienodo intervalo grupavimas biologijoje naudojamas palyginti retai. Paprastai biometriniai duomenys paskirstomi vienodo intervalo eilutėmis, o tai leidžia ne tik atskleisti kitimo dėsningumą, bet ir palengvina variacijų eilučių suminių skaitinių charakteristikų skaičiavimą, pasiskirstymo eilučių tarpusavio palyginimą.

Pradedant kurti vienodo intervalo variacijų seriją, svarbu teisingai apibrėžti klasės intervalo plotį. Faktas yra tas, kad grubus grupavimas (kai nustatomi labai platūs klasių intervalai) iškreipia tipines variacijos ypatybes ir sumažina serijos skaitinių charakteristikų tikslumą. Pasirinkus pernelyg siaurus intervalus, didėja apibendrinančių skaitinių charakteristikų tikslumas, tačiau serija pasirodo per daug ištempta ir neduoda aiškaus variacijos vaizdo.

Norėdami gauti aiškiai matomą variacijų seriją ir norint užtikrinti pakankamą iš jo skaičiuojamų skaitinių charakteristikų tikslumą, požymio kitimas (riboje nuo minimalių iki maksimalių variantų) turėtų būti suskirstytas į tokį grupių ar klasių skaičių, kuris tenkintų abu reikalavimus. Ši problema išspręsta padalijus ypatybės variacijų diapazoną iš grupių ar klasių, nurodytų variacijų serijos konstrukcijoje, skaičiaus:

,

kur h- intervalo dydis; X m a x ir X min - didžiausios ir mažiausios vertės visumoje; k- grupių skaičius.

Konstruojant intervalo skirstinio eilutę, reikia pasirinkti optimalų grupių (požymių intervalų) skaičių ir nustatyti intervalo ilgį (diapazoną). Kadangi skirstinių serijos analizė lygina dažnius skirtingais intervalais, būtina, kad intervalų ilgis būtų pastovus. Jei turite susidoroti su pasiskirstymo intervalų serija su nevienodais intervalais, tada palyginimui reikia sumažinti dažnį arba dažnį iki intervalo vieneto, gauta reikšmė vadinama tankis ρ , tai yra
.

Optimalus grupių skaičius parenkamas taip, kad agregate pakankamai atsispindėtų požymio reikšmių įvairovė, o kartu pasiskirstymo dėsningumas, jo forma nebūtų iškraipoma atsitiktinių dažnių svyravimų. Jei grupių yra per mažai, variacijos modelis neatsiras; jei grupių yra per daug, atsitiktiniai dažnio šuoliai iškraipys skirstinio formą.

Dažniausiai pasiskirstymo serijos grupių skaičius nustatomas pagal Sturjess formulę:

kur n- gyventojų skaičius.

Grafinis vaizdas suteikia esminę pagalbą analizuojant daugybę skirstinių ir jų savybių. Intervalų serija pavaizduota juostine diagrama, kurioje išilgai abscisių ašies esančių juostų pagrindai yra kintamo požymio verčių intervalai, o juostų aukščiai yra dažniai, atitinkantys skalę išilgai ordinačių ašis. Šis diagramos tipas vadinamas histograma.

Jei yra diskrečios skirstymo eilutės arba naudojami intervalų vidurio taškai, tada tokios serijos grafinis vaizdas vadinamas poligonas, kuris gaunamas sujungus tiesius taškus su koordinatėmis X i ir f i .

Jei klasių reikšmes nubraižote ant abscisės, o sukauptus dažnius - ordinatėje, tada sujunkite taškus tiesiomis linijomis, gausite grafiką, vadinamą kaupiamasis. Sukaupti dažniai randami nuosekliai sumuojant arba kumuliacija dažniai kryptimi nuo pirmosios klasės iki variacijų serijos pabaigos.

Pavyzdys. Yra duomenų apie 50 vištų dedeklių, laikomų paukštyne per 1 metus, kiaušinių produkciją (1.1 lentelė).

1.1 lentelė

Vištų dedeklių kiaušinių gamyba

Vištos dedeklės Nr

Kiaušinių gamyba, vnt.

Vištos dedeklės Nr

Kiaušinių gamyba, vnt.

Vištos dedeklės Nr

Kiaušinių gamyba, vnt.

Vištos dedeklės Nr

Kiaušinių gamyba, vnt.

Vištos dedeklės Nr

Kiaušinių gamyba, vnt.

Būtina sudaryti intervalų skirstinio eilutę ir grafiškai ją atvaizduoti histogramos, daugiakampio ir kumuliacijos pavidalu.

Matyti, kad požymis svyruoja nuo 212 iki 245 kiaušinių, gautų iš vištos per 1 metus.

Mūsų pavyzdyje, naudodami Sturjess formulę, nustatome grupių skaičių:

k = 1 + 3,322lg 50 = 6,643 ≈ 7.

Apskaičiuokime intervalo ilgį (diapazoną) naudodami formulę:

.

Sukurkime intervalų seriją su 7 grupėmis ir 5 dalių intervalu. kiaušinių (1.2 lentelė). Norėdami sudaryti diagramas lentelėje, apskaičiuojame intervalų vidurį ir sukauptą dažnį.

1.2 lentelė

Kiaušinių produkcijos pasiskirstymo intervalinė serija

Vištų dedeklių grupė pagal kiaušinių produkcijos vertę

X i

Vištų dedeklių skaičius

f i

Intervalo vidurys

NS aš'

Sukauptas dažnis

f i

Sukurkime kiaušinių produkcijos pasiskirstymo histogramą (1.1 pav.).

Ryžiai. 1.1. Kiaušinių produkcijos pasiskirstymo histograma

Šiose histogramose parodyta daugeliui požymių būdinga pasiskirstymo forma: dažnesnės ypatybės vidutinių intervalų reikšmės, rečiau – kraštutinės (mažos ir didelės) požymio reikšmės. Šio skirstinio forma artima normaliajam pasiskirstymo dėsniui, kuris susidaro, jei kintamąjį kintamąjį įtakoja daug veiksnių, kurių nė vienas nėra dominuojantis.

Kiaušinių produkcijos daugiakampis ir kumuliacinis pasiskirstymas turi formą (1.2 ir 1.3 pav.).

Ryžiai. 1.2. Kiaušinių paskirstymo daugiakampis

Ryžiai. 1.3. Kiaušinių produkcijos pasiskirstymo kumuliacija

Technologija, kaip išspręsti problemą lentelių procesorius Microsoft Excel Kitas.

1. Įveskite pradinius duomenis pagal pav. 1.4.

2. Įvertinkite eilutę.

2.1. Pasirinkite langelius A2: A51.

2.2. Kairiuoju pelės klavišu spustelėkite mygtuko įrankių juostą<Сортировка по возрастанию > .

3. Nustatykite intervalo dydį intervalo pasiskirstymo serijoms braižyti.

3.1. Nukopijuokite langelį A2 į langelį E53.

3.2. Nukopijuokite langelį A51 į langelį E54.

3.3. Apskaičiuokite variacijos diapazoną. Norėdami tai padaryti, įveskite formulę langelyje E55 = E54-E53.

3.4. Apskaičiuokite variantų grupių skaičių. Norėdami tai padaryti, įveskite formulę langelyje E56 = 1 + 3,322 * LOG10 (50).

3.5. E57 langelyje įveskite suapvalintą grupių skaičių.

3.6. Apskaičiuokite intervalo ilgį. Norėdami tai padaryti, įveskite formulę langelyje E58 = E55 / E57.

3.7. Įveskite suapvalintą intervalo ilgį langelyje E59.

4. Sukurkite intervalų seriją.

4.1. Nukopijuokite langelį E53 į langelį B64.

4.2. Įveskite formulę langelyje B65 = B64 + $ E 59 $.

4.3. Nukopijuokite langelį B65 į langelius B66: B70.

4.4. Įveskite formulę langelyje C64 = B65.

4.5. Įveskite formulę langelyje C65 = C64 + $ E 59 $.

4.6. Nukopijuokite langelį C65 į langelius C66: C70.

Sprendimo rezultatai rodomi ekrane tokia forma (1.5 pav.).

5. Apskaičiuokite intervalo dažnį.

5.1. Vykdykite komandą Aptarnavimas,Duomenų analizė pakaitomis spustelėdami kairiuoju pelės klavišu.

5.2. Dialogo lange Duomenų analizė kairiuoju pelės mygtuku įdiekite: Analizės įrankius <Гистограмма>(1.6 pav.).

5.3. Kairiuoju pelės mygtuku spustelėkite<ОК>.

5.4. Skirtuke juostos diagrama nustatykite parametrus pagal pav. 1.7.

5.5. Kairiuoju pelės mygtuku spustelėkite<ОК>.

Sprendimo rezultatai rodomi ekrane tokia forma (1.8 pav.).

6. Užpildykite lentelę „Paskirstymo intervalų serija“.

6.1. Nukopijuokite langelius B74: B80 į langelius D64: D70.

6.2. Apskaičiuokite dažnių sumą. Norėdami tai padaryti, pasirinkite langelius D64: D70 ir kairiuoju pelės klavišu spustelėkite mygtuko įrankių juostą<Автосумма > .

6.3. Apskaičiuokite intervalų vidurio tašką. Norėdami tai padaryti, įveskite formulę langelyje E64 = (B64 + C64) / 2 ir nukopijuokite į langelius E65: E70.

6.4. Apskaičiuokite sukauptus dažnius. Norėdami tai padaryti, nukopijuokite langelį D64 į langelį F64. Langelyje F65 įveskite formulę = F64 + D65 ir nukopijuokite ją į langelius F66: F70.

Sprendimo rezultatai rodomi ekrane tokia forma (1.9 pav.).

7. Redaguokite histogramą.

7.1. Dešiniuoju pelės mygtuku spustelėkite diagramą pavadinimu „kišenė“ ir pasirodžiusiame skirtuke spustelėkite<Очистить>.

7.2. Dešiniuoju pelės mygtuku spustelėkite diagramą ir pasirodžiusiame skirtuke spustelėkite mygtuką<Исходные данные>.

7.3. Dialogo lange Pradiniai duomenys pakeisti X ašies etiketes.. Tam reikia pažymėti langelius B64: C70 (1.10 pav.).

7.5. Paspauskite klavišą .

Rezultatai rodomi ekrane tokia forma (1.11 pav.).

8. Sukurkite kiaušinių produkcijos paskirstymo daugiakampį.

8.1. Kairiuoju pelės klavišu spustelėkite mygtuko įrankių juostą<Мастер диаграмм > .

8.2. Dialogo lange Diagramos vedlys (1 veiksmas iš 4) kairiuoju pelės mygtuku nustatykite: Standartinis <График>(1.12 pav.).

8.3. Kairiuoju pelės mygtuku spustelėkite<Далее>.

8.4. Dialogo lange Diagramos vedlys (2 veiksmas iš 4) nustatykite parametrus pagal pav. 1.13.

8.5. Kairiuoju pelės mygtuku spustelėkite<Далее>.

8.6. Dialogo lange Diagramos vedlys (3 veiksmas iš 4)įveskite diagramos ir y ašies pavadinimus (1.14 pav.).

8.7. Kairiuoju pelės mygtuku spustelėkite<Далее>.

8.8. Dialogo lange Diagramos vedlys (4 veiksmas iš 4) nustatykite parametrus pagal pav. 1.15.

8.9. Kairiuoju pelės mygtuku spustelėkite<Готово>.

Rezultatai rodomi ekrane tokia forma (1.16 pav.).

9. Į grafiką įterpkite duomenų etiketes.

9.1. Dešiniuoju pelės mygtuku spustelėkite diagramą ir pasirodžiusiame skirtuke spustelėkite mygtuką<Исходные данные>.

9.2. Dialogo lange Pradiniai duomenys pakeisti X ašies etiketes.. Tam pažymėkite langelius E64: E70 (1.17 pav.).

9.3. Paspauskite klavišą .

Rezultatai rodomi ekrane tokia forma (1.18 pav.).

Kaupiamasis skirstinys sudaromas panašiai kaip skirstinio daugiakampis, remiantis sukauptais dažniais.

Jie pateikiami platinimo serijų forma ir sudaromi pagal formą.

Paskirstymo serija yra grupavimo tipas.

Platinimo serija- vaizduoja tvarkingą tiriamos populiacijos vienetų pasiskirstymą į grupes pagal tam tikrą kintantį požymį.

Priklausomai nuo požymio, kuriuo grindžiama skirstinių serijos formavimas, jie išskiriami atributinė ir variacinė paskirstymo rangai:

  • Atributika- iškvieskite paskirstymo seriją, sukurtą pagal kokybines charakteristikas.
  • Paskirstymo serijos, sudarytos didėjančia arba mažėjančia kiekybinės charakteristikos verčių tvarka, vadinamos variacinis.
Paskirstymo variacijų serija susideda iš dviejų stulpelių:

Pirmame stulpelyje yra kintančio atributo kiekybinės reikšmės, kurios vadinamos galimybės ir yra nurodyti. Diskretinė parinktis – išreiškiama sveikuoju skaičiumi. Intervalo parinktis svyruoja nuo ir iki. Priklausomai nuo variantų tipo, galite sukurti atskirų arba intervalinių variacijų serijas.
Antrame stulpelyje yra konkrečios parinkties skaičius išreikštas dažniais arba dažniais:

Dažniai- tai yra absoliutūs skaičiai, rodantys, kiek kartų tam tikra ypatybės reikšmė atsiranda bendrai, ir tai reiškia. Visų dažnių suma turi būti lygi vienetų skaičiui visoje populiacijoje.

Dažniai() Ar dažniai išreiškiami procentais nuo bendro skaičiaus. Visų dažnių suma, išreikšta procentais, turi būti lygi 100 % vieneto trupmenoje.

Grafinis paskirstymo eilučių vaizdavimas

Paskirstymo serijos vizualizuojamos naudojant grafinius vaizdus.

Paskirstymo serijos pavaizduotos taip:
  • Poligonas
  • Histogramos
  • Kaupiasi
  • Ogives

Poligonas

Statant daugiakampį ant horizontalios ašies (abscisių ašies), brėžiamos kintamojo požymio reikšmės, o vertikalioje ašyje (ordinačių ašyje) – dažniai arba dažniai.

Daugiakampis pav. 6.1, pastatytas remiantis Rusijos gyventojų mikrosurašymu 1994 m.

6.1. Namų ūkių pasiskirstymas pagal dydį

Būklė: Pateikiami duomenys apie vienos iš įmonių 25 darbuotojų pasiskirstymą pagal tarifų kategorijas:
4; 2; 4; 6; 5; 6; 4; 1; 3; 1; 2; 5; 2; 6; 3; 1; 2; 3; 4; 5; 4; 6; 2; 3; 4
Užduotis: sukurkite atskirų variantų seriją ir grafiškai parodykite ją kaip paskirstymo daugiakampį.
Sprendimas:
Šiame pavyzdyje parinktys yra darbuotojo darbo užmokesčio lygis. Norint nustatyti dažnius, reikia apskaičiuoti darbuotojų, turinčių atitinkamą darbo užmokesčio kategoriją, skaičių.

Daugiakampis naudojamas atskiroms variacijų serijoms.

Norėdami sukurti pasiskirstymo daugiakampį (1 pav.), išilgai abscisių ašies (X), atidedame kiekybines kintančios savybės - parinkčių vertes, o išilgai ordinatės - dažnius arba dažnius.

Jei požymio reikšmės išreiškiamos intervalais, tai tokia serija vadinama intervalu.
Intervalinės eilutės pasiskirstymai vaizduojami grafiškai kaip histogramos, kumuliacijos arba ogives.

Statistinė lentelė

Būklė: Duomenys apie 20 asmenų indėlių dydį viename banke (tūkstantis rublių) 60; 25; 12; dešimt; 68; 35; 2; 17; 51; devyni; 3; 130; 24; 85; 100; 152; 6; aštuoniolika; 7; 42.
Užduotis: Nubraižykite intervalų variacijų eilutes vienodais intervalais.
Sprendimas:

  1. Pradinė populiacija susideda iš 20 vienetų (N = 20).
  2. Naudodami Sturgess formulę nustatome reikiamą naudojamų grupių skaičių: n = 1 + 3,322 * lg20 = 5
  3. Mes apskaičiuojame vienodo intervalo reikšmę: i = (152 - 2) / 5 = 30 tūkstančių rublių
  4. Padalinkime pradinę populiaciją į 5 grupes su 30 tūkstančių rublių intervalu.
  5. Grupavimo rezultatai pateikti lentelėje:

Įrašant nuolatinį požymį, kai ta pati reikšmė atsiranda du kartus (kaip viršutinė vieno intervalo riba ir apatinė kito intervalo riba), ši reikšmė nurodo grupę, kurioje ši reikšmė veikia kaip viršutinė riba.

juostos diagrama

Norėdami sukurti histogramą išilgai abscisių, nurodomos intervalų ribų reikšmės ir jų pagrindu sudaromi stačiakampiai, kurių aukštis yra proporcingas dažniams (arba dalims).

Fig. 6.2. parodyta 1997 metų Rusijos gyventojų pasiskirstymo pagal amžiaus grupes histograma.

Ryžiai. 6.2. Rusijos gyventojų pasiskirstymas pagal amžiaus grupes

Būklė: Pateikiamas 30 įmonės darbuotojų pasiskirstymas pagal mėnesinės algos dydį

Užduotis: parodykite intervalo variacijų serijas grafiškai histogramos ir kaupiamųjų duomenų pavidalu.
Sprendimas:

  1. Nežinoma atviro (pirmojo) intervalo riba nustatoma pagal antrojo intervalo reikšmę: 7000 - 5000 = 2000 rublių. Su ta pačia verte randame apatinę pirmojo intervalo ribą: 5000 - 2000 = 3000 rublių.
  2. Norėdami sukurti histogramą stačiakampėje koordinačių sistemoje išilgai abscisių ašies, atidedame segmentus, kurių reikšmės atitinka veislės serijos intervalus.
    Šie segmentai tarnauja kaip apatinis pagrindas, o atitinkamas dažnis (dažnis) - suformuotų stačiakampių aukštis.
  3. Sukurkime histogramą:

Norint sudaryti kumuliacijas, reikia apskaičiuoti sukauptus dažnius (dažnius). Jie nustatomi nuosekliai sudedant ankstesnių intervalų dažnius (dažnius) ir žymimi S. Sukaupti dažniai parodo, kiek populiacijos vienetų turi požymio reikšmę ne didesnę nei nagrinėjamoji.

Cumulata

Požymio pasiskirstymas variacijų serijoje pagal sukauptus dažnius (dalis) vaizduojamas naudojant kumuliacijas.

Cumulata arba kaupiamoji kreivė, priešingai nei daugiakampis, yra sudaryta iš sukauptų dažnių arba dalių. Šiuo atveju atributo reikšmės dedamos ant abscisių ašies, o sukaupti dažniai arba dažniai – ant ordinačių ašies (6.3 pav.).

Ryžiai. 6.3. Kaupiamasis namų ūkių pasiskirstymas pagal dydį

4. Apskaičiuokime sukauptus dažnius:
Pirmojo intervalo kelių dažnis apskaičiuojamas taip: 0 + 4 = 4, antrojo: 4 + 12 = 16; trečiajam: 4 + 12 + 8 = 24 ir kt.

Kuriant kumuliacijas, atitinkamo intervalo kaupiamasis dažnis (dažnis) priskiriamas jo viršutinei ribai:

Ogiva

Ogiva Konstruojamas panašiai kaip kaupiamasis, su vieninteliu skirtumu, kad sukaupti dažniai dedami ant abscisių ašies, o atributų reikšmės – ant ordinačių ašies.

Įvairios kumuliacijos yra koncentracijos kreivė arba Lorenco grafikas. Koncentracijos kreivei nubraižyti abiem stačiakampės koordinačių sistemos ašims taikoma skalė procentais nuo 0 iki 100. Sukaupti dažniai nurodomi ant abscisės, o sukauptos trupmenos reikšmės (procentais) – ordinatėse nurodomas požymio tūris.

Tolygus požymio pasiskirstymas atitinka kvadrato įstrižainę grafike (6.4 pav.). Esant netolygiam pasiskirstymui, grafikas yra įgaubta kreivė, priklausanti nuo požymio koncentracijos lygio.

6.4. Koncentracijos kreivė

Kas yra statistinių duomenų grupavimas ir kaip jis susijęs su pasiskirstymo eilutėmis, buvo aptarta šioje paskaitoje, kurioje taip pat galite sužinoti, kas yra diskrečioji ir variacinė skirstinio eilutė.

Pasiskirstymo eilutės yra viena iš statistinių eilučių atmainų (be jų statistikoje naudojamos dinamikos eilutės), jos naudojamos duomenims apie socialinio gyvenimo reiškinius analizuoti. Variacijų serijos sukūrimas yra gana įmanoma užduotis kiekvienam. Tačiau yra taisyklių, kurias reikia atsiminti.

Kaip nubraižyti diskrečiųjų variacijų pasiskirstymo eilutes

1 pavyzdys. Yra duomenų apie vaikų skaičių 20-yje apklaustų šeimų. Sukurkite diskrečiųjų variacijų seriją šeimų pasiskirstymas pagal vaikų skaičių.

0 1 2 3 1
2 1 2 1 0
4 3 2 1 1
1 0 1 0 2

Sprendimas:

  1. Pradėsime nuo lentelės išdėstymo, į kurią įvesime duomenis. Kadangi paskirstymo eilutės turi du elementus, lentelę sudarys du stulpeliai. Pirmas stulpelis visada yra parinktis - ką mes studijuojame - jo pavadinimą paimame iš užduoties (sakinio pabaiga su užduotimi sąlygose) - pagal vaikų skaičių– taigi mūsų pasirinkimas yra vaikų skaičius.

Antrasis stulpelis yra dažnis - kaip dažnai mūsų variantas pasireiškia tiriamame reiškinyje - taip pat stulpelio pavadinimą paimame iš užduoties - šeimų pasiskirstymas – taigi mūsų dažnis yra šeimų, turinčių atitinkamą skaičių vaikų, skaičius.

  1. Dabar iš pradinių duomenų pasirinkite tas reikšmes, kurios atsiranda bent kartą. Mūsų atveju taip yra

Ir šiuos duomenis išdėliosime pirmajame savo lentelės stulpelyje logine tvarka, šiuo atveju padidindami nuo 0 iki 4. Gauname

Ir pabaigai suskaičiuokime, kiek kartų pasitaiko kiekviena parinkčių reikšmė.

0 1 2 3 1

2 1 2 1 0

4 3 2 1 1

1 0 1 0 2

Dėl to gauname pilną lentelę arba reikiamą šeimų pasiskirstymo pagal vaikų skaičių eilutę.

Pratimas . Yra duomenų apie 30 įmonės darbuotojų darbo užmokesčio kategorijas. Sukurkite atskirų variacijų eilutę, skirtą darbuotojų pasiskirstymui pagal darbo užmokesčio kategorijas. 2 3 2 4 4 5 5 4 6 3

1 4 4 5 5 6 4 3 2 3

4 5 4 5 5 6 6 3 3 4

Kaip nubraižyti skirstinio intervalų variacijų eilutę

Sukurkime intervalų skirstinio seką ir pažiūrėkime, kuo jos konstrukcija skiriasi nuo diskrečiųjų serijų.

2 pavyzdys. Yra duomenų apie 16 įmonių gauto pelno sumą, mln. - 23 48 57 12 118 9 16 22 27 48 56 87 45 98 88 63. Sudarykite įmonių pasiskirstymo pagal pelną intervalų variacijų eilutę, vienodais intervalais išryškindami 3 grupes.

Žinoma, bus išsaugotas bendras serijos konstravimo principas, tos pačios dvi stulpeliai, tos pačios parinktys ir dažnis, tačiau čia parinktis bus intervale ir dažniai bus skaičiuojami skirtingai.

Sprendimas:

  1. Pradėkime panašiai kaip ir ankstesnėje užduotyje, sukurdami lentelės išdėstymą, į kurią vėliau įvesime duomenis. Kadangi paskirstymo eilutės turi du elementus, lentelę sudarys du stulpeliai. Pirmas stulpelis visada yra variantas - ką mes tiriame - jo pavadinimą paimame iš užduoties (sakinio pabaiga su užduotimi sąlygose) - pagal pelno sumą - tai reiškia, kad mūsų pasirinkimas yra pelno suma pagamintas.

Antrasis stulpelis yra dažnis - kaip dažnai pasitaiko mūsų variantas tiriamame reiškinyje - stulpelio pavadinimą taip pat paimame iš priskyrimo - įmonių pasiskirstymas - taigi mūsų dažnis yra įmonių skaičius, turinčių atitinkamą pelną, šiuo atveju krentantį į intervalą.

Dėl to mūsų lentelės išdėstymas atrodys taip:

kur i yra intervalo reikšmė arba ilgis,

Xmax ir Xmin – maksimali ir mažiausia funkcijos reikšmė,

n – reikiamas grupių skaičius pagal problemos teiginį.

Apskaičiuokime mūsų pavyzdžio intervalo dydį. Norėdami tai padaryti, tarp pradinių duomenų randame didžiausią ir mažiausią

23 48 57 12 118 9 16 22 27 48 56 87 45 98 88 63 - didžiausia vertė yra 118 milijonų rublių, o minimali - 9 milijonai rublių. Apskaičiuokime pagal formulę.

Skaičiuojant gavome skaičių 36, (3) laikotarpiu tris, tokiose situacijose intervalo reikšmę reikia suapvalinti iki didesnio, kad atlikus skaičiavimus nebūtų prarasti didžiausi duomenys, todėl skaičiuojant intervalo vertė yra 36,4 milijono rublių.

  1. Dabar sukurkime intervalus – mūsų šios problemos galimybes. Pirmasis intervalas pradedamas kurti nuo minimalios reikšmės, prie jo pridedama intervalo reikšmė ir gaunama pirmojo intervalo viršutinė riba. Tada pirmojo intervalo viršutinė riba tampa antrojo intervalo apatine riba, prie jos pridedama intervalo reikšmė ir gaunamas antras intervalas. Ir taip tiek kartų, kiek reikia norint nubraižyti intervalus pagal sąlygas.

Atkreipkime dėmesį, jei intervalo reikšmės nebūtume suapvalinę iki 36,4, o palikę ją ties 36,3, tada paskutinė reikšmė būtų buvusi 117,9. Būtent tam, kad būtų išvengta duomenų praradimo, intervalo reikšmę reikia suapvalinti iki didesnės reikšmės.

  1. Apskaičiuokime įmonių, kurios pateko į kiekvieną konkretų intervalą, skaičių. Apdorojant duomenis, atminkite, kad į viršutinę šio intervalo intervalo reikšmę neatsižvelgiama (neįtraukiama į šį intervalą), bet į ją atsižvelgiama kitame intervale (į šį intervalą įtraukiama apatinė intervalo riba, ir viršutinė riba neįskaičiuota), išskyrus paskutinį intervalą.

Apdorojant duomenis geriausia pažymėti pasirinktus duomenis sutartiniais simboliais arba spalva, kad būtų supaprastintas apdorojimas.

23 48 57 12 118 9 16 22

27 48 56 87 45 98 88 63

Pirmąjį intervalą pažymime geltona spalva - ir nustatome, kiek duomenų patenka į intervalą nuo 9 iki 45,4, o į šį 45,4 bus atsižvelgta antrajame intervale (su sąlyga, kad jis yra duomenyse) - kaip rezultatas 7 įmonės per pirmąjį intervalą. Ir taip toliau visais intervalais.

  1. (papildomas veiksmas) Apskaičiuokime bendrą įmonių gautą pelną kiekvienam intervalui ir bendrai. Norėdami tai padaryti, pridėkite skirtingomis spalvomis pažymėtus duomenis ir gaukite bendrą pelno vertę.

Pirmuoju intervalu - 23 + 12 + 9 + 16 + 22 + 27 + 45 = 154 milijonai rublių.

Už antrąjį intervalą - 48 + 57 + 48 + 56 + 63 = 272 milijonai rublių.

Už trečiąjį intervalą - 118 + 87 + 98 + 88 = 391 milijonas rublių.

Pratimas . Yra duomenų apie indėlio dydį 30 indėlininkų banke, tūkstančiai rublių. 150, 120, 300, 650, 1500, 900, 450, 500, 380, 440,

600, 80, 150, 180, 250, 350, 90, 470, 1100, 800,

500, 520, 480, 630, 650, 670, 220, 140, 680, 320

Sukurti intervalo variacijų serija indėlininkų pasiskirstymas, pagal įnašo dydį, vienodais intervalais išskiriant 4 grupes. Apskaičiuokite bendrą kiekvienos grupės indėlių sumą.

Siųsti savo gerą darbą žinių bazėje yra paprasta. Naudokite žemiau esančią formą

Studentai, magistrantai, jaunieji mokslininkai, kurie naudojasi žinių baze savo studijose ir darbe, bus jums labai dėkingi.

Publikuotas http://www.allbest.ru/

UŽDUOTIS1

Yra šie duomenys apie įmonės darbuotojų darbo užmokestį:

1.1 lentelė

Darbo užmokesčio suma konv. den. vienetų

Reikia sukurti intervalų skirstinio eilutę, pagal kurią būtų galima rasti;

1) vidutinis darbo užmokestis;

2) vidutinis tiesinis nuokrypis;

4) standartinis nuokrypis;

5) variacijos diapazonas;

6) virpesių koeficientas;

7) tiesinis variacijos koeficientas;

8) paprastasis variacijos koeficientas;

10) mediana;

11) asimetrijos koeficientas;

12) Pirsono asimetrijos indeksas;

13) kurtozės koeficientas.

Sprendimas

Kaip žinote, parinktys (pripažintos reikšmės) yra išdėstytos didėjančia tvarka diskrečių variacijų serija. Su dideliu skaičiumi variantas (daugiau nei 10), net ir diskrečios variacijos atveju sudaromos intervalų eilutės.

Jei intervalų serija sudaroma lyginiais intervalais, tada variacijų diapazonas dalijamas iš nurodyto intervalų skaičiaus. Be to, jei gauta reikšmė yra sveikasis skaičius ir nedviprasmiškas (kas yra reta), laikoma, kad intervalo ilgis yra lygus šiam skaičiui. Kitais atvejais pagaminta apvalinimas būtinai v pusėje padidinti, Taigi į paskutinis skaitmuo liko lyginis. Akivaizdu, kad ilgėjant intervalo trukmei, svyravimo diapazonas reikšme, lygia intervalų skaičiaus sandaugai: skirtumu tarp apskaičiuoto ir pradinio intervalo ilgio

a) Jei svyravimo diapazono išplėtimo dydis yra nereikšmingas, tada jis pridedamas prie didžiausios arba atimamas iš mažiausios požymio reikšmės;

b) Jei svyravimų diapazono išplėtimo dydis yra apčiuopiamas, tada, kad diapazono centras nesimaišytų, jis sumažinamas maždaug per pusę, vienu metu pridedant prie didžiausių ir atimant iš mažiausių atributo reikšmių. .

Jei intervalų serija sudaroma su nelygiais intervalais, tada procesas supaprastinamas, tačiau, kaip ir anksčiau, intervalų ilgis turėtų būti išreikštas skaičiumi su paskutiniu lyginiu skaitmeniu, o tai labai supaprastina tolesnius skaitinių charakteristikų skaičiavimus.

30 - imties dydis.

Sudarykite intervalų pasiskirstymo eilutę naudodami Sturges formulę:

K = 1 + 3,32 * log n,

K – grupių skaičius;

K = 1 + 3,32 * log 30 = 5,91 = 6

Atributo diapazoną - įmonės darbuotojų darbo užmokestis - (x) randame pagal formulę

R = xmax - xmin ir padalinkite iš 6; R = 195-112 = 83

Tada intervalo ilgis bus l juosta = 83: 6 = 13,83

Pirmojo intervalo pradžia bus 112. Pridedant prie 112 l rasės = 13,83, gauname galutinę jo reikšmę 125,83, kuri tuo pačiu yra antrojo intervalo pradžia ir tt. penktojo intervalo pabaiga – 195.

Ieškant dažnių, reikia vadovautis taisykle: „jei požymio reikšmė sutampa su vidinio intervalo riba, vadinasi, ji turi būti nukreipta į ankstesnį intervalą“.

Gauname intervalų dažnių ir saugojimo dažnių serijas.

1.2 lentelė

Vadinasi, 3 darbuotojai turi atlyginimą. mokestis nuo 112 iki 125,83 sutartinių vienetų Didžiausias mokestis. mokėjimas nuo 181,15 iki 195 sutartinių piniginių vienetų tik 6 darbuotojai.

Norėdami apskaičiuoti skaitines charakteristikas, intervalų eilutes transformuojame į diskrečią, kaip variantą paimdami intervalų vidurį:

1.3 lentelė

14131,83

Pagal svertinio aritmetinio vidurkio formulę

kondensacijos vienetai

Vidutinis tiesinis nuokrypis:

čia xi yra tiriamo požymio reikšmė i-tajame populiacijos vienete,

Vidutinė tiriamo požymio reikšmė.

Publikuotas http://www.allbest.ru/

L Paskelbta http://www.allbest.ru/

Paslaugų den.ed.

Standartinis nuokrypis:

Sklaida:

Santykinis svyravimas (svyravimo koeficientas): c = R :,

Santykinis tiesinis nuokrypis: q = L:

Variacijos koeficientas: V = y:

Virpesių koeficientas parodo kraštutinių atributo verčių santykinius svyravimus aplink aritmetinį vidurkį, o variacijos koeficientas apibūdina populiacijos laipsnį ir homogeniškumą.

c = R: = 83 / 159,485 * 100 % = 52,043 %

Taigi skirtumas tarp kraštutinių verčių yra 5,16% (= 94,84% -100%) mažesnis nei vidutinis įmonės darbuotojų atlyginimas.

q = L: = 17,765 / 159,485 * 100 % = 11,139 %

V = y: = 21,704 / 159,485 * 100 % = 13,609 %

Variacijos koeficientas yra mažesnis nei 33%, o tai rodo silpną darbuotojų darbo užmokesčio svyravimą įmonėje, t.y. kad vidutinė reikšmė yra tipinė darbuotojų darbo užmokesčio charakteristika (homogeninė aibė).

Paskirstymo intervalinėse eilutėse mada nustatoma pagal formulę -

Modalinio intervalo dažnis, tai yra intervalas, kuriame yra didžiausias variantų skaičius;

Intervalo prieš modalą dažnis;

Intervalo dažnis po modalo;

Modalinio intervalo ilgis;

Modalinio intervalo apatinė riba.

Norėdami nustatyti medianos intervalų eilutėse naudojame formulę

kur yra kaupiamasis (sukauptas) intervalo prieš medianą dažnis;

Apatinė medianinio intervalo riba;

Vidutinio intervalo dažnis;

Vidutinio intervalo ilgis.

Vidutinis intervalas- intervalas, kurio kaupiamasis dažnis (= 3 + 3 + 5 + 7) viršija pusę dažnių sumos - (153,49; 167,32).

Apskaičiuokime pasvirumą ir kurtozę, kuriai sukursime naują darbalapį:

1.4 lentelė

Faktiniai duomenys

Apskaičiuoti duomenys

Apskaičiuokime trečiosios eilės momentą

Todėl asimetrija yra

Kadangi 0,3553 0,25, asimetrija laikoma reikšminga.

Apskaičiuokime ketvirtosios eilės momentą

Todėl kurtozė yra

Nes< 0, то эксцесс является плосковершинным.

Iškrypimo laipsnis gali būti nustatytas naudojant Pirsono kreivumo koeficientą (As): svyravimo imties vertės apyvarta.

kur yra pasiskirstymo eilutės aritmetinis vidurkis; - mada; - standartinis nuokrypis.

Su simetriniu (normaliu) pasiskirstymu = Mo, todėl pasvirimo koeficientas lygus nuliui. Jei Аs> 0, tai yra daugiau režimo, todėl yra dešinės pusės asimetrija.

Jei As< 0, то меньше моды, следовательно, имеется левосторонняя асимметрия. Коэффициент асимметрии может изменяться от -3 до +3.

Pasiskirstymas nėra simetriškas, bet turi kairiąją asimetriją.

UŽDUOTIS 2

Koks turėtų būti imties dydis, kad atrankos paklaida neviršytų 0,04 su 0,954 tikimybe, jei iš ankstesnių tyrimų žinoma, kad dispersija yra 0,24?

Sprendimas

Imties dydis nekartotiniam ėmimui apskaičiuojamas pagal formulę:

t yra pasikliovimo koeficientas (su tikimybe 0,954 jis yra lygus 2,0; nustatomas pagal tikimybių integralų lenteles),

y2 = 0,24 - standartinis nuokrypis;

10 000 žmonių - imties dydis;

Dx = 0,04 yra imties vidurkio ribinė paklaida.

Su 95,4% tikimybe galima teigti, kad imties dydis, suteikiantis ne didesnę kaip 0,04 santykinę paklaidą, turėtų būti bent 566 šeimos.

UŽDUOTIS3

Pateikiami šie duomenys apie įmonės pagrindinės veiklos pajamas, mln.

Norėdami išanalizuoti daugybę dinamikų, nustatykite šiuos rodiklius:

1) grandinė ir pagrindinė:

Absoliutus pelnas;

Augimo tempai;

Augimo tempai;

2) vidutinis

Daugelio dinamikos lygis;

Absoliutus pelnas;

Augimo tempas;

Padidėjimo greitis;

3) 1% padidėjimo absoliuti vertė.

Sprendimas

1. Absoliutus pelnas (Dy) yra skirtumas tarp kito serijos lygio ir ankstesnio (arba pagrindinio):

grandinė: Du = yi - yi-1,

pagrindinis: Ду = уi - y0,

уi – eilės lygis,

i - eilutės lygio numeris,

y0 yra bazinių metų lygis.

2. Augimo tempas (Tu) yra kito serijos lygio ir ankstesnio (arba 2001 m. bazinio lygio) santykis:

grandinė: Tu =;

pagrindinis: Tu =

3. Augimo tempas (TD) yra absoliutaus augimo ir ankstesnio lygio santykis, išreikštas %.

grandinė: Tu =;

pagrindinis: Tu =

4. Absoliuti 1 % padidėjimo vertė (A) yra grandinės absoliutaus augimo ir augimo greičio santykis, išreikštas %.

A =

Vidurinis eilės lygis apskaičiuojamas pagal aritmetinio vidurkio formulę.

Vidutinis pajamų iš pagrindinės veiklos lygis per 4 metus:

Vidutinis absoliutus augimas apskaičiuojamas pagal formulę:

kur n yra serijos lygių skaičius.

Vidutiniškai pajamos iš pagrindinės veiklos per metus padidėjo 3,333 mln. RUB.

Vidutinis metinis augimo tempas apskaičiuojamas pagal geometrinio vidurkio formulę:

уn - galutinis serijos lygis,

y0 yra pradinis eilutės lygis.

Tu = 100 % = 102,174 %

Vidutinis metinis augimo tempas apskaičiuojamas pagal formulę:

T? = Tu – 100 % = 102,74 % – 100 % = 2,74 %.

Taigi, vidutiniškai per metus pajamos iš pagrindinės įmonės veiklos išaugo 2,74 proc.

UŽDUOTYSA4

Apskaičiuoti:

1. Individualūs kainų indeksai;

2. Bendrasis apyvartos indeksas;

3. Bendras kainų indeksas;

4. Suvestinis fizinės prekių pardavimo apimties indeksas;

5. Absoliutus apyvartos vertės padidėjimas ir skaidymas pagal veiksnius (dėl kainų ir parduotų prekių skaičiaus pokyčių);

6. Padarykite trumpas išvadas apie visus gautus rodiklius.

Sprendimas

1. Pagal sąlygą individualūs A, B, C prekių kainų indeksai buvo -

ipA = 1,20; ipB = 1,15; ipB = 1,00.

2. Bendrasis apyvartos indeksas apskaičiuojamas pagal formulę:

I w = = 1470/1045 * 100 % = 140,67 %

Prekybos apyvarta išaugo 40,67% (140,67% -100%).

Vidutiniškai žaliavų kainos pakilo 10,24 proc.

Pirkėjų papildomų išlaidų suma dėl kainų padidėjimo:

w (p) =? p1q1 -? p0q1 = 1470 - 1333,478 = 136,522 milijono rublių.

Dėl kainų kilimo pirkėjai turėjo papildomai išleisti 136,522 mln.

4. Bendras fizinės prekybos apimties indeksas:

Fizinė prekybos apyvartos apimtis išaugo 27,61 proc.

5. Nustatykite bendrą antrojo laikotarpio apyvartos pokytį, palyginti su pirmuoju laikotarpiu:

w = 1470-1045 = 425 milijonai rublių.

dėl kainų pokyčių:

W (p) = 1470 - 1333,478 = 136,522 milijono rublių.

dėl fizinio tūrio pokyčių:

w (q) = 1333,478 - 1045 = 288,478 milijono rublių.

Prekių apyvarta išaugo 40,67 proc. 3 prekių kainos vidutiniškai padidėjo 10,24%. Fizinė prekybos apimtis išaugo 27,61 proc.

Apskritai pardavimų apimtis padidėjo 425 milijonais rublių, įskaitant dėl ​​kainų padidėjimo, ji padidėjo 136,522 milijono rublių, o dėl pardavimo apimčių padidėjimo - 288,478 milijonais rublių.

UŽDUOTIS5

Pateikiami 10 tos pačios pramonės šakų gamyklų duomenys.

Augalas Nr.

Gamybos išeiga, tūkst. vnt (NS)

Remiantis pateiktais duomenimis:

I) patvirtinti loginės analizės nuostatas dėl tiesinės koreliacijos tarp faktoriaus požymio (išėjimo apimties) ir efektyvaus požymio (galios suvartojimo) buvimo, koreliacijos lauko grafike nubraižyti pradinius duomenis ir padaryti išvadas apie ryšį, nurodykite jo formulę;

2) nustato ryšio lygties parametrus ir gautą teorinę tiesę nubraižo koreliacijos lauko grafike;

3) apskaičiuokite tiesinės koreliacijos koeficientą,

4) paaiškinti 2 ir 3 punktuose gautų rodiklių reikšmes;

5) naudojant gautą modelį, prognozuoti galimą elektros energijos suvartojimą gamykloje, kurios gamybos apimtis 4,5 tūkst.

Sprendimas

Funkcijų duomenys – išėjimo apimtis (koeficientas), žymime xi; ženklas - energijos suvartojimas (rezultatas) per уi; OXY koreliacijos laukui taikomi taškai su koordinatėmis (x, y).

Koreliacijos lauko taškai yra išilgai tiesios linijos. Todėl ryšys tiesinis, regresijos lygties ieškosime tiesės formos Yx = ax + b. Norėdami jį rasti, naudosime normaliųjų lygčių sistemą:

Padarykime skaičiavimo lentelę.

Naudodami rastą vidurkį sudarome sistemą ir išsprendžiame ją pagal parametrus a ir b:

Taigi, gauname y regresijos lygtį x: = 3,57692 x + 3,19231

Koreliacijos lauke sukuriame regresijos liniją.

Pakeitę x reikšmes iš 2 stulpelio į regresijos lygtį, gauname apskaičiuotą (7 stulpelis) ir palyginame jas su y duomenimis, kurie atsispindi 8 stulpelyje. Beje, skaičiavimų teisingumą patvirtina ir y ir vidutinių verčių sutapimas.

Koeficientastiesinė koreliacijaįvertina ženklų x ir y ryšio glaudumą ir apskaičiuojamas pagal formulę

Regresijos tiesės a (prie x) nuolydis apibūdina atskleidimo kryptįpriklausomybėsženklai: a> 0 yra vienodi, a<0- противоположны. Jos absoliutus reikšmė – efektyvaus požymio kitimo matas, kai veiksnys keičiasi vienam matavimo vienetui.

Laisvasis regresijos linijos narys atskleidžia kryptį, o jo absoliuti reikšmė yra kiekybinis visų kitų veiksnių įtakos efektyviajam ženklui matas.

Jeigu< 0, tada atskiro objekto faktoriaus atributo resursas naudojamas su mažesniu, o kada>0 sudidesnis efektyvumas nei viso objektų rinkinio vidurkis.

Atlikime postregresinę analizę.

Regresijos tiesės koeficientas ties x lygus 3,57692> 0, todėl, didėjant (mažėjant) gamybai, elektros energijos suvartojimas didėja (mažėja). Gamybos produkcijos padidėjimas 1 tūkst. vnt. duoda vidutinį elektros suvartojimo padidėjimą 3,57692 tūkst. kWh.

2. Tiesioginės regresijos laisvasis terminas yra 3,19231, todėl kitų veiksnių įtaka padidina produkcijos įtakos elektros energijos suvartojimui stiprumą absoliučiais dydžiais 3,19231 tūkst. kWh.

3. Koreliacijos koeficientas 0,8235 atskleidžia labai glaudžią energijos suvartojimo priklausomybę nuo išėjimo.

Naudojant regresijos modelio lygtį, lengva daryti prognozes. Norėdami tai padaryti, x reikšmės pakeičiamos į regresijos lygtį - numatoma gamybos apimtis ir elektros suvartojimas. Tokiu atveju x reikšmės gali būti paimtos ne tik nurodytame diapazone, bet ir už jo ribų.

Padarykime prognozę apie galimą elektros suvartojimą gamykloje, kurios gamybos apimtis 4,5 tūkst.

3,57692 * 4,5 + 3,19231 = 19,288 45 tūkst. kWh.

NAUDOJAMŲ ŠALTINIŲ SĄRAŠAS

1. Zacharenkovas S.N. Socialinė-ekonominė statistika: Vadovėlis-praktinis vadovas. -Mn .: BSEU, 2002.

2. Efimova M.R., Petrova E.V., Rumyantsev V.N. Bendroji statistikos teorija. - M .: INFRA - M., 2000 m.

3. Eliseeva I.I. Statistika. - M .: Prospektas, 2002 m.

4. Bendroji statistikos teorija / Under total. red. O.E. Bašina, A.A. Spirina. - M .: Finansai ir statistika, 2000 m.

5. Socialinė-ekonominė statistika: Vadovėlis-praktinis. pašalpa / Zakharenkov S.N. ir kt. – Minskas: YSU, 2004 m.

6. Socialinė-ekonominė statistika: Vadovėlis. pašalpa. / Red. Nesterovičius S.R. - Minskas: BSEU, 2003 m.

7. Teslyuk I.E., Tarlovskaya V.A., Terlizhenko N. Statistika.- Minskas, 2000 m.

8. Charčenko L.P. Statistika. - M .: INFRA - M, 2002 m.

9. Kharchenko L.P., Dolzhenkova V.G., Ionin V.G. Statistika. - M .: INFRA - M, 1999 m.

10. Ekonominė statistika / Red. Yu.N. Ivanova – M., 2000 m.

Paskelbta Allbest.ru

...

Panašūs dokumentai

    Intervalų skirstinio eilučių aritmetinio vidurkio apskaičiavimas. Fizinės prekybos apimties bendrojo indekso nustatymas. Absoliutaus bendros gaminių savikainos pokyčio dėl fizinės apimties pokyčių analizė. Variacijos koeficiento apskaičiavimas.

    testas, pridėtas 2010-07-19

    Didmeninės, mažmeninės ir viešųjų prekių apyvartos esmė. Individualių, suvestinių apyvartos indeksų skaičiavimo formulės. Intervalų skirstinio eilučių charakteristikų skaičiavimas - aritmetinis vidurkis, moda ir mediana, variacijos koeficientas.

    Kursinis darbas pridėtas 2013-10-05

    Planuojamų ir faktinių pardavimų skaičiavimas, plano procentas, absoliutus apyvartos pokytis. Absoliutaus augimo, vidutinių augimo tempų ir grynųjų pinigų augimo nustatymas. Struktūrinių vidurkių skaičiavimas: modai, medianos, kvartiliai.

    testas, pridėtas 2012-02-24

    Bankų pasiskirstymo pagal pelno apimtį intervalinės eilutės. Gautų intervalų skirstinių eilučių modos ir medianos nustatymas grafiniu metodu ir skaičiavimais. Intervalo skirstinio eilučių charakteristikų skaičiavimas. Aritmetinio vidurkio apskaičiavimas.

    testas, pridėtas 2010-12-15

    Formulės, skirtos nustatyti intervalų serijos vidutines reikšmes - režimas, mediana, dispersija. Dinamikos eilučių analitinių rodiklių skaičiavimas pagal grandinę ir pagrindines schemas, augimo ir augimo tempus. Pirminės savikainos, kainų, sąnaudų ir apyvartos konsoliduoto indekso samprata.

    Kursinis darbas, pridėtas 2011-02-27

    Variacijų serijos konstravimo samprata ir tikslas, tvarka ir taisyklės. Duomenų homogeniškumo analizė grupėse. Požymio kitimo (kintamumo) rodikliai. Vidutinio tiesinio ir kvadratinio nuokrypio, svyravimų ir kitimo koeficiento nustatymas.

    testas, pridėtas 2010-04-26

    Mados ir medianos kaip tipinių savybių samprata, jų nustatymo tvarka ir kriterijai. Režimo ir medianos radimas diskrečioje ir intervalo variacijų eilutėje. Kvartiliai ir deciliai kaip papildomos statistinių variacijų eilučių charakteristikos.

    testas, pridėtas 2010-11-09

    Intervalų skirstinio serijos konstravimas, remiantis grupavimo kriterijumi. Dažnio skirstinio nuokrypio nuo simetriškos formos charakteristika, kurtozės ir asimetrijos indeksų skaičiavimas. Balanso arba pelno (nuostolių) ataskaitos rodiklių analizė.

    testas, pridėtas 2014-10-19

    Konvertuokite empirines eilutes į diskrečiąsias ir intervalines. Diskretinės serijos vidutinės vertės nustatymas naudojant jos savybes. Skaičiavimas diskrečiųjų režimo, medianos, kitimo rodiklių (dispersijos, nuokrypio, virpesių koeficiento) serijai.

    testas, pridėtas 2011-04-17

    Organizacijų pasiskirstymo statistinės eilutės sudarymas. Grafinis režimo ir medianos reikšmės apibrėžimas. Koreliacijos sandarumas naudojant determinacijos koeficientą. Vidutinio darbuotojų skaičiaus atrankos paklaidos nustatymas.

Daugeliu atvejų statistinė populiacija apima didelį ar net begalinį variantų skaičių, su kuriuo dažniausiai susiduriama nuolat kintant, sudaryti vienetų grupę kiekvienam variantui beveik neįmanoma ir nepraktiška. Tokiais atvejais statistinių vienetų agregavimas į grupes galimas tik pagal intervalą, t.y. tokia grupė, kuri turi tam tikras kintamojo atributo verčių ribas. Šios ribos žymimos dviem skaičiais, nurodančiais kiekvienos grupės viršutinę ir apatinę ribas. Naudojant intervalus susidaro intervalų pasiskirstymo eilutė.

Intervalas džiaugiuosi yra variacijų serija, kurios variantai pateikiami intervalų pavidalu.

Intervalų eilutės gali būti sudarytos su vienodais ir nelygiaverčiais intervalais, o šios eilutės sudarymo principo pasirinkimas daugiausia priklauso nuo statistinės visumos reprezentatyvumo ir patogumo. Jei populiacija yra pakankamai didelė (reprezentatyvi) pagal vienetų skaičių ir yra visiškai vienalytė savo sudėtimi, tada intervalų eilutės formavimo pagrindu patartina dėti intervalų lygybę. Paprastai pagal šį principą intervalų eilutė formuojama toms populiacijoms, kurių kitimo diapazonas yra palyginti mažas, t.y. maksimalus ir minimalus variantai dažniausiai skiriasi kelis kartus. Tokiu atveju vienodų intervalų reikšmė apskaičiuojama pagal požymio variacijos diapazono santykį su nurodytu suformuotų intervalų skaičiumi. Norėdami nustatyti lygybę ir Intervale gali būti naudojama Sturgess formulė (dažniausiai su nedideliu intervalo ypatybių skirtumu ir dideliu vienetų skaičiumi statistinėje populiacijoje):

kur x i - vienodo intervalo reikšmė; X max, X min- didžiausios ir minimalios galimybės statistinėje visumoje; n . - suvestinių vienetų skaičius.

Pavyzdys. Patartina apskaičiuoti vienodo intervalo dydį pagal radioaktyvaus užterštumo ceziu tankį - 137 100 Mogiliovo srities Krasnopolio rajono gyvenviečių, jei žinoma, kad pradinis (minimalus) variantas yra lygus I. km / km 2, finalas ( maksimalus) - 65 ki / km 2. Naudojant formulę 5.1. mes gauname:

Vadinasi, norint sudaryti intervalų eilutę su vienodais intervalais pagal cezio taršos tankį - 137 Krasnopolsko srities gyvenvietės, vienodo intervalo dydis gali būti 8 kub./km 2.

Netolygaus pasiskirstymo sąlygomis, t.y. kai maksimalus ir minimalus variantai yra šimtai kartų, formuojant intervalų eilutę galima taikyti principą nelygios intervalais. Nevienodi intervalai paprastai didėja, kai pereinate prie didesnių charakteristikų verčių.

Intervalai gali būti uždaros arba atviros formos. Uždarytaįprasta skambinti intervalais, kuriems nurodoma ir apatinė, ir viršutinė ribos. Atviras intervalai turi tik vieną kraštą: pirmajame intervale - viršutinė, paskutiniame - apatinė riba.

Patartina vertinti intervalų eilutes, ypač su nelygiais intervalais, atsižvelgiant į pasiskirstymo tankis, paprasčiausias būdas apskaičiuoti, kuris yra vietinio dažnio (arba dažnio) ir intervalo dydžio santykis.

Praktiniam intervalų serijų formavimui galite naudoti lentelės išdėstymą. 5.3.

5.3 lentelė. Krasnopolio srities gyvenviečių intervalinės serijos formavimo tvarka pagal radioaktyviosios taršos ceziu tankį -137

Pagrindinis intervalų serijos pranašumas yra jos kraštutinumas kompaktiškumas. tuo pat metu pasiskirstymo intervalinėje eilutėje atskiri požymio variantai yra paslėpti atitinkamuose intervaluose

Grafiškai vaizduojant intervalų eilutę stačiakampėje koordinačių sistemoje, ant abscisių ašies brėžiamos viršutinės intervalų ribos, o ant ordinačių ašies – lokaliniai serijų dažniai. Grafinė intervalų eilutės konstrukcija skiriasi nuo skirstinio daugiakampio konstrukcijos tuo, kad kiekvienas intervalas turi apatinę ir viršutinę kraštinę, o dvi abscisės atitinka bet kurią vieną ordinatės reikšmę. Todėl intervalų eilutės grafike pažymėtas ne taškas, kaip daugiakampyje, o tiesė, jungianti du taškus. Šios horizontalios linijos viena su kita sujungiamos vertikaliomis linijomis ir gaunama laiptuoto daugiakampio forma, kuri dažniausiai vadinama histograma pasiskirstymas (5.3 pav.).

Grafiškai braižant pakankamai didelės statistinės populiacijos intervalų eilutę, artėja histograma simetriškas paskirstymo forma. Tais atvejais, kai statistinė visuma paprastai yra maža, asimetriškas juostos diagrama.

Kai kuriais atvejais patartina suformuoti keletą sukauptų dažnių, t.y. kaupiamasis eilė. Kaupiamoji eilutė gali būti sudaryta remiantis diskrečiąja arba intervalo skirstinio seka. Grafiškai vaizduojant kumuliacinę eilutę stačiakampėje koordinačių sistemoje, parinktys brėžiamos ant abscisių ašies, o sukaupti dažniai (dažniai) – ant ordinačių ašies. Gauta kreiva linija paprastai vadinama kaupiamasis pasiskirstymas (5.4 pav.).

Įvairių tipų variacijų eilučių formavimas ir grafinis vaizdavimas prisideda prie supaprastinto pagrindinių statistinių charakteristikų, kurios išsamiai aptariamos 6 temoje, skaičiavimo, padeda geriau suprasti statistinės visumos pasiskirstymo dėsnių esmę. Variacijų eilučių analizė ypač svarbi tais atvejais, kai reikia nustatyti ir atsekti ryšį tarp pasirinkimų ir dažnių (dažnių). Ši priklausomybė pasireiškia tuo, kad kiekvienam pasirinkimui tenkančių atvejų skaičius yra tam tikru būdu susijęs su šio pasirinkimo dydžiu, t.y. padidėjus kintamojo atributo reikšmėms, šių reikšmių dažnis (dažnis) keičiasi tam tikrais, sistemingais pokyčiais. Tai reiškia, kad dažnių (dažnių) stulpelyje esantys skaičiai chaotiškai svyruoja, o kinta tam tikra kryptimi, tam tikra tvarka ir seka.

Jei jų pokyčių dažniai atskleidžia tam tikrą sistemingumą, tai reiškia, kad mes einame identifikuoti modelius. Sistema, tvarka, seka besikeičiančiuose dažniuose yra bendrų priežasčių atspindys, bendrosios sąlygos, būdingos visai rinkiniui.

Nereikėtų manyti, kad paskirstymo modelis visada pateikiamas paruoštas. Yra nemažai variacijų serijų, kuriose dažniai keistai šokinėja, kartais didėja, kartais mažėja. Tokiais atvejais patartina pasidomėti, su kokiu skirstymu susiduria tyrėjas: arba šis skirstinys visai nebūdingas dėsningumams, tada dar neatskleista jo prigimtis: Pirmas atvejis retas, antrasis, antrasis atvejis. yra gana dažnas ir labai paplitęs reiškinys.

Taigi, formuojant intervalų eilutę, bendras statistinių vienetų skaičius gali būti mažas, o kiekviename intervale yra nedaug variantų (pavyzdžiui, 1-3 vienetai). Tokiais atvejais nebūtina tikėtis, kad pasireikš koks nors dėsningumas. Kad atsitiktinių stebėjimų pagrindu būtų gautas loginis rezultatas, turi įsigalioti didelių skaičių dėsnis, t.y. kad kiekvienam intervalui būtų ne keli, o dešimtys ir šimtai statistinių vienetų. Tuo tikslu reikėtų stengtis kiek įmanoma padidinti stebėjimų skaičių. Tai patikimiausias būdas aptikti masinių procesų modelius. Jei nėra realios galimybės padidinti stebėjimų skaičių, modelio identifikavimą galima pasiekti sumažinus intervalų skaičių pasiskirstymo eilutėje. Sumažinamas intervalų skaičius variacijų serijoje, taip padidinant dažnių skaičių kiekviename intervale. Tai reiškia, kad kiekvieno statistinio vieneto atsitiktiniai svyravimai uždedami vienas ant kito, „išlyginami“, virsdami dėsningumu.

Variacinių eilučių formavimas ir sudarymas leidžia susidaryti tik bendrą, apytikslį statistinės visumos pasiskirstymo vaizdą. Pavyzdžiui, histograma tik apytiksliai išreiškia ryšį tarp ypatybės reikšmių ir jos dažnių (dažnių). Todėl variacijų serija iš esmės yra tik pagrindas tolesniam, nuodugniam statinio pasiskirstymo vidinių dėsnių tyrimui.

5 TEMO KONTROLINIAI KLAUSIMAI

1. Kas yra variacija? Kas lemia bruožo kitimą statistinėje populiacijoje?

2. Kokie įvairūs bruožai gali atsirasti statistikoje?

3. Kas yra variacijų serija? Kokių tipų variacijų serijos gali būti?

4. Kas yra reitinguojama serija? Kokie jo privalumai ir trūkumai?

5. Kas yra diskrečioji serija ir kokie jos privalumai bei trūkumai?

6. Kokia intervalų eilučių formavimo tvarka, kokie jos privalumai ir trūkumai?

7. Kas yra grafinis intervalinės, diskrečios, intervalų skirstinio sekos vaizdas?

8. Kas yra kaupiamasis skirstinys ir ką jis apibūdina?