Статистическо обобщение и групиране. Статистически разпределителни серии. Примери за решаване на проблеми. Построяване на серия за интервално разпределение

Практически урок 1

ВАРИАЦИОННА СЕРИА НА РАЗПРЕДЕЛЕНИЕ

Вариационната серияили близко разпространениенаречено подредено разпределение на единиците от съвкупността чрез увеличаване (по-често) или намаляване (по-рядко) стойности на атрибута и преброяване на броя на единиците с една или друга стойност на атрибута.

има 3 от видасерия за разпространение:

1) класиран ред- това е списък на отделните единици от популацията във възходящ ред на изследваната черта; ако броят на единиците на популацията е достатъчно голям, класираният ред става тромав и в такива случаи серия на разпределение се изгражда чрез групиране на единиците на популацията според стойностите на изследвания атрибут (ако атрибутът заема малък брой от стойности, тогава се изгражда дискретна серия, а в противен случай - интервална серия);

2) дискретна серияТова е таблица, състояща се от две колони (редове) - специфични стойности на променлив атрибут х ии броя на единиците от съвкупността с дадена стойност на атрибута е и- честоти; броят на групите в дискретен ред се определя от броя на реално съществуващите стойности на променливия атрибут;

3) интервална серияТова е таблица, състояща се от две колони (редове) - интервали на променлив атрибут х ии броя на единиците на населението, попадащи в даден интервал (честоти), или дяловете на този брой в общия брой на популациите (честоти).

Извикват се числата, показващи колко пъти се появяват отделни опции в дадена популация честотиили везнивариант и се обозначава с малка буква на латинската азбука е. Общата сума от честотите на вариационния ред е равна на обема на дадената съвкупност, т.е.

където к- брой групи, н- общият брой на наблюденията или обемът на популацията.

Честотите (тегла) се изразяват не само в абсолютни, но и в относителни числа – във доли от единица или като процент от общия брой варианти, съставляващи даден набор. В такива случаи теглата се наричат относителни честотиили често срещан.Общата сума на данните е равна на едно

или
,

ако честотите са изразени като процент от общия брой наблюдения NSЗамяната на честоти с честоти не е необходима, но понякога се оказва полезна и дори необходима в случаите, когато е необходимо да се сравняват помежду си вариационни серии, които са много различни по обема си.

В зависимост от това как атрибутът варира - дискретно или непрекъснато, в широк или тесен диапазон - статистическата съвкупност се разпределя в без интервалиили интервалвариационна серия. В първия случай честотите са пряко свързани с класираните стойности на признака, които придобиват позицията на отделни групи или класове от вариационния ред; във втория, честотите се отчитат, отнасящи се до отделни интервали или интервали (от - до), на които общата вариация на чертата се разделя в диапазона от минимални до максимални опции за дадена популация. Тези празнини или класове може да са равни по ширина или да не са. Оттук се различават равни и неравномерни интервални вариационни серии.В неравноинтервалните серии естеството на честотното разпределение се променя с промяна на ширината на интервалите на класовете. Неравномерното интервално групиране се използва сравнително рядко в биологията. По правило биометричните данни се разпределят в серии с равни интервали, което позволява не само да се разкрие редовността на вариацията, но и улеснява изчисляването на сумарните числени характеристики на вариационните серии, сравнението на разпределителните серии помежду си.

Когато започвате да изграждате серия от вариации с равен интервал, важно е правилно да очертаете ширината на интервала на класа. Факт е, че грубото групиране (когато са установени много широки класови интервали) изкривява типичните характеристики на вариация и води до намаляване на точността на числените характеристики на серията. При избор на прекалено тесни интервали точността на обобщаващите числови характеристики се увеличава, но серията се оказва твърде разтеглена и не дава ясна картина на вариацията.

За да се получи ясно видима вариационна серия и за да се осигури достатъчна точност на числените характеристики, изчислени върху него, вариацията на характеристиката (в диапазона от минимални до максимални опции) трябва да бъде разделена на такъв брой групи или класове, които биха удовлетворили и двете изисквания. Този проблем се решава чрез разделяне на диапазона на вариация на характеристиката на броя на групите или класовете, очертани при конструирането на вариационната серия:

,

където з- размерът на интервала; х m a x и х min - максимални и минимални стойности в съвкупността; к- брой групи.

При конструиране на интервална серия за разпределение е необходимо да се избере оптималният брой групи (интервали на характеристиките) и да се зададе дължината (обхвата) на интервала. Тъй като анализът на серия от разпределения сравнява честотите в различни интервали, е необходимо дължината на интервалите да бъде постоянна. Ако трябва да се справите с интервална серия от разпределения с неравни интервали, тогава за съпоставимост трябва да намалите честотата или честотата до единица от интервала, получената стойност се нарича плътност ρ , това е
.

Оптималният брой групи е избран така, че разнообразието на стойностите на признака в съвкупността да бъде достатъчно отразено и в същото време редовността на разпределението, неговата форма да не се нарушава от случайни колебания на честотите. Ако има твърде малко групи, моделът на вариация няма да се появи; ако има твърде много групи, произволните честотни скокове ще изкривят формата на разпределението.

Най-често броят на групите в разпределителната серия се определя от формулата на Стържес:

където н- размерът на населението.

Графичното представяне осигурява съществена помощ при анализа на редица разпределения и техните свойства. Интервалната серия е изобразена с лентова диаграма, в която основите на лентите, разположени по оста на абсцисата, са интервалите на стойностите на променливия признак, а височините на лентите са честотите, съответстващи на скалата по протежение на ординатна ос. Този тип диаграма се нарича хистограма.

Ако има дискретна серия на разпределение или се използват средните точки на интервалите, тогава графичното представяне на такава серия се нарича многоъгълник, което се получава чрез свързване на прави точки с координати х ии е и .

Ако начертаете стойностите на класовете по абсцисата и натрупаните честоти по ординатата, след това свържете точките с прави линии, ще получите графика, наречена кумулативна.Натрупаните честоти се намират чрез последователно сумиране, или кумулациячестоти в посока от първия клас до края на вариационния ред.

Пример. Има данни за производството на яйца от 50 кокошки носачки за 1 година, отглеждани в птицефермата (Таблица 1.1).

Таблица 1.1

Производство на яйца от кокошки носачки

№ на кокошка носачка

Производство на яйца, бр.

№ на кокошка носачка

Производство на яйца, бр.

№ на кокошка носачка

Производство на яйца, бр.

№ на кокошка носачка

Производство на яйца, бр.

№ на кокошка носачка

Производство на яйца, бр.

Необходимо е да се построи интервална серия за разпределение и да се покаже графично под формата на хистограма, полигон и кумулати.

Вижда се, че чертата варира от 212 до 245 яйца, получени от кокошка за 1 година.

В нашия пример, използвайки формулата на Sturjess, ние определяме броя на групите:

к = 1 + 3,322lg 50 = 6,643 ≈ 7.

Нека изчислим дължината (диапазон) на интервала по формулата:

.

Нека изградим интервална серия от 7 групи и интервал от 5 броя. яйца (Таблица 1.2). За да изградим графики в таблицата, изчисляваме средата на интервалите и натрупаната честота.

Таблица 1.2

Интервални серии на разпределение на производството на яйца

Група кокошки носачки според стойността на производството на яйца

х и

Брой кокошки носачки

е и

Средата на интервала

NSаз '

Натрупана честота

е и

Нека изградим хистограма на разпределението на производството на яйца (фиг. 1.1).

Ориз. 1.1. Хистограма за разпределение на производството на яйца

Тези хистограми показват формата на разпределение, характерна за много характеристики: стойностите на средните интервали на характеристиката са по-чести, по-рядко - екстремните (малки и големи) стойности на характеристиката. Формата на това разпределение е близка до нормалния закон за разпределение, който се формира, ако променливата е повлияна от голям брой фактори, нито един от които няма преобладаваща стойност.

Многоъгълникът и кумулативното разпределение на производството на яйца имат формата (фиг. 1.2 и 1.3).

Ориз. 1.2. Полигон за разпределение на яйца

Ориз. 1.3. Кумул на разпределение на производството на яйца

Технологията за решаване на проблема в табличен процесор Microsoft Excel следващия.

1. Въведете първоначалните данни в съответствие с фиг. 1.4.

2. Подредете реда.

2.1. Изберете клетки A2: A51.

2.2. Щракнете с левия бутон върху лентата с инструменти върху бутона<Сортировка по возрастанию > .

3. Определете размера на интервала за начертаване на серията на интервалното разпределение.

3.1. Копирайте клетка A2 в клетка E53.

3.2. Копирайте клетка A51 в клетка E54.

3.3. Изчислете диапазона на вариация. За да направите това, въведете формулата в клетка E55 = E54-E53.

3.4. Изчислете броя на групите от варианти. За да направите това, въведете формулата в клетка E56 = 1 + 3,322 * LOG10 (50).

3.5. Въведете закръгления брой групи в клетка E57.

3.6. Изчислете дължината на интервала. За да направите това, въведете формулата в клетка E58 = E55 / E57.

3.7. Въведете закръглената дължина на интервала в клетка E59.

4. Изградете интервална серия.

4.1. Копирайте клетка E53 в клетка B64.

4.2. Въведете формулата в клетка B65 = B64 + $ E $ 59.

4.3. Копирайте клетка B65 в клетки B66: B70.

4.4. Въведете формулата в клетка C64 = B65.

4.5. Въведете формулата в клетка C65 = C64 + $ E $ 59.

4.6. Копирайте клетка C65 в клетки C66: C70.

Резултатите от решението се извеждат на екрана на дисплея в следната форма (фиг. 1.5).

5. Изчислете интервалната честота.

5.1. Изпълнете командата Обслужване,Анализ на данникато щракнете последователно с левия бутон на мишката.

5.2. В диалоговия прозорец Анализ на данниизползвайте левия бутон на мишката, за да инсталирате: Инструменти за анализ <Гистограмма>(фиг. 1.6).

5.3. Щракнете с левия бутон върху бутона<ОК>.

5.4. В раздела лентова графиказадайте параметрите според фиг. 1.7.

5.5. Щракнете с левия бутон върху бутона<ОК>.

Резултатите от решението се извеждат на екрана на дисплея в следната форма (фиг. 1.8).

6. Попълнете таблицата "Разпределителни интервални серии".

6.1. Копирайте клетки B74: B80 в клетки D64: D70.

6.2. Изчислете сумата от честотите. За да направите това, изберете клетки D64: D70 и щракнете с левия бутон върху лентата с инструменти върху бутона<Автосумма > .

6.3. Изчислете средната точка на интервалите. За да направите това, въведете формулата в клетка E64 = (B64 + C64) / 2и копирайте в клетки E65: E70.

6.4. Изчислете натрупаните честоти. За да направите това, копирайте клетка D64 в клетка F64. В клетка F65 въведете формулата = F64 + D65 и я копирайте в клетките F66: F70.

Резултатите от решението се извеждат на екрана на дисплея в следната форма (фиг. 1.9).

7. Редактирайте хистограмата.

7.1. Щракнете с десния бутон върху диаграмата върху името "джоб" и върху раздела, който се показва, щракнете<Очистить>.

7.2. Щракнете с десния бутон върху диаграмата и в раздела, който се показва, щракнете върху бутона<Исходные данные>.

7.3. В диалоговия прозорец Първоначални даннипроменете етикетите на оста X. За да направите това, изберете клетки B64: C70 (фиг. 1.10).

7.5. Натиснете клавиша .

Резултатите се извеждат на екрана на дисплея в следната форма (фиг. 1.11).

8. Изградете полигон за разпределение на производството на яйца.

8.1. Щракнете с левия бутон върху лентата с инструменти върху бутона<Мастер диаграмм > .

8.2. В диалоговия прозорец Съветник за диаграми (стъпка 1 от 4)използвайте левия бутон на мишката, за да зададете: Standard <График>(фиг. 1.12).

8.3. Щракнете с левия бутон върху бутона<Далее>.

8.4. В диалоговия прозорец Съветник за диаграми (стъпка 2 от 4)задайте параметрите според фиг. 1.13.

8.5. Щракнете с левия бутон върху бутона<Далее>.

8.6. В диалоговия прозорец Съветник за диаграми (стъпка 3 от 4)въведете имената на диаграмата и оста y (фиг. 1.14).

8.7. Щракнете с левия бутон върху бутона<Далее>.

8.8. В диалоговия прозорец Съветник за диаграми (стъпка 4 от 4)задайте параметрите според фиг. 1.15.

8.9. Щракнете с левия бутон върху бутона<Готово>.

Резултатите се извеждат на екрана на дисплея в следната форма (фиг. 1.16).

9. Вмъкнете етикети с данни в графиката.

9.1. Щракнете с десния бутон върху диаграмата и в раздела, който се показва, щракнете върху бутона<Исходные данные>.

9.2. В диалоговия прозорец Първоначални даннипроменете етикетите на оста X. За да направите това, изберете клетки E64: E70 (фиг. 1.17).

9.3. Натиснете клавиша .

Резултатите се извеждат на екрана на дисплея в следната форма (фиг. 1.18).

Кумулативното разпределение се конструира подобно на полигона на разпределение въз основа на натрупаните честоти.

Представени са под формата на разпределителни серии и се оформят във формата.

Серията за разпространение е вид групиране.

Серия за разпространение- представлява подредено разпределение на единиците от изследваната съвкупност в групи по определена вариабилна характеристика.

В зависимост от особеността, лежаща в основата на формирането на поредица от разпределения, те се разграничават атрибутивни и вариационникласове на разпределение:

  • Атрибутивна- обадете се на разпределителната серия, изградена според качествените характеристики.
  • Реди на разпределение, изградени във възходящ или низходящ ред на стойностите на количествената характеристика, се наричат вариационен.
Поредицата от варианти на разпространение се състои от две колони:

Първата колона съдържа количествените стойности на променливия атрибут, които се наричат настроикии са посочени. Дискретна опция - изразена като цяло число. Опцията за интервал варира от и до. В зависимост от вида на вариантите можете да изградите дискретна или интервална серия от вариации.
Втората колона съдържа брой конкретна опцияизразено чрез честоти или честоти:

Честоти- това са абсолютни числа, показващи колко пъти дадена стойност на даден признак се среща в съвкупност, които означават. Сумата от всички честоти трябва да е равна на броя на единиците в цялата съвкупност.

Честоти() Честотите са изразени като процент от общия брой. Сборът от всички честоти, изразени като процент, трябва да бъде равен на 100% в част от едно.

Графично представяне на разпределителни редове

Разпределителните серии са ясно представени с помощта на графични изображения.

Разпределителните серии са изобразени като:
  • многоъгълник
  • Хистограми
  • Натрупва се
  • Ogives

многоъгълник

При конструиране на многоъгълник по хоризонталната ос (ос на абсцисата) се нанасят стойностите на променливия признак, а по вертикалната ос (ос на ординатите) - честоти или честоти.

Многоъгълник на фиг. 6.1, построен въз основа на микропреброяването на населението на Русия през 1994 г.

6.1. Разпределение на домакинствата по големина

състояние: Дадени са данни за разпределението на 25 служители на едно от предприятията по тарифни категории:
4; 2; 4; 6; 5; 6; 4; 1; 3; 1; 2; 5; 2; 6; 3; 1; 2; 3; 4; 5; 4; 6; 2; 3; 4
Задача: Създайте дискретна серия от вариации и я покажете графично като полигон за разпределение.
Решение:
В този пример опциите са степента на заплата на служителя. За да се определят честотите, е необходимо да се изчисли броят на служителите със съответната категория заплати.

Многоъгълникът се използва за дискретни вариационни серии.

За да изградим полигон на разпределение (фиг. 1), по оста на абсцисата (X), отлагаме количествените стойности на променливата характеристика - опции и по ординатата - честоти или честоти.

Ако стойностите на даден признак са изразени като интервали, тогава такава серия се нарича интервал.
Интервални редоверазпределенията се изобразяват графично като хистограми, кумулати или огиви.

Статистическа таблица

състояние: Данните за размера на депозитите на 20 физически лица в една банка (хиляда рубли) 60; 25; 12; десет; 68; 35; 2; 17; 51; девет; 3; 130; 24; 85; 100; 152; 6; осемнадесет; 7; 42.
Задача: Начертайте серия от интервални вариации на равни интервали.
Решение:

  1. Първоначалната популация се състои от 20 единици (N = 20).
  2. Използвайки формулата на Стърджес, ние определяме необходимия брой използвани групи: n = 1 + 3,322 * lg20 = 5
  3. Изчисляваме стойността на равен интервал: i = (152 - 2) / 5 = 30 хиляди рубли
  4. Нека разделим първоначалното население на 5 групи с интервал от 30 хиляди рубли.
  5. Резултатите от групирането са представени в таблицата:

При такъв запис на непрекъсната характеристика, когато една и съща стойност се среща два пъти (като горна граница на един интервал и долна граница на друг интервал), тогава тази стойност се отнася за групата, където тази стойност действа като горна граница.

лентова графика

За да се построи хистограма по абсцисата, се посочват стойностите на границите на интервалите и въз основа на тях се изграждат правоъгълници, чиято височина е пропорционална на честотите (или части).

На фиг. 6.2. показва хистограма на разпределението на населението на Русия през 1997 г. по възрастови групи.

Ориз. 6.2. Разпределение на населението на Русия по възрастови групи

състояние: Дадено е разпределението на 30 служители на фирмата по размера на месечната работна заплата

Задача: Показва графично серията от вариации на интервала под формата на хистограма и се натрупва.
Решение:

  1. Неизвестната граница на отворения (първия) интервал се определя от стойността на втория интервал: 7000 - 5000 = 2000 рубли. Със същата стойност намираме долната граница на първия интервал: 5000 - 2000 = 3000 рубли.
  2. За да построим хистограма в правоъгълна координатна система по оста на абсцисата, оставяме настрана сегментите, чиито стойности съответстват на интервалите на сортовата серия.
    Тези сегменти служат като долна основа, а съответната честота (честота) - височината на образуваните правоъгълници.
  3. Нека изградим хистограма:

За конструиране на кумулати е необходимо да се изчислят натрупаните честоти (честоти). Те се определят чрез последователно сумиране на честотите (честотите) на предходните интервали и се обозначават с S. Натрупаните честоти показват колко единици от съвкупността имат стойност на атрибута не повече от разглежданата.

Кумулата

Разпределението на характеристика във вариационния ред според натрупаните честоти (части) е изобразено с помощта на кумулати.

Кумулатаили кумулативната крива, за разлика от полигона, се изгражда от натрупаните честоти или части. В този случай стойностите на атрибута се поставят по оста на абсцисата, а натрупаните честоти или честоти се поставят върху оста на ординатите (фиг. 6.3).

Ориз. 6.3. Кумулативно разпределение на домакинствата по размер

4. Нека изчислим натрупаните честоти:
Честотата на коляното на първия интервал се изчислява, както следва: 0 + 4 = 4, за втория: 4 + 12 = 16; за третия: 4 + 12 + 8 = 24 и т.н.

При конструиране на кумулати натрупаната честота (честота) на съответния интервал се приписва на горната му граница:

Огива

Огивасе конструира подобно на кумулативната, с единствената разлика, че натрупаните честоти се поставят по оста на абсцисата, а стойностите на атрибута се поставят върху оста на ординатите.

Разнообразие от кумулати е кривата на концентрацията или графиката на Лоренц. За да се начертае кривата на концентрацията, върху двете оси на правоъгълна координатна система се прилага скала в проценти от 0 до 100. Натрупаните честоти са посочени по абсцисата, а натрупаните стойности на фракцията (в проценти) от обемът на елемента са посочени на ординатата.

Равномерното разпределение на признака съответства на диагонала на квадрата на графиката (фиг. 6.4). При неравномерно разпределение графиката е вдлъбната крива в зависимост от нивото на концентрация на признака.

6.4. Крива на концентрация

Какво представлява групирането на статистическите данни и как е свързано с редовете на разпределение, беше обсъдено в тази лекция, където можете също да научите какво представлява дискретната и вариационна разпределителна серия.

Редовете на разпределение са една от разновидностите на статистическите редове (освен тях в статистиката се използват динамични редове), те се използват за анализ на данни за явленията от социалния живот. Изграждането на поредица от вариации е доста изпълнима задача за всеки. Има обаче правила, които трябва да запомните.

Как да начертаем дискретна вариационна серия на разпределение

Пример 1. Има данни за броя на децата в 20 анкетирани семейства. Създайте дискретна серия от вариации разпределение на семействатапо броя на децата.

0 1 2 3 1
2 1 2 1 0
4 3 2 1 1
1 0 1 0 2

Решение:

  1. Ще започнем с оформление на таблицата, в която след това ще попълним данните. Тъй като редовете за разпределение имат два елемента, таблицата ще се състои от две колони. Първата колона винаги е опция - това, което изучаваме - вземаме името му от задачата (края на изречението със задачата в условията) - по броя на децата- така че нашият вариант е броят на децата.

Втората колона е честотата - колко често нашият вариант се среща в изследваното явление - също вземаме името на колоната от задачата - разпределение на семействата - така че нашата честота е броят на семействата със съответния брой деца.

  1. Сега от първоначалните данни изберете тези стойности, които се появяват поне веднъж. В нашия случай е така

И ние ще подредим тези данни в първата колона на нашата таблица в логически ред, в този случай увеличавайки от 0 до 4. Получаваме

И в заключение, нека преброим колко пъти се среща всяка стойност на опциите.

0 1 2 3 1

2 1 2 1 0

4 3 2 1 1

1 0 1 0 2

В резултат на това получаваме пълна таблица или необходимата серия от разпределение на семействата по брой деца.

Упражнение . Има данни за категориите заплати на 30 работници от предприятието. Създайте дискретна серия от вариации за разпределение на работниците по категории заплати. 2 3 2 4 4 5 5 4 6 3

1 4 4 5 5 6 4 3 2 3

4 5 4 5 5 6 6 3 3 4

Как да начертаете интервална вариационна серия на разпределение

Нека построим интервална серия за разпределение и да видим как нейната конструкция се различава от дискретната серия.

Пример 2. Има данни за размера на печалбата, получена от 16 предприятия, млн. рубли. - 23 48 57 12 118 9 16 22 27 48 56 87 45 98 88 63. Изградете интервална вариационна серия на разпределение на предприятията по отношение на печалбата, като откроите 3 групи на равни интервали.

Общият принцип на конструиране на серията, разбира се, ще бъде запазен, същите две колони, същите опции и честота, но тук опцията ще бъде разположена в интервала и честотите ще се броят по различен начин.

Решение:

  1. Нека започнем по подобен начин на предишната задача, като изградим оформление за таблица, в която след това ще въведем данните. Тъй като редовете за разпределение имат два елемента, таблицата ще се състои от две колони. Първата колона винаги е опцията - това, което изучаваме - вземаме името му от заданието (края на изречението със заданието в условията) - по размера на печалбата - което означава, че нашата опция е сумата на печалбата направени.

Втората колона е честотата - тъй като нашият вариант често се среща в изследваното явление - ние вземаме и името на колоната от заданието - разпределение на предприятията - така че нашата честота е броят на предприятията със съответната печалба, в случая падаща в интервала.

В резултат на това оформлението на нашата таблица ще изглежда така:

където i е стойността или дължината на интервала,

Xmax и Xmin - максималната и минималната стойност на функцията,

n е необходимия брой групи според постановката на задачата.

Нека изчислим размера на интервала за нашия пример. За да направите това, сред изходните данни намираме най-големия и най-малкия

23 48 57 12 118 9 16 22 27 48 56 87 45 98 88 63 - максималната стойност е 118 милиона рубли, а минималната - 9 милиона рубли. Нека да изчислим по формулата.

При изчислението получихме числото 36, (3) три в периода, в такива ситуации стойността на интервала трябва да се закръгли до по-голямо, така че след изчисленията да не се губят максималните данни, поради което при изчислението стойността на интервала е 36,4 милиона рубли.

  1. Сега нека изградим интервалите - нашите опции в този проблем. Първият интервал започва да се изгражда от минималната стойност, към него се добавя стойността на интервала и се получава горната граница на първия интервал. Тогава горната граница на първия интервал става долна граница на втория интервал, към него се добавя стойността на интервала и се получава вторият интервал. И така нататък толкова пъти, колкото е необходимо за начертаване на интервали по условие.

Нека обърнем внимание, ако не бяхме закръглили стойността на интервала до 36,4, а щяхме да го оставим на 36,3, тогава последната стойност щеше да се окаже 117,9. Именно за да се избегне загуба на данни, е необходимо стойността на интервала да се закръгли до по-голяма стойност.

  1. Нека изчислим броя на предприятията, попаднали във всеки конкретен интервал. Когато обработвате данни, не забравяйте, че горната стойност на интервала в този интервал не се взема предвид (не е включена в този интервал), а се взема предвид в следващия интервал (долната граница на интервала е включена в този интервал, и горната граница не е включена), с изключение на последния интервал.

Когато обработвате данни, най-добре е да маркирате избраните данни с конвенционални символи или цвят, за да опростите обработката.

23 48 57 12 118 9 16 22

27 48 56 87 45 98 88 63

Означаваме първия интервал с жълто - и определяме колко данни попадат в интервала от 9 до 45.4, докато това 45.4 ще бъде взето предвид във втория интервал (при условие, че е в данните) - в резултат получаваме 7 предприятия в първия интервал. И така на всички интервали.

  1. (допълнително действие) Нека изчислим общата печалба, получена от предприятията за всеки интервал и като цяло. За да направите това, добавете данните, маркирани в различни цветове и получете общата стойност на печалбата.

До първия интервал - 23 + 12 + 9 + 16 + 22 + 27 + 45 = 154 милиона рубли.

За втория интервал - 48 + 57 + 48 + 56 + 63 = 272 милиона рубли.

За третия интервал - 118 + 87 + 98 + 88 = 391 милиона рубли.

Упражнение . Има данни за размера на депозита в банката от 30 вложители, хиляди рубли. 150, 120, 300, 650, 1500, 900, 450, 500, 380, 440,

600, 80, 150, 180, 250, 350, 90, 470, 1100, 800,

500, 520, 480, 630, 650, 670, 220, 140, 680, 320

Изграждане интервални вариационни серииразпределение на вложителите, според размера на вноската, като се открояват 4 групи на равни интервали. Изчислете общата сума на депозитите за всяка група.

Изпратете добрата си работа в базата от знания е лесно. Използвайте формуляра по-долу

Студенти, специализанти, млади учени, които използват базата от знания в своето обучение и работа, ще Ви бъдат много благодарни.

публикувано на http://www.allbest.ru/

ЗАДАЧА1

Има следните данни за заплатите на служителите в предприятието:

Таблица 1.1

Размерът на заплатите в конв. ден. единици

Необходимо е да се построи интервална серия на разпределение, чрез която да се намери;

1) средна работна заплата;

2) средното линейно отклонение;

4) стандартно отклонение;

5) диапазонът на вариация;

6) коефициент на трептене;

7) линеен коефициент на вариация;

8) прост коефициент на вариация;

10) медиана;

11) коефициент на асиметрия;

12) Индекс на асиметрия на Пиърсън;

13) коефициент на ексцес.

Решение

Както знаете, опциите (разпознати стойности) са подредени във възходящ ред дискретни вариационни серии. С голям брой вариант (повече от 10), дори в случай на дискретна вариация се изграждат интервални серии.

Ако интервалната серия е съставена на четни интервали, тогава диапазонът на вариация се разделя на определения брой интервали. Освен това, ако получената стойност е цяла и недвусмислена (което е рядко), тогава се приема, че дължината на интервала е равна на това число. В други случаи произведени закръгляване задължително v страна нараства, Така да се последната останала цифра беше четна. Очевидно с увеличаване на дължината на интервала, диапазонът на вариация със стойност, равна на произведението на броя на интервалите: чрез разликата между изчислената и първоначалната дължина на интервала

а) Ако големината на разширяването на диапазона на вариация е незначителна, тогава тя или се добавя към най-голямата, или се изважда от най-малката стойност на характеристиката;

б) Ако големината на разширяването на диапазона на вариация е осезаема, тогава, така че центърът на диапазона да не се смесва, той се намалява приблизително наполовина чрез едновременно добавяне към най-големите и изваждане от най-малките стойности на атрибута .

Ако се компилира интервална серия с неравни интервали, процесът се опростява, но както преди, дължината на интервалите трябва да бъде изразена като число с последната четна цифра, което значително опростява последващите изчисления на числените характеристики.

30 - размер на извадката.

Нека съставим серия за интервално разпределение, използвайки формулата на Стърджс:

K = 1 + 3,32 * log n,

K е броят на групите;

K = 1 + 3,32 * log 30 = 5,91 = 6

Откриваме диапазона на атрибута - заплатите на работниците в предприятието - (x) по формулата

R = xmax - xmin и се разделя на 6; R = 195-112 = 83

Тогава дължината на интервала ще бъде ллента = 83: 6 = 13,83

Началото на първия интервал ще бъде 112. Добавяне към 112 лсъстезания = 13,83, получаваме крайната му стойност 125,83, което в същото време е началото на втория интервал и т.н. края на петия интервал - 195.

При намиране на честоти човек трябва да се ръководи от правилото: „ако стойността на дадена характеристика съвпада с границата на вътрешен интервал, тогава тя трябва да бъде отнесена към предишния интервал“.

Получаваме интервална серия от честоти и честоти на съхранение.

Таблица 1.2

Следователно 3-ма работници имат заплата. такса от 112 до 125,83 условни единици Най-големият заряд. плащане от 181,15 до 195 условни парични единици само 6 служители.

За да изчислим числените характеристики, преобразуваме интервалната серия в дискретна, като като вариант приемаме средата на интервалите:

Таблица 1.3

14131,83

По формулата на претеглената средна аритметична стойност

кон.ден. възли

Средно линейно отклонение:

където xi е стойността на изследваната черта в i-та единица от популацията,

Средната стойност на изследваната черта.

публикувано на http://www.allbest.ru/

L Публикувано на http://www.allbest.ru/

Сервизен ден.ед.

Стандартно отклонение:

дисперсия:

Относително люлеене (коефициент на трептене): c = R :,

Относително линейно отклонение: q = L:

Коефициент на вариация: V = y:

Коефициентът на осцилация показва относителните колебания на екстремните стойности на атрибута около средноаритметичната стойност, а коефициентът на вариация характеризира степента и хомогенността на популацията.

c = R: = 83 / 159,485 * 100% = 52,043%

По този начин разликата между екстремните стойности е с 5,16% (= 94,84% -100%) по-малко от средната заплата на работниците в предприятието.

q = L: = 17,765 / 159,485 * 100% = 11,139%

V = y: = 21,704 / 159,485 * 100% = 13,609%

Коефициентът на вариация е по-малък от 33%, което показва слаба вариация на заплатите на служителите в предприятието, т.е. че средната стойност е типична характеристика на заплатите на работниците (хомогенна съвкупност).

В интервални серии на разпределение модасе определя по формулата -

Честотата на модалния интервал, тоест интервалът, съдържащ най-голям брой варианти;

Честотата на интервала, предхождащ модалния;

Честотата на интервала, следващ модала;

Дължината на модалния интервал;

Долната граница на модалния интервал.

За определяне медианив интервалната серия използваме формулата

където е кумулативната (натрупаната) честота на интервала, предхождащ медианата;

Долна граница на медианния интервал;

Честотата на медианния интервал;

Дължината на медианния интервал.

Среден интервал- интервал, чиято натрупана честота (= 3 + 3 + 5 + 7) надвишава половината от сбора на честотите - (153,49; 167,32).

Нека изчислим изкривяването и ексцеса, за които ще създадем нов работен лист:

Таблица 1.4

Фактически данни

Приблизителни данни

Нека изчислим момента от третия ред

Следователно асиметрията е

Тъй като 0,3553 0,25, асиметрията се счита за значителна.

Нека изчислим момента от четвърти ред

Следователно ексцесът е

Защото< 0, то эксцесс является плосковершинным.

Степента на изкривяване може да бъде определена с помощта на коефициента на изкривяване на Пиърсън (As): оборот на стойността на осцилационна проба

където е средното аритметично на редовете на разпределение; - мода; - стандартно отклонение.

При симетрично (нормално) разпределение = Mo, следователно, коефициентът на асиметрия е нула. Ако Аs> 0, тогава има повече режим, следователно има дясностранна асиметрия.

Ако As< 0, то меньше моды, следовательно, имеется левосторонняя асимметрия. Коэффициент асимметрии может изменяться от -3 до +3.

Разпределението не е симетрично, но има лява асиметрия.

ЗАДАЧА 2

Какъв трябва да бъде размерът на извадката, така че с вероятност от 0,954 грешката на извадката да не надвишава 0,04, ако от предишни проучвания е известно, че дисперсията е 0,24?

Решение

Размерът на извадката за неповтаряща се извадка се изчислява по формулата:

t е коефициентът на доверие (с вероятност 0,954 е равен на 2,0; определен от таблици на вероятностните интеграли),

y2 = 0,24 - стандартно отклонение;

10 000 души - размера на извадката;

Dx = 0,04 е пределната грешка на средната стойност на извадката.

С вероятност от 95,4% може да се твърди, че размерът на извадката, осигуряващ относителна грешка от не повече от 0,04, трябва да бъде най-малко 566 семейства.

ЗАДАЧА3

Има следните данни за приходите от основната дейност на предприятието, млн. рубли.

За да анализирате редица динамики, определете следните показатели:

1) верига и основни:

Абсолютни печалби;

Темпи на растеж;

Темпове на растеж;

2) среден

Нивото на редица динамики;

Абсолютна печалба;

Темп на растеж;

Темп на нарастване;

3) абсолютната стойност от 1% увеличение.

Решение

1. Абсолютна печалба (дy)е разликата между следващото ниво на серията и предишното (или основното):

верига: Du = yi - yi-1,

основно: Ду = уi - y0,

уi - ниво на ред,

i - номер на ниво ред,

y0 е нивото на базовата година.

2. Темп на растеж (Tu)е съотношението на следващото ниво на серията и предишната (или базова година 2001):

верига: Tu =;

основно: Tu =

3. Темп на растеж (Tд) е съотношението на абсолютния растеж към предишното ниво, изразено в%.

верига: Tu =;

основно: Tu =

4. Абсолютна стойност на печалба от 1% (A)е съотношението на абсолютния растеж на веригата към темпа на растеж, изразено в%.

А =

Средно ниво на редаизчислено по формулата за средно аритметично.

Средно ниво на доходи от основни дейности за 4 години:

Среден абсолютен растежизчислено по формулата:

където n е броят на нивата в серията.

Средно приходите от оперативна дейност са се увеличили с 3,333 милиона рубли през годината.

Среден годишен темп на растежизчислено по средногеометричната формула:

уn - крайното ниво на серията,

y0 е началното ниво на реда.

Tu = 100% = 102,174%

Среден годишен темп на растежизчислено по формулата:

T? = Tu - 100% = 102,74% - 100% = 2,74%.

Така средно за годината приходите от основните дейности на предприятието нарастват с 2,74%.

ЗАДАЧИА4

Изчисли:

1. Индивидуални ценови индекси;

2. Общ индекс на оборота;

3. Индекс на съвкупните цени;

4. Агрегиран индекс на физическия обем на продажбите на стоки;

5. Абсолютно увеличение на стойността на оборота и разлагане по фактори (поради промени в цените и броя на продадените стоки);

6. Направете кратки заключения по всички получени показатели.

Решение

1. По условие индивидуалните индекси на цените за артикули A, B, C бяха -

ipA = 1,20; ipB = 1,15; ipB = 1,00.

2. Общият индекс на оборота се изчислява по формулата:

I w = = 1470/1045 * 100% = 140,67%

Търговският оборот нараства с 40,67% (140,67% -100%).

Средно цените на стоките се повишиха с 10,24%.

Размерът на допълнителните разходи на купувачите от увеличение на цените:

w (p) =? p1q1 -? p0q1 = 1470 - 1333,478 = 136,522 милиона рубли.

В резултат на покачването на цените купувачите трябваше да похарчат допълнително 136,522 милиона рубли.

4. Общ индекс на физическия обем на търговията:

Физическият обем на търговския оборот нараства с 27.61%.

5. Определете общата промяна в оборота през втория период спрямо първия период:

w = 1470-1045 = 425 милиона рубли.

поради промени в цените:

W (p) = 1470 - 1333,478 = 136,522 милиона рубли.

поради промени във физическия обем:

w (q) = 1333,478 - 1045 = 288,478 милиона рубли.

Стокооборотът нараства с 40.67%. Цените на 3 стоки се повишават средно с 10,24%. Физическият обем на търговията нараства с 27.61%.

Като цяло обемът на продажбите се е увеличил с 425 милиона рубли, включително поради увеличението на цените, той се е увеличил със 136,522 милиона рубли, а поради увеличаването на обема на продажбите - с 288,478 милиона рубли.

ЗАДАЧА5

Следните данни са налични за 10 завода в същата индустрия.

Завод №

Производство, хиляди бр (NS)

Въз основа на предоставените данни:

I) за да потвърдите разпоредбите на логическия анализ за наличието на линейна корелация между атрибута на фактора (изходен обем) и ефективния атрибут (консумация на мощност), начертайте първоначалните данни на графиката на корелационното поле и направете заключения за формата на връзка, посочете нейната формула;

2) определете параметрите на уравнението на комуникацията и нанесете получената теоретична линия върху графиката на корелационното поле;

3) изчислете коефициента на линейна корелация,

4) обяснява стойностите на показателите, получени в параграфи 2) и 3);

5) използвайки получения модел, направете прогноза за възможното потребление на електроенергия в завод с производствен обем от 4,5 хиляди единици.

Решение

Характеристики - обемът на продукцията (фактор), ние означаваме с xi; знак - консумация на енергия (резултат) чрез уi; точки с координати (x, y) се прилагат към полето за корелация OXY.

Точките на корелационното поле са разположени по някаква права линия. Следователно връзката е линейна, ще търсим регресионното уравнение под формата на права линия Yx = ax + b. За да го намерим, ще използваме системата от нормални уравнения:

Нека направим изчислителна таблица.

Използвайки намерената средна стойност, съставяме системата и я решаваме по отношение на параметрите a и b:

И така, получаваме регресионното уравнение за y на x: = 3,57692 x + 3,19231

Изграждаме регресионна линия върху корелационното поле.

Замествайки стойностите на x от колона 2 в регресионното уравнение, получаваме изчислените (колона 7) и ги сравняваме с данните за y, което е отразено в колона 8. Между другото, правилността на изчисленията се потвърждава и от съвпадението на средните стойности на y и.

Коефициентлинейна корелацияоценява близостта на връзката между знаците x и y и се изчислява по формулата

Наклонът на регресионната линия a (при x) характеризира посоката на разкритотозависимостизнаците: за a> 0 са еднакви, за a<0- противоположны. Негов абсолютен стойност - мярка за промяната в ефективния атрибут при промяна на фактора за мерна единица.

Свободният член на линията на регресия разкрива посоката, а нейната абсолютна стойност е количествена мярка за влиянието върху ефективния знак на всички останали фактори.

Ако< 0, тогава ресурсът на факторния атрибут на отделен обект се използва с по-малък и кога>0 спо-голяма ефективност от средната за целия набор от обекти.

Нека направим анализ след регресия.

Коефициентът при x на регресионната линия е 3,57692> 0, следователно, с увеличаване (намаление) на производството, потреблението на електроенергия се увеличава (намалява). Увеличение на производството с 1 хил. бр. дава средно увеличение на потреблението на електроенергия с 3,57692 хил. kWh.

2. Свободният член на директната регресия е 3,19231, следователно влиянието на други фактори увеличава силата на въздействието на продукцията върху потреблението на електроенергия в абсолютно изражение с 3,19231 хил. kWh.

3. Коефициент на корелация 0,8235 разкрива много тясна зависимост на консумацията на мощност от изхода.

Лесно е да се правят прогнози, като се използва уравнението на регресионния модел. За да направите това, стойностите на x се заменят в регресионното уравнение - прогнозира се обемът на производството и потреблението на електроенергия. В този случай стойностите на x могат да бъдат взети не само в рамките на посочения диапазон, но и извън него.

Нека направим прогноза за възможното потребление на електроенергия в завод с производствен обем от 4,5 хиляди единици.

3,57692 * 4,5 + 3,19231 = 19,288 45 хиляди kWh.

СПИСЪК НА ИЗПОЛЗВАНИ ИЗТОЧНИЦИ

1. Захаренков С.Н. Социално-икономическа статистика: Учебник-практическо ръководство. -Мн.: БДЕУ, 2002г.

2. Ефимова М.Р., Петрова Е.В., Румянцев В.Н. Обща теория на статистиката. - М.: ИНФРА - М., 2000.

3. Елисеева И.И. Статистика. - М .: Проспект, 2002.

4. Обща теория на статистиката / Под общ. изд. O.E. Башина, А.А. Спирина. - М .: Финанси и статистика, 2000.

5. Социално-икономическа статистика: Учебник-практ. надбавка / Захаренков С.Н. и др. - Минск: YSU, 2004.

6. Социално-икономическа статистика: Учеб. надбавка. / Изд. Нестерович С.Р. - Минск: БДЕУ, 2003.

7. Теслюк И.Е., Тарловская В.А., Терлиженко Н. Статистика.- Минск, 2000.

8. Харченко Л.П. Статистика. - М .: ИНФРА - М, 2002.

9. Харченко Л.П., Долженкова В.Г., Йонин В.Г. Статистика. - М .: ИНФРА - М, 1999.

10. Икономическа статистика / Изд. Ю.Н. Иванова - М., 2000г.

Публикувано на Allbest.ru

...

Подобни документи

    Изчисляване на средноаритметичната стойност за интервалните редове на разпределение. Определяне на общия индекс на физическия обем на търговията. Анализ на абсолютната промяна в общата себестойност на продуктите поради промени във физическия обем. Изчисляване на коефициента на вариация.

    тест, добавен на 19.07.2010

    Същността на оборота на едро, дребно и обществени стоки. Формули за изчисляване на индивидуални, съвкупни индекси на оборота. Изчисляване на характеристиките на интервалното разпределение - средноаритметично, мода и медиана, коефициент на вариация.

    курсова работа добавена на 05/10/2013

    Изчисляване на планираните и действителните продажби, процента от плана, абсолютната промяна в оборота. Определяне на абсолютен растеж, средни темпове на растеж и растеж на паричните приходи. Изчисляване на структурни средни: модове, медиани, квартили.

    тест, добавен на 24.02.2012

    Интервални серии от разпределение на банките по обем на печалбата. Намиране на мода и медиана на получените интервални разпределителни редове чрез графичен метод и чрез изчисления. Изчисляване на характеристиките на интервалното разпределение. Изчисляване на средноаритметичната стойност.

    тест, добавен на 15.12.2010 г

    Формули за определяне на средните стойности на интервалната серия - мод, медиана, дисперсия. Изчисляване на аналитични показатели на поредица от динамика по верижни и основни схеми, темпове на растеж и растеж. Концепцията за консолидирания индекс на себестойност, цени, разходи и оборот.

    курсова работа, добавена на 27.02.2011

    Понятие и предназначение, ред и правила за изграждане на вариационна поредица. Анализ на хомогенността на данните в групи. Показатели за вариация (изменчивост) на признака. Определяне на средното линейно и квадратно отклонение, коефициента на трептене и вариация.

    тест, добавен на 26.04.2010

    Понятието мода и медиана като типични характеристики, ред и критерии за тяхното определяне. Намиране на модата и медиана в дискретна и интервална вариационна серия. Квартили и децили като допълнителни характеристики на статистическата вариационна поредица.

    тест, добавен на 09/11/2010

    Построяване на интервална серия на разпределение на базата на критерий за групиране. Характеристика на отклонението на честотното разпределение от симетричната форма, изчисляване на индексите на ексцес и асиметрия. Анализ на показателите на баланса или отчета за приходите и разходите.

    тест, добавен на 19.10.2014

    Преобразуване на емпирични серии в дискретни и интервални. Определяне на средната стойност за дискретна серия чрез нейните свойства. Изчисляване за дискретна серия от мода, медиана, индикатори за вариация (дисперсия, отклонение, коефициент на трептене).

    тест, добавен на 17.04.2011

    Построяване на статистическа поредица от разпределението на организациите. Графична дефиниция на стойността на мода и медиана. Стегнатостта на корелацията с помощта на коефициента на детерминация. Определяне на извадковата грешка на средния брой служители.

В много случаи статистическата съвкупност включва голям или дори по-безкраен брой опции, което най-често се среща с непрекъснати вариации, почти невъзможно и непрактично е да се формира група от единици за всеки вариант. В такива случаи обединяването на статистическите единици в групи е възможно само на базата на интервал, т.е. такава група, която има определени ограничения за стойностите на променливия атрибут. Тези граници са обозначени с две цифри, обозначаващи горната и долната граница на всяка група. Използването на интервали води до формиране на интервална серия за разпределение.

Интервал доволене вариационна серия, чиито варианти са представени под формата на интервали.

Интервалните редове могат да се формират с равни и неравни интервали, като изборът на принципа на построяване на този ред зависи главно от степента на представителност и удобство на статистическата съвкупност. Ако популацията е достатъчно голяма (представителна) по отношение на броя на единиците и е напълно хомогенна в състава си, тогава е препоръчително да се постави равенството на интервалите като основа за формиране на интервалната серия. Обикновено според този принцип се формира интервална серия за онези популации, при които диапазонът на вариация е относително малък, т.е. максималната и минималната опция обикновено се различават няколко пъти. В този случай стойността на равни интервали се изчислява чрез съотношението на диапазона на вариация на характеристиката към определения брой формирани интервали. За да се определи равенството иВ интервала може да се използва формулата на Стърджес (обикновено с малка вариация на характеристиките на интервала и голям брой единици в статистическата популация):

където x i - стойността на равния интервал; X max, X min- максимални и минимални опции в статистическата съвкупност; н . - броят на единиците в съвкупността.

Пример. Препоръчително е да се изчисли размерът на равен интервал по отношение на плътността на радиоактивно замърсяване с цезий - 137 в 100 населени места от Краснополския район на Могилевска област, ако е известно, че първоначалният (минимален) вариант е равен на I км / км 2, финалът (максимум) - 65 ki / km 2. Използване на формула 5.1. получаваме:

Следователно, за да се образува интервална серия с равни интервали по отношение на плътността на замърсяването с цезий - 137 населени места от района на Краснополск, размерът на равен интервал може да бъде 8 cu / km 2.

В условия на неравномерно разпределение, т.е. когато максималният и минимален вариант са стотици пъти, при образуване на интервална серия може да се приложи принципът неравностойноинтервали. Неравните интервали обикновено се увеличават, когато преминете към по-големи стойности на характеристиките.

Интервалите могат да бъдат затворени или отворени по форма. Затворенобичайно е да се извикват интервали, за които са посочени както долната, така и горната граница. Отвориинтервалите имат само една граница: в първия интервал - горната, в последния - долната граница.

Препоръчително е да се оценяват интервални серии, особено с неравни интервали, като се вземат предвид плътност на разпределение, най-простият начин да се изчисли кое е съотношението на локалната честота (или честота) към размера на интервала.

За практическото формиране на интервалните серии можете да използвате оформлението на таблицата. 5.3.

Таблица 5.3. Процедурата за формиране на интервалната серия от населени места в района на Краснополск според плътността на радиоактивно замърсяване с цезий -137

Основното предимство на интервалната серия е нейната екстремност компактност.в същото време, в интервалната серия на разпределение, отделните варианти на характеристиката са скрити в съответните интервали

При графично изобразяване на интервална серия в правоъгълна координатна система, горните граници на интервалите се нанасят по оста на абсцисата, а локалните честоти на серията се нанасят върху оста на ординатите. Графичната конструкция на интервална серия се различава от конструкцията на многоъгълник на разпределение по това, че всеки интервал има долна и горна граница, а две абсциси съответстват на всяка една стойност на ординатата. Следователно на графиката на интервалната серия не е отбелязана точка, както в многоъгълник, а линия, свързваща две точки. Тези хоризонтални линии се свързват една с друга с вертикални линии и се получава формата на стъпаловиден многоъгълник, който обикновено се нарича хистограмаразпределение (Фигура 5.3).

При графично изобразяване на интервална серия за достатъчно голяма статистическа съвкупност, хистограмата се приближава симетричниформа за разпространение. В случаите, когато статистическата съвкупност е малка, като правило, асиметричналентова графика.

В някои случаи е препоръчително да се формират редица натрупани честоти, т.е. кумулативнаред. Кумулативен ред може да се формира на базата на дискретна или интервална серия на разпределение. При графично изобразяване на кумулативен ред в правоъгълна координатна система опциите се нанасят по оста на абсцисата, а натрупаните честоти (честоти) се нанасят по оста на ординатите. Получената крива линия обикновено се нарича кумулативнаразпределение (Фигура 5.4).

Формирането и графичното представяне на различни видове вариационни серии допринася за опростено изчисляване на основните статистически характеристики, които са разгледани подробно в тема 6, помага да се разбере по-добре същността на законите на разпределението на статистическата съвкупност. Анализът на вариационния ред е от особено значение в случаите, когато е необходимо да се идентифицира и проследи връзката между опциите и честотите (честотите). Тази зависимост се проявява във факта, че броят на случаите, попадащи на всеки вариант, е по определен начин свързан с величината на тази опция, т.е. с увеличаване на стойностите на променливия атрибут, честотата (честотата) на тези стойности претърпява определени, систематични промени. Това означава, че числата в колоната с честоти (честоти) не са обект на хаотични трептения, а се променят в определена посока, в определен ред и последователност.

Ако честотите в техните промени разкриват известна систематичност, това означава, че сме на път да идентифицираме модели. Системата, редът, последователността в променящите се честоти е отражение на общи причини, общи условия, характерни за цялата съвкупност.

Не трябва да се приема, че моделът на разпространение винаги се дава готов. Има доста серии от вариации, в които честотите странно скачат, понякога се увеличават, понякога намаляват. В такива случаи е препоръчително да разберете с какво разпределение се занимава изследователят: или това разпределение изобщо не е присъщо на закономерности, тогава неговата природа все още не е разкрита: Първият случай е рядък, вторият, вторият случай е доста често и много разпространено явление.

Така че, когато се формира интервална серия, общият брой на статистическите единици може да бъде малък и всеки интервал съдържа малък брой варианти (например 1-3 единици). В такива случаи не е необходимо да се разчита на проява на някаква закономерност. За да се получи логически резултат на базата на случайни наблюдения, трябва да влезе в сила законът за големите числа, т.е. така че за всеки интервал да има не няколко, а десетки и стотици статистически единици. За тази цел трябва да се опитаме да увеличим колкото е възможно повече броя на наблюденията. Това е най-сигурният начин за откриване на закономерности в масовите процеси. Ако няма реална възможност за увеличаване на броя на наблюденията, тогава идентифицирането на модел може да се постигне чрез намаляване на броя на интервалите в разпределителната серия. Намаляване на броя на интервалите в вариационната серия, като по този начин се увеличава броят на честотите във всеки интервал. Това означава, че случайните флуктуации на всяка статистическа единица се наслагват една върху друга, „изглаждат се”, превръщайки се в закономерност.

Формирането и изграждането на серията от вариации ви позволява да получите само обща, приблизителна картина на разпределението на статистическата съвкупност. Например, хистограмата само в груб вид изразява връзката между стойностите на дадена характеристика и нейните честоти (честоти) Следователно поредицата от вариации по същество са само основата за по-нататъшно, задълбочено изследване на вътрешните закони на статично разпределение.

КОНТРОЛНИ ВЪПРОСИ ЗА ТЕМА 5

1. Какво е вариация? Какво причинява вариацията на даден признак в статистическата популация?

2. Какви видове вариращи характеристики могат да се осъществят в статистиката?

3. Какво е вариационна серия? Какви видове вариационни серии могат да съществуват?

4. Каква е класираната серия? Какви са неговите предимства и недостатъци?

5. Какво е дискретна серия и какви са нейните предимства и недостатъци?

6. Какъв е редът на формиране на интервалната серия, какви са нейните предимства и недостатъци?

7. Какво е графично представяне на диапазонна, дискретна, интервална серия на разпределение?

8. Какво е кумулативното разпределение и какво характеризира то?