Определете 1 дисперсия. Дисперсия и стандартно отклонение

Изчисляваме вГОСПОЖИЦАEXCELдисперсия и стандартно отклонение на извадката. Ние също така изчисляваме дисперсията на произволна променлива, ако нейното разпределение е известно.

Помислете първо дисперсия, тогава стандартно отклонение.

Дисперсия на извадката

Дисперсия на извадката (дисперсия на извадката,пробадисперсия) характеризира разпространението на стойностите в масива спрямо.

И трите формули са математически еквивалентни.

От първата формула се вижда, че извадкова дисперсияе сумата от квадратите на отклоненията на всяка стойност в масива от средноразделено на размера на извадката минус 1.

дисперсия вземане на пробисе използва функцията DISP (). VAR име, т.е. VARiance. Тъй като версията на MS EXCEL 2010 се препоръчва използването на нейния аналог DISP.B (), инж. името VARS, т.е. Примерна вариация. Освен това, от версията на MS EXCEL 2010 има функция DISP.G (), английска. името на VARP, т.е. Популация VARiance, която изчислява дисперсияза общото население... Цялата разлика се свежда до знаменателя: вместо n-1, както в DISP.B (), DISP.G () има само n в знаменателя. Преди MS EXCEL 2010 функцията VARP () беше използвана за изчисляване на дисперсията на общата съвкупност.

Дисперсия на извадката
= КВАДРАТ (Извадка) / (БРОЙ (Извадка) -1)
= (SUM (Извадка) -БРОЙ (Извадка) * СРЕДНА (Извадка) ^ 2) / (БРОЙ (Извадка) -1)- обичайната формула
= СУМ ((Извадка -СТОЙНОСТ (Извадка)) ^ 2) / (БРОЙ (Извадка) -1) –

Дисперсия на извадкатае равно на 0, само ако всички стойности са равни една на друга и съответно са равни средно аритметично... Обикновено, колкото по-голяма е стойността дисперсия, толкова по-голямо е разпространението на стойностите в масива.

Дисперсия на извадкатае точкова оценка дисперсияразпределение на случайната променлива, от която проба... Относно строителството доверителни интервалипри оценяване дисперсияможе да се прочете в статията.

Дисперсия на произволна променлива

Да изчисля дисперсияпроизволна променлива, трябва да я знаете.

За дисперсияпроизволна променлива X често се използва нотация Var (X). Дисперсияравно на квадрата на отклонението от средното E (X): Var (X) = E [(X-E (X)) 2]

дисперсияизчислено по формулата:

където x i е стойността, която произволната променлива може да приеме, а μ е средната стойност (), p (x) е вероятността случайната променлива да приеме стойността x.

Ако произволната променлива има, тогава дисперсияизчислено по формулата:

Измерение дисперсиясъответства на квадрата на мерната единица на първоначалните стойности. Например, ако стойностите в извадката са измервания на теглото на детайла (в kg), тогава размерът на дисперсията ще бъде kg 2. Следователно това може да бъде трудно за интерпретиране, за да се характеризира разпределението на стойностите, стойност, равна на квадратния корен от дисперсиястандартно отклонение.

Някои имоти дисперсия:

Var (X + a) = Var (X), където X е произволна променлива, а a е константа.

Var (aX) = a 2 Var (X)

Var (X) = E [(XE (X)) 2] = E = E (X 2) -E (2 * X * E (X)) + (E (X)) 2 = E (X 2) - 2 * E (X) * E (X) + (E (X)) 2 = E (X 2) - (E (X)) 2

Това свойство на дисперсията се използва в статия за линейната регресия.

Var (X + Y) = Var (X) + Var (Y) + 2 * Cov (X; Y), където X и Y са случайни променливи, Cov (X; Y) е ковариацията на тези случайни променливи.

Ако случайните променливи са независими, тогава техните ковариацияе равно на 0 и следователно Var (X + Y) = Var (X) + Var (Y). Това свойство на дисперсията се използва в изхода.

Нека покажем, че за независими величини Var (X-Y) = Var (X + Y). Всъщност Var (X-Y) = Var (X-Y) = Var (X + (- Y)) = Var (X) + Var (-Y) = Var (X) + Var (-Y) = Var ( X) + ( - 1) 2 Var (Y) = Var (X) + Var (Y) = Var (X + Y). Това свойство на дисперсията се използва за начертаване.

Извадково стандартно отклонение

Извадково стандартно отклонениее мярка за това колко широко са разпръснати стойностите в извадката спрямо техните.

По дефиниция, стандартно отклонениее равен на корен квадратен от дисперсия:

Стандартно отклонениене взема предвид величината на стойностите в проба, а само степента на дисперсия на стойностите около тях среден... Ето един пример, който да илюстрира това.

Нека изчислим стандартното отклонение за 2 проби: (1; 5; 9) и (1001; 1005; 1009). И в двата случая s = 4. Очевидно съотношението на стандартното отклонение към стойностите на масива е значително различно за пробите. За такива случаи използвайте Коефициентът на вариация(Коефициент на вариация, CV) - съотношение Стандартно отклонениедо средата аритметикаизразено като процент.

В MS EXCEL 2007 и по-рано, за изчисляване Извадково стандартно отклонениеизползва се функцията = STDEV (), инж. име STDEV, т.е. Стандартно отклонение. Тъй като версия MS EXCEL 2010 се препоръчва използването на нейния аналог = STDEV.V (), инж. името STDEV.S, т.е. Примерно стандартно отклонение.

Освен това, започвайки от версията на MS EXCEL 2010 има функция STDEV.G (), инж. име STDEV.P, т.е. Стандартно отклонение на населението, което се изчислява стандартно отклонениеза общото население... Цялата разлика се свежда до знаменателя: вместо n-1 като STDEV.V (), STDEV.G () има само n в знаменателя.

Стандартно отклонениеможе също да се изчисли директно по следните формули (вижте примерния файл)
= КОРЕН (КВАДРАТ (Извадка) / (БРОЙ (Извадка) -1))
= ROOT ((SUM (Извадка) -БРОЙ (Извадка) * СРЕДНА (Извадка) ^ 2) / (БРОЙ (Извадка) -1))

Други мерки за разпространение

Функцията SQUARE () изчислява с umma на квадрат отклонения на стойностите от техните среден... Тази функция ще върне същия резултат като формулата = DISP.G ( Проба)*ПРОВЕРКИ( Проба) , където Проба- препратка към диапазон, съдържащ масив от примерни стойности (). Изчисленията във функцията КВАДРАТ () се правят по формулата:

Функцията AVEDEV () също е мярка за разпространението на набор от данни. Функцията AVEDV () изчислява средната стойност на абсолютните стойности на отклоненията на стойностите от среден... Тази функция ще върне същия резултат като формулата = SUMPRODUCT (ABS (Извадка-СРЕДНА (Извадка))) / COUNT (Извадка), където Проба- препратка към диапазон, съдържащ масив от извадкови стойности.

Изчисленията във функцията AVEDV () се правят по формулата:

Математическото очакване и дисперсията са най-често използваните числени характеристики на произволна променлива. Те характеризират най-важните характеристики на разпределението: неговото положение и степента на дисперсия. В много практически задачи пълна, изчерпателна характеристика на случайна величина - законът на разпределението - или не може да бъде получена изобщо, или изобщо не е необходима. В тези случаи те са ограничени до приблизително описание на произволна променлива, използвайки числови характеристики.

Математическото очакване често се нарича просто средна стойност на произволна променлива. Дисперсията на произволна променлива е характеристика на дисперсията, дисперсия на произволна променлива спрямо нейното математическо очакване.

Математическото очакване на дискретна случайна променлива

Нека се доближим до концепцията за математическо очакване, като първо изхождаме от механична интерпретация на разпределението на дискретна случайна променлива. Нека единичната маса е разпределена между точките на оста на абсцисата х1 , х 2 , ..., хн, и всяка материална точка има съответна маса от стр1 , стр 2 , ..., стрн... Необходимо е да се избере една точка на оста на абсцисата, която характеризира позицията на цялата система от материални точки, като се вземат предвид техните маси. Естествено е да вземем за такава точка центъра на масата на системата от материални точки. Това е среднопретеглената стойност на произволна променлива х, при което абсцисата на всяка точка хивлиза с "тегло", равно на съответната вероятност. Средната стойност на произволната променлива, получена по този начин хсе нарича нейно математическо очакване.

Математическото очакване на дискретна случайна променлива е сумата от произведенията на всичките й възможни стойности по вероятностите на тези стойности:

Пример 1.Беше организирана печеливша лотария. Има 1000 печалби, от които 400 са по 10 рубли всяка. 300-20 рубли всеки 200-100 рубли всеки и 100 - 200 рубли всеки. Каква е средната печалба за един купувач на билети?

Решение. Ще намерим средните печалби, ако общата сума на печалбите, която е 10 * 400 + 20 * 300 + 100 * 200 + 200 * 100 = 50 000 рубли, се раздели на 1000 (общата сума на печалбите). Тогава получаваме 50 000/1000 = 50 рубли. Но изразът за изчисляване на средното изплащане може да бъде представен в следната форма:

От друга страна, при тези условия, размерът на наградата е произволна променлива, която може да приеме стойности от 10, 20, 100 и 200 рубли. с вероятности, равни съответно на 0,4; 0,3; 0,2; 0.1. Следователно очакваното средно изплащане е равно на сбора от произведенията на размера на изплащанията по вероятността за тяхното получаване.

Пример 2.Издателството реши да издаде нова книга. Той възнамерява да продаде книгата за 280 рубли, от които ще получи 200, 50 - на книжарницата и 30 - на автора. Таблицата предоставя информация за разходите за издаване на книга и вероятността от продажба на определен брой копия от книгата.

Намерете очакваната печалба на издателя.

Решение. Случайната стойност "печалба" е равна на разликата между приходите от продажбата и разходите за разходи. Например, ако се продадат 500 екземпляра от книга, тогава приходите от продажбата са 200 * 500 = 100 000, а разходите за публикуване са 225 000 рубли. Така издателят е изправен пред загуба от 125 000 рубли. Следната таблица обобщава очакваните стойности на случайната променлива - печалба:

номерпечалба хи Вероятност стри хи стри
500 -125000 0,20 -25000
1000 -50000 0,40 -20000
2000 100000 0,25 25000
3000 250000 0,10 25000
4000 400000 0,05 20000
Обща сума: 1,00 25000

Така получаваме математическото очакване на печалбата на издателя:

.

Пример 3.Вероятност за удар на изстрел стр= 0,2. Определете консумацията на снаряди, осигурявайки математическо очакване на броя попадения, равен на 5.

Решение. От същата математическа формула за очакване, която използвахме досега, ние изразяваме х- разход на снаряд:

.

Пример 4.Определете математическото очакване на произволна променлива хброят на попаденията за три изстрела, ако е вероятността за попадение за всеки изстрел стр = 0,4 .

Съвет: вероятността за стойности на произволна променлива се намира от Формула на Бернули .

Свойства на математическите очаквания

Разгледайте свойствата на математическото очакване.

Свойство 1.Математическото очакване на константа е равно на тази константа:

Свойство 2.Постоянният фактор може да бъде изваден отвъд знака на математическото очакване:

Свойство 3.Математическото очакване на сумата (разликата) на случайните променливи е равно на сумата (разликата) от техните математически очаквания:

Свойство 4.Математическото очакване на продукта на случайните променливи е равно на произведението на техните математически очаквания:

Свойство 5.Ако всички стойности на произволната променлива хнамаление (увеличение) със същото число С, тогава математическото му очакване ще намалее (увеличи) със същото число:

Когато не можеш да бъдеш ограничен само от математическото очакване

В повечето случаи само математическото очакване не може адекватно да характеризира случайна променлива.

Нека произволните променливи хи Йса дадени от следните закони за разпределение:

смисъл х Вероятност
-0,1 0,1
-0,01 0,2
0 0,4
0,01 0,2
0,1 0,1
смисъл Й Вероятност
-20 0,3
-10 0,1
0 0,2
10 0,1
20 0,3

Математическите очаквания на тези количества са еднакви - равни на нула:

Въпреки това естеството на тяхното разпространение е различно. Случайна стойност хможе да приема само стойности, които се различават малко от математическото очакване, и произволната променлива Йможе да приеме стойности, които значително се отклоняват от математическото очакване. Подобен пример: средната заплата прави невъзможно да се прецени съотношението на високо- и нископлатените работници. С други думи, чрез математическото очакване е невъзможно да се прецени какви отклонения от него, поне средно, са възможни. За да направите това, трябва да намерите дисперсията на произволната променлива.

Дисперсия на дискретна случайна променлива

Дисперсиядискретна случайна променлива хе математическото очакване на квадрата на неговото отклонение от математическото очакване:

Стандартното отклонение на произволна променлива харитметичната стойност на квадратния корен от неговата дисперсия се нарича:

.

Пример 5.Изчислете дисперсии и стандартни отклонения на случайните променливи хи Й, чиито закони за разпределение са дадени в таблиците по-горе.

Решение. Математически очаквания за случайни променливи хи Й, както е намерено по-горе, са равни на нула. Според дисперсионната формула при Е(х)=Е(г) = 0 получаваме:

След това стандартните отклонения на случайните променливи хи Йгрим

.

По този начин, със същите математически очаквания, дисперсията на случайната променлива хе много малка, но произволна променлива Й- значителен. Това е следствие от разликата в тяхното разпределение.

Пример 6.Инвеститорът разполага с 4 алтернативни инвестиционни проекта. Таблицата обобщава очакваната печалба в тези проекти със съответната вероятност.

Проект 1Проект 2Проект 3Проект 4
500, П=1 1000, П=0,5 500, П=0,5 500, П=0,5
0, П=0,5 1000, П=0,25 10500, П=0,25
0, П=0,25 9500, П=0,25

Намерете математическото очакване, дисперсията и стандартното отклонение за всяка алтернатива.

Решение. Нека покажем как се изчисляват тези стойности за 3-та алтернатива:

Таблицата обобщава стойностите, намерени за всички алтернативи.

Всички алтернативи имат едни и същи математически очаквания. Това означава, че в дългосрочен план всички имат еднакви доходи. Стандартното отклонение може да се тълкува като мерна единица за риск – колкото по-голямо е то, толкова по-голям е рискът на инвестицията. Инвеститор, който не иска много риск, ще избере проект 1, тъй като той има най-малкото стандартно отклонение (0). Ако инвеститорът даде предпочитание на риск и голяма доходност за кратък период, тогава той ще избере проекта с най-голямо стандартно отклонение - проект 4.

Дисперсионни свойства

Ето свойствата на дисперсията.

Свойство 1.Дисперсията на константата е нула:

Свойство 2.Постоянният фактор може да бъде изваден от знака на дисперсията, като се възведе на квадрат:

.

Свойство 3.Дисперсията на произволна променлива е равна на математическото очакване на квадрата на това количество, от което се изважда квадратът на математическото очакване на самото количество:

,

където .

Свойство 4.Дисперсията на сбора (разликата) на случайните променливи е равна на сумата (разликата) от техните дисперсии:

Пример 7.Известно е, че е дискретна случайна променлива хприема само две стойности: −3 и 7. Освен това е известно математическото очакване: Е(х) = 4. Намерете дисперсията на дискретна случайна променлива.

Решение. Нека означим с стрвероятността, с която произволна променлива приема стойност х1 = −3 ... След това вероятността на стойността х2 = 7 ще бъде 1 - стр... Нека изведем уравнението за математическото очакване:

Е(х) = х 1 стр + х 2 (1 − стр) = −3стр + 7(1 − стр) = 4 ,

откъде получаваме вероятностите: стр= 0,3 и 1 - стр = 0,7 .

Законът за разпределението на произволна променлива:

х −3 7
стр 0,3 0,7

Изчисляваме дисперсията на тази случайна променлива по формулата от свойство 3 на дисперсията:

д(х) = 2,7 + 34,3 − 16 = 21 .

Намерете сами математическото очакване на произволна променлива и след това погледнете решението

Пример 8.Дискретна случайна променлива хприема само две стойности. Той приема по-голямата от стойностите 3 с вероятност 0,4. Освен това е известна дисперсията на случайната променлива д(х) = 6. Намерете математическото очакване на произволна променлива.

Пример 9.В урната има 6 бели и 4 черни топки. От урната се изваждат 3 топки. Броят на белите топки сред извадените топки е дискретна произволна променлива х... Намерете математическото очакване и дисперсията на тази случайна променлива.

Решение. Случайна стойност хможе да приеме стойностите 0, 1, 2, 3. Съответните вероятности могат да бъдат изчислени от правило за умножение на вероятностите... Законът за разпределението на произволна променлива:

х 0 1 2 3
стр 1/30 3/10 1/2 1/6

Оттук математическото очакване на дадена случайна променлива:

М(х) = 3/10 + 1 + 1/2 = 1,8 .

Дисперсията на дадена произволна променлива:

д(х) = 0,3 + 2 + 1,5 − 3,24 = 0,56 .

Математическо очакване и дисперсия на непрекъсната случайна променлива

За непрекъсната случайна променлива механичната интерпретация на математическото очакване ще запази същото значение: центърът на масата за единица маса, разпределена непрекъснато по оста на абсцисата с плътност е(х). За разлика от дискретна случайна променлива, в която аргументът на функцията хисе променя рязко, за непрекъсната случайна променлива аргументът се променя непрекъснато. Но математическото очакване на непрекъсната случайна променлива също е свързано със средната й стойност.

За да намерите математическото очакване и дисперсията на непрекъсната случайна променлива, трябва да намерите определени интеграли ... Ако е дадена функция на плътност на непрекъсната случайна променлива, тя директно влиза в интегралната функция. Ако е дадена функция за разпределение на вероятността, тогава, като я диференцирате, трябва да намерите функцията на плътност.

Средноаритметичната стойност на всички възможни стойности на непрекъсната случайна променлива се нарича нейна математическо очакване, означено с или.

Теорията на вероятностите е специален клон на математиката, който се изучава само от студенти. Харесвате ли изчисления и формули? Не се ли страхувате от перспективата да се запознаете с нормалното разпределение, ентропията на ансамбъла, математическото очакване и дисперсията на дискретна случайна променлива? Тогава тази тема ще ви бъде много интересна. Нека се запознаем с някои от най-важните основни понятия в този клон на науката.

Нека си спомним основите

Дори ако си спомняте най-простите концепции на теорията на вероятностите, не пренебрегвайте първите параграфи на статията. Факт е, че без ясно разбиране на основите, няма да можете да работите с формулите, разгледани по-долу.

Така че се случва някакво случайно събитие, някакъв експеримент. В резултат на извършените действия можем да получим няколко резултата - някои от тях са по-чести, други са по-рядко срещани. Вероятността за събитие е съотношението на броя на действително получените резултати от един вид към общия брой възможни резултати. Само като знаете класическата дефиниция на това понятие, можете да започнете да изучавате математическото очакване и дисперсията на непрекъснатите случайни променливи.

Средно аритметично

Още в училище, в уроците по математика, започнахте да работите със средноаритметичната стойност. Тази концепция е широко използвана в теорията на вероятностите и следователно не може да бъде пренебрегната. Основното за нас в момента е, че ще го срещнем във формулите за математическото очакване и дисперсията на произволна величина.

Имаме поредица от числа и искаме да намерим средноаритметичното. Всичко, което се изисква от нас, е да сумираме всичко налично и да разделим на броя на елементите в последователността. Да предположим, че имаме числа от 1 до 9. Сборът от елементите ще бъде 45 и ще разделим тази стойност на 9. Отговор: - 5.

Дисперсия

В научен смисъл дисперсията е средният квадрат на отклоненията на получените стойности на даден признак от средноаритметичната стойност. Единият се обозначава с главна латинска буква D. Какво ви е необходимо, за да го изчислите? За всеки елемент от последователността изчислете разликата между наличното число и средноаритметичното и я квадратирайте. Ще има точно толкова стойности, колкото може да има резултати за събитието, което обмисляме. След това обобщаваме всичко получено и разделяме на броя на елементите в последователността. Ако имаме пет възможни резултата, тогава ще разделим на пет.

Отклонението също има свойства, които трябва да бъдат запомнени, за да бъдат приложени при решаване на проблеми. Например, когато произволната променлива се увеличи с X пъти, дисперсията се увеличава с X пъти на квадрат (т.е. X * X). Никога не е по-малко от нула и не зависи от изместването на стойностите с еднаква стойност нагоре или надолу. Освен това, за независими тестове дисперсията на сбора е равна на сумата от дисперсиите.

Сега определено трябва да разгледаме примери за дисперсия на дискретна случайна променлива и математическо очакване.

Да приемем, че проведохме 21 експеримента и получихме 7 различни резултата. Наблюдавахме всеки от тях съответно 1,2,2,3,4,4 и 5 пъти. Каква е дисперсията?

Първо, нека изчислим средноаритметичната стойност: сборът на елементите, разбира се, е равен на 21. Разделете го на 7, като получите 3. Сега от всяко число в оригиналната последователност извадете 3, квадратирайте всяка стойност и добавете резултати заедно. Ще се окаже 12. Сега остава да разделим числото на броя на елементите и, изглежда, това е всичко. Но има уловка! Нека го обсъдим.

Зависимост от броя на експериментите

Оказва се, че при изчисляване на дисперсията знаменателят може да бъде едно от две числа: или N, или N-1. Тук N е броят на извършените експерименти или броят на елементите в последователността (които по същество са еднакви). От какво зависи?

Ако броят на тестовете се измерва в стотици, тогава трябва да поставим в знаменателя N. Ако в единици, тогава N-1. Учените решиха да начертаят границата доста символично: днес тя върви на числото 30. Ако сме провели по-малко от 30 експеримента, тогава ще разделим сумата на N-1, а ако е повече, тогава на N.

Задача

Нека се върнем към нашия пример за решаване на проблема с дисперсията и очакванията. Получихме междинно число 12, което трябваше да бъде разделено на N или N-1. Тъй като проведохме 21 експеримента, което е по-малко от 30, ще изберем втория вариант. Така че отговорът е: дисперсията е 12/2 = 2.

Очаквана стойност

Нека да преминем към втората концепция, която определено трябва да разгледаме в тази статия. Очакваната стойност е сумата от всички възможни резултати, умножена по съответните вероятности. Важно е да се разбере, че получената стойност, както и резултатът от изчисляването на дисперсията, се получава само веднъж за целия проблем, без значение колко резултата се разглеждат в него.

Формулата за математическо очакване е доста проста: вземаме резултата, умножаваме по неговата вероятност, добавяме същото за втория, третия резултат и т.н. Всичко, свързано с тази концепция, е лесно да се изчисли. Например, сумата на очакванията е равна на очакването на сумата. Същото важи и за произведението. Не всяка стойност в теорията на вероятностите позволява такива прости операции да се извършват със себе си. Нека вземем задача и да изчислим значението на двете понятия, които изучавахме наведнъж. Освен това бяхме разсеяни от теорията – време е за практика.

Още един пример

Проведохме 50 опита и получихме 10 вида резултати - числа от 0 до 9 - срещащи се в различни проценти. Това са съответно: 2%, 10%, 4%, 14%, 2%, 18%, 6%, 16%, 10%, 18%. Припомнете си, че за да получите вероятностите, трябва да разделите стойностите в проценти на 100. Така получаваме 0,02; 0,1 и др. Нека представим пример за решаване на задачата за дисперсията на произволна променлива и математическо очакване.

Изчисляваме средната аритметика по формулата, която помним от началното училище: 50/10 = 5.

Сега нека преобразуваме вероятностите в броя на резултатите "на парчета", за да улесним преброяването. Получаваме 1, 5, 2, 7, 1, 9, 3, 8, 5 и 9. От всяка получена стойност изваждаме средноаритметичната стойност, след което квадратуваме всеки от получените резултати. Вижте как да направите това, като използвате първия елемент като пример: 1 - 5 = (-4). Следващо: (-4) * (-4) = 16. За останалите стойности направете тези операции сами. Ако сте направили всичко правилно, тогава след добавяне на всичко получавате 90.

Нека продължим да изчисляваме дисперсията и средната стойност, като разделим 90 на N. Защо избираме N, а не N-1? Точно така, защото броят на извършените експерименти надхвърля 30. И така: 90/10 = 9. Получихме дисперсията. Ако получите различен номер, не се отчайвайте. Най-вероятно сте направили често срещана грешка в изчисленията. Проверете отново какво сте написали и със сигурност всичко ще си дойде на мястото.

И накрая, нека си припомним формулата за математическото очакване. Няма да даваме всички изчисления, ще напишем само отговор, с който можете да проверите, след като завършите всички необходими процедури. Очакването ще бъде 5.48. Нека само да си припомним как да извършваме операции, като използваме примера на първите елементи: 0 * 0,02 + 1 * 0,1 ... и така нататък. Както можете да видите, ние просто умножаваме стойността на резултата по неговата вероятност.

Отклонение

Друга концепция, тясно свързана с дисперсията и математическото очакване, е стандартното отклонение. Обозначава се или с латинските букви sd, или с гръцката малка буква "сигма". Тази концепция показва колко средно стойностите се отклоняват от централната характеристика. За да намерите стойността му, трябва да изчислите квадратния корен от дисперсията.

Ако начертаете нормалното разпределение и искате да видите стандартното отклонение директно върху него, това може да стане на няколко стъпки. Вземете половината от изображението вляво или вдясно от режима (централна стойност), начертайте перпендикуляр на хоризонталната ос, така че площите на получените форми да са равни. Стойността на сегмента между средата на разпределението и получената проекция върху хоризонталната ос ще представлява стандартното отклонение.

софтуер

Както се вижда от описанията на формулите и представените примери, изчисляването на дисперсията и математическото очакване не е най-простата процедура от аритметична гледна точка. За да не губите време, има смисъл да използвате програмата, използвана във висшето образование - тя се нарича "R". Той има функции, които ви позволяват да изчислявате стойности за много понятия от статистиката и теорията на вероятностите.

Например, вие дефинирате вектор от стойности. Това се прави по следния начин: вектор<-c(1,5,2…). Теперь, когда вам потребуется посчитать какие-либо значения для этого вектора, вы пишете функцию и задаете его в качестве аргумента. Для нахождения дисперсии вам нужно будет использовать функцию var. Пример её использования: var(vector). Далее вы просто нажимаете «ввод» и получаете результат.

Най-накрая

Дисперсия и математическо очакване - без които е трудно да се изчисли нещо в бъдеще. В основния курс на лекциите в университетите те се разглеждат още в първите месеци на изучаване на предмета. Именно поради липсата на разбиране на тези прости понятия и невъзможността да се изчислят, много студенти веднага започват да изостават в програмата и по-късно получават слаби оценки въз основа на резултатите от сесията, което ги лишава от стипендии.

Практикувайте поне една седмица, половин час на ден, като решавате задачи, подобни на представените в тази статия. След това на всеки тест по теория на вероятностите ще се справите с примери без странични съвети и листове за мами.

Въпреки това, тази характеристика сама по себе си все още не е достатъчна за изследване на произволна променлива. Представете си двама стрелци, които стрелят по мишена. Единият стреля точно и удря близо до центъра, а другият ... просто се забавлява и дори не се цели. Но това, което е смешно, е неговото средно аритметичнорезултатът ще бъде точно същият като първия стрелец! Тази ситуация обикновено се илюстрира със следните произволни променливи:

Математическото очакване на "снайперист" обаче е равно за "интересна личност": - то също е нула!

Следователно е необходимо да се определи количествено докъде разпръснатикуршуми (стойности на произволна променлива) спрямо центъра на целта (математическо очакване). добре и разпръскванеот латински се превежда само като дисперсия .

Нека да видим как се определя тази числена характеристика в един от примерите от 1-ва част на урока:

Там открихме разочароващо математическо очакване на тази игра и сега трябва да изчислим нейната дисперсия, която е обозначенопрез .

Нека да разберем колко далеч са "разпръснати" победите/загубите спрямо средното. Очевидно за това трябва да изчислите разликимежду стойности на произволна променливаи тя математическо очакване:

–5 – (–0,5) = –4,5
2,5 – (–0,5) = 3
10 – (–0,5) = 10,5

Сега, изглежда, е необходимо да се обобщят резултатите, но този път не е подходящ - поради причината, че флуктуациите вляво ще се отменят с колебанията вдясно. Така че, например, "любителски" стрелец (пример по-горе)разликата е , а при добавяне ще даде нула, така че няма да получим никаква оценка за разсейването на стрелбата му.

За да заобиколите тази неприятност, можете да помислите модулиразлики, но по технически причини подходът се е вкоренил, когато те са на квадрат. По-удобно е да съставите решението с таблица:

И тук започва да се изчислява средно претегленастойността на квадратите на отклоненията. Какво е? Тяхно е очаквана стойност, което е мярката за разсейване:

определениедисперсия. От определението веднага става ясно, че дисперсията не може да бъде отрицателна- вземете под внимание за практиката!

Нека си спомним как да намерим очакването. Умножаваме квадратите на разликите по съответните вероятности (Продължение на таблицата):
- образно казано, това е "теглителна сила",
и обобщете резултатите:

Не мислите ли, че на фона на печалбите резултатът се оказа твърде голям? Точно така – направихме квадрат и за да се върнем към измерението на нашата игра, трябва да извлечем квадратния корен. Това количество се нарича стандартно отклонение и се обозначава с гръцката буква "сигма":

Тази стойност понякога се нарича стандартно отклонение .

Какво е значението му? Ако се отклоним от математическото очакване наляво и надясно със стандартното отклонение:

- тогава най-вероятните стойности на произволната променлива ще бъдат "концентрирани" в този интервал. Какво всъщност наблюдаваме:

Обаче се случи така, че при анализиране на разсейването почти винаги се оперира с концепцията за дисперсия. Нека да видим какво означава това във връзка с игрите. Ако в случай на стрели говорим за "точността" на попадения спрямо центъра на целта, то тук дисперсията характеризира две неща:

Първо, очевидно е, че с увеличаването на ставките дисперсията също се увеличава. Така например, ако увеличим 10 пъти, тогава математическото очакване ще се увеличи 10 пъти, а дисперсията - 100 пъти (стига това да е квадратна величина)... Но имайте предвид, че самите правила на играта не са се променили! Само процентите се промениха, грубо казано, преди залагахме 10 рубли, сега е 100.

Вторият, по-интересен момент е, че вариацията характеризира стила на игра. Нека мислено коригираме ставките на играта на определено ниво, и вижте какво има тук:

Играта с ниска вариация е предпазлива игра. Играчът е склонен да избира най-надеждните схеми, при които не губи / печели твърде много наведнъж. Например червено/черната система в рулетка (вижте пример 4 от статията Случайни променливи) .

Игра с висока вариация. Често я наричат дисперсионенигра. Това е приключенски или агресивен стил на игра, при който играчът избира адреналинови схеми. Да си спомним поне Мартингейл, в който има заложени суми, които са с порядък по-висока от „тихата“ игра от предишния параграф.

Ситуацията в покера е показателна: има т.нар стегнатиграчи, които са склонни да бъдат предпазливи и да се „непокорят“ над своите игрални активи (по банкова сметка)... Не е изненадващо, че тяхната банка не се колебае много (ниска дисперсия). Напротив, ако играчът има голяма дисперсия, тогава това е агресорът. Той често поема рискове, прави големи залози и може както да разбие огромна банка, така и да отиде на парчета.

Същото се случва и във Форекс и така нататък - има много примери.

Освен това във всички случаи няма значение - дали играта е на стотинка или на хиляди долари. Всяко ниво има свои собствени играчи с ниска и висока дисперсия. Е, за средното изплащане, както си спомняме, е "отговорен" очаквана стойност.

Вероятно сте забелязали, че намирането на дисперсията е дълъг и старателен процес. Но математиката е щедра:

Формулата за намиране на дисперсията

Тази формула се извлича директно от дефиницията на дисперсията и веднага я пускаме в обращение. Ще копирам горната част на чинията с нашата игра:

и намереното очакване.

Нека изчислим дисперсията по втория начин. Първо намираме математическото очакване - квадрата на произволна променлива. от дефиниция на очакване:

В такъв случай:

И така, според формулата:

Почувствайте разликата, както се казва. И на практика, разбира се, е по-добре да приложите формулата (освен ако условието не изисква друго).

Ние владеем техниката на решение и дизайн:

Пример 6

Намерете неговото математическо очакване, дисперсия и стандартно отклонение.

Тази задача се среща навсякъде и като правило остава без смислен смисъл.
Можете да си представите няколко крушки с числа, които светят в лудница с определени вероятности :)

Решение: Основните изчисления са удобно обобщени в таблица. Първо, записваме оригиналните данни в горните два реда. След това изчисляваме продуктите, след това и накрая сумите в дясната колона:

Всъщност почти всичко е готово. Третият ред съдържа готово математическо очакване: .

Изчисляваме дисперсията по формулата:

И накрая, стандартното отклонение:
- лично аз обикновено закръгля до 2 знака след десетичната запетая.

Всички изчисления могат да се правят на калкулатор или още по-добре - в Excel:

тук е трудно да се сбърка :)

Отговор:

Желаещите могат допълнително да опростят живота си и да използват моя калкулатор (демонстрация), което не само незабавно ще реши този проблем, но и ще изгради тематични диаграми (ще пристигнем скоро)... Програмата може изтегляне в библиотеката- ако сте качили поне един образователен материал или получите друг начин... Благодаря за подкрепата на проекта!

Няколко задачи за самостоятелно решение:

Пример 7

Изчислете дисперсията на произволна променлива от предишния пример по дефиниция.

И подобен пример:

Пример 8

Дискретна случайна променлива се определя от собствения си закон за разпределение:

Да, стойностите на произволна променлива могат да бъдат доста големи (пример от реална работа), и тук, ако е възможно, използвайте Excel. Както, между другото, в пример 7 - това е по-бързо, по-надеждно и по-приятно.

Решения и отговори в долната част на страницата.

В заключение на 2-ра част на урока ще анализираме още един типичен проблем, може да се каже дори малък ребус:

Пример 9

Дискретна случайна променлива може да приеме само две стойности: и освен това. Вероятността, математическото очакване и дисперсията са известни.

Решение: Да започнем с неизвестна вероятност. Тъй като произволната променлива може да приеме само две стойности, сумата от вероятностите за съответните събития:

и от тогава.

Остава да се намери... лесно е да се каже :) Но, добре, тръгваме. По дефиниция на математическото очакване:
- заместваме известните стойности:

- и нищо повече не може да се изтръгне от това уравнение, освен че можете да го пренапишете в обичайната посока:

или:

Мисля, че можете да се досетите за по-нататъшните действия. Нека съставим и решим системата:

Десетичните дроби, разбира се, са пълен позор; умножете двете уравнения по 10:

и разделете на 2:

Това е по-добре. От 1-во уравнение изразяваме:
(това е по-лесен начин)- заместваме във 2-ро уравнение:


Ние издигаме на квадрати направете опростявания:

Умножете по:

Резултатът е квадратно уравнение, намираме неговия дискриминант:
- перфектно!

и получаваме две решения:

1) ако , тогава ;

2) ако , тогава .

Първата двойка стойности удовлетворява условието. С голяма вероятност всичко е правилно, но въпреки това пишем закона за разпределението:

и ще проверим, а именно, ще намерим очакването:

Видове дисперсия:

Пълна дисперсияхарактеризира вариацията на чертата на цялата популация под влиянието на всички онези фактори, които са причинили тази вариация. Тази стойност се определя от формулата

където е общата средна аритметична стойност на цялата изследвана популация.

Средна дисперсия в рамките на групатаобозначава случайна вариация, която може да възникне под влиянието на всякакви неотчетени фактори и която не зависи от фактора-атрибут, лежащ в основата на групирането. Тази дисперсия се изчислява по следния начин: първо се изчисляват дисперсии за отделните групи (), след това се изчислява средната вътрешногрупова дисперсия:

където n i е броят на единиците в групата

Междугрупова дисперсия(вариантност на груповите средни) характеризира системната вариация, т.е. разлики в размера на изследваната черта, възникващи под влияние на признак-фактор, който е в основата на групирането.

където е средната стойност за отделна група.

И трите типа дисперсия са свързани помежду си: общата дисперсия е равна на сумата от средната вътрешногрупова дисперсия и междугруповата дисперсия:

Имоти:

25 Относителни нива на вариация

Коефициент на трептене

Относително линейно отклонение

Коефициентът на вариация

Коеф. Osc. Оотразява относителните колебания на екстремните стойности на атрибута около средната стойност. отн. лин изключен... характеризира дела на средната стойност на знака на абсолютните отклонения от средната стойност. Коеф. Вариацията е най-често срещаната мярка за променливост, използвана за оценка на типичността на средните стойности.

В статистиката популациите с коефициент на вариация по-голям от 30–35% се считат за хетерогенни.

    Редовността на разпределителните серии. Моменти на разпространение. Индикатори на формата за разпространение

В поредицата от вариации има връзка между честотите и стойностите на променливата характеристика: с увеличаване на характеристиката стойността на честотата първо се увеличава до определена граница, а след това намалява. Такива промени се наричат модели на разпространение.

Формата на разпределението се изследва с помощта на индикатори за асиметрия и ексцес. При изчисляване на тези показатели се използват моменти на разпределение.

Моментът от k-тия ред е средната стойност на k-та степен на отклонения на вариантите на стойностите на атрибута от някаква постоянна стойност. Редът на момента се определя от стойността на k. Когато анализират вариационните серии, те се ограничават до изчисляване на моментите от първите четири реда. При изчисляване на моменти, честоти или честоти могат да се използват като тегла. В зависимост от избора на константа има начални, условни и централни моменти.

Индикатори на формата за разпространение:

Асиметрия(As) индикатор, характеризиращ степента на асиметрия на разпределението .

Следователно, с (лява) отрицателна асиметрия ... С (дясностранна) положителна асиметрия .

Централните моменти могат да се използват за изчисляване на асиметрия. Тогава:

,

където μ 3 Е централният момент от трети порядък.

- ексцес (Е Да се ) характеризира наклона на графиката на функцията в сравнение с нормалното разпределение при същата сила на вариация:

,

където μ 4 е централният момент от 4-ти порядък.

    Закон за нормалното разпределение

За нормално разпределение (разпределение на Гаус) функцията на разпределение има следната форма:

Очаквана стойност - стандартно отклонение

Нормалното разпределение е симетрично и се характеризира със следната зависимост: Xav = Me = Mo

Ексцесът на нормалното разпределение е 3, а коефициентът на изкривяване е 0.

Кривата на камбаната е многоъгълник (симетрична права линия с форма на камбана)

    Видове дисперсии. Правило за добавяне на дисперсия. Същността на емпиричния коефициент на детерминация.

Ако първоначалната съвкупност се раздели на групи според някаква съществена характеристика, тогава се изчисляват следните видове дисперсии:

    Обща дисперсия на първоначалната популация:

където е общата средна стойност на първоначалната съвкупност; f са честотите на първоначалната съвкупност. Общата дисперсия характеризира отклонението на индивидуалните стойности на даден признак от общата средна стойност на първоначалната популация.

    Вътрешногрупови дисперсии:

където j е номерът на групата; е средната стойност във всяка j-та група; - честотите на j-та група. Вътрешногруповите вариации характеризират отклонението на индивидуалната стойност на признака във всяка група от средната за групата. От всички вътрешногрупови вариации средната стойност се изчислява по формулата:, където е броят на единиците във всяка j-та група.

    Междугрупова дисперсия:

Междугруповата дисперсия характеризира отклонението на средните за групата от общата средна стойност на първоначалната съвкупност.

Правило за добавяне на дисперсиясе състои във факта, че общата дисперсия на първоначалната съвкупност трябва да бъде равна на сумата от междугруповата и средната стойност на вътрешногруповите дисперсии:

Емпиричен коефициент на детерминацияпоказва пропорцията на вариация на изследваната черта, дължаща се на вариацията на групиращия признак, и се изчислява по формулата:

    Метод за броене от условна нула (метод на моментите) за изчисляване на средната стойност и дисперсията

Изчисляването на дисперсията по метода на моментите се основава на използването на формули и 3 и 4 дисперсионни свойства.

(3. Ако всички стойности на атрибута (опции) се увеличат (намалят) с някакво постоянно число A, тогава дисперсията на новата съвкупност няма да се промени.

4. Ако всички стойности на атрибута (опции) се увеличат (умножат) по K пъти, където K е постоянно число, тогава дисперсията на новата съвкупност ще се увеличи (намали) с K 2 пъти.)

Получаваме формулата за изчисляване на дисперсията във вариационни серии с равни интервали по метода на моментите:

A - условна нула, равна на опцията с максимална честота (средата на интервала с максимална честота)

Изчисляването на средната стойност по метода на моментите също се основава на използването на свойствата на средната стойност.

    Концепцията за селективно наблюдение. Етапи на изследване на икономическите явления по метода на извадката

Извадката е наблюдение, при което не се изследват и изследват всички единици от първоначалната съвкупност, а само част от единиците, докато резултатът от изследване на част от съвкупността се отнася за цялата първоначална съвкупност. Извиква се наборът, от който се избират единици за по-нататъшно изследване и изследване общи се извикват всички показатели, характеризиращи този набор общ.

Наричат ​​се възможните граници на отклонения на средната извадка от общата средна стойност грешка в извадката.

Наборът от избрани единици се извиква избирателени се извикват всички показатели, характеризиращи този набор избирателен.

Примерното проучване включва следните етапи:

Характеристика на обекта на изследване (масови икономически явления). Ако общата популация е малка, тогава вземането на проби не се препоръчва, необходимо е непрекъснато проучване;

Изчисляване на размера на извадката. Важно е да се определи оптималният обем, който ще позволи да се получи грешка на извадката в рамките на приемливия диапазон при най-ниска цена;

Избор на единици за наблюдение, като се вземат предвид изискванията за случайност, пропорционалност.

Доказателство за представителност въз основа на оценка на грешката на извадката. За произволна извадка грешката се изчислява с помощта на формули. За целевата извадка представителността се оценява с помощта на качествени методи (сравнение, експеримент);

Анализ на пробата. Ако формираната извадка отговаря на изискванията за представителност, тогава тя се анализира с помощта на аналитични показатели (средни, относителни и др.)