Վիճակագրական ամփոփում և խմբավորում: Վիճակագրական բաշխման շարք: Խնդիրների լուծման օրինակներ: Տվյալների խմբավորում և բաշխման շարք գծագրել

Հավաքված վիճակագրության խմբավորման արդյունքները սովորաբար ներկայացվում են որպես բաշխման շարք: Բաշխման շարքը բնակչության միավորների խմբավորված խմբերի ըստ ուսումնասիրվող հատկության է:

Բաշխման շարքերը բաժանվում են վերագրման և տատանումների ՝ կախված խմբավորման հիմքում ընկած հատկությունից: Եթե ​​հատկությունը որակական է, ապա բաշխման շարքը կոչվում է վերագրող: Հատկանշական շարքի օրինակ է ձեռնարկությունների և կազմակերպությունների բաշխումը ըստ սեփականության ձևերի (տե՛ս Աղյուսակ 3.1):

Եթե ​​հատկանիշը, որի վրա կառուցված է բաշխման շարքը, քանակական է, ապա շարքը կոչվում է տատանումային:

Բաշխման տատանումների շարքը միշտ բաղկացած է երկու մասից ՝ տարբերակից և համապատասխան հաճախություններից (կամ հաճախականություններից): Տարբերակն այն արժեքն է, որը հատկությունը կարող է վերցնել բնակչության միավորներում, հաճախականությունը `դիտման միավորների քանակը, որոնք ունեն տրված հատկության արժեք: Հաճախականությունների գումարը միշտ հավասար է բնակչության ծավալին: Երբեմն հաճախությունների փոխարեն հաշվարկվում են հաճախականությունները. Դրանք հաճախականություններ են, որոնք արտահայտվում են կամ մեկի կոտորակներով (ապա բոլոր հաճախությունների հանրագումարը 1 է), կամ ընդհանուր ծավալի տոկոսով (հաճախությունների գումարը հավասար կլինի 100% -ի) ,

Վարիացիոն շարքերը դիսկրետ են և ընդմիջումային: Դիսկրետ շարքերի համար (Աղյուսակ 3.7) ընտրանքներն արտահայտվում են հատուկ թվերով, առավել հաճախ `ամբողջական թվերով:

Աղյուսակ 3.8. Աշխատողների բաշխում ըստ աշխատաժամանակի ապահովագրական ընկերությունում
Ընկերությունում աշխատանքի ժամանակը, լրիվ տարիներ (տարբերակներ) Աշխատակիցների թիվը
Մարդ (հաճախականություն) % -ով ընդհանուր (հաճախականություն)
մինչեւ մեկ տարի 15 11,6
1 17 13,2
2 19 14,7
3 26 20,2
4 10 7,8
5 18 13,9
6 24 18,6
Ընդհանուր 129 100,0

Ընդմիջումների շարքում (տե՛ս Աղյուսակ 3.2) ցուցիչի արժեքները դրվում են որպես ընդմիջումներ: Ընդմիջումները ունեն երկու սահման `ստորին և վերին: Ընդմիջումները կարող են լինել բաց կամ փակ: Բացերը չունեն սահմաններից մեկը, այնպես որ, աղյուսակում: 3.2. Առաջին միջակայքը չունի ստորին սահման, իսկ վերջինը չունի վերև: Միջանկյալ շարքեր կառուցելիս, կախված հատկանիշի արժեքների ցրման բնույթից, օգտագործվում են և՛ հավասար ընդմիջումներով, և՛ անհավասար ընդմիջումներով (Աղյուսակ 3.2-ը ցույց է տալիս հավասար ընդմիջումներով տատանումների շարք):

Եթե ​​հատկությունը վերցնում է սահմանափակ թվով արժեքներ, սովորաբար 10-ից ոչ ավելի, կառուցվում են դիսկրետ բաշխման շարքեր: Եթե ​​տարբերակն ավելի մեծ է, ապա դիսկրետ շարքը կորցնում է իր հստակությունը. այս դեպքում ցանկալի է օգտագործել տատանումների շարքի միջակայքային ձևը: Հատկանիշի շարունակական փոփոխությամբ, երբ որոշակի սահմաններում դրա արժեքները կամայականորեն փոքր քանակությամբ տարբերվում են միմյանցից, կառուցվում է նաև միջակայքային բաշխման շարք:

3.3.1. Դիսկրետ տատանումների շարքի կառուցում

Եկեք քննարկենք դիսկրետ տատանումային շարքերի կառուցման մեթոդը ՝ օգտագործելով օրինակ:

Օրինակ 3.2. 60 ընտանիքի քանակական կազմի վերաբերյալ կան հետեւյալ տվյալները.

Ընտանիքների բաշխվածության վերաբերյալ ըստ նրանց անդամների քանակի մասին պատկերացում կազմելու համար պետք է կառուցել տատանումների շարք: Քանի որ հատկությունը տանում է սահմանափակ թվով ամբողջ արժեքների, մենք կառուցում ենք տարբերակված տատանումների շարք: Դա անելու համար նախ խորհուրդ է տրվում աճի կարգով գրել հատկության բոլոր արժեքները (ընտանիքի անդամների թիվը) (այսինքն ՝ վիճակագրական տվյալները դասակարգել).

Այդ դեպքում անհրաժեշտ է հաշվել նույն կազմով ընտանիքների քանակը: Ընտանիքի անդամների թիվը (փոփոխականի հատկության արժեքը) ընտրանքներ են (մենք դրանք կնշենք x- ով), նույն կազմով ընտանիքների քանակը հաճախականություններն են (դրանք կնշենք f): Խմբավորման արդյունքները ներկայացված են հետևյալ դիսկրետ տատանումների բաշխման շարքի տեսքով.

Աղյուսակ 3.11.
Ընտանիքի անդամների թիվը (x) Ընտանիքների քանակ (y)
1 8
2 14
3 20
4 9
5 5
6 4
Ընդհանուր 60

3.3.2. Միջանկյալ տատանումների շարքի կառուցում

Եկեք ցույց տանք հետևյալ օրինակի օգտագործմամբ միջակայքային տատանումային բաշխման շարքերի կառուցման տեխնիկա:

Օրինակ 3.3. Վիճակագրական դիտարկման արդյունքում 50 առևտրային բանկերի միջին տոկոսադրույքի (%) վերաբերյալ ստացվել են հետևյալ տվյալները.

Աղյուսակ 3.12.
14,7 19,0 24,5 20,8 12,3 24,6 17,0 14,2 19,7 18,8
18,1 20,5 21,0 20,7 20,4 14,7 25,1 22,7 19,0 19,6
19,0 18,9 17,4 20,0 13,8 25,6 13,0 19,0 18,7 21,1
13,3 20,7 15,2 19,9 21,9 16,0 16,9 15,3 21,4 20,4
12,8 20,8 14,3 18,0 15,1 23,8 18,5 14,4 14,4 21,0

Ինչպես տեսնում եք, տվյալների նման զանգված դիտելը չափազանց անհարմար է, ավելին ՝ ցուցանիշի փոփոխության ոչ մի օրինաչափություն չի երեւում: Եկեք կառուցենք միջակայքի բաշխման շարք:

  1. Եկեք որոշենք ընդմիջումների քանակը:

    Գործնականում, ընդմիջումների քանակը հաճախ սահմանում է ինքը ՝ հետազոտողը, յուրաքանչյուր կոնկրետ դիտարկման առաջադրանքների հիման վրա: Միևնույն ժամանակ, այն կարող է նաև մաթեմատիկորեն հաշվարկվել ՝ օգտագործելով Sturgess բանաձևը

    n = 1 + 3.322 լ N,

    որտեղ n - ընդմիջումների քանակը;

    N- ը բնակչության ծավալն է (դիտորդական միավորների քանակը):

    Մեր օրինակի համար մենք ստանում ենք ՝ n = 1 + 3.322lgN = 1 + 3.322lg50 = 6.6 "7:

  2. Եկեք որոշենք ընդմիջումների չափը (i) բանաձևով

    որտեղ x max հատկության առավելագույն արժեքն է.

    x min - հատկության նվազագույն արժեքն է:

    Մեր օրինակի համար

    Փոփոխությունների շարքի միջակայքերը պարզ են, եթե դրանց սահմաններն ունեն «կլոր» արժեքներ, հետևաբար, մենք կլորացնենք 1.9-ից 2 միջակայքի արժեքը, իսկ հատկության նվազագույն արժեքը `12.3-ից 12.0:

  3. Եկեք որոշենք ընդմիջումների սահմանները:

    Ընդմիջումները սովորաբար գրանցվում են այնպես, որ մեկ ընդմիջման վերին սահմանը միաժամանակ լինի հաջորդ ընդմիջման ստորին սահմանը: Այսպիսով, մեր օրինակի համար մենք ստանում ենք ՝ 12.0-14.0; 14.0-16.0; 16.0-18.0; 18.0-20.0; 20.0-22.0; 22.0-24.0; 24.0-26.0.

    Նման գրառումը նշանակում է, որ հատկությունը շարունակական է: Եթե ​​առանձնահատկության տարբերակները վերցնում են խստորեն սահմանված արժեքներ, օրինակ ՝ միայն ամբողջ թվեր, բայց դրանց թիվը չափազանց մեծ է դիսկրետ սերիա կառուցելու համար, ապա կարող է ստեղծվել ընդմիջումային շարք, որտեղ միջակայքի ստորին սահմանը չի համընկնի վերին սահմանի հետ հաջորդ ընդմիջումից (սա կնշանակի, որ հատկությունը դիսկրետ է): Օրինակ, ձեռնարկության աշխատողների բաշխման ժամանակ ըստ տարիքի, կարող եք ստեղծել հետևյալ տարիների խմբեր. 18-25, 26-33, 34-41, 42-49, 50-57, 58-65, 66 և ավելին

    Բացի այդ, մեր օրինակում մենք կարող ենք բացել առաջին և վերջին ընդմիջումները և այլն: գրել `մինչեւ 14.0; 24.0 և ավելի բարձր:

  4. Սկզբնական տվյալների հիման վրա մենք կկառուցենք տատանվող շարք: Դա անելու համար աճման կարգով գրիր այն հատկությունները, որոնք վերցնում է հատկանիշը: Արդյունքները ներկայացված են աղյուսակում. Աղյուսակ 3.13. Առևտրային բանկերի տոկոսադրույքների դասակարգված շարք
    Բանկի տոկոսադրույքը% (ընտրանքներ)
    12,3 17,0 19,9 23,8
    12,8 17,4 20,0 24,5
    13,0 18,0 20,0 24,6
    13,3 18,1 20,4 25,1
    13,8 18,5 20,4 25,6
    14,2 18,7 20,5
    14,3 18,8 20,7
    14,4 18,9 20,7
    14,7 19,0 20,8
    14,7 19,0 21,0
    15,1 19,0 21,0
    15,2 19,0 21,1
    15,3 19,0 21,4
    16,0 19,6 21,9
    16,9 19,7 22,7
  5. Եկեք հաշվենք հաճախականությունները:

    Հաճախականությունները հաշվարկելիս կարող է իրավիճակ առաջանալ, երբ հատկության արժեքը ընկնում է ընդմիջման սահմանի վրա: Այս դեպքում կարող եք առաջնորդվել կանոնով. Այս միավորը նշանակվում է այն ընդմիջմանը, որի համար դրա արժեքը վերին սահմանն է: Այսպիսով, մեր օրինակում 16.0 արժեքը վերաբերելու է երկրորդ ընդմիջմանը:

Մեր օրինակում ստացված խմբավորման արդյունքները կներկայացվեն աղյուսակում:

Աղյուսակ 3.14. Առևտրային բանկերի բաշխում ըստ վարկի տոկոսադրույքի
Կարճ տոկոսադրույք,% Բանկերի, միավորների քանակը (հաճախականություն) Կուտակված հաճախականություններ
12,0-14,0 5 5
14,0-16,0 9 14
16,0-18,0 4 18
18,0-20,0 15 33
20,0-22,0 11 44
22,0-24,0 2 46
24,0-26,0 4 50
Ընդհանուր 50 -

Աղյուսակի վերջին սյունը ցույց է տալիս կուտակված հաճախականությունները, որոնք ստացվում են հաճախականությունների հաջորդական ամփոփմամբ `սկսած առաջինից (օրինակ` առաջին ընդմիջումից `5, երկրորդ միջակայքի համար 5 + 9 = 14, երրորդ միջակայքի համար 5 + 9 + 4 = 18 և այլն): Կուտակային հաճախականությունը, օրինակ, 33-ը, ցույց է տալիս, որ 33 բանկերի վարկավորման տոկոսադրույքը չի գերազանցում 20% -ը (համապատասխան միջակայքի վերին սահմանը):

Տատանումների շարքը կառուցելիս տվյալների խմբավորման գործընթացում երբեմն օգտագործվում են անհավասար ընդմիջումներ: Սա վերաբերում է այն դեպքերին, երբ հատկանիշի արժեքները ենթարկվում են թվաբանական կամ երկրաչափական առաջընթացի կանոնին, կամ երբ Sturgess բանաձևի կիրառումը հանգեցնում է «դատարկ» միջակայքային խմբերի հայտնվելուն, որոնք չեն պարունակում մեկ դիտորդ միավոր: Այնուհետև ընդմիջումների սահմանները կամայականորեն սահմանվում են հենց հետազոտողի կողմից ՝ հիմնվելով առողջ դատողության և հետազոտության նպատակների վրա, կամ բանաձևերով: Այսպիսով, թվաբանական առաջընթացի փոփոխման տվյալների համար, ընդմիջումների չափը հաշվարկվում է հետևյալ կերպ.

Դիսկրետ տատանումների շարքը կառուցվում է դիսկրետ հատկությունների համար:

Դիսկրետ տատանումների շարքը կառուցելու համար անհրաժեշտ է կատարել հետևյալ քայլերը. 1) դիտորդական միավորները պատվիրել հատկության ուսումնասիրված արժեքի աճման կարգով,

2) որոշել x i հատկանիշի բոլոր հնարավոր արժեքները, դասավորել դրանք աճման կարգով,

հատկության արժեքը, ես .

բնութագրական արժեքի հաճախականությունը և նշանակում է զ ես . Սերիայի բոլոր հաճախականությունների հանրագումարը հավասար է ուսումնասիրված բնակչության տարրերի քանակին:

Օրինակ 1 .

Քննություններին ուսանողների ստացած գնահատականների ցուցակը. 3; 4; 3; հինգ 4; 2; 2; 4; 4; 3; հինգ 2; 4; հինգ 4; 3; 4; 3; 3; 4; 4; 2; 2; հինգ հինգ 4; հինգ 2; 3; 4; 4; 3; 4; հինգ 2; հինգ հինգ 4; 3; 3; 4; 2; 4; 4; հինգ 4; 3; հինգ 3; հինգ 4; 4; հինգ 4; 4; հինգ 4; հինգ հինգ հինգ

Այստեղ համարը NS - դասարանդիսկրետ պատահական փոփոխական է, և արդյունքում ստացված գնահատականները `վիճակագրական (դիտարկվող) տվյալներ .

    դիտարկման միավորները ըստ հատկության ուսումնասիրված արժեքի աճման կարգով պատվիրել.

2; 2; 2; 2; 2; 2; 2; 2; 3; 3; 3; 3; 3; 3; 3; 3; 3; 3; 3; 3; 4; 4; 4; 4; 4; 4; 4; 4; 4; 4; 4; 4; 4; 4; 4; 4; 4; 4; 4; 4; 4; 4; 4; 5; 5; 5; 5; 5; 5; 5; 5; 5; 5; 5; 5; 5; 5; 5; 5; 5.

2) որոշել x i հատկանիշի բոլոր հնարավոր արժեքները, դասավորել դրանք աճման կարգով.

Այս օրինակում բոլոր դասարանները կարելի է բաժանել չորս խմբի `հետևյալ արժեքներով. 2; 3; 4; հինգ

Դիտարկվող տվյալների առանձին խմբին համապատասխանող պատահական փոփոխականի արժեքը կոչվում է հատկության արժեքը, տարբերակ (տարբերակ) և նշել x ես .

Կոչվում է այն թիվը, որը ցույց է տալիս, թե քանի անգամ է տեղի ունենում ատրիբուտի համապատասխան արժեքի մի շարք դիտարկումներ բնութագրական արժեքի հաճախականությունը և նշանակում է զ ես .

Մեր օրինակի համար

տեղի է ունենում 2 միավոր ՝ 8 անգամ,

տեղի է ունենում 3 միավոր ՝ 12 անգամ,

տեղի է ունենում 4 միավոր ՝ 23 անգամ,

տեղի է ունենում 5 միավոր ՝ 17 անգամ:

Ընդհանուր 60 գնահատական:

4) ստացված տվյալները գրել երկու տողերի (սյունակների) աղյուսակում `x i և f i:

Այս տվյալների հիման վրա հնարավոր է կառուցել տարբերակված տատանումների շարք

Դիսկրետ տատանումների շարք - սա այն աղյուսակն է, որում ուսումնասիրվող հատկության հանդիպող արժեքները նշվում են որպես աճման կարգով առանձին արժեքներ և դրանց հաճախականությունը

  1. Ընդմիջման տատանումների շարքի կառուցում

Դիսկրետ տատանումների շարքից բացի, հաճախ գոյություն ունի տվյալների խմբավորման այնպիսի եղանակ, ինչպիսին է ընդմիջման տատանումների շարքը:

Ընդմիջումների շարքը կառուցվում է, եթե.

    նշանն ունի փոփոխության շարունակական բնույթ.

    Կան շատ դիսկրետ արժեքներ (ավելի քան 10)

    դիսկրետ արժեքների հաճախականությունները շատ փոքր են (չեն գերազանցում 1-3-ը `համեմատաբար մեծ թվով դիտորդական միավորներով);

    նույն հաճախականություններով հատկության շատ դիսկրետ արժեքներ:

Միջանկյալ տատանումների շարքը տվյալների խմբավորման եղանակ է աղյուսակի տեսքով, որն ունի երկու սյունակ (հատկանիշի արժեքները արժեքների ընդմիջման տեսքով և յուրաքանչյուր ընդմիջման հաճախականությունը):

Ի տարբերություն դիսկրետ շարքի, ընդմիջումային շարքի բնութագրիչի արժեքները ներկայացվում են ոչ թե առանձին արժեքներով, այլ արժեքների ընդմիջումով («սկսած-ից»):

Կոչվում է այն թիվը, որը ցույց է տալիս, թե քանի դիտորդ միավոր է ընկել յուրաքանչյուր ընտրված միջակայքում բնութագրական արժեքի հաճախականությունը և նշանակում է զ ես . Սերիայի բոլոր հաճախականությունների հանրագումարը հավասար է ուսումնասիրված բնակչության տարրերի քանակին (դիտարկման միավորներ):

Եթե ​​միավորն ունի միջակայքի վերին սահմանի արժեքին հավասար հատկանիշի արժեք, ապա այն պետք է վկայակոչվի հաջորդ ընդմիջմանը:

Օրինակ, 100 սմ հասակ ունեցող երեխան ընկնելու է ոչ թե առաջինը, այլ 2-րդ ընդմիջում: իսկ 130 սմ հասակ ունեցող երեխան ընկնելու է ոչ թե երրորդ, այլ վերջին ընդմիջման մեջ:

Այս տվյալների հիման վրա հնարավոր է կառուցել միջակայքի տատանումների շարք:

Յուրաքանչյուր աղբարկղ ունի ստորին սահման (x n), վերին սահման (x h) և աղբարկղի լայնություն ( ես).

Ընդմիջման սահմանը բնութագրական արժեք է, որը ընկած է երկու ընդմիջումների սահմանին:

երեխաների բարձրությունը (սմ)

երեխաների բարձրությունը (սմ)

երեխաների քանակը

ավելի քան 130

Եթե ​​ընդմիջումն ունի վերին և ստորին սահման, ապա այն կոչվում է փակ ընդմիջում... Եթե ​​ընդմիջումն ունի միայն ստորին կամ միայն վերին սահման, ապա դա է. բաց ընդմիջում:Բաց է միայն առաջին կամ ամենավերջին միջակայքը: Վերոնշյալ օրինակում վերջին ընդմիջումը բաց է:

Ընդմիջման լայնությունը (ես) - վերին և ստորին սահմանների տարբերությունը:

ես = x n - x ներսում

Ենթադրվում է, որ բաց աղբարկղի լայնությունը նույնն է, ինչ հարակից փակ աղբարկղի լայնությունը:

երեխաների բարձրությունը (սմ)

երեխաների քանակը

Միջանկյալ լայնություն (i)

130 + 20 = 150 հաշվարկների համար

20 (քանի որ հարակից փակ ընդմիջման լայնությունը 20 է)

Բոլոր ընդմիջումային շարքերը բաժանվում են հավասար ընդմիջումներով ընդմիջումների սերիաների և անհավասար ընդմիջումներով ընդմիջումների սերիաների ... Հավասար ընդմիջումներով ընդմիջվող շարքերում բոլոր ընդմիջումների լայնությունը նույնն է: Անհավասար ընդմիջումներով ընդմիջվող շարքերում ընդմիջումների լայնությունը տարբեր է:

Այս օրինակում ՝ ընդմիջումային շարք ՝ անհավասար ընդմիջումներով:

Մաթեմատիկական վիճակագրություն- մաթեմատիկայի մի հատված, որը նվիրված է վիճակագրական տվյալների մշակման, համակարգավորման և գիտական ​​և գործնական եզրակացությունների օգտագործման մաթեմատիկական մեթոդներին:

3.1. Մաթեմատիկական վիճակագրության հիմնական հասկացությունները

Կենսաբժշկական խնդիրներում հաճախ անհրաժեշտ է ուսումնասիրել որոշակի գծի բաշխումը շատ մեծ թվով անհատների համար: Տարբեր անհատների մոտ այս նշանն այլ իմաստ ունի, հետևաբար պատահական փոփոխական է: Օրինակ ՝ ցանկացած բժշկական արտադրանք տարբեր արդյունավետություն ունի, երբ կիրառվում է տարբեր հիվանդների վրա: Այնուամենայնիվ, այս դեղամիջոցի արդյունավետության մասին պատկերացում կազմելու համար հարկավոր չէ այն կիրառել դրա վրա բոլորինհիվանդ Հնարավոր է դեղի օգտագործման արդյունքները հետևել հիվանդների համեմատաբար փոքր խմբին և ստացված տվյալների հիման վրա բացահայտել բուժման գործընթացի էական հատկությունները (արդյունավետությունը, հակացուցումները):

Ընդհանուր բնակչություն- ուսումնասիրվող միատարր տարրերի ամբողջություն, որը բնութագրվում է որոշակի առանձնահատկությամբ: Այս առանձնահատկությունն այն է շարունակականբաշխման խտությամբ պատահական փոփոխական զ (x)

Օրինակ, եթե մենք շահագրգռված ենք որոշակի տարածաշրջանում հիվանդության տարածվածությամբ, ապա ընդհանուր բնակչությունը տարածաշրջանի ամբողջ բնակչությունն է: Եթե ​​մենք ուզում ենք առանձին պարզել տղամարդկանց և կանանց այս հիվանդության նկատմամբ ընկալունակությունը, ապա պետք է հաշվի առնենք երկու ընդհանուր պոպուլյացիա:

Ընդհանուր բնակչության հատկությունները ուսումնասիրելու համար ընտրվում են դրա որոշ տարրեր:

Նմուշ- ընդհանուր բնակչության այն մասը, որն ընտրված է հետազոտման (բուժման) համար:

Եթե ​​դա խառնաշփոթ չի առաջացնում, ապա նմուշը նշվում է որպես օբյեկտների հավաքածու,փորձաքննության համար ընտրված և համախառն

արժեքներուսումնասիրված հատկությունը, որը ձեռք է բերվել հետազոտության ընթացքում: Այս արժեքները կարող են ներկայացվել մի քանի եղանակներով:

Պարզ վիճակագրական շարք -ուսումնասիրված հատկության արժեքները, արձանագրված ըստ դրանց ստացված հերթականության:

Պարզ վիճակագրական շարքի օրինակ, որը ձեռք է բերվել 20 հիվանդների ճակատի մաշկի մակերեսային ալիքի արագությունը (մ / վ) չափելով, բերված է աղյուսակում: 3.1.

Աղյուսակ 3.1.Պարզ վիճակագրական շարք

Պարզ վիճակագրական շարքը հետազոտության արդյունքների գրանցման հիմնական և ամբողջական ձևն է: Այն կարող է պարունակել հարյուրավոր իրեր: Շատ դժվար է մեկ հայացքով նայել այդպիսի համադրությանը: Հետեւաբար, մեծ նմուշները սովորաբար բաժանվում են խմբերի: Դրա համար բնութագրի փոփոխության տարածքը բաժանված է մի քանիսի (N) ընդմիջումներովհավասար լայնությամբ և հաշվարկել այդ ընդմիջումներին հարվածող հատկության հարաբերական հաճախականությունները (n / n): Յուրաքանչյուր ընդմիջման լայնությունը `

Ընդմիջումների սահմանները ունեն հետեւյալ իմաստները.

Եթե ​​նմուշի որոշ տարր սահման է երկու հարակից ընդմիջումների միջև, ապա այն հիշատակվում է որպես ձախընդմիջում Այս եղանակով խմբավորված տվյալները կոչվում են ընդմիջումներով վիճակագրական շարքեր:

- սա աղյուսակ է, որը ցույց է տալիս հատկանիշի արժեքների միջակայքերը և հատկանիշի հարաբերական հաճախականությունները, որոնք ընկնում են այս ընդմիջումների մեջ:

Մեր դեպքում հնարավոր է ձևավորել, օրինակ, նման ընդմիջումից վիճակագրական շարք (N = 5, դ= 4), ներդիր: 3.2.

Աղյուսակ 3.2.Միջանկյալ վիճակագրական շարքեր

Այստեղ 28-ին հավասար երկու արժեքներ են նշանակվում 28-32 միջակայքին (Աղյուսակ 3.1), իսկ 32-36 միջակայքին `32, 33, 34 և 35 արժեքներին:

Միջանկյալ վիճակագրական շարքերը կարող են ցուցադրվել գրաֆիկորեն: Դա անելու համար հատկանիշի արժեքների միջակայքերը գծագրվում են աբսցիսայի առանցքի երկայնքով, և դրանցից յուրաքանչյուրի վրա, ինչպես հիմքի վրա, կառուցվում է ուղղանկյուն, որի բարձրությունը հավասար է հարաբերական հաճախությանը: Արդյունքում ստացվող գծապատկերը կոչվում է հիստոգրամա

Բրինձ 3.1.գծապատկեր

Հիստոգրամայի վրա գծի բաշխման վիճակագրական օրինաչափությունները բավականին պարզ են:

Նմուշի մեծ չափսով (մի քանի հազար) և սյունների փոքր լայնությամբ, հիստոգրամայի ձևը մոտ է գրաֆիկի ձևին բաշխման խտությունընշան.

Հիստոգրամում ձողերի քանակը կարելի է ընտրել հետևյալ բանաձևով.

Ձեռքով հիստոգրամայի կառուցումը երկար գործընթաց է: Հետեւաբար, դրանց ավտոմատ կառուցման համար մշակվել են համակարգչային ծրագրեր:

3.2. ՎԻATԱԿԱԳՐԱԿԱՆ ՇՐIESԱՆԻ ԹՎԱԿԱՆԱԿԱՆ ԲՆՈՒԹԱԳԻՐՆԵՐ

Վիճակագրական շատ ընթացակարգերում օգտագործվում են բնակչության միջին և շեղման (կամ ՌՍՍ) ընտրանքային գնահատականներ:

Նմուշի միջին(X) պարզ վիճակագրական շարքի բոլոր տարրերի թվաբանական միջինն է.

Մեր օրինակի համար NS= 37.05 (մ / վ):

Միջին նմուշն էլավագույնըընդհանուր միջին գնահատականՄ.

Նմուշի շեղում s 2հավասար է տարրերի քառակուսի շեղումների հանրագումարին `բաժանված բաժանված միջինի նմուշից ն- 1:

Մեր օրինակում s 2 = 25,2 (մ / վ) 2:

Խնդրում ենք նկատի ունենալ, որ նմուշի շեղումը հաշվարկելիս բանաձևի հայտարարը ոչ թե նմուշի չափսն է, այլ n-1: Դա պայմանավորված է նրանով, որ բանաձևի շեղումները հաշվարկելիս (3.3), անհայտ մաթեմատիկական սպասման փոխարեն, օգտագործվում է դրա նախահաշիվը. նմուշի միջին:

Նմուշի շեղումը ` լավագույնըընդհանուր շեղման նախահաշիվ (σ 2):

Ստանդարտ շեղման նմուշ(ներ) ը նմուշի շեղման քառակուսի արմատն է.

Մեր օրինակի համար ս= 5.02 (մ / վ):

Ընտրովի արմատ միջին քառակուսիշեղումը ընդհանուր ստանդարտ շեղման լավագույն գնահատումն է (σ):

Նմուշի չափի անսահմանափակ աճով, ընտրանքի բոլոր բնութագրերը հակված են ընդհանուր բնակչության համապատասխան բնութագրերին:

Նմուշի բնութագրերը հաշվարկելու համար օգտագործվում են համակարգչային բանաձևեր: Excel- ում այս հաշվարկները կատարում են վիճակագրական գործառույթները `միջին, VAR: STDEV

3.3. ՄԻERԱԳԱՅԻՆ ԳՆԱՀԱՏՈՒՄ

Նմուշի բոլոր բնութագրերն են պատահական փոփոխականներ:Սա նշանակում է, որ նույն չափի մեկ այլ նմուշի համար նմուշի բնութագրերի արժեքները տարբեր կլինեն: Այսպիսով, ընտրովի

բնութագրերը միայն գնահատականներընդհանուր բնակչության համապատասխան բնութագրերը.

Նմուշի գնահատման թերությունները փոխհատուցվում են միջակայքի գնահատում,ներկայացնելով թվային միջակայք,որի ներսում տրված հավանականությամբ Ռ դԳտնվում է գնահատվող պարամետրի իրական արժեքը:

Թող լինի U r - ընդհանուր բնակչության որոշ պարամետր (ընդհանուր միջին, ընդհանուր շեղում և այլն):

Միջանկյալ գնահատում U r պարամետրը կոչվում է ընդմիջում (U 1, U 2),բավարարելով պայմանը.

P (U < Ur < U2) = Рд. (3.5)

Հավանականություն Ռ դկոչված գաղտնի հավանականություն:

Վստահության հավանականություն Pդ - հավանականությունը, որ գնահատված քանակի իրական արժեքը լինի ներսումնշված միջակայքը:

Այս դեպքում ընդմիջումը (U 1, U 2)կոչված վստահության միջակայքգնահատվող պարամետրի համար:

Հաճախ, վստահության հավանականության փոխարեն, օգտագործվում է դրա հետ կապված արժեքը α = 1 - P d, որը կոչվում է նշանակության մակարդակը:

Նշանակության մակարդակըհավանականությունն է, որ գնահատված պարամետրի իրական արժեքը լինի դրսումվստահության միջակայք

Երբեմն α և P q արտահայտվում են տոկոսներով, օրինակ ՝ 5% 0,05-ի փոխարեն և 95% ՝ 0,95-ի փոխարեն:

Ընդմիջման գնահատման մեջ նախ ընտրեք համապատասխանը վստահության մակարդակ(սովորաբար 0.95 կամ 0.99), ապա գտեք գնահատվող պարամետրի համապատասխան արժեքների տիրույթը:

Եկեք նշենք ընդմիջումների գնահատման որոշ ընդհանուր հատկություններ:

1. Որքան ցածր է նշանակության մակարդակը (այնքան ավելին) R ե),ընդարձակ միջակայքի գնահատումը: Այսպիսով, եթե նշանակության մակարդակում 0,05 է, ապա ընդհանուր միջին միջակայքի գնահատումը 34,7 է< Մ< 39,4, то для уровня 0,01 она будет гораздо шире: 33,85 < Մ< 40,25.

2. Որքան մեծ է նմուշի չափը n,որքան նեղ է միջակայքի գնահատումը ՝ ընտրված նշանակության մակարդակով: Եկեք, օրինակ, 5-ը լինի 20 տարրերի նմուշից ստացված ընդհանուր միջին (β = 0,05) տոկոսի գնահատումը, ապա 34,7< Մ< 39,4.

Նմուշի չափը հասցնելով 80-ի, մենք կստանանք ավելի ճշգրիտ գնահատական ​​՝ նույն նշանակության մակարդակում ՝ 35,5< Մ< 38,6.

Ընդհանուր դեպքում, վստահության հուսալի գնահատումների կառուցումը պահանջում է գիտելիքներ այն օրենքի վերաբերյալ, համաձայն որի գնահատված պատահական հատկանիշը բաշխված է ընդհանուր բնակչության շրջանում: Հաշվի առեք, թե ինչպես է կառուցվում միջակայքի գնահատումը ընդհանուր երկրորդականհատկություն, որը բաշխվում է ընդհանուր բնակչության մեջ ըստ նորմալօրենքը

3.4. ԸՆԴՀԱՆՈՒՐ ԳՆԱՀԱՏՄԱՆ ՆՈՐՄԱԼ ԲԱ MEԱՆՄԱՆ ՕՐԵՆՔԻ ԸՆԴՀԱՆՈՒՐ ՄԻANՈԸ

Նորմալ բաշխում ունեցող ընդհանուր բնակչության ընդհանուր միջին M- ի ընդմիջման գնահատման կառուցումը հիմնված է հետևյալ հատկության վրա: Նմուշի ծավալի համար նվերաբերմունք

ենթարկվում է ուսանողի բաշխմանը ՝ ազատության աստիճանի քանակով ν = ն- 1.

Ահա այստեղ NSնմուշի միջինն է, և ս- ընտրովի ստանդարտ շեղում:

Օգտագործելով Student- ի բաշխման աղյուսակները կամ դրանց համակարգչային անալոգը, կարելի է գտնել այնպիսի սահմանային արժեք, որը տրված վստահության մակարդակի հետ կապված պահպանում է հետևյալ անհավասարությունը.

Այս անհավասարությունը համապատասխանում է անհավասարությանը M- ի համար.

որտեղ ε վստահության միջակայքի կես լայնությունն է:

Այսպիսով, M- ի համար վստահության միջակայքի կառուցումը կատարվում է հետևյալ հաջորդականությամբ.

1. Ընտրեք վստահության հավանականություն P d (սովորաբար 0.95 կամ 0.99) և դրա համար, ըստ Ուսանողի բաշխման աղյուսակի, հայտնաբերվում է t պարամետրը:

2. Հաշվեք վստահության միջակայքի կես լայնությունը ε:

3. Ստացեք ընդհանուր միջին միջակայքի գնահատական ​​ընտրված վստահության մակարդակի հետ.

Կարճ ասած, գրված է այսպես.

Մշակվել են համակարգչային ընթացակարգեր `ընդմիջումների գնահատումները գտնելու համար:

Եկեք բացատրենք, թե ինչպես օգտագործել Ուսանողի բաշխման աղյուսակը: Այս աղյուսակն ունի երկու «մուտք». Ձախ սյունը, որը կոչվում է ν = ազատության աստիճանի քանակ ն- 1, իսկ վերին գիծը նշանակության մակարդակն α է: Համապատասխան տողի և սյունակի հատման կետում գտիր Ուսանողի գործակիցը տ

Եկեք կիրառենք այս մեթոդը մեր նմուշի վրա: Ստորև ներկայացված է Ուսանողների բաշխման աղյուսակի մի հատված:

Աղյուսակ 3.3. Ուսանողի բաշխման աղյուսակի հատված

Պարզ վիճակագրական շարք 20 հոգանոց նմուշի համար = 20, ν = 19) ներկայացված է աղյուսակում: 3.1. Այս շարքի համար բանաձևերի հաշվարկները (3.1-3.3) տալիս են. NS= 37,05; ս= 5,02.

Եկեք ընտրենք α = 0,05 (P d = 0,95): «19» տողի և «0,05» սյունակի հատման հատվածում մենք գտնում ենք տ= 2,09.

Եկեք հաշվարկենք գնահատման ճշգրտությունը (3.6) բանաձևով. Ε = 2.09? 5.02 / λ / 20 = 2.34:

Եկեք կառուցենք ընդմիջման գնահատում. 95% հավանականությամբ անհայտ ընդհանուր միջին ցուցանիշը բավարարում է անհավասարությունը.

37,05 - 2,34 < Մ< 37,05 + 2,34, или Մ= 37.05 ± 2.34 (մ / վ), P d = 0.95:

3.5. ՎԻATԱԿԱԳՐԱԿԱՆ ՀԻՓՈԹԵ VԻ ՎԵՐՍՏԵՄԱՆ ՄԵԹՈԴՆԵՐ

Վիճակագրական վարկածներ

Նախքան ձևակերպելը, թե ինչ է վիճակագրական վարկածը, դիտարկենք հետևյալ օրինակը:

Որոշակի հիվանդության բուժման երկու մեթոդները համեմատելու համար ընտրվել են 20 հոգուց բաղկացած հիվանդների երկու խմբեր, որոնց բուժումն իրականացվել է ըստ այդ մեթոդների: Յուրաքանչյուր հիվանդի համար արձանագրվել է ընթացակարգերի քանակը,որից հետո դրական արդյունքի հասան: Այս տվյալների հիման վրա յուրաքանչյուր խմբի համար հայտնաբերվել է նմուշի միջոց (X), ընտրանքի տատանումներ (ներ 2)և RMS նմուշ (ներ)

Արդյունքները ներկայացված են աղյուսակում: 3.4.

Աղյուսակ 3.4

Դրական ազդեցություն ստանալու համար անհրաժեշտ ընթացակարգերի քանակը պատահական փոփոխական է, որի վերաբերյալ ամբողջ տեղեկատվությունը ներկայումս պարունակվում է տվյալ նմուշում:

Սեղանից: 3.4-ը ցույց է տալիս, որ առաջին խմբի նմուշի միջին ցուցանիշն ավելի քիչ է, քան երկրորդում: Նշանակու՞մ է սա արդյոք, որ ընդհանուր հարաբերակցությունը նույն հարաբերակցությունն է. M 1< М 2 ? Достаточно ли статистических данных для такого вывода? Ответы на эти вопросы и дает վիճակագրական վարկածի փորձարկում:

Վիճակագրական վարկած- դա ենթադրություն է բնակչության հատկությունների մասին:

Մենք կքննարկենք հատկությունների վերաբերյալ վարկածներ երկուսըընդհանուր բնակչություն:

Եթե ​​բնակչությունն ունի հայտնի է, նույնըգնահատված քանակի բաշխումը, և ենթադրությունները վերաբերում են մեծություններին որոշ պարամետրայս բաշխման, ապա կոչվում են վարկածներ պարամետրայինՕրինակ, նմուշները կազմվում են բնակչությունից, որոնց հետ կա նորմալ օրենքբաշխումը և նույն շեղումը: Դուք ուզում եք պարզել նույնն ենայս բնակչության ընդհանուր միջին ցուցանիշները:

Եթե ​​ընդհանուր բնակչության բաշխման օրենքների մասին ոչինչ հայտնի չէ, ապա դրանց հատկությունների վերաբերյալ վարկածներ են կոչվում ոչ պարամետրայինՕրինակ, նույնն ենընդհանուր բնակչության բաշխման օրենքները, որոնցից արդյունահանվում են նմուշներ:

Ullրոյական և այլընտրանքային վարկածներ:

Հիպոթեզների փորձարկման խնդիրը: Նշանակության մակարդակը

Եկեք ծանոթանանք վարկածի փորձարկումում օգտագործվող տերմինաբանությանը:

H 0 - զրոյական վարկած (սկեպտիկի վարկած) - սա վարկած է ոչ մի տարբերությունհամեմատված նմուշների միջեւ: Սկեպտիկոսը կարծում է, որ հետազոտության արդյունքներից ստացված նմուշի գնահատումների տարբերությունները պատահական են.

Հ 1- այլընտրանքային վարկածը (լավատեսական վարկած) `համեմատված նմուշների միջև տարբերությունների առկայության վարկած: Լավատեսը կարծում է, որ ընտրանքի գնահատումների տարբերությունները պայմանավորված են օբյեկտիվ պատճառներով և համապատասխանում են ընդհանուր բնակչության միջև եղած տարբերություններին:

Վիճակագրական վարկածների փորձարկումն իրագործելի է միայն այն դեպքում, երբ հնարավոր է կազմել որոշները մեծություն(չափանիշ), որի բաշխման մասին օրենքը արդարության դեպքում Հ 0հայտնի է Ապա այս քանակի համար կարելի է նշել վստահության միջակայք,որում տրված հավանականությամբ Ռ դընկնում է իր արժեքի մեջ: Այս միջակայքը կոչվում է կրիտիկական տարածք:Եթե ​​չափանիշի արժեքը ընկնում է կրիտիկական շրջանի մեջ, ապա վարկածն ընդունվում է Հ 0Հակառակ դեպքում ընդունվում է H 1 վարկածը:

Բժշկական հետազոտություններում օգտագործվում են P d = 0.95 կամ P d = 0.99: Այս արժեքները համապատասխանում են նշանակության մակարդակներըα = 0,05 կամ α = 0,01:

Վիճակագրական վարկածները փորձարկելիսնշանակության մակարդակը(α) զրոյական վարկածը մերժելու հավանականությունն է, երբ դա ճիշտ է:

Նշենք, որ իր հիմքում վարկածի փորձարկման կարգը միտված է տարբերությունների հայտնաբերում,եւ ոչ թե հաստատել դրանց բացակայությունը: Երբ չափանիշի արժեքը դուրս է գալիս կրիտիկական տարածքի սահմաններից, մենք կարող ենք մաքուր սրտով ասել «հոռետեսին». Լավ, էլ ի՞նչ եք ուզում: Եթե ​​տարբերություններ չլինեին, ապա 95% (կամ 99%) հավանականությամբ, հաշվարկված արժեքը կլիներ նշված սահմաններում: Բայց ոչ! ..

Դե, եթե չափանիշի արժեքը ընկնում է կրիտիկական շրջանի մեջ, ապա հիմք չկա հավատալու, որ H 0 վարկածը ճիշտ է: Սա, ամենայն հավանականությամբ, մատնանշում է երկու հնարավոր պատճառներից մեկը:

1. Նմուշի չափերն այնքան մեծ չեն, որ տարբերությունները հայտնաբերվեն: Հավանական է, որ շարունակական փորձերը հաջողություն կբերեն:

2. Տարբերություններ կան: Բայց դրանք այնքան փոքր են, որ գործնական նշանակություն չունեն: Այս դեպքում փորձերի շարունակությունն իմաստ չունի:

Եկեք անցնենք դիտարկման որոշ բժշկական վիճակագրական վարկածներ, որոնք օգտագործվում են բժշկական հետազոտություններում:

3.6. ՏԱՐԱԱՇՐ EԱՆԱՅԻՆ ՀԱՍՏԱՏՈՒԹՅԱՆ ՀԻՓՈԹԵԻ ՎԵՍՏԱՈՒՄ, FISCHER F- ՉԱՓՈՆԱԿԱՆ

Որոշ կլինիկական ուսումնասիրություններում դրական ազդեցությունն այդքան էլ չի վկայում մեծությունուսումնասիրված պարամետրի, որքան է դա կայունացում,նրա տատանումների նվազում: Այս պարագայում հարց է առաջանում `ընտրանքային հետազոտության արդյունքների հիման վրա երկու ընդհանուր տատանումների համեմատության մասին: Այս խնդիրը կարելի է լուծել դրանով Ֆիշերի չափանիշը:

Խնդրի ձևակերպում

նորմալ օրենքբաշխում. Նմուշի չափսեր -

n 1և n 2,բայց ընտրանքային տատանումներհավասար են s 1 և s 2 2 ընդհանուր տատանումներ:

Ստուգելի վարկածներ.

Հ 0- ընդհանուր տատանումներ նույնն են;

Հ 1- ընդհանուր տատանումներ տարբեր են

Shուցադրվում է, եթե նմուշները հանվում են ընդհանուր բնակչությունից նորմալ օրենքբաշխում, ապա եթե վարկածը ճիշտ է Հ 0ընտրանքի տատանումների հարաբերակցությունը ենթարկվում է Fisher- ի բաշխմանը: Հետեւաբար, որպես վավերությունը ստուգելու չափանիշ Հ 0արժեքը վերցված է F,հաշվարկված բանաձևով.

որտեղ s 1-ը և s 2-ը ընտրանքային տարբերություններ են:

Այս հարաբերակցությունը ենթարկվում է Ֆիշերի բաշխմանը `ν 1 = համարիչի ազատության աստիճանի քանակով n 1- 1 և հայտարարի ν 2 = n 2 - ազատության աստիճանի քանակը. 1. Կրիտիկական շրջանի սահմանները հայտնաբերվում են ըստ Ֆիշերի բաշխման աղյուսակների կամ օգտագործելով BRASPOBR համակարգչային գործառույթը:

Աղյուսակում ներկայացված օրինակի համար. 3.4, մենք ստանում ենք `ν 1 = ν 2 = 20 - 1 = 19; Ֆ= 2.16 / 4.05 = 0.53: Α = 0,05-ի սահմաններում կրիտիկական շրջանի սահմանները համապատասխանաբար հավասար են ՝ = 0,40, = 2,53:

Չափանիշի արժեքը ընկավ կրիտիկական տարածաշրջան, ուստի վարկածն ընդունված է Հ 0:նմուշների ընդհանուր տատանումները նույնն են.

3.7. ՆՇԱՆԱԿՈՒՄ Է ՀԱՍԱՐԱԿՈՒԹՅԱՆ ՀԻՓՈԹԵԻ ՉԵԿՆ, ՈՒՍԱՆՈ tՆԵՐԻ ՏԵ CRԵԿԱԳԻՐ

Համեմատության առաջադրանք միջիներկու ընդհանուր բնակչություն առաջանում է, երբ դա գործնական նշանակություն ունի մեծությունուսումնասիրվող հատկությունը: Օրինակ ՝ բուժման պայմանները երկու տարբեր մեթոդների կամ դրանց օգտագործման արդյունքում առաջացող բարդությունների քանակի համեմատության ժամանակ: Այս դեպքում կարող եք օգտագործել Ուսանողի t-test- ը:

Խնդրի ձևակերպում

Ստացվել են երկու նմուշներ (X 1) և (X 2), որոնք արդյունահանվել են ընդհանուր բնակչությունից նորմալ օրենքբաշխումը և նույն տատանումները:Նմուշի չափերը `n 1 և n 2, նմուշի միջոցներհավասար են X 1 և X 2, և ընտրանքային տատանումներ- s 1 2 և s 2 2համապատասխանաբար Պահանջվում է համեմատել միմյանց հետ ընդհանուր միջինները:

Ստուգելի վարկածներ.

Հ 0- ընդհանուր միջիններ նույնն են;

Հ 1- ընդհանուր միջիններ տարբեր են

Ուցադրվում է, որ վարկածի վավերության դեպքում Հ 0 t- ի արժեքը, որը հաշվարկվում է բանաձևով.

բաշխված ուսանողի օրենքի համաձայն `ազատության աստիճաններ ν = ν 1 + + ν2 - 2:

Այստեղ, որտեղ ν 1 = ն 1 - 1 - ազատ նմուշի աստիճաններ առաջին նմուշի համար; ν 2 = ն 2 - 1 - երկրորդ նմուշի համար ազատության աստիճանի քանակն է:

Կրիտիկական շրջանի սահմանները հայտնաբերվում են t- բաշխման աղյուսակներից կամ TIDERINST համակարգչային գործառույթի օգտագործմամբ: Ուսանողի բաշխումը սիմետրիկ է զրոյի վերաբերյալ, ուստի կրիտիկական շրջանի ձախ և աջ սահմանները մեծությամբ նույնն են և նշանով հակառակ. - և

Աղյուսակում ներկայացված օրինակի համար. 3.4, մենք ստանում ենք.

ν 1 = ν 2 = 20 - 1 = 19; ν = 38, տ= -2.51. Α = 0,05 = 2,02-ով:

Չափանիշի արժեքը դուրս է գալիս կրիտիկական շրջանի ձախ սահմանից այն կողմ, ուստի մենք ընդունում ենք վարկածը Հ 1:ընդհանուր միջինները տարբեր ենԱվելին, ընդհանուր բնակչության միջին ցուցանիշը առաջին նմուշըՔԻՉ:

Ուսանողի t- թեստի կիրառելիությունը

Ուսանողի թեստը կիրառելի է միայն նմուշներից նորմալագրեգատներ հետ նույն ընդհանուր տատանումները:Եթե ​​պայմաններից գոնե մեկը խախտվում է, ապա չափանիշի կիրառելիությունը կասկածելի է: Ընդհանուր բնակչության նորմալության պահանջը սովորաբար անտեսվում է ՝ վկայակոչելով կենտրոնական սահմանի թեորեմ:Իրոք, (3.10) - ի համարիչի ընտրանքի միջև տարբերությունը կարելի է համարել նորմալ բաշխված ν> 30-ի համար: Բայց տատանումների հավասարության հարցը հնարավոր չէ ստուգել, ​​և հղումները այն փաստի վրա, որ Ֆիշերի թեստը տարբերություններ չի հայտնաբերել, չեն կարող լինել հաշվի են առնվում. Այնուամենայնիվ, t- թեստը լայնորեն օգտագործվում է բնակչության միջին արժեքների տարբերությունները հայտնաբերելու համար, չնայած որ առանց հիմնավոր պատճառների:

Դիտարկվում է ստորև ոչ պարամետրական թեստ,որը հաջողությամբ օգտագործվում է նույն նպատակների համար և որը չի պահանջում որևէ նորմալություն,ոչ էլ տարաձայնությունների հավասարություն:

3.8. ԵՐԿՈՒ ՆՇԱՆՆԵՐԻ ՈՉ ՊԱՐԱՄԵՏՐԱԿԱՆ համեմատություն. Մեն-Ուիթնիի չափանիշ

Ոչ պարամետրական թեստերը նախատեսված են երկու ընդհանուր բնակչության բաշխման օրենքների տարբերությունները հայտնաբերելու համար: Չափանիշներ, որոնք զգայուն են ընդհանրապես տարբերությունների նկատմամբ միջին,կոչվում են չափանիշներ հերթափոխՉափանիշներ, որոնք զգայուն են ընդհանրապես տարբերությունների նկատմամբ տարաձայնություններ,կոչվում են չափանիշներ մասշտաբ Mann-Whitney չափանիշը վերաբերում է չափանիշներին հերթափոխև օգտագործվում է երկու ընդհանուր պոպուլյացիաների միջև տարբերությունները հայտնաբերելու համար, որոնց նմուշները ներկայացված են աստիճանի սանդղակ:Չափված հատկությունները տեղակայված են այս մասշտաբով աճման կարգով, ապա համարակալվում են 1, 2 ամբողջ թվերով ... Այս թվերը կոչվում են շարքերըՀավասար արժեքներին նշանակվում են նույն կոչումները: Կարևոր է ոչ թե հենց հատկության չափը, այլ միայն շարքային տեղ,որը այն դասվում է այլ մեծությունների շարքում:

Աղյուսակ 3.5. 3.4 աղյուսակից առաջին խումբը ներկայացված է ընդլայնված տեսքով (տող 1), ենթարկվում է դասակարգման (հոսք 2), այնուհետև նույն արժեքների շարքերը փոխարինվում են միջին թվաբանական արժեքներով: Օրինակ, առաջին շարքի 4-րդ և 4-րդ տարրերին տրվեց 2-րդ և 3-րդ դասարաններ, որոնք այնուհետև փոխարինվում են նույն 2.5 արժեքով:

Աղյուսակ 3.5

Խնդրի ձևակերպում

Անկախ նմուշներ (X 1)և (X 2)արդյունահանված անհայտ բաշխման օրենքներով բնակչություններից: Նմուշի չափերը n 1և n 2համապատասխանաբար Տարրի նմուշի արժեքները ներկայացված են աստիճանի սանդղակ:Դուք ուզում եք ստուգել, ​​արդյոք այս բնակչությունը տարբերվո՞ւմ է միմյանցից:

Ստուգելի վարկածներ.

Հ 0- նմուշները պատկանում են նույն ընդհանուր բնակչությանը. Հ 1- նմուշները պատկանում են տարբեր ընդհանուր պոպուլյացիաների:

Նման վարկածները ստուգելու համար (/-mann-Whitney) թեստը:

Նախ, երկու նմուշից պատրաստվում է համակցված նմուշ (X), որի տարրերը դասակարգվում են: Դրանից հետո հայտնաբերվում է առաջին նմուշի տարրերին համապատասխանող շարքերի հանրագումարը: Այս գումարը վարկածների փորձարկման չափանիշ է:

Ու= Առաջին նմուշի շարքերի հանրագումար: (3.11)

Անկախ նմուշների համար, որոնց ծավալը գերազանցում է 20-ը, արժեքը Ուենթարկվում է նորմալ բաշխմանը, որի մաթեմատիկական սպասումն ու ստանդարտ շեղումը հավասար են.

Հետեւաբար, կրիտիկական տարածքի սահմանները հայտնաբերվում են նորմալ բաշխման աղյուսակներում:

Աղյուսակում ներկայացված օրինակի համար. 3.4, մենք ստանում ենք. Ν 1 = ν 2 = 20 - 1 = 19, Ու= 339, μ = 410, σ = 37. α = 0,05-ի համար մենք ստանում ենք. Եվ առյուծը = 338, և աջը = 482:

Չափանիշի արժեքը դուրս է գալիս կրիտիկական շրջանի ձախ սահմանից այն կողմ, հետևաբար, ընդունված է H 1 վարկածը. Ընդհանուր բնակչությունն ունի բաշխման տարբեր օրենքներ: Ավելին, ընդհանուր բնակչության միջին ցուցանիշը առաջին նմուշըՔԻՉ:

Սոցիալ-տնտեսական երեւույթների և գործընթացների ուսումնասիրության ամենակարևոր փուլը առաջնային տվյալների համակարգումն է և դրա հիման վրա ընդհանուր օբյեկտի օգտագործմամբ ամբողջ օբյեկտի ամփոփ բնութագրերի ստացումը, որը ձեռք է բերվում առաջնային վիճակագրական նյութի ամփոփման և խմբավորման միջոցով:

Վիճակագրական ամփոփում մի շարք կազմող հատուկ անհատական ​​փաստերն ընդհանրացնելու, ընդհանուր առմամբ ուսումնասիրվող ֆենոմենին բնորոշ առանձնահատկություններն ու օրինաչափությունները բացահայտելու համար հաջորդական գործողությունների համալիր է: Վիճակագրական ամփոփագրի անցկացումը ներառում է հետևյալ քայլերը :

  • խմբավորման հատկության ընտրություն;
  • խմբերի կազմավորման կարգի որոշում;
  • խմբերը և առարկան ընդհանուր առմամբ բնութագրելու վիճակագրական ցուցանիշների համակարգի մշակում;
  • ամփոփ արդյունքների ներկայացման համար վիճակագրական աղյուսակների դասավորությունների մշակում:

Վիճակագրական խմբավորում կոչվում է ուսումնասիրված բնակչության միավորների բաժանում միատարր խմբերի ՝ ըստ նրանց համար անհրաժեշտ էական հատկությունների: Խմբավորումները վիճակագրական տվյալների ամփոփման ամենակարևոր վիճակագրական մեթոդն են, վիճակագրական ցուցանիշների ճիշտ հաշվարկման հիմքը:

Կան խմբավորումների հետևյալ տեսակները. Տիպաբանական, կառուցվածքային, վերլուծական: Այս բոլոր խմբավորումներին միավորում է այն փաստը, որ օբյեկտի միավորները որոշ չափանիշների համաձայն բաժանվում են խմբերի:

Խմբավորման նշան կոչվում է հատկանիշ, որով իրականացվում է բնակչության միավորների բաժանումը առանձին խմբերի: Վիճակագրական ուսումնասիրության եզրակացությունները կախված են խմբավորման հատկության ճիշտ ընտրությունից: Որպես խմբավորման հիմք `անհրաժեշտ է օգտագործել էական, տեսականորեն հիմնավորված հատկություններ (քանակական կամ որակական):

Խմբավորման քանակական նշաններ ունեն թվային արտահայտություն (առևտրի ծավալը, անձի տարիքը, ընտանիքի եկամուտը և այլն), և խմբավորման որակական նշաններ արտացոլում են ընդհանուրի միավորի վիճակը (սեռ, ընտանեկան դրություն, ձեռնարկության արդյունաբերության պատկանելություն, դրա սեփականության ձև և այլն):

Խմբավորման հիմքը պարզելուց հետո պետք է որոշվի այն խմբերի քանակի հարցը, որոնցում պետք է բաժանվի ուսումնասիրված բնակչությունը: Խմբերի քանակը կախված է ուսումնասիրության նպատակներից և խմբավորման հիմքում ընկած ցուցիչի տեսակից, բնակչության ծավալից, հատկության տատանման աստիճանից:

Օրինակ, ձեռնարկությունների խմբավորումը ըստ սեփականության տեսակի հաշվի է առնում ֆեդերացիայի սուբյեկտների քաղաքային, դաշնային և ունեցվածքը: Եթե ​​խմբավորումն իրականացվում է քանակական հիմունքներով, ապա անհրաժեշտ է հատուկ ուշադրություն դարձնել ուսումնասիրված օբյեկտի միավորների քանակին և խմբավորման հատկության փոփոխականության աստիճանին:

Երբ որոշվում է խմբերի քանակը, պետք է որոշվեն խմբավորման միջակայքերը: Ընդմիջում - սրանք փոփոխական հատկության արժեքներ են, որոնք ընկած են որոշակի սահմաններում: Յուրաքանչյուր ընդմիջում ունի իր արժեքը, վերին և ստորին սահմանները կամ դրանցից գոնե մեկը:

Ինտերվալի ստորին սահմանը միջակայքում նշվում է հատկության ամենափոքր արժեքը, և վերին սահմանը - միջակայքում հատկության ամենամեծ արժեքը: Ընդմիջման արժեքը վերին և ստորին սահմանների միջև տարբերությունն է:

Խմբավորման միջակայքերը, կախված դրանց չափից, հետևյալն են. Հավասար և անհավասար: Եթե ​​հատկության տատանումն արտահայտվում է համեմատաբար նեղ սահմաններում, և բաշխումը միատեսակ է, ապա հավասար ընդմիջումներով խմբավորում է կառուցվում: Հավասար ընդմիջման արժեքը որոշվում է հետևյալ բանաձևով :

որտեղ Xmax, Xmin հատկանիշի առավելագույն և նվազագույն արժեքներն են ագրեգատում. n խմբերի քանակն է:

Ամենապարզ խմբավորումը, որում յուրաքանչյուր ընտրված խումբ բնութագրվում է մեկ ցուցանիշով, բաշխման շարք է:

Վիճակագրական բաշխման շարք - Սա բնակչության միավորների խմբավորված խմբերի է `ըստ որոշակի հատկության: Կախված բաշխման շարքի ձևավորման հիմքում ընկած հատկությունից `առանձնացվում են վերագրման և տատանումների բաշխման շարքերը:

Հատկանշական զանգահարել բաշխման շարքը ՝ կառուցված ըստ որակական հատկանիշների, այսինքն ՝ բնութագրեր, որոնք չունեն թվային արտահայտություն (բաշխում ըստ աշխատանքի տեսակի, ըստ սեռի, մասնագիտության և այլն) Հատկանշական բաշխման շարքերը բնութագրում են բնակչության կազմը այս կամ այն ​​էական հատկությունների համար: Մի քանի ժամանակահատվածում վերցված այս տվյալները թույլ են տալիս ուսումնասիրել կառուցվածքի փոփոխությունը:

Վարիացիոն շարքեր կոչվում են քանակական հիմքի վրա կառուցված բաշխման շարքեր: Varանկացած տատանումների շարք բաղկացած է երկու տարրերից `ընտրանքներ և հաճախականություններ: Վարիանտներ կոչվում են հատկանիշի անհատական ​​արժեքները, որոնք նա տանում է տատանումների շարքում, այսինքն փոփոխվող հատկության հատուկ արժեքը:

Հաճախականությունները կոչվում է անհատական ​​տարբերակների քանակը կամ տատանումների շարքի յուրաքանչյուր խումբ, այսինքն ՝ սրանք թվեր են, որոնք ցույց են տալիս, թե որքան հաճախ են որոշ տարբերակներ հայտնաբերվում բաշխման շարքերում: Բոլոր հաճախականությունների հանրագումարը որոշում է ամբողջ բնակչության չափը, դրա ծավալը: Հաճախականությունները կոչվում են հաճախականություններ ՝ արտահայտված միավորի կոտորակներով կամ ընդհանուրի տոկոսով: Ըստ այդմ, հաճախականությունների գումարը 1 կամ 100% է:

Կախված հատկության տատանման բնույթից `առանձնանում են տատանումների շարքի երեք ձևեր` դասակարգված շարք, դիսկրետ շարք և ընդմիջումային շարք:

Վարկանիշային տատանումների շարք - Սա բնակչության առանձին միավորների բաշխումն է ՝ ուսումնասիրված հատկության աճման կամ նվազման կարգով Վարկանիշը թույլ է տալիս հեշտությամբ բաժանել քանակական տվյալները խմբերի, անմիջապես գտնել հատկության ամենափոքր և ամենամեծ արժեքները, ընդգծել այն արժեքները, որոնք առավել հաճախ կրկնվում են:

Դիսկրետ տատանումների շարք բնութագրում է բնակչության միավորների բաշխումը ըստ առանձնացված հատկության, որը տանում է միայն ամբողջ արժեքներ: Օրինակ ՝ աշխատավարձի կատեգորիան, ընտանիքի երեխաների թիվը, ձեռնարկությունում աշխատողների թիվը և այլն:

Եթե ​​որևէ հատկություն ունի անընդհատ փոփոխություն, որը որոշակի սահմաններում կարող է ցանկացած արժեք վերցնել («-ից-ից»), ապա այս հատկության համար անհրաժեշտ է կառուցել միջակայքի տատանումների շարք ... Օրինակ ՝ եկամտի չափը, աշխատանքային փորձը, ձեռնարկության հիմնական միջոցների արժեքը և այլն:

«Վիճակագրական ամփոփում և խմբավորում» թեմայով խնդիրների լուծման օրինակներ

Խնդիր 1 ... Տեղեկություններ կան անցած ուսումնական տարվա ուսանողների բաժանորդագրությամբ ստացված գրքերի քանակի մասին:

Կառուցել դասակարգված և դիսկրետ տատանումների բաշխման շարք `նշելով շարքի տարրերը:

Լուծում

Այս հավաքածուն ներկայացնում է ուսանողների ստացած գրքերի քանակի բազմաթիվ տարբերակներ: Եկեք հաշվենք նման ընտրանքների քանակը և դրանք դասավորենք տատանումային միջակայքում և տատանումային դիսկրետ բաշխման շարքերի տեսքով:

Առաջադրանք 2 ... Կան տվյալներ հիմնական ձեռնարկությունների արժեքի մասին 50 ձեռնարկությունների համար, հազար ռուբլի:

Կառուցեք բաշխումների շարք ՝ առանձնացնելով ձեռնարկությունների 5 խումբ (հավասար ընդմիջումներով):

Լուծում

Լուծման համար մենք կընտրենք ձեռնարկությունների հիմնական միջոցների ինքնարժեքի ամենամեծ և ամենափոքր արժեքները: Սրանք 30,0 և 10,2 հազար ռուբլի են:

Եկեք գտնենք ընդմիջման չափը. H = (30.0-10.2): 5 = 3.96 հազար ռուբլի:

Այնուհետև առաջին խումբը կներառի 10,2 հազար ռուբլուց հիմնական միջոցներ ունեցող ձեռնարկություններ: մինչեւ 10,2 + 3,96 = 14,16 հազար ռուբլի: Կլինեն այդպիսի 9 ձեռնարկություններ: Երկրորդ խումբը կներառի ձեռնարկություններ, որոնց հիմնական միջոցների չափը կկազմի 14,16 հազար ռուբլի: մինչեւ 14,16 + 3,96 = 18,12 հազար ռուբլի: Նման ձեռնարկություններ կլինեն 16: Նմանապես, մենք կգտնենք երրորդ, չորրորդ և հինգերորդ խմբերում ընդգրկված ձեռնարկությունների քանակը:

Արդյունքում բաշխման շարքը տեղադրված է աղյուսակում:

Խնդիր 3 ... Թեթև արդյունաբերության մի շարք ձեռնարկությունների համար ստացվել են հետևյալ տվյալները.

Ձեռնարկությունները խմբավորեք ըստ աշխատողների քանակի ՝ հավասար ընդմիջումներով կազմելով 6 խումբ: Հաշվեք յուրաքանչյուր խմբի համար.

1. ձեռնարկությունների քանակը
2. աշխատողների թիվը
3. տարեկան արտադրվող արտադրանքի ծավալը
4. մեկ աշխատողի միջին փաստացի արտադրանքը
5. հիմնական միջոցների ծավալը
6. մեկ ձեռնարկության հիմնական միջոցների միջին չափը
7. մեկ ձեռնարկության կողմից արտադրված ապրանքների միջին արժեքը

Լրացրեք հաշվարկի արդյունքները աղյուսակներում: Եզրակացություններ արեք:

Լուծում

Լուծման համար մենք կընտրենք ձեռնարկությունում աշխատողների միջին թվաքանակի ամենամեծ և ամենափոքր արժեքները: Սրանք 43-ն են և 256-ը:

Գտեք ընդմիջման չափը. H = (256-43) ՝ 6 = 35,5

Այնուհետև առաջին խումբը կներառի ձեռնարկություններ, որոնց միջին աշխատողների թիվը 43-ից 43 + 35,5 = 78,5 մարդ է: Կլինեն այդպիսի 5 ձեռնարկություններ: Երկրորդ խումբը կներառի ձեռնարկություններ, որոնց միջին աշխատողների թիվը կլինի 78,5-ից 78,5 + 35,5 = 114 մարդ: Նման ձեռնարկություններ կլինեն 12: Նմանապես, մենք կգտնենք երրորդ, չորրորդ, հինգերորդ և վեցերորդ խմբերում ընդգրկված ձեռնարկությունների քանակը:

Արդյունքում բաշխման շարքը դնում ենք աղյուսակում և յուրաքանչյուր խմբի համար հաշվարկում անհրաժեշտ ցուցանիշները.

Եզրակացություն Ինչպես երեւում է աղյուսակից, ձեռնարկությունների երկրորդ խումբն ամենաշատն է: Այն ներառում է 12 ձեռնարկություն: Ամենափոքրը հինգերորդ և վեցերորդ խմբերն են (երկու ձեռնարկություն): Սրանք ամենամեծ ձեռնարկություններն են (աշխատողների թվաքանակի առումով):

Քանի որ երկրորդ խումբը ամենաշատն է, այս խմբի ձեռնարկությունների կողմից տարեկան արտադրվող ապրանքների ծավալը և հիմնական միջոցների ծավալը զգալիորեն ավելին են, քան մյուսները: Միևնույն ժամանակ, այս խմբի ձեռնարկություններում մեկ աշխատողի միջին փաստացի արտադրանքը ամենաբարձրը չէ: Այստեղ չորրորդ խմբի ձեռնարկություններն առաջատար են: Այս խմբին են պատկանում նաև հիմնական միջոցների բավականին մեծ քանակություն:

Ամփոփելով, մենք նշում ենք, որ հիմնական ձեռնարկությունների միջին չափը և մեկ ձեռնարկության արտադրանքի միջին արժեքը ուղղակիորեն համամասնական են ձեռնարկության չափին (ըստ աշխատողների թվաքանակի):

Թիվ 1 լաբորատոր աշխատանք

Մաթեմատիկական վիճակագրությամբ

Թեմա ՝ փորձնական տվյալների առաջնային մշակում

3. Միավորների քան-միավոր: մեկը

5. Վերահսկիչ հարցեր .. 2

6. Լաբորատոր աշխատանքների կատարման մեթոդաբանություն: 3

աշխատանքի նպատակը

Մաթեմատիկական վիճակագրության մեթոդներով էմպիրիկ տվյալների առաջնային մշակման հմտությունների ձեռքբերում:

Ելնելով փորձարարական տվյալների ամբողջությունից ՝ կատարեք հետևյալ առաջադրանքները.

Վարժություն 1:Կառուցեք բաշխման միջակայքային տատանումների շարքը:

Առաջադրանք 2:Կառուցել ընդմիջման տատանումների շարքի հաճախականությունների հիստոգրամա:

Առաջադրանք 3:Կազմեք էմպիրիկ բաշխման գործառույթ և կազմեք գրաֆիկ:

ա) նորաձեւություն և միջին

բ) պայմանական սկզբնական պահերը.

գ) նմուշի միջին.

դ) ընտրանքի շեղում, ընդհանուր բնակչության շտկված շեղում, շտկված ստանդարտ շեղում.

ե) տատանումների գործակիցը.

զ) ասիմետրիա.

է) ավելցուկ;

Առաջադրանք 5:Որոշեք տրված հուսալիությամբ ուսումնասիրված պատահական փոփոխականի թվային բնութագրերի իրական արժեքների սահմանները:

Առաջադրանք 6:Առաջնային վերամշակման արդյունքների էական մեկնաբանում ՝ ըստ խնդրի վիճակի:

Հաշիվ միավորներով

Հարցումներ 1-56 միավոր

Առաջադրանք 62 միավոր

Լաբորատոր աշխատանքների պաշտպանություն(բանավոր հարցազրույց վերահսկողական հարցերի և լաբորատոր աշխատանքների վերաբերյալ) - 2 միավոր

Ստեղծագործությունը պետք է գրավոր ներկայացվի A4 թերթի վրա և ներառում է.

1) Վերնագրի էջ (հավելված 1)

2) նախնական տվյալներ.

3) աշխատանքների ներկայացում `ըստ նշված նմուշի:

4) հաշվարկման արդյունքները (կատարվում են ձեռքով և (կամ օգտագործելով MS Excel)) նշված կարգով:

5) եզրակացություններ `առաջնային մշակման արդյունքների իմաստալից մեկնաբանություն` ըստ խնդրի վիճակի:

6) բանավոր հարցազրույց աշխատանքի և թեստի հարցերի վերաբերյալ:



5. Վերահսկիչ հարցեր


Լաբորատոր աշխատանքի տեխնիկա

Առաջադրանք 1. Կառուցել բաշխման միջակայքային տատանումների շարք

Որպեսզի վիճակագրական տվյալները ներկայացվեն տատանումային շարքի տեսքով `հավասարաչափ տարածված ընտրանքներով, անհրաժեշտ է.

1. Գտեք ամենափոքր և ամենամեծ արժեքները տվյալների բնօրինակ աղյուսակում:

2. Սահմանել տատանումների տիրույթ :

3. Որոշեք h միջակայքի երկարությունը, եթե նմուշը պարունակում է մինչև 1000 տվյալ, օգտագործեք բանաձևը. , որտեղ n - նմուշի չափը - նմուշում առկա տվյալների քանակը; lgn- ն օգտագործվում է հաշվարկների համար):

Հաշվարկված հարաբերակցությունը կլորացվում է դեպի հարմար ամբողջ արժեք .

4. Որոշեք առաջին ընդմիջման սկիզբը զույգ թվով ընդմիջումների համար: Խորհուրդ է տրվում վերցնել արժեքը. և տարօրինակ ընդմիջումներով:

5. Գրեք խմբավորման միջակայքերը և դրանք դասավորեք ըստ աճող սահմանների

, ,………., ,

որտեղ է առաջին ընդմիջման ստորին սահմանը: Հարմար թիվ է վերցված, ոչ ավելին, վերջին ընդմիջման վերին սահմանը պետք է լինի ոչ պակաս: Առաջարկվում է, որ ընդմիջումները պարունակում են պատահական փոփոխականի սկզբնական արժեքներ և առանձնացված են դրանցից 5-ից 20-ըընդմիջումներով

6. Գրանցեք նախնական տվյալները խմբավորումների ընդմիջումների վերաբերյալ, այսինքն. հաշվարկել պատահական փոփոխականի արժեքների քանակը, որը ընկնում է նշված ընդմիջումների մեջ, ըստ բնօրինակ աղյուսակի: Եթե ​​որոշ արժեքներ համընկնում են ընդմիջումների սահմանների հետ, ապա դրանք վերաբերում են կա՛մ միայն նախորդին, կա՛մ միայն հետագա միջակայքին:

Նշում 1:Անհրաժեշտ չէ, որ ընդմիջումները հավասար լինեն երկարությամբ: Այն տարածքներում, որտեղ արժեքներն ավելի խիտ են, ավելի հարմար է վերցնել ավելի փոքր, ավելի կարճ ընդմիջումներ, իսկ ավելի հազվադեպ ՝ ավելի մեծ:

Նշում 2.Եթե որոշ արժեքների համար ստացվում են «զրոյական» կամ հաճախականությունների փոքր արժեքներ, ապա անհրաժեշտ է տվյալների վերախմբավորումը `ընդլայնելով ընդմիջումները (քայլը մեծացնելով):