Հաճախականությունների և հարվածների վստահության միջակայքերը: Նմուշներ և վստահության միջակայքեր

Վստահության միջակայքերը.

Վստահության միջակայքի հաշվարկը հիմնված է համապատասխան պարամետրի միջին սխալի վրա: Վստահության միջակայք ցույց է տալիս սահմանները (1-ա) հավանականությամբ, գնահատված պարամետրի իրական արժեքը. Այստեղ a-ն նշանակության մակարդակն է, (1-a) կոչվում է նաև վստահության մակարդակ:

Առաջին գլխում մենք ցույց տվեցինք, որ, օրինակ, թվաբանական միջինի համար իրական բնակչության միջինը դեպքերի մոտ 95%-ում գտնվում է միջինի 2 միջին սխալների սահմաններում: Այսպիսով, միջինի համար 95% վստահության միջակայքի սահմանները ընտրանքի միջինից կբաժանվեն միջինի միջին սխալի կրկնապատիկով, այսինքն. Մենք միջինի միջին սխալը բազմապատկում ենք ինչ-որ գործակցով՝ կախված վստահության մակարդակից: Միջինների և միջինների տարբերության համար վերցվում է Ուսանողի գործակիցը (Ուսանողի թեստի կրիտիկական արժեքը), բաժնետոմսերի բաժնեմասի և տարբերության համար՝ z չափանիշի կրիտիկական արժեքը։ Միջին սխալով գործակցի արտադրյալը կարելի է անվանել այս պարամետրի սահմանային սխալ, այսինքն. առավելագույնը, որը մենք կարող ենք ստանալ այն գնահատելիս:

Վստահության միջակայքը համար թվաբանական միջին : .

Ահա միջին նմուշը.

Միջին թվաբանական սխալը;

s -նմուշի ստանդարտ շեղում;

n

f = n-1 (Ուսանողի գործակից):

Վստահության միջակայքը համար թվաբանական միջոցների տարբերություն :

Ահա ընտրանքային միջոցների տարբերությունը.

- թվաբանական միջինների տարբերության միջին սխալը.

s 1, s 2 -նմուշի ստանդարտ շեղումներ;

n 1, n 2

Ուսանողի չափանիշի կրիտիկական արժեքը տվյալ նշանակության մակարդակի և ազատության աստիճանների համար f = n 1 + n 2-2 (Ուսանողի գործակից):

Վստահության միջակայքը համար կիսվել :

.

Այստեղ d-ն ընտրանքի արագությունն է.

- բաժնետոմսերի միջին սխալ;

n- ընտրանքի չափը (խմբի չափը);

Վստահության միջակայքը համար բաժնետոմսերի տարբերությունը :

Ահա նմուշի բաժնետոմսերի տարբերությունը.

- թվաբանական միջինների տարբերության միջին սխալը.

n 1, n 2- նմուշների ծավալներ (խմբերի քանակը);

z չափանիշի կրիտիկական արժեքը տվյալ մակարդակում նշանակության a (,,).

Հաշվարկելով ցուցիչների տարբերության վստահության միջակայքերը, մենք, առաջին հերթին, ուղղակիորեն տեսնում ենք ազդեցության հնարավոր արժեքները, և ոչ միայն դրա կետային գնահատումը: Երկրորդ, մենք կարող ենք եզրակացություն անել զրոյական վարկածի ընդունման կամ հերքման մասին և, երրորդ, կարող ենք եզրակացություն անել չափանիշի ուժի մասին:

Վստահության միջակայքերով վարկածները ստուգելիս պետք է հետևել հետևյալ կանոնին.

Եթե ​​միջինների տարբերության 100 (1-ա) տոկոս վստահության միջակայքը զրո չի պարունակում, ապա տարբերությունները վիճակագրորեն նշանակալի են նշանակալիության մակարդակում a; ընդհակառակը, եթե այս ինտերվալը պարունակում է զրո, ապա տարբերությունները վիճակագրորեն նշանակալի չեն։

Իսկապես, եթե այս ինտերվալը պարունակում է զրո, ապա դա նշանակում է, որ համեմատվող ցուցանիշը խմբերից մեկում կարող է լինել կամ շատ կամ պակաս՝ համեմատած մյուսի հետ, այսինքն. նկատված տարբերությունները պատահական են։

Ըստ այն վայրի, որտեղ զրոն վստահության միջակայքում է, կարելի է դատել չափանիշի ուժի մասին: Եթե ​​զրոն մոտ է միջակայքի ստորին կամ վերին սահմանին, ապա, հավանաբար, ավելի մեծ թվով համեմատվող խմբերի դեպքում տարբերությունները կհասնեն վիճակագրական նշանակության: Եթե ​​զրոն մոտ է միջակայքի կեսին, ապա դա նշանակում է, որ փորձարարական խմբում ցուցանիշի աճն ու նվազումը հավասարապես հավանական են, և, հավանաբար, իսկապես տարբերություններ չկան։

Օրինակներ.

Վիրահատական ​​մահացությունը համեմատել երկու տարբեր տեսակի անզգայացման կիրառման հետ. 61 մարդ վիրահատվել է առաջին տեսակի անզգայացման միջոցով, 8-ը մահացել է, երկրորդի կիրառմամբ՝ 67 մարդ, 10-ը մահացել են:

դ 1 = 8/61 = 0,131; դ 2 = 10/67 = 0,149; d1-d2 = - 0,018:

Համեմատված մեթոդների մահացության տարբերությունը կլինի (-0,018 - 0,122; -0,018 + 0,122) կամ (-0,14; 0,104) միջակայքում՝ 100 (1-ա) = 95% հավանականությամբ: Ինտերվալը պարունակում է զրո, այսինքն. նույն մահացության վարկածը երկու տարբեր տեսակի անզգայացման դեպքում չի կարելի մերժել:

Այսպիսով, մահացությունը կարող է և կնվազի մինչև 14% և կբարձրանա մինչև 10,4% 95% հավանականությամբ, այսինքն. զրոն գտնվում է մոտավորապես միջակայքի մեջտեղում, ուստի կարելի է պնդել, որ, ամենայն հավանականությամբ, այս երկու մեթոդները իրականում չեն տարբերվում մահացուությամբ:

Նախկինում դիտարկված օրինակում կտկտոցների թեստի միջին ժամանակը համեմատվել է ուսանողների չորս խմբերում, որոնք տարբերվում են քննությունների միավորներով: Եկեք հաշվարկենք վստահության միջակայքերը միջին սեղմման ժամանակի համար այն ուսանողների համար, ովքեր հանձնել են քննությունը 2-ին և 5-ին և վստահության միջակայքը այս միջինների տարբերության համար:

Մենք գտնում ենք Ուսանողի գործակիցները ըստ Ուսանողի բաշխման աղյուսակների (տես Հավելված). առաջին խմբի համար՝ = t (0.05; 48) = 2.011; երկրորդ խմբի համար՝ = t (0.05; 61) = 2.000: Այսպիսով, առաջին խմբի համար վստահության միջակայքերը. 152,8; 160,3): Այսպիսով, նրանց համար, ովքեր հանձնել են քննությունը 2-ով, սեղմման միջին ժամանակը տատանվում է 157,8 ms-ից մինչև 166,6 մվ միջակայքում՝ 95 հավանականությամբ, նրանց համար, ովքեր հանձնել են քննությունը 5-ով, 152,8 մվ-ից մինչև 160,3 մվ հավանականությամբ: 95%-ից:

Դուք կարող եք նաև ստուգել զրոյական վարկածը՝ օգտագործելով վստահության միջակայքերը միջոցների համար, և ոչ միայն միջինների տարբերության համար: Օրինակ, ինչպես մեր դեպքում, եթե միջոցների վստահության միջակայքերը համընկնում են, ապա զրոյական վարկածը չի կարող մերժվել: Նշանակության ընտրված մակարդակով վարկածը մերժելու համար համապատասխան վստահության միջակայքերը չպետք է համընկնեն:

Եկեք գտնենք 2-ով և 5-ով քննություն հանձնած խմբերի միջին սեղմման ժամանակի տարբերության վստահության միջակայքը: Միջինների տարբերությունը` 162,19 - 156,55 = 5,64: Ուսանողի գործակիցը՝ = t (0,05; 49 + 62-2) = t (0,05; 109) = 1,982: Խմբի ստանդարտ շեղումները հավասար կլինեն. ... Մենք հաշվարկում ենք միջոցների տարբերության միջին սխալը. Վստահության միջակայքը՝ = (5,64-1,982 * 2,87; 5,64 + 1,982 * 2,87) = (-0,044; 11,33):

Այսպիսով, 2-րդ և 5-րդ համարներում քննություն հանձնած խմբերում սեղմելու միջին ժամանակի տարբերությունը կլինի -0,044 ms-ից մինչև 11,33 ms միջակայքում: Այս միջակայքը ներառում է զրո, այսինքն. Քննությունը գերազանց հանձնածների միջին սեղմման ժամանակը կարող է աճել և նվազել՝ համեմատած նրանց հետ, ովքեր բավարար չափով չեն անցել թեստը, այսինքն. զրոյական վարկածը չի կարող մերժվել: Բայց զրոն շատ մոտ է ստորին սահմանին, սեղմելու ժամանակը շատ ավելի հավանական է, որ կնվազի այն հաջողությամբ անցածների դեպքում։ Այսպիսով, մենք կարող ենք եզրակացնել, որ 2-ը և 5-ը անցածների միջին սեղմման ժամանակի մեջ դեռևս կան տարբերություններ, մենք պարզապես չկարողացանք գտնել դրանք միջին ժամանակի, միջին ժամանակի տարածման և նմուշի ծավալների տվյալ փոփոխությամբ:



Թեստի հզորությունը սխալ զրո վարկածը մերժելու հավանականությունն է, այսինքն. գտնել տարբերություններ, որտեղ նրանք իրականում կան:

Թեստի հզորությունը որոշվում է՝ ելնելով նշանակության մակարդակից, խմբերի միջև եղած տարբերությունների մեծությունից, խմբերում արժեքների տարածվածությունից և նմուշների չափից:

Ուսանողի թեստի և շեղումների վերլուծության համար կարող եք օգտագործել զգայունության դիագրամներ:

Չափանիշի հզորությունը կարող է օգտագործվել խմբերի անհրաժեշտ քանակի նախնական որոշման ժամանակ։

Վստահության միջակայքը ցույց է տալիս այն սահմանները, որոնք ունեն գնահատված պարամետրի իրական արժեքը:

Վստահության միջակայքերը կարող են օգտագործվել վիճակագրական վարկածները ստուգելու և չափորոշիչների զգայունության վերաբերյալ եզրակացություններ անելու համար:

ԳՐԱԿԱՆՈՒԹՅՈՒՆ.

Glantz S. - Գլուխ 6.7.

Ռեբրովա Օ.Յու. - էջ 112-114, էջ 171-173, էջ 234-238։

Sidorenko E.V. - էջ 32-33:

Ուսանողների ինքնաքննության հարցեր.

1. Ո՞րն է թեստի կարդինալությունը:

2. Ո՞ր դեպքերում է անհրաժեշտ գնահատել չափանիշների ուժը:

3. Հզորության հաշվարկման մեթոդներ.

6. Ինչպե՞ս ստուգել վիճակագրական վարկածը՝ օգտագործելով վստահության միջակայքը:

7. Ի՞նչ կարող եք ասել թեստի հզորության մասին վստահության միջակայքը հաշվարկելիս:

Առաջադրանքներ.

Վիճակագրության մեջ կան երկու տեսակի գնահատումներ՝ կետ և միջակայք։ Միավոր գնահատականմեկ ընտրանքային վիճակագրություն է, որն օգտագործվում է բնակչության պարամետրը գնահատելու համար: Օրինակ, նմուշի միջինը ընդհանուր բնակչության մաթեմատիկական ակնկալիքների և ընտրանքի շեղումների կետային գնահատումն է Ս 2- ընդհանուր բնակչության շեղումների կետային գնահատում σ 2... ցույց է տրվել, որ ընտրանքային միջինը ընդհանուր բնակչության մաթեմատիկական ակնկալիքների անաչառ գնահատականն է: Ընտրանքի միջինը կոչվում է անկողմնակալ, քանի որ բոլոր ընտրանքի միջինը (նույն նմուշի չափի համար n) հավասար է ընդհանուր բնակչության մաթեմատիկական ակնկալիքին:

Նմուշի շեղումների համար Ս 2դարձավ բնակչության շեղումների անաչառ գնահատական σ 2, ընտրանքի շեղման հայտարարը պետք է հավասար լինի n – 1 , բայց չէ n... Այլ կերպ ասած, ընդհանուր բնակչության շեղումը բոլոր հնարավոր ընտրանքային շեղումների միջինն է:

Ընդհանուր բնակչության պարամետրերը գնահատելիս պետք է նկատի ունենալ, որ ընտրանքային վիճակագրությունը, ինչպիսիք են , կախված կոնկրետ նմուշներից։ Այս փաստը հաշվի առնել, ձեռք բերել միջակայքի գնահատումվերլուծվում է ընդհանուր բնակչության մաթեմատիկական ակնկալիքը, ընտրանքային միջոցների բաշխումը (մանրամասների համար տե՛ս): Կառուցված ինտերվալը բնութագրվում է որոշակի վստահության մակարդակով, որը ընդհանուր բնակչության իրական պարամետրի ճիշտ գնահատման հավանականությունն է: Նմանատիպ վստահության միջակայքերը կարող են օգտագործվել հատկանիշի մասնաբաժինը գնահատելու համար Ռև ընդհանուր բնակչության հիմնական բաշխված զանգվածը։

Ներբեռնեք նշումը ձևաչափով կամ օրինակներ ձևաչափով

Ընդհանուր բնակչության մաթեմատիկական ակնկալիքի վստահության միջակայքի գծագրում ստանդարտ շեղումով

Ընդհանուր բնակչության մեջ հատկանիշի մասնաբաժնի համար վստահության միջակայքի կառուցում

Այս բաժնում վստահության միջակայքի հասկացությունը տարածվում է կատեգորիկ տվյալների վրա: Սա թույլ է տալիս գնահատել հատկանիշի մասնաբաժինը ընդհանուր բնակչության մեջ: Ռօգտագործելով ընտրանքային դրույքաչափը ՌՍ= X /n... Ինչպես նշված է, եթե քանակները nՌև n(1 - p)գերազանցում է 5 թիվը, երկանդամ բաշխումը կարելի է մոտավորել նորմալով: Հետևաբար, ընդհանուր բնակչության մեջ հատկանիշի մասնաբաժինը գնահատելու համար Ռկարող է գծագրվել միջակայք, որի վստահության մակարդակն է (1 - α) х100%.


որտեղ էջՍ- հատկանիշի ընտրովի մասնաբաժինը հավասար է NS/n, այսինքն. հաջողությունների թիվը բաժանված ընտրանքի չափի վրա, Ռ- հատկանիշի մասնաբաժինը ընդհանուր բնակչության մեջ, Զ- ստանդարտացված նորմալ բաշխման կրիտիկական արժեքը, n- նմուշի չափը.

Օրինակ 3.Ենթադրենք, որ տեղեկատվական համակարգից վերցված է նմուշ, որը բաղկացած է վերջին ամսվա ընթացքում կատարված 100 հաշիվ-ապրանքագրերից: Ասենք, որ այդ հաշիվ-ապրանքագրերից 10-ը կազմված են սխալներով։ Այսպիսով, Ռ= 10/100 = 0,1: 95% վստահության մակարդակը համապատասխանում է Z = 1,96 կրիտիկական արժեքին:

Այսպիսով, հավանականությունը, որ հաշիվ-ապրանքագրերի 4,12%-ից 15,88%-ը պարունակում է սխալներ, կազմում է 95%:

Տվյալ ընտրանքի չափի համար ընդհանուր պոպուլյացիայի մեջ հատկանիշի մասնաբաժինը պարունակող վստահության միջակայքը կարծես ավելի լայն է, քան շարունակական պատահական փոփոխականի համար: Դա պայմանավորված է նրանով, որ շարունակական պատահական փոփոխականի չափումները պարունակում են ավելի շատ տեղեկատվություն, քան դասակարգային տվյալների չափումները: Այլ կերպ ասած, կատեգորիկ տվյալները, որոնք վերցնում են ընդամենը երկու արժեք, բավարար տեղեկատվություն չեն պարունակում դրանց բաշխման պարամետրերը գնահատելու համար:

Վվերջավոր պոպուլյացիայից ստացված գնահատումների հաշվարկ

Մաթեմատիկական ակնկալիքի գնահատում.Վերջնական բնակչության համար ուղղման գործակիցը ( fpc) օգտագործվել է ստանդարտ սխալը գործոնով նվազեցնելու համար: Պոպուլյացիայի պարամետրերի գնահատման համար վստահության միջակայքերը հաշվարկելիս կիրառվում է ուղղիչ գործոն այն իրավիճակներում, երբ նմուշները վերցվում են առանց վերադարձման: Այսպիսով, վստահության միջակայքը մաթեմատիկական ակնկալիքի համար, որը հավասար է վստահության մակարդակին (1 - α) х100%, հաշվարկվում է բանաձևով.

Օրինակ 4.Վերջնական բնակչության համար ուղղման գործոնի կիրառումը պատկերացնելու համար եկեք վերադառնանք օրինակ 3-ում վերը նշված հաշիվների միջին գումարի վստահության միջակայքի հաշվարկման խնդրին: Ենթադրենք, որ ընկերությունը ամսական թողարկում է 5000 հաշիվ-ապրանքագիր, և = 110,27 դոլար, Ս= 28,95 դոլար Ն = 5000, n = 100, α = 0,05, t 99 = 1,9842: Բանաձևով (6) մենք ստանում ենք.

Հատկանիշի մասնաբաժնի գնահատում:Առանց վերադարձի ընտրելիս վստահության միջակայքը հատկանիշի մասնաբաժնի համար, որն ունի վստահության մակարդակ հավասար (1 - α) х100%, հաշվարկվում է բանաձևով.

Վստահության միջակայքերը և էթիկական խնդիրները

Հաճախ էթիկական խնդիրներ են առաջանում բնակչության ընտրանքից և վիճակագրական եզրակացություններ կազմելիս: Հիմնականն այն է, թե ինչպես են համընկնում վստահության միջակայքերը և ընտրանքային վիճակագրության կետերի գնահատումները: Կետային գնահատականների հրապարակումն առանց համապատասխան վստահության միջակայքերի (սովորաբար 95% վստահության մակարդակի) և ընտրանքի չափերի, որոնցից դրանք ստացվել են, կարող են ապակողմնորոշիչ լինել: Սա կարող է օգտվողին տպավորություն ստեղծել, որ միավորի գնահատումը հենց այն է, ինչ նրան անհրաժեշտ է ամբողջ բնակչության հատկությունները կանխատեսելու համար: Այսպիսով, անհրաժեշտ է հասկանալ, որ ցանկացած հետազոտության ժամանակ ինտերվալային գնահատականները պետք է դրվեն առաջին պլանում: Բացի այդ, հատուկ ուշադրություն պետք է դարձնել նմուշի չափսերի ճիշտ ընտրությանը:

Ամենից հաճախ վիճակագրական մանիպուլյացիայի օբյեկտ են հանդիսանում տարբեր քաղաքական հարցերի վերաբերյալ բնակչության սոցիոլոգիական հարցումների արդյունքները։ Միաժամանակ հարցման արդյունքները դրվում են թերթերի առաջին էջերին, իսկ ընտրանքային հետազոտության սխալն ու վիճակագրական վերլուծության մեթոդաբանությունը տպվում են ինչ-որ տեղ մեջտեղում։ Ստացված միավորային գնահատումների վավերականությունն ապացուցելու համար անհրաժեշտ է նշել նմուշի չափը, որի հիման վրա դրանք ստացվել են, վստահության միջակայքի սահմանները և դրա նշանակության մակարդակը։

Հաջորդ նշումը

Լևինը և այլ վիճակագրություն մենեջերների համար գրքի օգտագործված նյութերը: - M .: Williams, 2004 .-- էջ. 448-462 թթ

Կենտրոնական սահմանային թեորեմնշում է, որ բավականաչափ մեծ ընտրանքի չափի դեպքում միջոցների ընտրանքային բաշխումը կարող է մոտավորվել նորմալ բաշխմամբ: Այս գույքը կախված չէ ընդհանուր բնակչության բաշխվածության տեսակից:

Վստահության միջակայք- վիճակագրական մեծության սահմանափակող արժեքները, որոնք տվյալ վստահության հավանականությամբ γ կլինեն այս միջակայքում ավելի մեծ նմուշի հետ: Այն նշվում է որպես P (θ - ε: Գործնականում, γ վստահության հավանականությունը ընտրվում է գ = 0,9, γ = 0,95, γ = 0,99 արժեքներից, որոնք բավական մոտ են միասնությանը:

Ծառայության նպատակը... Այս ծառայությունը սահմանում է.

  • վստահության միջակայքը ընդհանուր միջինի համար, վստահության միջակայքը շեղումների համար;
  • վստահության միջակայքը ստանդարտ շեղման համար, վստահության միջակայքը ընդհանուր կոտորակի համար.
Ստացված լուծումը պահվում է Word ֆայլում (տես օրինակ): Ստորև բերված է վիդեո հրահանգ, թե ինչպես լրացնել նախնական տվյալները:

Օրինակ # 1. Կոլտնտեսությունում 1000 գլուխ ոչխարների ընդհանուր հոտից ընտրովի հսկողական խուզում է անցել 100 ոչխար: Արդյունքում սահմանվել է բրդի միջին խուզում՝ 4,2 կգ մեկ ոչխարի համար։ Որոշեք 0,99 հավանականությամբ նմուշի արմատ-միջին քառակուսի սխալը մեկ ոչխարի բրդի միջին կտրվածքը որոշելիս և այն սահմանները, որոնցում ընդգրկված է կտրման արժեքը, եթե շեղումը 2,5 է: Նմուշը չի կրկնվում։
Օրինակ թիվ 2. Մոսկվայի հյուսիսային մաքսակետում ներկրված ապրանքների խմբաքանակից պատահական կրկնվող նմուշառման կարգով վերցվել է «Ա» ապրանքի 20 նմուշ։ Ստուգման արդյունքում պարզվել է «Ա» արտադրանքի միջին խոնավությունը նմուշում, որը պարզվել է 6%՝ 1% ստանդարտ շեղումով։
0,683 հավանականությամբ որոշել ապրանքի միջին խոնավության սահմանները ներմուծվող ապրանքների ողջ խմբաքանակում։
Օրինակ թիվ 3. 36 ուսանողների շրջանում անցկացված հարցումը ցույց է տվել, որ նրանց կողմից կարդացած դասագրքերի միջին թիվը մեկ ուսումնական տարում ստացվել է 6: Ենթադրելով, որ ուսանողի կողմից կարդացած դասագրքերի թիվը մեկ կիսամյակում ունի նորմալ բաշխման օրենք՝ 6 ստանդարտ շեղումով, գտե՛ք. Ա) այս պատահական փոփոխականի մաթեմատիկական ակնկալիքի համար 0, 99 ինտերվալային գնահատմամբ. Բ) որքանո՞վ է հավանական պնդել, որ այս նմուշի համար հաշվարկված ուսանողի կողմից կարդացած դասագրքերի միջին թիվը մեկ կիսամյակում կշեղվի բացարձակ արժեքով մաթեմատիկական ակնկալիքից ոչ ավելի, քան 2-ով:

Վստահության միջակայքի դասակարգում

Ըստ գնահատված պարամետրի տեսակի.

Ըստ նմուշի տեսակի.

  1. Վստահության միջակայքը անսահման նմուշի համար;
  2. Վերջնական նմուշի վստահության միջակայքը;
Նմուշառումը կոչվում է նմուշառում:եթե ընտրված օբյեկտը վերադարձվում է բնակչությանը մինչև հաջորդը ընտրելը: Նմուշը կոչվում է չկրկնվողեթե ընտրված օբյեկտը չի վերադարձվում ընդհանուր բնակչությանը: Գործնականում սովորաբար գործ ունենք չկրկնվող նմուշների հետ:

Պատահական ընտրանքի միջին ընտրանքի սխալի հաշվարկը

Ընտրանքից ստացված ցուցանիշների արժեքների և ընդհանուր բնակչության համապատասխան պարամետրերի միջև անհամապատասխանությունը կոչվում է. ներկայացուցչական սխալ.
Ընդհանուր և ընտրանքային բնակչության հիմնական պարամետրերի նշանակում:
Միջին նմուշառման սխալի բանաձևեր
վերընտրությունչկրկնվող ընտրություն
միջինի համարբաժնեմասի համարմիջինի համարբաժնեմասի համար
Որոշակի հավանականությամբ երաշխավորված ընտրանքային սխալի սահմանի (Δ) հարաբերակցությունը P (t),իսկ միջին նմուշառման սխալն ունի ձև՝ կամ Δ = t μ, որտեղ տ- վստահության գործակիցը, որը որոշվում է կախված P (t) հավանականության մակարդակից՝ ըստ Լապլասի ինտեգրալ ֆունկցիայի աղյուսակի։

Պատահական ընտրության ճիշտ մեթոդով նմուշի չափը հաշվարկելու բանաձևեր

Վստահության միջակայք(CI; անգլերենում վստահության միջակայքը - CI), որը ստացվել է ընտրանքով ուսումնասիրության արդյունքում, տալիս է հետազոտության արդյունքների ճշգրտությունը (կամ անորոշությունը), որպեսզի եզրակացություններ անեն բոլոր նման հիվանդների (ընդհանուր բնակչության) պոպուլյացիայի մասին: 95% CI-ի ճիշտ սահմանումը կարելի է ձևակերպել հետևյալ կերպ. նման ինտերվալների 95%-ը կպարունակի իրական արժեքը պոպուլյացիայի մեջ: Այս մեկնաբանությունը փոքր-ինչ ավելի քիչ ճշգրիտ է. CI-ն արժեքների այն շրջանակն է, որի շրջանակներում կարելի է 95%-ով վստահ լինել, որ այն պարունակում է իրական արժեքը: CI-ներ օգտագործելիս շեշտը դրվում է էֆեկտի քանակականացման վրա՝ ի տարբերություն P արժեքի, որը ստացվում է վիճակագրական նշանակության փորձարկումով: P-արժեքը չի չափում որևէ մեծություն, այլ ավելի շուտ ծառայում է որպես ապացույցի ուժի չափում «առանց ազդեցության» զրոյական վարկածի դեմ: P արժեքն ինքնին մեզ ոչինչ չի ասում տարբերության մեծության կամ նույնիսկ դրա ուղղության մասին: Հետևաբար, P-ի անկախ արժեքները հոդվածներում կամ ռեֆերատներում բացարձակապես ոչ տեղեկատվական են: Ի հակադրություն, CI-ն ցույց է տալիս և՛ անմիջական հետաքրքրության ազդեցության չափը, ինչպիսին է բուժման օգտակարությունը, և՛ ապացույցների ուժը: Հետևաբար, JI-ն ուղղակիորեն կապված է EBM-ի պրակտիկայի հետ:

CI-ի կողմից ցուցադրված վիճակագրական վերլուծության գնահատման մոտեցումը նպատակ ունի չափել հետաքրքրության ազդեցության չափը (ախտորոշիչ թեստի զգայունությունը, կանխատեսված դեպքերի մակարդակը, բուժման մեջ հարաբերական ռիսկի նվազեցումը և այլն), ինչպես նաև չափել այս հարցում անորոշությունը: ազդեցություն. Ամենից հաճախ CI-ն գնահատման երկու կողմերում գտնվող արժեքների միջակայքն է, որում, ամենայն հավանականությամբ, կլինի իրական արժեքը, և դուք կարող եք 95% վստահ լինել դրանում: 95% հավանականությունը կամայականորեն օգտագործելու համաձայնությունը, ինչպես նաև P արժեքը<0,05 для оценки статистической значимости, и авторы иногда используют 90% или 99% ДИ. Заметим, что слово «интервал» означает диапазон величин и поэтому стоит в единственном числе. Две величины, которые ограничивают интервал, называются «доверительными пределами».

CI-ն հիմնված է այն մտքի վրա, որ հիվանդների այլ նմուշների վրա իրականացված նույն ուսումնասիրությունը չի հանգեցնի նույնական արդյունքների, այլ որ դրանց արդյունքները կբաշխվեն իրական, բայց անհայտ քանակի շուրջ: Այլ կերպ ասած, CI-ն այն նկարագրում է որպես «ընտրանքից կախված փոփոխականություն»: CI-ն չի արտացոլում այլ պատճառներով պայմանավորված լրացուցիչ անորոշություն. մասնավորապես, այն չի ներառում հիվանդի ընտրովի կորստի հետևանքները հետևելու, վատ համապատասխանության կամ արդյունքների ոչ ճշգրիտ չափման, կուրացման բացակայությունը և այլն: Այսպիսով, CI-ն միշտ թերագնահատում է անորոշության ընդհանուր գումարը:

Վստահության միջակայքի հաշվարկ

Աղյուսակ A1.1. Որոշ կլինիկական չափումների համար ստանդարտ սխալներ և վստահության միջակայքեր

Սովորաբար, CI-ն հաշվարկվում է քանակական չափման դիտարկված գնահատականից, ինչպիսին է տարբերությունը (դ) երկու համամասնությունների միջև և ստանդարտ սխալը (SE) այս տարբերության գնահատման մեջ: Այսպիսով ստացված մոտավոր 95% CI-ն d ± 1,96 SE է: Բանաձևը փոխվում է ըստ արդյունքի չափման բնույթի և CI-ի շրջանակի: Օրինակ, պատվաստանյութ ստացած 1670 (4.3%) նորածիններից 72-ի մոտ 1665 (14.4%) վերահսկվողներից 240-ի մոտ զարգացել է կապույտ հազի պատվաստանյութի պատահականացված, պլացեբո վերահսկվող փորձարկումը: Տոկոսային տարբերությունը, որը հայտնի է որպես բացարձակ ռիսկի նվազեցում, կազմում է 10,1%: Այս տարբերության SE-ն 0,99% է: Համապատասխանաբար, 95% CI-ն 10.1% + 1.96 x 0.99% է, այսինքն. 8.2-ից մինչև 12.0:

Չնայած տարբեր փիլիսոփայական մոտեցումներին, CI և վիճակագրական նշանակության թեստերը մաթեմատիկորեն սերտորեն կապված են:

Այսպիսով, P արժեքը «նշանակալի» է. Ռ<0,05 соответствует 95% ДИ, который исключает величину эффекта, указывающую на отсутствие различия. Например, для различия между двумя средними пропорциями это ноль, а для относительного риска или отношения шансов - единица. При некоторых обстоятельствах эти два подхода могут быть не совсем эквивалентны. Преобладающая точка зрения: оценка с помощью ДИ - предпочтительный подход к суммированию результатов исследования, но ДИ и величина Р взаимодополняющи, и во многих статьях используются оба способа представления результатов.

Գնահատման անորոշությունը (անորոշությունը)՝ արտահայտված CI-ով, մեծապես կապված է ընտրանքի չափի քառակուսի արմատի հետ: Փոքր նմուշները ավելի քիչ տեղեկատվություն են տալիս, քան մեծերը, իսկ CI-ն համապատասխանաբար ավելի լայն է փոքր նմուշներում: Օրինակ, մի հոդվածում, որը համեմատում է երեք թեստերի կատարումը, որոնք օգտագործվում են Helicobacter pylori վարակի ախտորոշման համար, հաղորդում է միզանյութի շնչառության թեստի 95,8%-ի զգայունությունը (95% CI 75-100): Թեև 95.8%-ի թիվը տպավորիչ է թվում, I. pylori-ով 24 չափահաս հիվանդների փոքր նմուշը նշանակում է, որ այս գնահատականում զգալի անորոշություն կա, ինչպես ցույց է տրված լայն CI-ով: Իսկապես, 75% ստորին սահմանը շատ ավելի ցածր է, քան 95,8% գնահատականը։ Եթե ​​նույն զգայունությունը նկատվեր 240 հոգուց բաղկացած ընտրանքում, ապա 95% CI-ն կլիներ 92,5-98,0, ինչը ավելի շատ երաշխիքներ է տալիս, որ թեստը բարձր զգայուն է:

Պատահականացված վերահսկվող փորձարկումներում (RCTs) ոչ էական արդյունքները (այսինքն՝ P> 0.05 ունեցողները) հատկապես հակված են սխալ մեկնաբանությունների: CI-ն հատկապես օգտակար է այստեղ, քանի որ այն ցույց է տալիս, թե որքանով են համահունչ արդյունքները կլինիկականորեն շահավետ իրական ազդեցության հետ: Օրինակ, RCT-ում, որը համեմատում է կարերը և կեռային անաստոմոզը հաստ աղիքի հետ, վերքի վարակը զարգացել է հիվանդների համապատասխանաբար 10,9% և 13,5% (P = 0,30): Այս տարբերության 95% CI-ն 2,6% է (-2-ից +8): Նույնիսկ 652 հիվանդների այս ուսումնասիրության մեջ հավանականությունը մնում է, որ երկու պրոցեդուրաներից առաջացած վարակների հաճախականության չափավոր տարբերություն կա: Որքան քիչ հետազոտություններ, այնքան մեծ է անորոշությունը: Sung et al. իրականացրել է RCT՝ համեմատելու օկտրեոտիդային ինֆուզիոն և շտապ սկլերոթերապիան 100 հիվանդի սուր վարիկային արյունահոսության համար: Օկտրեոտիդային խմբում արյունահոսության դադարեցման մակարդակը կազմել է 84%; սկլերոթերապիայի խմբում `90%, որը տալիս է P = 0,56: Նկատի ունեցեք, որ շարունակվող արյունահոսության տեմպերը նման են վերքերի վարակման ցուցանիշներին նշված հետազոտության մեջ: Այս դեպքում, սակայն, միջամտությունների միջև տարբերության 95% CI-ն 6% է (-7-ից +19): Այս միջակայքը բավականին լայն է՝ համեմատած 5% տարբերության հետ, որը կլինիկական հետաքրքրություն կառաջացներ: Հասկանալի է, որ ուսումնասիրությունը չի բացառում արդյունավետության էական տարբերությունը։ Հետևաբար, հեղինակների եզրակացությունը՝ «օկտրեոտիդային ինֆուզիոն և սկլերոթերապիան հավասարապես արդյունավետ են վարիկոզային արյունահոսության բուժման համար», միանշանակ վավեր չէ: Նման դեպքերում, երբ, ինչպես այստեղ, բացարձակ ռիսկի նվազեցման 95% CI-ն (ARR) ներառում է զրո, բուժման համար անհրաժեշտ քանակի CI-ն (NNT) բավականին դժվար է մեկնաբանել: NPLP-ը և դրա CI-ն ստացվում են ACP-ի փոխադարձությունից (բազմապատկվում է 100-ով, եթե այս արժեքները տրված են որպես տոկոս): Այստեղ մենք ստանում ենք BPHP = 100: 6 = 16.6 95% CI-ով -14.3-ից մինչև 5.3: Ինչպես երևում է աղյուսակի «դ» ծանոթագրությունից. A1.1, այս CI-ն ներառում է BPHP արժեքները 5.3-ից մինչև անսահմանություն և BPHP արժեքները 14.3-ից մինչև անսահմանություն:

CI-ները կարող են կառուցվել առավել հաճախ օգտագործվող վիճակագրական գնահատումների կամ համեմատությունների համար: RCT-ների համար այն ներառում է միջին համամասնությունների, հարաբերական ռիսկերի, հավանականության գործակիցների և ԱԷԿ-ի միջև եղած տարբերությունը: Նմանապես, CI-ները կարելի է ձեռք բերել ախտորոշիչ թեստերի ճշգրտության ուսումնասիրություններում արված բոլոր հիմնական գնահատումների համար՝ զգայունություն, սպեցիֆիկություն, դրական արդյունքի կանխատեսող արժեք (որոնք բոլորն էլ պարզ համամասնություններ են), և հավանականության գործակիցներ՝ մետավերլուծություններում ստացված գնահատականներ և համեմատության հետ հսկողության ուսումնասիրություններ: Համակարգչային ծրագիր անհատական ​​համակարգիչների համար, որն ընդգրկում է ID-ի այս կիրառություններից շատերը, հասանելի է «Վստահության վիճակագրություն» աշխատության երկրորդ հրատարակության հետ միասին: Համամասնությունների համար CI-ի հաշվարկման մակրոները հասանելի են անվճար Excel-ի և SPSS և Minitab վիճակագրական ծրագրերի համար՝ http://www.uwcm.ac.uk/study/medicine/epidemiology_statistics / հետազոտություն / վիճակագրություն / համամասնություններ, htm:

Բուժման ազդեցության բազմակի գնահատում

Թեև CI-ները ցանկալի են հետազոտության առաջնային արդյունքների համար, դրանք պարտադիր չեն բոլոր արդյունքների համար: CI-ն վերաբերում է կլինիկական համապատասխան համեմատություններին: Օրինակ, երկու խմբերը համեմատելիս ճիշտ է այն CI-ն, որը կառուցված է խմբերը տարբերելու համար, ինչպես ցույց է տրված վերը նշված օրինակներում, և ոչ այն CI, որը կարող է կառուցվել յուրաքանչյուր խմբի գնահատման համար: Յուրաքանչյուր խմբում գնահատականների համար առանձին CI-ներ տրամադրելը ոչ միայն անօգուտ է, այլև այս ներկայացումը կարող է ապակողմնորոշիչ լինել: Նմանապես, ճիշտ մոտեցումը տարբեր ենթախմբերում բուժման արդյունավետությունը համեմատելիս երկու (կամ ավելի) ենթախմբերի ուղղակիորեն համեմատելն է: Սխալ է ենթադրել, որ բուժումն արդյունավետ է միայն մեկ ենթախմբում, եթե դրա CI-ն բացառում է ոչ մի ազդեցություն, իսկ մյուսները՝ ոչ: CI-ները նաև օգտակար են բազմաթիվ ենթախմբերի արդյունքները համեմատելիս: Նկ. A 1.1-ը ցույց է տալիս էկլամպսիայի հարաբերական վտանգը պրեէկլամպսիայով կանանց մոտ մագնեզիումի սուլֆատի պլացեբո վերահսկվող RCT-ից կանանց ենթախմբում:

Բրինձ. Ա1.2. Անտառային սյուժեն ցույց է տալիս տավարի ռոտավիրուսի դեմ պատվաստանյութի 11 պատահական կլինիկական փորձարկումների արդյունքները՝ լուծի կանխարգելման համար՝ ընդդեմ պլացեբոյի: Դիարխի հարաբերական ռիսկը գնահատելիս օգտագործվել է 95% վստահության միջակայք: Սև քառակուսու չափը համաչափ է տեղեկատվության քանակին: Բացի այդ, ցուցադրվում են բուժման արդյունավետության կուտակային գնահատումը և 95% վստահության միջակայքը (նշված է ադամանդի կողմից): Մետա-վերլուծության ընթացքում օգտագործվել է պատահական էֆեկտների մոդել, որը գերազանցում է որոշ նախապես հաստատված մոդելներ. օրինակ, դա կարող է լինել այն չափը, որն օգտագործվում է նմուշի չափը հաշվարկելիս: Ավելի խիստ չափանիշի համար CI-ի ողջ տիրույթը պետք է ցույց տա օգուտներ, որոնք գերազանցում են կանխորոշված ​​նվազագույնը:

Մենք արդեն քննարկել ենք վիճակագրական նշանակության բացակայությունը որպես ցուցում, որ երկու բուժում հավասարապես արդյունավետ են: Նույնքան կարևոր է վիճակագրական նշանակությունը կլինիկական նշանակության հետ չհավասարեցնել: Կլինիկական նշանակությունը կարելի է եզրակացնել, երբ արդյունքը վիճակագրորեն նշանակալի է և բուժման արդյունավետության գնահատման մեծությունը

Հետազոտությունը կարող է ցույց տալ, թե արդյոք արդյունքները վիճակագրորեն նշանակալի են, և որոնք են կլինիկական կարևոր, իսկ որոնք՝ ոչ: Նկ. A1.2-ը ցույց է տալիս չորս թեստերի արդյունքներ, որոնց համար ամբողջ CI<1, т.е. их результаты статистически значимы при Р <0,05 , . После высказанного предположения о том, что клинически важным различием было бы сокращение риска диареи на 20% (ОР = 0,8), все эти испытания показали клинически значимую оценку сокращения риска, и лишь в исследовании Treanor весь 95% ДИ меньше этой величины. Два других РКИ показали клинически важные результаты, которые не были статистически значимыми. Обратите внимание, что в трёх испытаниях точечные оценки эффективности лечения были почти идентичны, но ширина ДИ различалась (отражает размер выборки). Таким образом, по отдельности доказательная сила этих РКИ различна.

ՀԱՃԱԽԱԿԱՆՈՒԹՅՈՒՆՆԵՐԻ ԵՎ ԲԵՌՆԵՐԻ ՀԱՄԱՐ ՎՍՏԱՀՈՒԹՅԱՆ միջակայքերը

© 2008

Հանրային առողջության ազգային ինստիտուտ, Օսլո, Նորվեգիա

Հոդվածում նկարագրվում և քննարկվում է հաճախականությունների և ֆրակցիաների վստահության միջակայքերի հաշվարկը Ուոլդ, Վիլսոն, Քլոպպեր-Պիրսոն մեթոդներով, օգտագործելով անկյունային փոխակերպումը և Ուոլդի մեթոդով Ագրեստի-Քոլ ուղղումով: Ներկայացված նյութը տրամադրում է ընդհանուր տեղեկատվություն հաճախականությունների և ֆրակցիաների համար վստահության միջակայքերը հաշվարկելու մեթոդների մասին և նպատակ ունի առաջացնել ամսագրի ընթերցողների հետաքրքրությունը ոչ միայն սեփական հետազոտության արդյունքները ներկայացնելիս վստահության միջակայքների օգտագործման, այլ նաև. կարդալ մասնագիտացված գրականություն՝ նախքան ապագա հրապարակումների վրա աշխատելը:

Հիմնաբառերվստահության միջակայք, հաճախականություն, համամասնություն

Նախորդ հրապարակումներից մեկում համառոտ նշվել է որակական տվյալների նկարագրությունը և զեկուցվել է, որ դրանց ինտերվալային գնահատումը նախընտրելի է ընդհանուր պոպուլյացիայի մեջ ուսումնասիրված հատկանիշի առաջացման հաճախականությունը նկարագրելու կետային գնահատականից: Իրոք, քանի որ ուսումնասիրություններն իրականացվում են ընտրանքային տվյալների միջոցով, արդյունքների պրոյեկցիան ընդհանուր բնակչության վրա պետք է պարունակի ընտրանքային գնահատման անճշտության տարր: Վստահության միջակայքը գնահատված պարամետրի ճշգրտության չափանիշ է: Հետաքրքիր է, որ բժշկական մասնագետների հիմնական վիճակագրության վերաբերյալ որոշ գրքերում հաճախականությունների համար վստահության միջակայքերի թեման ամբողջությամբ անտեսված է: Այս հոդվածում մենք կքննարկենք հաճախականությունների համար վստահության միջակայքերը հաշվարկելու մի քանի մեթոդներ, որոնք ենթադրում են նմուշի այնպիսի բնութագրեր, ինչպիսիք են չկրկնվող և ներկայացուցչականությունը, ինչպես նաև դիտումների անկախությունը միմյանցից: Այս հոդվածում հաճախականությունը ընկալվում է ոչ թե որպես բացարձակ թիվ, որը ցույց է տալիս, թե քանի անգամ է որոշակի արժեք հայտնվում ագրեգատում, այլ որպես հարաբերական արժեք, որը որոշում է հետազոտության մասնակիցների մասնաբաժինը, որոնցում տեղի է ունենում ուսումնասիրվող հատկանիշը:

Կենսաբժշկական հետազոտություններում առավել հաճախ օգտագործվում են 95% վստահության միջակայքերը: Այս վստահության միջակայքն այն տարածքն է, որի իրական համամասնությունը ընկնում է ժամանակի 95%-ի սահմաններում: Այսինքն՝ 95% վստահությամբ կարող ենք ասել, որ ընդհանուր պոպուլյացիայի մեջ հատկանիշի առաջացման հաճախականության իրական արժեքը կլինի 95% վստահության միջակայքում։

Բժշկական հետազոտողների համար նախատեսված վիճակագրության ձեռնարկների մեծ մասը հայտնում է, որ հաճախականության սխալը հաշվարկվում է բանաձևով

որտեղ p-ն նմուշում հատկանիշի առաջացման հաճախականությունն է (արժեքը 0-ից 1): Ռուսական գիտական ​​հոդվածների մեծ մասը ցույց է տալիս նմուշի մեջ հատկանիշի առաջացման հաճախականության արժեքը (p), ինչպես նաև դրա սխալը (ներ) p ± s ձևով: Այնուամենայնիվ, ավելի նպատակահարմար է ընդհանուր բնակչության մեջ որևէ հատկանիշի առաջացման հաճախականության համար ներկայացնել 95% վստահության միջակայք, որը կներառի արժեքներ.

նախքան.

Որոշ ձեռնարկներում փոքր նմուշների համար խորհուրդ է տրվում փոխարինել 1,96 արժեքը N - 1 ազատության աստիճանի համար t արժեքով, որտեղ N-ը նմուշի դիտարկումների թիվն է: t-ի արժեքը հայտնաբերվում է t-բաշխման աղյուսակներից, որոնք հասանելի են վիճակագրության գրեթե բոլոր դասագրքերում: Ուոլդի մեթոդի համար t բաշխման օգտագործումը տեսանելի առավելություններ չի տալիս ստորև քննարկված այլ մեթոդների նկատմամբ և, հետևաբար, որոշ հեղինակների կողմից չի խրախուսվում:

Հաճախականությունների կամ ֆրակցիաների համար վստահության միջակայքերը հաշվարկելու վերը նշված մեթոդն անվանվել է Ուոլդի անունով՝ ի պատիվ Աբրահամ Ուոլդի (1902-1950), քանի որ դրա լայն տարածումը սկսվել է 1939 թվականին Ուոլդի և Վոլֆովիցի հրապարակումից հետո: Այնուամենայնիվ, մեթոդն ինքնին առաջարկվել է Պիեռ Սիմոն Լապլասի կողմից (1749–1827) դեռևս 1812 թ.

Ուոլդի մեթոդը շատ տարածված է, սակայն դրա կիրառումը կապված է զգալի խնդիրների հետ։ Մեթոդը խորհուրդ չի տրվում փոքր նմուշների չափերի համար, ինչպես նաև այն դեպքերում, երբ որևէ հատկանիշի առաջացման հաճախականությունը ձգտում է 0-ի կամ 1-ի (0% կամ 100%) և պարզապես անհնար է 0 և 1 հաճախականությունների համար: Բացի այդ, մոտավորությունը. նորմալ բաշխման, որն օգտագործվում է սխալը հաշվարկելու համար, «Չի աշխատում» այն դեպքերում, երբ n · p< 5 или n · (1 – p) < 5 . Более консервативные статистики считают, что n · p и n · (1 – p) должны быть не менее 10 . Более детальное рассмотрение метода Вальда показало, что полученные с его помощью доверительные интервалы в большинстве случаев слишком узки, то есть их применение ошибочно создает слишком оптимистичную картину, особенно при удалении частоты встречаемости признака от 0,5, или 50 % . К тому же при приближении частоты к 0 или 1 доверительный интревал может принимать отрицательные значения или превышать 1, что выглядит абсурдно для частот. Многие авторы совершенно справедливо не рекомендуют применять данный метод не только в уже упомянутых случаях, но и тогда, когда частота встречаемости признака менее 25 % или более 75 % . Таким образом, несмотря на простоту расчетов, метод Вальда может применяться лишь в очень ограниченном числе случаев. Зарубежные исследователи более категоричны в своих выводах и однозначно рекомендуют не применять этот метод для небольших выборок , а ведь именно с такими выборками часто приходится иметь дело исследователям-медикам.

Քանի որ նոր փոփոխականը սովորաբար բաշխված է, 95% վստահության միջակայքի ստորին և վերին սահմանները φ փոփոխականի համար կլինեն φ-1,96 և φ + 1,96 ձախ:

Փոքր նմուշների համար 1,96-ի փոխարեն խորհուրդ է տրվում t-ով փոխարինել N - 1 աստիճան ազատության: Այս մեթոդը բացասական արժեքներ չի տալիս և թույլ է տալիս ավելի ճշգրիտ գնահատել հաճախականությունների վստահության միջակայքերը, քան Ուոլդի մեթոդը: Բացի այդ, այն նկարագրված է բժշկական վիճակագրության վերաբերյալ բազմաթիվ հայրենական տեղեկատու գրքերում, ինչը, սակայն, չի հանգեցրել բժշկական հետազոտություններում դրա լայն կիրառմանը: Անկյունային փոխակերպման միջոցով վստահության միջակայքերի հաշվարկը խորհուրդ չի տրվում 0-ին կամ 1-ին մոտեցող հաճախականությունների համար:

Այստեղ սովորաբար ավարտվում է բժշկական հետազոտողների վիճակագրության հիմունքների վերաբերյալ գրքերի վստահության միջակայքերը գնահատելու մեթոդների նկարագրությունը, և այս խնդիրը բնորոշ է ոչ միայն ներքին, այլև արտասահմանյան գրականությանը: Երկու մեթոդներն էլ հիմնված են կենտրոնական սահմանային թեորեմի վրա, որը ենթադրում է մեծ նմուշ։

Հաշվի առնելով վերը նշված մեթոդներով վստահության միջակայքերը գնահատելու թերությունները, Քլոպերը և Փիրսոնը 1934 թվականին առաջարկեցին այսպես կոչված ճշգրիտ վստահության միջակայքը հաշվարկելու մեթոդ՝ հաշվի առնելով ուսումնասիրվող հատկանիշի երկանդամ բաշխումը։ Այս մեթոդը հասանելի է բազմաթիվ առցանց հաշվիչներում, սակայն այս կերպ ձեռք բերված վստահության միջակայքերը շատ դեպքերում չափազանց լայն են: Միևնույն ժամանակ, այս մեթոդը խորհուրդ է տրվում օգտագործել այն դեպքերում, երբ պահանջվում է պահպանողական գնահատում: Մեթոդի պահպանողականության աստիճանը մեծանում է ընտրանքի չափի նվազմամբ, հատկապես, երբ Ն< 15 . описывает применение функции биномиального распределения для анализа качественных данных с использованием MS Excel, в том числе и для определения доверительных интервалов, однако расчет последних для частот в электронных таблицах не «затабулирован» в удобном для пользователя виде, а потому, вероятно, и не используется большинством исследователей.

Շատ վիճակագիրների կարծիքով, հաճախականությունների համար վստահության միջակայքերի ամենաօպտիմալ գնահատումն իրականացվում է Վիլսոնի մեթոդով, որն առաջարկվել է դեռևս 1927 թվականին, բայց գործնականում չի օգտագործվում ներքին կենսաբժշկական հետազոտություններում: Այս մեթոդը ոչ միայն հնարավորություն է տալիս գնահատել վստահության միջակայքերը և՛ շատ փոքր, և՛ շատ բարձր հաճախականությունների համար, այլև կիրառելի է փոքր թվով դիտարկումների համար: Ընդհանուր առմամբ, վստահության միջակայքը, ըստ Վիլսոնի բանաձևի, ունի ձև



որտեղ 95% վստահության միջակայքը հաշվարկելիս ստանում է 1.96 արժեքը, N-ը դիտարկումների թիվն է, իսկ p-ն նմուշում որևէ հատկանիշի առաջացման հաճախականությունն է: Այս մեթոդը հասանելի է առցանց հաշվիչներում, ուստի դրա կիրառումը խնդրահարույց չէ։ և խորհուրդ չեն տալիս օգտագործել այս մեթոդը n p< 4 или n · (1 – p) < 4 по причине слишком грубого приближения распределения р к нормальному в такой ситуации, однако зарубежные статистики считают метод Уилсона применимым и для малых выборок .

Ենթադրվում է, որ, ի լրումն Ուիլսոնի մեթոդի, Ուոլդ Ագրեստի-Քոլի ուղղված մեթոդը նաև ապահովում է հաճախականությունների վստահության միջակայքի օպտիմալ գնահատում: Ուղղումը ըստ Ագրեստի - Քոուլի (p) նմուշում հատկանիշի առաջացման հաճախականության փոխարինում է Ուոլդի բանաձևում p`-ով, որի հաշվարկում համարիչին գումարվում է 2, իսկ հայտարարին ավելացվում է 4, այսինքն, p` = (X + 2) / (N + 4), որտեղ X-ը հետազոտության մասնակիցների թիվն է, ովքեր ունեն ուսումնասիրվող հատկանիշը, իսկ N-ը ընտրանքի չափն է: Այս փոփոխությունը հանգեցնում է արդյունքների, որոնք շատ նման են Wilson բանաձևի արդյունքներին, բացառությամբ այն դեպքերի, երբ իրադարձությունների մակարդակը մոտենում է 0% կամ 100%, իսկ նմուշը փոքր է: Ի հավելումն հաճախականությունների համար վստահության միջակայքերը հաշվարկելու վերոհիշյալ մեթոդներին, շարունակականության ուղղումներ են առաջարկվել ինչպես Ուոլդի մեթոդի, այնպես էլ Վիլսոնի մեթոդի համար՝ փոքր նմուշների համար, սակայն ուսումնասիրությունները ցույց են տվել, որ դրանց կիրառումն անիրագործելի է:

Դիտարկենք վստահության միջակայքերը հաշվարկելու վերը նշված մեթոդների կիրառումը երկու օրինակով: Առաջին դեպքում մենք ուսումնասիրում ենք 1000 պատահականորեն ընտրված հետազոտության մասնակիցների մեծ ընտրանք, որոնցից 450-ն ունեն ուսումնասիրվող հատկանիշը (դա կարող է լինել ռիսկի գործոն, արդյունք կամ որևէ այլ հատկանիշ), որը կազմում է 0,45 կամ 45%: Երկրորդ դեպքում հետազոտությունն իրականացվում է փոքր ընտրանքով, ասենք՝ ընդամենը 20 հոգու, իսկ ուսումնասիրված հատկանիշն առկա է հետազոտության միայն 1 մասնակցի մոտ (5%)։ Վստահության միջակայքերը՝ ըստ Ուոլդի մեթոդի, Ուոլդի մեթոդի՝ Ագրեստի-Քոուլի ուղղման և Վիլսոնի մեթոդի հաշվարկված՝ օգտագործելով առցանց հաշվիչը, որը մշակվել է Ջեֆ Սաուրոյի կողմից (http: // www. / Wald. Htm): Շարունակականության միջոցով շտկված Wilson վստահության միջակայքերը հաշվարկվել են Wassar Stats-ի կողմից տրամադրված հաշվիչի միջոցով: Վիճակագրական հաշվարկների վեբ կայքը (http: Ֆիշերի անկյունային փոխակերպման միջոցով հաշվարկները կատարվել են «ձեռքով»՝ օգտագործելով t-ի կրիտիկական արժեքը համապատասխանաբար 19 և 999 աստիճանի ազատության համար: Հաշվարկի արդյունքները ներկայացված են աղյուսակում երկու օրինակների համար:

Վստահության միջակայքերը հաշվարկված են վեց տարբեր եղանակներով տեքստում նկարագրված երկու օրինակների համար

Վստահության միջակայքի հաշվարկման մեթոդ

P = 0,0500 կամ 5%

95% CI X = 450, N = 1000, P = 0,4500 կամ 45%

–0,0455–0,2541

Ուոլդ Ագրեստի-Քոուլի ուղղումով

<,0001–0,2541

Ուիլսոնը շարունակականության ուղղումով

Clopper - Pearson «ճշգրիտ մեթոդ»

Անկյունային փոխակերպում

<0,0001–0,1967

Ինչպես երևում է աղյուսակից, առաջին օրինակի համար «ընդհանուր ընդունված» Wald մեթոդով հաշվարկված վստահության միջակայքը գնում է դեպի բացասական շրջան, ինչը չի կարող լինել հաճախականությունների դեպքում: Ցավոք, նման դեպքերը հազվադեպ չեն ռուս գրականության մեջ։ Տվյալների հաճախականության և դրանց սխալների առումով տվյալների ներկայացման ավանդական եղանակը մասամբ քողարկում է այս խնդիրը: Օրինակ, եթե հատկանիշի առաջացման հաճախականությունը (որպես տոկոս) ներկայացվում է 2,1 ± 1,4, ապա դա այնքան էլ «ցավոտ չէ աչքերի համար», որքան 2,1%-ը (95% CI: –0,7; 4,9), չնայած և նշանակում է նույնը. Ուոլդի մեթոդը Agresti-ով. Քոլի ուղղումը և հաշվարկը, օգտագործելով անկյունային փոխակերպումը, տալիս են զրոյի ձգվող ստորին սահման: Շարունակականության շտկված Վիլսոնի մեթոդը և «ճշգրիտ մեթոդը» տալիս են ավելի լայն վստահության միջակայքեր, քան Վիլսոնի մեթոդը: Երկրորդ օրինակի համար բոլոր մեթոդները տալիս են մոտավորապես նույն վստահության միջակայքերը (տարբերությունները հայտնվում են միայն հազարերորդականներով), ինչը զարմանալի չէ, քանի որ այս օրինակում իրադարձության առաջացման հաճախականությունը շատ չի տարբերվում 50%-ից, իսկ ընտրանքի չափը. բավականին մեծ:

Այս խնդրով հետաքրքրված ընթերցողների համար մենք կարող ենք խորհուրդ տալ R. G. Newcombe-ի և Brown-ի, Cai-ի և Dasgupta-ի աշխատանքները, որոնք ցույց են տալիս վստահության միջակայքերը հաշվարկելու համար համապատասխանաբար 7 և 10 տարբեր մեթոդների օգտագործման դրական և բացասական կողմերը: Ներքին ձեռնարկներից խորհուրդ է տրվում պատվիրել և, որը, ի լրումն տեսության մանրամասն նկարագրության, ներկայացնում է Ուոլդի, Վիլսոնի մեթոդները, ինչպես նաև վստահության միջակայքերը հաշվարկելու մեթոդ՝ հաշվի առնելով երկանդամ հաճախականության բաշխումը: Ի հավելումն անվճար առցանց հաշվիչների (http: // www. / Wald. Htm և http: // ֆակուլտետ. Vassar. Edu / lowry / prop1.html), հաճախականությունների վստահության միջակայքերը (և ավելին) կարող են հաշվարկվել ԿՀՎ-ի միջոցով: ծրագիր ( Confidence Intervals Analysis), որը կարելի է ներբեռնել http: // www. բժշկական դպրոց. սոտոն. ակ. uk / cia /.

Հաջորդ հոդվածում կքննարկվեն որակյալ տվյալների համեմատության միաչափ եղանակներ:

Մատենագիտություն

Բաներջի Ա.Բժշկական վիճակագրություն պարզ լեզվով. ներածական դասընթաց / A. Banerji. - Մ.: Գործնական բժշկություն, 2007 .-- 287 էջ. Բժշկական վիճակագրություն /. - Մ.: Բժշկական տեղեկատվական գործակալություն, 2007 թ.-- 475 էջ. Գլանց Ս.Կենսաբժշկական վիճակագրություն / S. Glants. - Մ.: Պրակտիկա, 1998 թ. Տվյալների տեսակները, բաշխման ստուգումը և նկարագրական վիճակագրությունը / // Մարդկային էկոլոգիա - 2008. - No 1. - P. 52–58: Ժիժին Կ... Բժշկական վիճակագրություն. դասագիրք /. - Ռոստով n / a: Phoenix, 2007 .-- 160 p. Կիրառական բժշկական վիճակագրություն /,. - SPb. Ֆոլիո, 2003 .-- 428 էջ. Լակին Գ.Ֆ... Կենսաչափություն /. - Մ.: Բարձրագույն դպրոց, 1990 .-- 350 էջ. Բժիշկ Վ.Ա... Մաթեմատիկական վիճակագրություն բժշկության մեջ /,. - Մ.: Ֆինանսներ և վիճակագրություն, 2007 թ.-- 798 էջ. Մաթեմատիկական վիճակագրությունը կլինիկական հետազոտություններում /,. - M.: GEOTAR-MED, 2001 .-- 256 էջ. Յունկերով Վ. ԵՎ... Բժշկական հետազոտությունների տվյալների բժշկական և վիճակագրական մշակում /,. - SPb. ՝ VmedA, 2002 .-- 266 էջ. Ագրեստի Ա.Մոտավորը ավելի լավ է, քան ճշգրիտը երկանդամ համամասնությունների միջակայքային գնահատման համար / Ա. Ագրեստի, Բ. Քուլ // Ամերիկացի վիճակագիր: - 1998. - N 52. - S. 119-126. Ալթման Դ.Վիճակագրություն վստահորեն // D. Altman, D. Machin, T. Bryant, M. J. Gardner: - London: BMJ Books, 2000 .-- 240 p. Բրաուն Լ.Դ.Երկանդամ համամասնության միջակայքի գնահատում / L. D. Brown, T. T. Cai, A. Dasgupta // Վիճակագրական գիտություն. - 2001. - N 2. - P. 101-133: Քլոպեր Ք.Ջ.Վստահության կամ հավատարիմ սահմանների օգտագործումը, որը պատկերված է երկանդամության դեպքում / C. J. Clopper, E. S. Pearson // Biometrika. - 1934. - N 26. - P. 404-413: Գարսիա-Պերես Մ.Ա... Երկանդամ պարամետրի վստահության միջակայքի մասին / M. A. Garcia-Perez // Որակ և քանակ: - 2005. - N 39. - P. 467–481: Մոտուլսկի Հ.Ինտուիտիվ կենսավիճակագրություն // Հ. Մոտուլսկի. - Oxford: Oxford University Press, 1995 .-- 386 p. Նյուքոմբ Ռ.Գ.Երկկողմանի վստահության միջակայքերը միայնակ համամասնության համար. Յոթ մեթոդների համեմատություն / R. G. Newcombe // Վիճակագրություն բժշկության մեջ. - 1998. - N. 17. - P. 857-872: Սաուրո Ջ.Փոքր նմուշներից ավարտման տեմպերի գնահատում, օգտագործելով երկանդամ վստահության միջակայքերը. համեմատություններ և առաջարկություններ / J. Sauro, J. R. Lewis // Մարդկային գործոնների և էրգոնոմիկայի հասարակության տարեկան ժողով: - Օռլանդո, Ֆլորիդա, 2005 թ. Ուոլդ Ա.Շարունակական բաշխման ֆունկցիաների վստահության սահմանները // A. Wald, J. Wolfovitz // Մաթեմատիկական վիճակագրության տարեգրություն: - 1939. - N 10. - P. 105-118: Վիլսոն Է. Բ... Հավանական եզրակացություն, իրավահաջորդության օրենք և վիճակագրական եզրակացություն / E. B. Wilson // Ամերիկյան վիճակագրական ասոցիացիայի ամսագիր: - 1927. - N 22. - P. 209-212:

ՎՍՏԱՀՈՒԹՅԱՆ ԸՆԿԵՐԱՑՈՒՄՆԵՐ ՀԱՄԱմասնությունների համար

Ա. Մ.Գրիբովսկի

Հանրային առողջության ազգային ինստիտուտ, Օսլո, Նորվեգիա

Հոդվածում ներկայացված են երկանդամ համամասնությունների վստահության ինտերվալների հաշվարկման մի քանի մեթոդներ, մասնավորապես՝ Ուոլդ, Վիլսոն, արկսին, Ագրեստի-Կուլ և ճշգրիտ Կլոպեր-Պիրսոնի մեթոդներ: Թուղթը միայն ընդհանուր ներածություն է տալիս երկանդամ համամասնության վստահության միջակայքի գնահատման խնդրին, և դրա նպատակն է ոչ միայն խթանել ընթերցողներին օգտագործել վստահության միջակայքերը սեփական էմպիրիկ հետազոտության արդյունքները ներկայացնելիս, այլ նաև խրախուսել նրանց խորհրդակցել վիճակագրության գրքերից մինչև սեփական տվյալների վերլուծություն և ձեռագրերի պատրաստում։

Բանալի բառերվստահության միջակայք, համամասնություն

Կոնտակտային տվյալներ:

Ավագ խորհրդական, Հանրային առողջության ազգային ինստիտուտ, Օսլո, Նորվեգիա