Доверителни интервали за честоти и удари. Проби и доверителни интервали

Доверителни интервали.

Изчисляването на доверителния интервал се основава на средната грешка на съответния параметър. Доверителен интервал показва границите с вероятност (1-a) истинската стойност на оценения параметър е. Тук a е нивото на значимост, (1-a) се нарича още ниво на доверие.

В първата глава показахме, че например за средноаритметичната стойност истинската средна популация в около 95% от случаите се намира в рамките на 2 средни грешки на средната стойност. По този начин границите на 95% доверителен интервал за средната стойност ще бъдат отделени от средната стойност на извадката с удвоената средна грешка на средната стойност, т.е. умножаваме средната грешка на средната стойност по някакъв фактор в зависимост от нивото на доверие. За средната и разликата между средните се взема коефициентът на Студент (критичната стойност на критерия на Студент), за съотношението и разликата на дяловете - критичната стойност на z критерия. Произведението на коефициента от средната грешка може да се нарече пределна грешка на този параметър, т.е. максимума, който можем да получим, когато го оценяваме.

Доверителен интервал за средноаритметично : .

Ето примерната средна стойност;

Средна грешка на средноаритметичната стойност;

с -стандартно отклонение на извадката;

н

f = n-1 (Коефициент на студента).

Доверителен интервал за разлика в средните аритметични :

Ето разликата на извадковите средни;

- средната грешка на разликата на средноаритметичните;

s 1, s 2 -пробни стандартни отклонения;

n 1, n 2

Критична стойност на критерия на Студент за дадено ниво на значимост а и броя на степените на свобода f = n 1 + n 2-2 (Коефициент на студента).

Доверителен интервал за дял :

.

Тук d е честотата на извадката;

- средна грешка в дяла;

н- размер на извадката (размер на групата);

Доверителен интервал за разлика в дяловете :

Ето разликата в дяловете на извадката;

- средната грешка на разликата на средноаритметичните;

n 1, n 2- обеми на пробите (брой групи);

Критичната стойност на критерия z при дадено ниво на значимост a (,,).

Изчислявайки доверителните интервали за разликата в индикаторите, ние, първо, директно виждаме възможните стойности на ефекта, а не само неговата точкова оценка. Второ, можем да направим заключение за приемането или опровергаването на нулевата хипотеза и, трето, можем да направим извод за силата на критерия.

При тестване на хипотези с помощта на доверителни интервали трябва да се спазва следното правило:

Ако 100 (1-a) -процентов доверителен интервал на разликата от средните не съдържа нула, тогава разликите са статистически значими на ниво на значимост а; напротив, ако този интервал съдържа нула, тогава разликите не са статистически значими.

Всъщност, ако този интервал съдържа нула, тогава това означава, че сравняваният индикатор може да бъде повече или по-малко в една от групите, в сравнение с другата, т.е. наблюдаваните разлики са случайни.

По мястото, където нулата е в рамките на доверителния интервал, може да се прецени силата на критерия. Ако нулата е близо до долната или горната граница на интервала, тогава може би при по-голям брой сравнявани групи разликите биха достигнали статистическа значимост. Ако нулата е близо до средата на интервала, тогава това означава, че увеличението и намаляването на индикатора в експерименталната група са еднакво вероятни и вероятно наистина няма разлики.

Примери:

Да се ​​сравни оперативната смъртност с използването на два различни вида анестезия: 61 души са оперирани с използването на първия вид анестезия, 8 са починали, с използването на втория - 67 души, 10 са починали.

d 1 = 8/61 = 0,131; d2 = 10/67 = 0,149; d1-d2 = - 0,018.

Разликата в смъртността на сравняваните методи ще бъде в интервала (-0,018 - 0,122; -0,018 + 0,122) или (-0,14; 0,104) с вероятност 100 (1-a) = 95%. Интервалът съдържа нула, т.е. хипотезата за една и съща смъртност при два различни вида анестезия не може да бъде отхвърлена.

По този начин смъртността може и ще намалее до 14% и ще се увеличи до 10,4% с вероятност от 95%, т.е. нулата се намира приблизително в средата на интервала, така че може да се твърди, че най-вероятно тези два метода всъщност не се различават по смъртност.

В примера, разгледан по-рано, средното време на теста за потупване беше сравнено в четири групи студенти, различаващи се по резултат от изпита. Нека изчислим доверителните интервали за средното време за пресоване за студенти, издържали изпита на 2 и 5, и доверителния интервал за разликата между тези средни стойности.

Откриваме коефициентите на Студент според таблиците за разпределение на Студент (виж Приложението): за първа група: = t (0.05; 48) = 2.011; за втората група: = t (0.05; 61) = 2.000. По този начин, доверителните интервали за първата група: = (162.19-2.011 * 2.18; 162.19 + 2.011 * 2.18) = (157.8; 166.6), за втората група (156.55- 2.000 * 1.6.5 * 1.80 * 1.80; 152,8; 160,3). Така че, за тези, които са издържали изпита за 2, средното време за натискане е в диапазона от 157,8 ms до 166,6 ms с вероятност от 95%, за тези, които са издържали изпита за 5 - от 152,8 ms до 160,3 ms с вероятност от 95%.

Можете също да тествате нулевата хипотеза, като използвате доверителни интервали за средните стойности, а не само за разликата в средните стойности. Например, както в нашия случай, ако доверителните интервали за средните стойности се припокриват, тогава нулевата хипотеза не може да бъде отхвърлена. За да се отхвърли хипотеза на избраното ниво на значимост, съответните доверителни интервали не трябва да се припокриват.

Нека намерим доверителния интервал за разликата в средното време на натискане в групите, издържали изпита с 2 и 5. Разликата в средната стойност: 162.19 - 156.55 = 5.64. Коефициент на Студент: = t (0,05; 49 + 62-2) = t (0,05; 109) = 1,982. Груповите стандартни отклонения ще бъдат равни на:; ... Изчисляваме средната грешка на разликата между средните:. Доверителен интервал: = (5,64-1,982 * 2,87; 5,64 + 1,982 * 2,87) = (-0,044; 11,33).

Така че разликата в средното време за натискане в групите, издържали изпита за 2 и за 5, ще бъде в диапазона от -0,044 ms до 11,33 ms. Този интервал включва нула, т.е. средното време за натискане за тези, които са издържали перфектно изпита, може да се увеличи и намали в сравнение с тези, които не са издържали теста задоволително, т.е. нулевата хипотеза не може да бъде отхвърлена. Но нулата е много близо до долната граница, времето за натискане е много по-вероятно да намалее в случай на успешно преминали. По този начин можем да заключим, че все още има разлики в средното време на пресоване между тези, които са преминали на 2 и 5, просто не можахме да ги намерим при дадена промяна в средното време, разпределението на средното време и обемите на пробите.



Силата на теста е вероятността да се отхвърли неправилна нулева хипотеза, т.е. намерете разликите там, където те наистина са.

Силата на теста се определя въз основа на нивото на значимост, големината на разликите между групите, разпределението на стойностите в групите и размера на извадките.

За теста на Студент и анализа на дисперсията можете да използвате диаграми на чувствителността.

Силата на критерия може да се използва при предварителното определяне на необходимия брой групи.

Доверителният интервал показва границите с дадена вероятност истинската стойност на изчисления параметър.

Доверителни интервали могат да се използват за тестване на статистически хипотези и за извеждане на заключения относно чувствителността на критериите.

ЛИТЕРАТУРА.

Glantz S. - Глава 6.7.

Реброва О.Ю. - с. 112-114, с. 171-173, с. 234-238.

Сидоренко Е.В. - с. 32-33.

Въпроси за самопроверка на учениците.

1. Каква е мощността на теста?

2. В какви случаи е необходимо да се оцени силата на критериите?

3. Методи за изчисляване на мощността.

6. Как да тестваме статистическа хипотеза с помощта на доверителен интервал?

7. Какво можете да кажете за силата на теста при изчисляване на доверителния интервал?

Задачи.

В статистиката има два вида оценки: точкови и интервални. Точкова оценкае единична извадкова статистика, която се използва за оценка на параметър на съвкупност. Например средната стойност на извадката е точкова оценка на математическото очакване на общата съвкупност и дисперсията на извадката S 2- точкова оценка на дисперсията на общата съвкупност σ 2... беше показано, че средната стойност на извадката е безпристрастна оценка на математическото очакване на общата съвкупност. Средната извадка се нарича безпристрастна, тъй като средната стойност на всички средни извадки (за същия размер на извадката н) е равно на математическото очакване на общата съвкупност.

С цел дисперсията на извадката S 2се превърна в безпристрастна оценка на дисперсията на населението σ 2, знаменателят на дисперсията на извадката трябва да бъде равен на н – 1 , но не н... С други думи, дисперсията на генералната съвкупност е средната стойност от всички възможни дисперсии на извадката.

При оценката на параметрите на генералната съвкупност трябва да се има предвид, че извадковата статистика като напр , зависи от конкретни проби. Да се ​​вземе предвид този факт, да се получи интервална оценкаанализира се математическото очакване на генералната съвкупност, разпределението на извадковите средни (за повече подробности вижте). Конструираният интервал се характеризира с определено ниво на доверие, което е вероятността истинският параметър на генералната съвкупност да бъде оценен правилно. Подобни доверителни интервали могат да се използват за оценка на дела на даден елемент Ри основната разпределена маса от общото население.

Изтеглете бележката във формата или примерите във формата

Построяване на доверителния интервал за математическото очакване на общата съвкупност с известно стандартно отклонение

Изграждане на доверителен интервал за дела на характеристика в общата съвкупност

В този раздел концепцията за доверителен интервал се разширява до категорични данни. Това ви позволява да оцените дела на чертата в общата популация. Ризползвайки честота на извадка РС= X /н... Както е посочено, ако количествата нРи н(1 - стр)надвишава числото 5, биномното разпределение може да се аппроксимира с нормално. Следователно, за да се оцени делът на даден признак в общата съвкупност Рможе да се начертае интервал, чието ниво на доверие е (1 - α) х100%.


където стрС- селективен дял на характеристика, равен на NS/н, т.е. броят на успехите, разделен на размера на извадката, Р- делът на признака в общата съвкупност, З- критичната стойност на стандартизираното нормално разпределение, н- размер на извадката.

Пример 3.Да предположим, че от информационната система е извлечена извадка, състояща се от 100 фактури, попълнени през последния месец. Да кажем, че 10 от тези фактури са направени с грешки. Поради това, Р= 10/100 = 0,1. 95% ниво на доверие съответства на критичната стойност Z = 1,96.

Така вероятността между 4,12% и 15,88% от фактурите да съдържат грешки е 95%.

За даден размер на извадката доверителният интервал, съдържащ дела на даден признак в общата съвкупност, изглежда е по-широк, отколкото за непрекъсната случайна променлива. Това е така, защото измерванията на непрекъсната случайна променлива съдържат повече информация, отколкото измерванията на категорични данни. С други думи, категоричните данни, които приемат само две стойности, не съдържат достатъчно информация, за да се оценят параметрите на тяхното разпределение.

Vизчисляване на оценки, получени от ограничена съвкупност

Оценка на математическото очакване.Коефициентът за корекция за крайната популация ( fpc) се използва за намаляване на стандартната грешка с коефициент. При изчисляване на доверителни интервали за оценки на параметрите на популацията се прилага корекционен коефициент в ситуации, при които пробите се извличат, без да се връщат. По този начин, доверителният интервал за математическото очакване с ниво на доверие, равно на (1 - α) х100%, се изчислява по формулата:

Пример 4.За да илюстрираме прилагането на корекционния коефициент за крайната съвкупност, нека се върнем към проблема за изчисляване на доверителния интервал за средния размер на фактури, разгледан по-горе в Пример 3. Да предположим, че една компания издава 5000 фактури на месец и Х= 110,27 долара., С= $28,95 н = 5000, н = 100, α = 0,05, t 99 = 1,9842. По формула (6) получаваме:

Оценка на дела на даден признак.При избор без връщане, интервалът на доверие за частта от характеристиката с ниво на доверие, равно на (1 - α) х100%, се изчислява по формулата:

Интервали на доверие и етични въпроси

Често възникват етични проблеми при вземане на извадка от населението и формулиране на статистически заключения. Основното е как се съгласуват доверителните интервали и точковите оценки на извадковата статистика. Публикуването на точкови оценки без подходящи доверителни интервали (обикновено 95% нива на доверие) и размерите на извадката, от които са получени, може да бъде подвеждащо. Това може да създаде у потребителя впечатлението, че точковата оценка е точно това, от което се нуждае, за да предскаже свойствата на цялата популация. Следователно е необходимо да се разбере, че при всяко изследване интервалните оценки трябва да бъдат поставени на преден план. Освен това трябва да се обърне специално внимание на правилния избор на размери на извадката.

Най-често обект на статистическа манипулация са резултатите от социологически проучвания на населението по различни политически въпроси. В същото време резултатите от проучването се поставят на първите страници на вестниците, а грешката на извадковото изследване и методологията на статистическия анализ се отпечатват някъде по средата. За да се докаже валидността на получените точкови оценки, е необходимо да се посочи размерът на извадката, въз основа на която са получени, границите на доверителния интервал и нивото му на значимост.

Следваща бележка

Използвани материали от книгата Levin and other Statistics for managers. - М .: Уилямс, 2004 .-- с. 448-462

Централна гранична теоремазаявява, че за достатъчно голям размер на извадката, извадковото разпределение на средните може да бъде апроксимирано чрез нормално разпределение. Това свойство не зависи от вида на разпространение на генералната съвкупност.

Доверителен интервал- граничните стойности на статистическата величина, която с дадена доверителна вероятност γ ще бъде в този интервал с по-голяма извадка. Означава се като P (θ - ε. На практика доверителната вероятност γ се избира от стойностите γ = 0,9, γ = 0,95, γ = 0,99, които са достатъчно близки до единицата.

Цел на услугата... Тази услуга дефинира:

  • доверителен интервал за обща средна стойност, доверителен интервал за дисперсия;
  • доверителния интервал за стандартното отклонение, доверителния интервал за общата фракция;
Полученото решение се записва в Word файл (вижте примера). По-долу е дадена видео инструкция как да попълните първоначалните данни.

Пример №1. В колективната ферма от общо стадо от 1000 глави овце 100 овце са подложени на селективна контролна стрижка. В резултат на това беше установено средно срязване на вълна от 4,2 кг на овца. Определете с вероятност 0,99 средноквадратната грешка на извадката при определяне на средното срязване на вълната на овца и границите, в които е затворена стойността на срязването, ако дисперсията е 2,5. Пробата не се повтаря.
Пример №2. От партида вносни продукти на поста на Московската северна митница са взети 20 проби от продукт "А" чрез произволно многократно вземане на проби. В резултат на проверката беше установено средното съдържание на влага на продукт "А" в пробата, което се оказа 6% със стандартно отклонение от 1%.
Определете с вероятност 0,683 границите на средното съдържание на влага на продукта в цялата партида вносни продукти.
Пример №3. Проучване на 36 студенти показа, че средният брой прочетени от тях учебници за учебна година се оказва 6. Ако приемем, че броят на учебниците, прочетени от студент за семестър, има нормален закон за разпределение със стандартно отклонение 6, намерете: А) с надеждност от 0 , 99 интервална оценка за математическото очакване на тази случайна величина; Б) колко вероятно е да се твърди, че средният брой учебници, прочетени от студент за семестър, изчислен за тази извадка, ще се отклони от математическото очакване в абсолютна стойност с не повече от 2.

Класификация на доверителния интервал

По вида на оценявания параметър:

По тип проба:

  1. Доверителен интервал за безкрайна извадка;
  2. Доверителен интервал за крайната проба;
Извадката се нарича повторно вземане на проби.ако избраният обект бъде върнат в популацията, преди да се избере следващият. Извадката се нарича неповтаряща сеако избраният обект не бъде върнат в общата съвкупност. На практика обикновено се работи с неповторяващи се проби.

Изчисляване на средната грешка на извадката за произволна извадка

Несъответствието между стойностите на показателите, получени от извадката, и съответните параметри на общата съвкупност се нарича грешка в представителността.
Обозначаване на основните параметри на генералната и извадковата съвкупност.
Формули за средна извадкова грешка
повторен подборнеповтарящ се избор
за среденза дялза среденза дял
Съотношението между границата на грешката на извадката (Δ), гарантирана с известна вероятност P (t),и средната грешка на извадката има формата: или Δ = t μ, където T- коефициентът на доверие, определен в зависимост от нивото на вероятност P(t) съгласно таблицата на интегралната функция на Лаплас.

Формули за изчисляване на размера на извадката с подходящ метод на случаен подбор

Доверителен интервал(CI; на английски, доверителен интервал - CI), получен при изследване с проба, дава мярка за точността (или несигурността) на резултатите от изследването, за да се направят заключения за популацията на всички такива пациенти (генерална популация). Правилната дефиниция на 95% CI може да бъде формулирана по следния начин: 95% от такива интервали ще съдържат истинската стойност в популацията. Тази интерпретация е малко по-малко точна: CI е диапазонът от стойности, в който човек може да бъде 95% сигурен, че съдържа истинската стойност. Когато се използват CI, акцентът е върху количественото определяне на ефекта, за разлика от P-стойността, която се получава чрез тестване за статистическа значимост. P-стойността не измерва никакво количество, а по-скоро служи като мярка за силата на доказателствата срещу нулевата хипотеза за „без ефект“. Стойността P сама по себе си не ни казва нищо за големината на разликата или дори за нейната посока. Следователно независимите стойности на P са абсолютно неинформативни в статии или резюмета. Обратно, CI показва както количеството ефект от непосредствен интерес, като полезността на лечението, така и силата на доказателствата. Следователно JI е пряко свързано с практиката на EBM.

Подходът за оценка към статистическия анализ, илюстриран от CI, има за цел да измери размера на интересния ефект (чувствителност на диагностичния тест, прогнозирана честота, намаляване на относителния риск при лечението и т.н.), както и да измери несигурността в това ефект. Най-често CI е диапазонът от стойности от двете страни на оценката, в който вероятно е истинската стойност и можете да сте 95% сигурни в това. Споразумението да се използва произволно 95% вероятност, както и стойността на P<0,05 для оценки статистической значимости, и авторы иногда используют 90% или 99% ДИ. Заметим, что слово «интервал» означает диапазон величин и поэтому стоит в единственном числе. Две величины, которые ограничивают интервал, называются «доверительными пределами».

CI се основава на идеята, че същото проучване, извършено върху други проби от пациенти, няма да доведе до идентични резултати, но техните резултати ще бъдат разпределени около истинско, но неизвестно количество. С други думи, CI го описва като „зависима от извадката променливост“. CI не отразява допълнителна несигурност поради други причини; по-специално, то не включва ефектите от селективна загуба на пациенти при проследяване, лошо спазване или неточно измерване на резултата, липса на заслепяване и т.н. Следователно CI винаги подценява общата сума на несигурността.

Изчисляване на доверителния интервал

Таблица A1.1. Стандартни грешки и доверителни интервали за някои клинични измервания

Обикновено CI се изчислява от наблюдавана оценка на количествена мярка, като например разликата (d) между две пропорции и стандартна грешка (SE) в оценката на тази разлика. Така получената приблизително 95% CI е d ± 1,96 SE. Формулата се променя в зависимост от естеството на мярката за резултат и обхвата на CI. Например, в рандомизирано, плацебо-контролирано проучване на ацелуларна ваксина срещу коклюш, 72 от 1670 (4,3%) бебета, които са получили ваксината, са развили коклюш и 240 от 1665 (14,4%) контроли. Разликата в процентите, известна като абсолютно намаляване на риска, е 10,1%. SE на тази разлика е 0,99%. Съответно 95% CI е 10,1% + 1,96 x 0,99%, т.е. от 8.2 до 12.0.

Въпреки различните философски подходи, CI и тестовете за статистическа значимост са тясно свързани математически.

По този начин стойността P е „значителна“; Р<0,05 соответствует 95% ДИ, который исключает величину эффекта, указывающую на отсутствие различия. Например, для различия между двумя средними пропорциями это ноль, а для относительного риска или отношения шансов - единица. При некоторых обстоятельствах эти два подхода могут быть не совсем эквивалентны. Преобладающая точка зрения: оценка с помощью ДИ - предпочтительный подход к суммированию результатов исследования, но ДИ и величина Р взаимодополняющи, и во многих статьях используются оба способа представления результатов.

Несигурността (несигурността) на оценката, изразена в CI, до голяма степен е свързана с квадратния корен от размера на извадката. Малките извадки предоставят по-малко информация от големите и съответно CI е по-широк в по-малка извадка. Например, статия, сравняваща характеристиките на три теста, използвани за диагностициране на инфекция с Helicobacter pylori, съобщава за чувствителност от 95,8% от дихателния тест с урея (95% CI 75-100). Докато броят от 95,8% изглежда впечатляващ, малка извадка от 24 възрастни пациенти с I. pylori означава, че има значителна несигурност в тази оценка, както е показано от широката CI. Всъщност долната граница от 75% е много по-ниска от оценката от 95,8%. Ако същата чувствителност се наблюдава в извадка от 240 души, тогава 95% CI ще бъде 92,5-98,0, което дава повече гаранции, че тестът е силно чувствителен.

При рандомизирани контролирани проучвания (RCTs), незначимите резултати (т.е. тези с P> 0,05) са особено податливи на погрешно тълкуване. CI е особено полезен тук, защото показва колко последователни са резултатите с клинично полезния истински ефект. Например, в RCT, сравняващо шев спрямо анастомоза за защипване на дебелото черво, инфекцията на раната се развива съответно при 10,9% и 13,5% от пациентите (P = 0,30). 95% CI за тази разлика е 2,6% (-2 до +8). Дори в това проучване на 652 пациенти остава вероятността да има скромна разлика в честотата на инфекциите в резултат на двете процедури. Колкото по-малко изследвания, толкова по-голяма е несигурността. Sung et al. извърши RCT за сравняване на инфузия на октреотид със спешна склеротерапия за остро кървене от разширени вени при 100 пациенти. В групата с октреотиди, честотата на спиране на кървенето е 84%; в групата на склеротерапията - 90%, което дава P = 0,56. Имайте предвид, че честотата на продължаващото кървене е подобна на тази при инфекция на раната в споменатото проучване. В този случай обаче 95% CI за разликата между интервенциите е 6% (-7 до +19). Този диапазон е доста широк в сравнение с разликата от 5%, която би представлявала клиничен интерес. Ясно е, че проучването не изключва значителна разлика в ефективността. Следователно заключението на авторите „инфузията на октреотид и склеротерапията са еднакво ефективни при лечение на кървене от разширени вени“ определено не е валидно. В случаи като този, когато, както тук, 95% CI за абсолютно намаляване на риска (ARR) включва нула, CI за брой, необходим за лечение (NNT) е доста трудно да се интерпретира. ... NPLP и неговият CI са получени от реципрочната стойност на ACP (умножена по 100, ако тези стойности са дадени като проценти). Тук получаваме BPHP = 100: 6 = 16,6 с 95% CI от -14,3 до 5,3. Както можете да видите от бележката под линия "d" в таблицата. A1.1, този CI включва стойностите на BPHP от 5,3 до безкрайност и стойностите на BPHP от 14,3 до безкрайност.

CI могат да бъдат конструирани за най-често използваните статистически оценки или сравнения. За RCT тя включва разликата между средните пропорции, относителните рискове, съотношенията на шансовете и NPP. По същия начин, CI могат да бъдат получени за всички основни оценки, направени в проучвания за точността на диагностичните тестове - чувствителност, специфичност, прогнозна стойност на положителен резултат (всички от които са прости пропорции) и съотношения на вероятност - оценки, получени в мета-анализ и проучвания за сравнение с контрол. Компютърна програма за персонални компютри, която покрива много от тези употреби на идентификатор, се предлага с второто издание на Статистика с увереност. Макросите за изчисляване на CI за пропорции са достъпни безплатно за Excel и статистическите програми SPSS и Minitab на http://www.uwcm.ac.uk/study/medicine/epidemiology_statistics / research / statistics / proportions, htm.

Множество оценки на ефекта от лечението

Въпреки че КИ са желателни за първичните резултати от изследването, те не са необходими за всички резултати. CI се занимава с клинично значими сравнения. Например, когато се сравняват две групи, CI, който е изграден за разграничаване между групите, както е показано в примерите по-горе, е правилен, а не CI, който може да бъде изграден за оценката във всяка група. Не само че е безполезно да се предоставят отделни CI за оценки във всяка група, това представяне може да бъде подвеждащо. По същия начин, правилният подход при сравняване на ефикасността на лечението в различни подгрупи е да се сравняват директно две (или повече) подгрупи. Неправилно е да се приеме, че лечението е ефективно само в една подгрупа, ако нейната CI изключва никакъв ефект, а други не. CI също са полезни при сравняване на резултатите в множество подгрупи. На фиг. А 1.1 показва относителния риск от еклампсия при жени с прееклампсия в подгрупа жени от плацебо-контролирано RCT на магнезиев сулфат.

Ориз. A1.2. Графикът на гората показва резултатите от 11 рандомизирани клинични изпитвания на ваксина срещу ротавирус по говедата за превенция на диария спрямо плацебо. При оценката на относителния риск от диария е използван 95% доверителен интервал. Размерът на черния квадрат е пропорционален на количеството информация. Освен това са показани кумулативната оценка на ефективността на лечението и 95% доверителен интервал (обозначен с диаманта). Метаанализът използва модел на случайни ефекти, който надхвърля някои от предварително установените; например, това може да бъде размерът, използван при изчисляване на размера на извадката. За по-строг критерий, целият диапазон на CI трябва да показва ползи, надвишаващи предварително определения минимум.

Вече обсъдихме заблудата да приемем липсата на статистическа значимост като индикация, че две лечения са еднакво ефективни. Също толкова важно е да не се отъждествява статистическата значимост с клиничната значимост. Клиничното значение може да се направи, когато резултатът е статистически значим и величината на оценката на ефикасността на лечението

Изследванията могат да покажат дали резултатите са статистически значими и кои са клинично важни и кои не. На фиг. A1.2 показва резултатите от четири теста, за които цялата CI<1, т.е. их результаты статистически значимы при Р <0,05 , . После высказанного предположения о том, что клинически важным различием было бы сокращение риска диареи на 20% (ОР = 0,8), все эти испытания показали клинически значимую оценку сокращения риска, и лишь в исследовании Treanor весь 95% ДИ меньше этой величины. Два других РКИ показали клинически важные результаты, которые не были статистически значимыми. Обратите внимание, что в трёх испытаниях точечные оценки эффективности лечения были почти идентичны, но ширина ДИ различалась (отражает размер выборки). Таким образом, по отдельности доказательная сила этих РКИ различна.

ДОВЕРЕНИ ИНТЕРВАЛИ ЗА ЧЕСТОТИ И НАТОРЕНИЯ

© 2008

Национален институт по обществено здраве, Осло, Норвегия

Статията описва и обсъжда изчисляването на доверителни интервали за честоти и фракции по методите на Wald, Wilson, Clopper - Pearson, използвайки ъгловата трансформация и по метода на Wald с корекцията на Agresti - Cole. Представеният материал предоставя обща информация за методите за изчисляване на доверителни интервали за честоти и фракции и има за цел да предизвика интереса на читателите на списанието не само към използването на доверителни интервали при представяне на резултатите от собственото им изследване, но и в четене на специализирана литература преди започване на работа по бъдещи публикации.

Ключови думи: доверителен интервал, честота, пропорция

В една от предишните публикации накратко беше споменато описанието на качествените данни и беше съобщено, че тяхната интервална оценка е за предпочитане пред точковата оценка за описване на честотата на поява на изследваната характеристика в общата популация. Всъщност, тъй като проучванията се провеждат с използване на извадкови данни, проекцията на резултатите върху общата съвкупност трябва да съдържа елемент на неточност в оценката на извадката. Доверителният интервал е мярка за точността на оценен параметър. Интересното е, че в някои книги за основна статистика за медицински специалисти темата за доверителните интервали за честотите е напълно игнорирана. В тази статия ще разгледаме няколко метода за изчисляване на доверителни интервали за честоти, които предполагат такива характеристики на извадката като нерепликация и представителност, както и независимостта на наблюденията един от друг. Честотата в тази статия се разбира не като абсолютно число, което показва колко пъти дадена стойност се среща в съвкупността, а като относителна стойност, която определя дела на участниците в изследването, при които се среща изследваната черта.

В биомедицинските изследвания най-често се използват 95% доверителни интервали. Този доверителен интервал е областта, в която истинската пропорция попада в 95% от времето. С други думи, можем да кажем с 95% увереност, че истинската стойност на честотата на поява на даден признак в общата популация ще бъде в рамките на 95% доверителен интервал.

Повечето статистически ръководства за медицински изследователи съобщават, че честотната грешка се изчислява по формулата

където p е честотата на поява на признака в извадката (стойност от 0 до 1). Повечето руски научни статии посочват стойността на честотата на поява на даден признак в извадката (p), както и неговата грешка (s) под формата на p ± s. По-целесъобразно е обаче да се представи 95% доверителен интервал за честотата на поява на даден признак в общата популация, който ще включва стойности от

преди.

В някои ръководства се препоръчва за малки проби стойността от 1,96 да бъде заменена със стойността t за N - 1 степени на свобода, където N е броят на наблюденията в извадката. Стойността на t се намира от таблици за t-разпределението, които са налични в почти всички учебници по статистика. Използването на t разпределението за метода на Wald не осигурява видими предимства пред другите методи, разгледани по-долу, и следователно не се насърчава от някои автори.

Горният метод за изчисляване на доверителни интервали за честоти или фракции е кръстен на Уолд в чест на Ейбрахам Уолд (1902-1950), тъй като широкото му използване започва след публикуването на Wald и Wolfowitz през 1939 г. Самият метод обаче е предложен от Пиер Симон Лаплас (1749–1827) още през 1812 г.

Методът на Wald е много популярен, но използването му е свързано със значителни проблеми. Методът не се препоръчва за малки размери на извадката, както и в случаите, когато честотата на поява на характеристика клони към 0 или 1 (0% или 100%) и е просто невъзможна за честоти 0 и 1. В допълнение, приближението на нормалното разпределение, което се използва за изчисляване на грешката, „Не работи“ в случаите, когато n · p< 5 или n · (1 – p) < 5 . Более консервативные статистики считают, что n · p и n · (1 – p) должны быть не менее 10 . Более детальное рассмотрение метода Вальда показало, что полученные с его помощью доверительные интервалы в большинстве случаев слишком узки, то есть их применение ошибочно создает слишком оптимистичную картину, особенно при удалении частоты встречаемости признака от 0,5, или 50 % . К тому же при приближении частоты к 0 или 1 доверительный интревал может принимать отрицательные значения или превышать 1, что выглядит абсурдно для частот. Многие авторы совершенно справедливо не рекомендуют применять данный метод не только в уже упомянутых случаях, но и тогда, когда частота встречаемости признака менее 25 % или более 75 % . Таким образом, несмотря на простоту расчетов, метод Вальда может применяться лишь в очень ограниченном числе случаев. Зарубежные исследователи более категоричны в своих выводах и однозначно рекомендуют не применять этот метод для небольших выборок , а ведь именно с такими выборками часто приходится иметь дело исследователям-медикам.

Тъй като новата променлива е нормално разпределена, долната и горната граница на 95% доверителен интервал за променливата φ ще бъдат φ-1,96 и φ + 1,96 вляво ">

Вместо 1,96 за малки проби, се препоръчва t да се замени с N - 1 степени на свобода. Този метод не дава отрицателни стойности и позволява по-точна оценка на доверителните интервали за честотите от метода на Уолд. Освен това той е описан в много национални справочници по медицинска статистика, което обаче не доведе до широкото му използване в медицински изследвания. Изчисляването на доверителни интервали с помощта на ъглова трансформация не се препоръчва за честоти, приближаващи се до 0 или 1.

Тук обикновено приключва описанието на методите за оценка на доверителните интервали в повечето книги за основите на статистиката за медицински изследователи и този проблем е характерен не само за местната, но и за чуждестранната литература. И двата метода се основават на централната гранична теорема, която предполага голяма извадка.

Като се вземат предвид недостатъците на оценката на доверителните интервали с помощта на горните методи, Клопър и Пиърсън предлагат през 1934 г. метод за изчисляване на т. нар. точен доверителен интервал, като се отчита биномното разпределение на изследваната черта. Този метод е наличен в много онлайн калкулатори, но получените по този начин доверителни интервали в повечето случаи са твърде широки. В същото време този метод се препоръчва да се използва в случаите, когато е необходима консервативна оценка. Степента на консерватизъм на метода се увеличава с намаляване на размера на извадката, особено когато N< 15 . описывает применение функции биномиального распределения для анализа качественных данных с использованием MS Excel, в том числе и для определения доверительных интервалов, однако расчет последних для частот в электронных таблицах не «затабулирован» в удобном для пользователя виде, а потому, вероятно, и не используется большинством исследователей.

Според много статистици най-оптималната оценка на доверителните интервали за честотите се извършва по метода на Уилсън, предложен още през 1927 г., но практически не използван в местните биомедицински изследвания. Този метод не само дава възможност да се оценят доверителните интервали както за много малки, така и за много високи честоти, но е приложим и за малък брой наблюдения. Най-общо, доверителният интервал според формулата на Уилсън има формата на



където приема стойност от 1,96 при изчисляване на 95% доверителен интервал, N е броят на наблюденията, а p е честотата на поява на характеристика в извадката. Този метод е наличен в онлайн калкулатори, така че приложението му не е проблематично. и не препоръчвайте използването на този метод за n p< 4 или n · (1 – p) < 4 по причине слишком грубого приближения распределения р к нормальному в такой ситуации, однако зарубежные статистики считают метод Уилсона применимым и для малых выборок .

Смята се, че в допълнение към метода на Уилсън, коригираният метод на Wald Agresti-Cole също осигурява оптимална оценка на доверителния интервал за честотите. Корекция по Agresti - Cole е замяна във формулата на Wald на честотата на поява на черта в извадката (p) с p`, при чието изчисляване към числителя се добавя 2, а към знаменателя се добавя 4, тоест p` = (X + 2) / (N + 4), където X е броят на участниците в проучването, които имат изследваната черта, а N е размерът на извадката. Тази модификация води до резултати, много подобни на резултатите от формулата на Уилсън, с изключение на случаите, когато честотата на събитията се доближава до 0% или 100% и извадката е малка. В допълнение към гореспоменатите методи за изчисляване на доверителни интервали за честоти, бяха предложени корекции на непрекъснатостта както за метода на Уолд, така и за метода на Уилсън за малки проби, но проучванията показват, че използването им е непрактично.

Нека разгледаме приложението на горните методи за изчисляване на доверителни интервали, като използваме два примера. В първия случай изследваме голяма извадка от 1000 произволно избрани участници в проучването, от които 450 имат изследваната черта (тя може да бъде рисков фактор, резултат или всяка друга черта), което е 0,45 или 45%. Във втория случай изследването се провежда с помощта на малка извадка, да речем, само 20 души, а изследваната черта присъства само при 1 участник в изследването (5%). Доверителните интервали според метода на Wald, метода на Wald с корекция на Agresti-Cole и метода на Wilson бяха изчислени с помощта на онлайн калкулатор, разработен от Jeff Sauro (http: // www. / Wald. Htm). Коригираните за непрекъснатост доверителни интервали на Уилсън бяха изчислени с помощта на калкулатора, предоставен от Wassar Stats: уеб сайт за статистически изчисления (http: // faculty.vassar.edu / lowry / prop1.html). Изчисленията с помощта на ъгловата трансформация на Фишер бяха извършени „ръчно“, като се използва критичната стойност на t за 19 и 999 степени на свобода, съответно. Резултатите от изчисленията са представени в таблицата и за двата примера.

Доверителни интервали, изчислени по шест различни начина за двата примера, описани в текста

Метод за изчисляване на доверителния интервал

P = 0,0500, или 5%

95% CI за X = 450, N = 1000, P = 0,4500 или 45%

–0,0455–0,2541

Уолда с корекция на Агрести-Коул

<,0001–0,2541

Уилсън с корекция на непрекъснатостта

Clopper - Pearson "точен метод"

Ъглова трансформация

<0,0001–0,1967

Както се вижда от таблицата, за първия пример, доверителният интервал, изчислен по „общоприетия“ метод на Wald, отива в отрицателната област, което не може да бъде за честотите. За съжаление подобни инциденти не са рядкост в руската литература. Традиционният начин за представяне на данните по отношение на честотата и техните грешки частично маскира този проблем. Например, ако честотата на поява на даден признак (като процент) е представена като 2,1 ± 1,4, тогава това не е толкова "болезнено за очите", колкото 2,1% (95% CI: –0,7; 4,9), въпреки че и означава същото. Методът на Wald с корекция на Agresti - Cole и изчисление с помощта на ъгловата трансформация дават долна граница, стремяща се към нула. Методът на Уилсън с корекция на непрекъснатостта и „точният метод“ дават по-широки доверителни интервали от метода на Уилсън. За втория пример всички методи дават приблизително еднакви доверителни интервали (разликите се появяват само в хилядни), което не е изненадващо, тъй като честотата на възникване на събитието в този пример не се различава много от 50%, а размерът на извадката е доста голям.

За читателите, интересуващи се от този проблем, можем да препоръчаме трудовете на R. G. Newcombe и Brown, Cai и Dasgupta, които показват плюсовете и минусите на използването съответно на 7 и 10 различни метода за изчисляване на доверителни интервали. От домашни ръководства се препоръчва да се резервират и, които, освен подробно описание на теорията, представят методите на Wald, Wilson, както и метод за изчисляване на доверителни интервали, като се вземе предвид биномното честотно разпределение. В допълнение към безплатни онлайн калкулатори (http: // www. / Wald. Htm и http: // faculty. Vassar. Edu / lowry / prop1.html), доверителните интервали за честотите (и повече!) могат да бъдат изчислени с помощта на ЦРУ програма ( Анализ на доверителните интервали), която може да бъде изтеглена от http: // www. медицинско училище. сотон. ак. Великобритания / cia /.

Следващата статия ще разгледа едномерните начини за сравняване на качествени данни.

Библиография

Банерджи А.Медицинска статистика на разбираем език: уводен курс / А. Банерджи. - М.: Практическа медицина, 2007 .-- 287 с. Медицинска статистика /. - М.: Агенция за медицинска информация, 2007 .-- 475 с. Гланц С.Биомедицинска статистика / С. Гланц. - М.: Практика, 1998. Типове данни, проверка на разпространението и описателна статистика / // Екология на човека - 2008. - № 1. - С. 52–58. Жижин К. С... Медицинска статистика: учебник /. - Ростов n/a: Phoenix, 2007 .-- 160 с. Приложна медицинска статистика /,. - SPb. : Фолио, 2003 .-- 428 с. Лакин Г. Ф... Биометрия /. - М.: Висше училище, 1990 .-- 350 с. Медик V.A... Математическа статистика в медицината /,. - М.: Финанси и статистика, 2007 .-- 798 с. Математическа статистика в клиничните изследвания /,. - М.: ГЕОТЪР-МЕД, 2001 .-- 256 с. Юнкеров В. И... Медико-статистическа обработка на данни от медицински изследвания /,. - SPb. : ВмедА, 2002 .-- 266 с. Агрести А.Приблизителното е по-добре от точното за интервална оценка на биномни пропорции / А. Агрести, Б. Коул // Американски статистик. - 1998. - N 52. - С. 119-126. Алтман Д.Статистика с увереност // D. Altman, D. Machin, T. Bryant, M. J. Gardner. - Лондон: BMJ Books, 2000 .-- 240 стр. Браун Л. Д.Интервална оценка за биномна пропорция / L. D. Brown, T. T. Cai, A. Dasgupta // Статистическа наука. - 2001. - N 2. - С. 101-133. Clopper C. J.Използването на доверие или фидуциални граници, илюстрирано в случая на бинома / C. J. Clopper, E. S. Pearson // Биометрия. - 1934. - N 26. - С. 404-413. Гарсия-Перес М.А... За доверителния интервал за биномния параметър / M. A. Garcia-Perez // Качество и количество. - 2005. - N 39. - С. 467–481. Мотулски Х.Интуитивна биостатистика // Х. Мотулски. - Оксфорд: Oxford University Press, 1995 .-- 386 стр. Нюкомб Р. Г.Двустранни доверителни интервали за единична пропорция: сравнение на седем метода / R. G. Newcombe // Статистика в медицината. - 1998. - N. 17. - С. 857-872. Сауро Дж.Оценяване на степента на завършване от малки проби с помощта на биномни доверителни интервали: сравнения и препоръки / J. Sauro, J. R. Lewis // Proceedings of the Human Factors and Ergonomics Society Year meeting. - Орландо, Флорида, 2005 г. Уолд А.Доверителни граници за непрекъснати функции на разпределение // A. Wald, J. Wolfovitz // Annals of Mathematical Statistics. - 1939. - N 10. - С. 105-118. Уилсън Е. Б... Вероятен извод, законът за наследяване и статистически извод / E. B. Wilson // Journal of American Statistical Association. - 1927. - N 22. - С. 209-212.

ДОВЕРЕНИ ИНТЕРВАЛИ ЗА ПРОПОРЦИИ

А. М. Гржибовски

Национален институт по обществено здраве, Осло, Норвегия

Статията представя няколко метода за изчисляване на доверителни интервали за биномни пропорции, а именно, Уолд, Уилсън, арксинус, Агрести-Коул и точни методи на Клопър-Пиърсън. Статията дава само общо въведение в проблема с оценката на доверителния интервал на биномна пропорция и целта му е не само да стимулира читателите да използват доверителни интервали, когато представят резултати от собствени емпирични изследвания, но и да ги насърчи да се консултират със статистически книги преди анализиране на собствени данни и подготовка на ръкописи.

Ключови думи: доверителен интервал, пропорция

Информация за връзка:

Старши съветник, Национален институт по обществено здраве, Осло, Норвегия