Pagrindiniai medicinos statistikos terminai ir sąvokos. Statistinio tyrimo rezultatų patikimumo įvertinimas

PATIKIMUMAS STATISTINIS

- Anglų patikimumas/pagrįstumas, statistinis; vokiečių kalba Patvirtintas, statistinis. Nuoseklumas, objektyvumas ir dviprasmiškumo trūkumas atliekant statistinį testą arba C.L. išmatavimų rinkinys. D. s. gali būti išbandytas kartojant tą patį testą (arba klausimyną) su tuo pačiu dalyku, siekiant išsiaiškinti, ar gauti tokie patys rezultatai; arba lyginant skirtingas testo dalis, kurios turėtų matuoti tą patį objektą.

Antinazi. Sociologijos enciklopedija, 2009

Pažiūrėkite, kas yra "STATISTINIS PATIKIMUMAS" kituose žodynuose:

PATIKIMUMAS STATISTINIS- Anglų. patikimumas/pagrįstumas, statistinis; vokiečių kalba Patvirtintas, statistinis. Nuoseklumas, objektyvumas ir dviprasmiškumo trūkumas atliekant statistinį testą arba s. išmatavimų rinkinys. D. s. galima patikrinti pakartojant tą patį testą (arba ... ... Žodynas sociologijoje

Statistikoje reikšmė vadinama statistiškai reikšminga, jei tikimybė, kad ji atsitiks atsitiktinai ar net kraštutinėms reikšmėms, yra maža. Čia kraštutinumas suprantamas kaip testo statistikos nukrypimo nuo nulinės hipotezės laipsnis. Skirtumas vadinamas ... ... Vikipedija

Fizinis statistinio stabilumo reiškinys yra tas, kad padidėjus imties dydžiui, atsitiktinio įvykio dažnis arba vidutinė fizinio dydžio vertė linksta į tam tikrą fiksuotą skaičių. Statistikos fenomenas ... ... Vikipedija

SKIRTUMO PATIKIMAS (panašumas)- analitinė ir statistinė procedūra skirtumų ar panašumų tarp imčių reikšmingumo lygiui nustatyti pagal tiriamus rodiklius (kintamuosius) ... Modernus ugdymo procesas: pagrindinės sąvokos ir terminai

ATASKAITOS, STATISTINIAI Didelis apskaitos žodynas

ATASKAITOS, STATISTINIAI- valstybinio statistinio stebėjimo forma, kai atitinkamos institucijos iš įmonių (organizacijų ir įstaigų) gauna joms reikalingą informaciją įstatymų nustatytų atskaitomybės dokumentų (statistinių ataskaitų) forma ... Didysis ekonomikos žodynas

Mokslas, tiriantis sisteminio stebėjimo metodus masiniai renginiai Socialinis gyvenimasžmonių, sudaryti jų skaitinius aprašymus ir moksliškai apdoroti šiuos aprašymus. Taigi teorinė statistika yra mokslas ... enciklopedinis žodynas F. Brockhausas ir I.A. Efronas

Koreliacijos koeficientas- (Koreliacijos koeficientas) Koreliacijos koeficientas yra statistinis dviejų priklausomybės rodiklis atsitiktiniai dydžiai Koreliacijos koeficiento apibrėžimas, koreliacijos koeficientų rūšys, koreliacijos koeficiento savybės, skaičiavimas ir taikymas ... ... Investuotojo enciklopedija

Statistika- (Statistika) Statistika yra bendras teorinis mokslas, tiriantis kiekybinius reiškinių ir procesų pokyčius. Valstybės statistika, statistikos paslaugos, Rosstat (Goskomstat), statistiniai duomenys, užklausų statistika, pardavimų statistika, ... ... Investuotojo enciklopedija

Koreliacija- (Koreliacija) Koreliacija yra dviejų ar daugiau atsitiktinių dydžių statistinis ryšys Koreliacijos samprata, koreliacijos rūšys, koreliacijos koeficientas, koreliacinė analizė, kainų koreliacija, valiutų porų koreliacija Forex Turinys ... ... Investuotojo enciklopedija

Knygos

Matematikos ir matematikos moksliniai tyrimai: metodinis rinkinys apie studentų tiriamąją veiklą, Borzenko V.I.. Rinkinyje yra metodologinius pokyčius taikomi organizacijoje tiriamoji veikla studentai. Pirmoji kolekcijos dalis skirta tyrimo metodo taikymui…

Statistinis rezultato reikšmingumas (p reikšmė) yra įvertintas pasitikėjimo jo „tikrumu“ (imties reprezentatyvumo prasme) matas. Techniškai kalbant, p reikšmė yra matas, kuris turi mažėjantį ryšį su rezultato patikimumu. Didesnė p reikšmė atitinka mažesnį imtyje rastų kintamųjų ryšio patikimumo lygį. Būtent p-reikšmė parodo klaidos tikimybę, susijusią su stebimo rezultato pasiskirstymu visai populiacijai. Pavyzdžiui, p reikšmė = 0,05 (t. y. 1/20) rodo, kad yra 5 % tikimybė, kad imtyje rastų kintamųjų ryšys yra tik atsitiktinis šios imties požymis. Kitaip tariant, jei šis ryšys neegzistuoja populiacijoje ir panašius eksperimentus atliktumėte daug kartų, maždaug kas dvidešimties eksperimento pakartojimų tikėtumėte tokio paties arba stipresnio ryšio tarp kintamųjų.

Daugelyje tyrimų p-reikšmė 0,05 laikoma „priimtina paklaidos riba“.

Jokiu būdu negalima išvengti savivalės sprendžiant, koks reikšmingumo lygis iš tikrųjų turėtų būti laikomas „reikšmingu“. Tam tikro reikšmingumo lygio, kurį viršijus rezultatai atmetami kaip klaidingi, pasirinkimas yra gana savavališkas. Praktikoje galutinis sprendimas dažniausiai priklauso nuo to, ar rezultatas buvo prognozuojamas a priori (t. y. prieš atliekant eksperimentą), ar aptiktas a posteriori dėl daugybės analizių ir palyginimų, atliktų su daugybe duomenų, taip pat nuo šioje tyrimų srityje egzistuojanti tradicija. Paprastai daugelyje sričių p 0,05 rezultatas yra priimtina statistinio reikšmingumo riba, tačiau reikia atsiminti, kad šis lygis vis dar apima gana didelę paklaidos tikimybę (5%). Rezultatai, reikšmingi esant p 0,01, paprastai laikomi statistiškai reikšmingais, o rezultatai, kai p 0,005 arba p 0,001 – labai reikšmingi. Tačiau reikia suprasti, kad toks reikšmingumo lygių klasifikavimas yra gana savavališkas ir tėra neformalus susitarimas, priimtas remiantis praktine patirtimi konkrečioje studijų srityje.

Kaip jau minėta, priklausomybės ir patikimumo mastai yra du įvairių savybių priklausomybės tarp kintamųjų. Tačiau negalima teigti, kad jie yra visiškai nepriklausomi. Apskritai, kuo didesnis ryšys (ryšis) tarp įprasto dydžio imties kintamųjų, tuo jis patikimesnis.

Jei darysime prielaidą, kad nėra ryšio tarp atitinkamų populiacijos kintamųjų, tai greičiausiai tiriamoje imtyje ryšio tarp šių kintamųjų taip pat nebus. Taigi, kuo stipresnis ryšys randamas imtyje, tuo mažesnė tikimybė, kad šio ryšio nėra populiacijoje, iš kurios jis paimtas.

Imties dydis turi įtakos santykio reikšmingumui. Jei stebėjimų yra nedaug, galimų šių kintamųjų reikšmių derinių yra atitinkamai mažai, todėl tikimybė netyčia rasti reikšmių derinį, rodantį stiprią priklausomybę, yra gana didelė.

Kaip apskaičiuojamas statistinio reikšmingumo lygis. Tarkime, kad jau apskaičiavote santykio tarp dviejų kintamųjų matą (kaip paaiškinta aukščiau). Kitas klausimas prieš jus yra toks: „Kiek reikšminga ši priklausomybė? Pavyzdžiui, ar 40 % paaiškintos dispersijos tarp dviejų kintamųjų pakanka, kad ryšys būtų reikšmingas? Atsakymas: „priklausomai nuo aplinkybių“. Būtent, reikšmingumas daugiausia priklauso nuo imties dydžio. Kaip jau buvo paaiškinta, labai didelėse imtyse net labai silpni ryšiai tarp kintamųjų bus reikšmingi, o mažose imtyse net labai stiprūs ryšiai nėra patikimi. Taigi, norint nustatyti statistinio reikšmingumo lygį, reikia funkcijos, atspindinčios ryšį tarp kiekvieno imties dydžio kintamųjų ryšio „dydžio“ ir „reikšmingumo“. Ši funkcija tiksliai nurodys, „kaip tikimybė gauti tam tikros vertės (ar daugiau) ryšį tam tikro dydžio imtyje, darant prielaidą, kad tokio ryšio populiacijoje nėra“. Kitaip tariant, ši funkcija suteiktų reikšmingumo lygį (p reikšmę), taigi ir tikimybę klaidingai atmesti prielaidą, kad populiacijoje nėra duoto ryšio. Ši „alternatyvi“ hipotezė (kad populiacijoje nėra priklausomybės) paprastai vadinama nuline hipoteze. Būtų idealu, jei funkcija, skaičiuojanti paklaidos tikimybę, būtų tiesinė ir turėtų skirtingus nuolydžius skirtingoms imties dydžiams. Deja, ši funkcija yra daug sudėtingesnė ir ne visada lygiai tokia pati. Tačiau daugeliu atvejų jo forma yra žinoma ir gali būti naudojama reikšmingumo lygiams nustatyti tiriant tam tikro dydžio mėginius. Dauguma šių funkcijų yra susijusios su labai svarbi klasė skirstiniai, vadinami normaliaisiais.

Tyrimas paprastai prasideda nuo tam tikrų prielaidų, reikalaujančių patikrinimo, įtraukiant faktus. Ši prielaida – hipotezė – formuluojama atsižvelgiant į reiškinių ar savybių ryšį tam tikrame objektų rinkinyje.

Norint patikrinti tokias prielaidas faktais, būtina išmatuoti atitinkamas jų nešėjų savybes. Tačiau neįmanoma išmatuoti visų moterų ir vyrų nerimo, kaip neįmanoma išmatuoti visų paauglių agresyvumo. Todėl atliekant tyrimą jie apsiriboja tik palyginti nedidele atitinkamų žmonių populiacijų atstovų grupe.

Gyventojų skaičius- tai visas objektų, kurių atžvilgiu formuluojama tyrimo hipotezė, rinkinys.

Pavyzdžiui, visi vyrai; arba visos moterys; arba visi miesto gyventojai. Bendrosios populiacijos, kurių atžvilgiu tyrėjas, remdamasis tyrimo rezultatais, darys išvadas, gali būti mažesnės ir kuklesnės, pavyzdžiui, visi konkrečios mokyklos pirmokai.

Taigi bendroji populiacija, nors ir nėra begalinė, yra daugybė potencialių dalykų, neprieinamų nuolatiniams tyrimams.

Imtis arba imties visuma- tai riboto skaičiaus objektų grupė (psichologijoje - subjektai, respondentai), specialiai atrinkta iš plačiosios populiacijos, kad ištirtų jos savybes. Atitinkamai vadinamas bendrosios populiacijos savybių tyrimas imtyje atrankiniai tyrimai. Beveik visi psichologiniai tyrimai yra selektyvūs, o jų išvados taikomos bendroms populiacijoms.

Taigi, suformulavus hipotezę ir nustačius atitinkamas bendrąsias populiacijas, tyrėjas susiduria su imties organizavimo problema. Imtis turi būti tokia, kad pasiteisintų imties tyrimo išvadų apibendrinimas – apibendrinimas, jų paskirstymas bendrajai visumai. Pagrindiniai tyrimo išvadų pagrįstumo kriterijai— tai imties reprezentatyvumas ir (empirinių) rezultatų statistinis pagrįstumas.

Imties reprezentatyvumas- kitaip tariant, jos reprezentatyvumas yra imties gebėjimas gana visapusiškai reprezentuoti tiriamus reiškinius - jų kintamumo bendrojoje populiacijoje požiūriu.

Žinoma, tik plačioji populiacija gali pateikti išsamų tiriamo reiškinio vaizdą su visu jo diapazonu ir kintamumo niuansais. Todėl reprezentatyvumas visada ribojamas tiek, kiek yra ribota imtis. Ir būtent imties reprezentatyvumas yra pagrindinis kriterijus nustatant tyrimo išvadų apibendrinimo ribas. Nepaisant to, yra metodų, leidžiančių gauti tyrėjui pakankamą reprezentatyvų pavyzdį (Šios technikos nagrinėjamos kurse „Eksperimentinė psichologija“).

Pirmoji ir pagrindinė technika yra paprastas atsitiktinis (atsitiktinis) pasirinkimas. Tai reiškia, kad kiekvienas populiacijos narys turėtų vienodas galimybes būti įtrauktas į imtį. Atsitiktinė atranka suteikia galimybę patekti į pačių įvairiausių bendrosios populiacijos atstovų atranką. Tuo pačiu metu imamasi specialių priemonių, kad būtų išvengta bet kokio atrankos dėsningumo. Ir tai leidžia tikėtis, kad galiausiai imtyje tirta savybė bus pavaizduota jei ne visa, tai maksimalia įmanoma įvairove.

Antrasis reprezentatyvumo užtikrinimo būdas – stratifikuota atsitiktinė atranka, arba atranka pagal bendrosios populiacijos savybes. Tai apima preliminarų tų savybių, kurios gali turėti įtakos tiriamo turto kintamumui (tai gali būti lytis, pajamų lygis ar išsilavinimas ir kt.), nustatymas. Tada nustatomas šiomis savybėmis besiskiriančių grupių (sluoksnių) skaičiaus procentinis santykis bendrojoje aibėje ir pateikiamas identiškas atitinkamų imties grupių procentinis santykis. Toliau kiekviename imties pogrupyje tiriamieji atrenkami paprastos atsitiktinės atrankos principu.

Statistinis pagrįstumas, arba statistinis reikšmingumas, tyrimo rezultatai nustatomi taikant statistinių išvadų metodus.

Ar esame apdrausti nuo klaidų priimdami sprendimus, darydami tam tikras išvadas iš tyrimo rezultatų? Žinoma ne. Juk mūsų sprendimai yra pagrįsti imties populiacijos tyrimo rezultatais, taip pat mūsų psichologinių žinių lygiu. Mes nesame visiškai apsaugoti nuo klaidų. Statistikoje tokios klaidos laikomos priimtinomis, jei pasitaiko ne daugiau kaip vienu atveju iš 1000 (klaidos tikimybė α = 0,001 arba su ja susijusi teisingos išvados pasikliovimo tikimybės reikšmė p = 0,999); vienu atveju iš 100 (klaidos tikimybė α = 0,01 arba susijusi teisingos išvados pasikliovimo tikimybės reikšmė p = 0,99) arba penkiais atvejais iš 100 (klaidos tikimybė α = 0,05 arba susijusi pasitikėjimo tikimybės reikšmė teisinga išvestis p=0,95). Būtent dviejuose paskutiniuose lygmenyse įprasta priimti sprendimus psichologijoje.

Kartais kalbant apie statistinis pagrįstumas, vartokite „reikšmingumo lygio“ sąvoką (žymima α). Skaitinės p ir α reikšmės papildo viena kitą iki 1000 - tai visas įvykių rinkinys: arba padarėme teisingą išvadą, arba padarėme klaidą. Šie lygiai nėra skaičiuojami, jie nustatomi. Reikšmingumo lygį galima suprasti kaip savotišką „raudoną“ liniją, kurios susikirtimas leis apie šį įvykį kalbėti kaip apie neatsitiktinį. Kiekvienoje kompetentingoje mokslinėje ataskaitoje ar publikacijoje prie padarytų išvadų turi būti nurodytos p arba α vertės, kuriomis remiantis daromos išvados.

Statistinių išvadų metodai išsamiai aptariami kurse " Matematinė statistika“. Kol kas pastebime tik tai, kad jie kelia tam tikrus reikalavimus numeriui arba imties dydis.

Deja, griežtų rekomendacijų dėl preliminaraus reikiamo imties dydžio nustatymo nėra. Be to, atsakymą į klausimą apie reikalingą ir pakankamą jo kiekį tyrėjas dažniausiai gauna per vėlai – tik išanalizavęs jau apklaustos imties duomenis. Tačiau galima suformuluoti bendriausias rekomendacijas:

1. Kuriant diagnostikos metodiką reikalingas didžiausias imties dydis – nuo 200 iki 1000-2500 žmonių.

2. Jei reikia lyginti 2 pavyzdžius, bendras jų skaičius turi būti ne mažesnis kaip 50 žmonių; lyginamų mėginių skaičius turėtų būti maždaug toks pat.

3. Jei tiriamas ryšys tarp kokių nors savybių, imties dydis turi būti ne mažesnis kaip 30-35 žmonės.

4. Kuo daugiau kintamumas iš tiriamos savybės, tuo didesnis turėtų būti imties dydis. Todėl kintamumą galima sumažinti padidinus imties homogeniškumą, pavyzdžiui, pagal lytį, amžių ir pan. Tai, žinoma, sumažina apibendrinančių išvadų galimybę.

Priklausomi ir nepriklausomi pavyzdžiai. Tipiška tyrimo situacija yra tada, kai tyrėją dominanti savybė tiriama dviejuose ar daugiau mėginių tolesniam jų palyginimui. Šie pavyzdžiai gali būti skirtingomis proporcijomis, atsižvelgiant į jų organizavimo tvarką. Nepriklausomi pavyzdžiai pasižymi tuo, kad bet kurio vienos imties subjekto atrankos tikimybė nepriklauso nuo bet kurio iš kitos imties tiriamųjų atrankos. prieš, priklausomi mėginiai pasižymi tuo, kad kiekvienas vienos imties subjektas pagal tam tikrą kriterijų atitinka subjektą iš kitos imties.

AT bendras atvejis priklausomos imtys apima porinę tiriamųjų atranką lyginamose imtyse, o nepriklausomos imtys – nepriklausomą tiriamųjų atranką.

Pažymėtina, kad „iš dalies priklausomų“ (arba „iš dalies nepriklausomų“) imčių atvejai neleidžiami: tai nenuspėjamai pažeidžia jų reprezentatyvumą.

Baigdami pažymime, kad galima išskirti dvi psichologinių tyrimų paradigmas.

Vadinamasis R-metodika apima tam tikros (psichologinės) savybės kintamumo tyrimą veikiant kokiai nors įtakai, veiksniui ar kitai savybei. Pavyzdys yra dalykų rinkinys.

Kitas požiūris Q metodika, apima tiriamojo (vienkartinio) kintamumo tyrimą veikiant įvairiems dirgikliams (sąlygoms, situacijoms ir kt.). Tai atitinka situaciją, kai pavyzdys yra stimulų rinkinys.

Statistika jau seniai buvo neatsiejama gyvenimo dalis. Žmonės su tuo susiduria visur. Remiantis statistika, daromos išvados, kur ir kokios ligos yra dažnos, kas yra paklausesnė konkrečiame regione ar tarp tam tikros gyventojų grupės. Tuo remiasi net politinių kandidatų į valdžios organus programų konstravimas. Jais pirkdami prekes naudoja ir prekybos tinklai, šiais duomenimis savo pasiūlymuose vadovaujasi ir gamintojai.

žaidžiama statistika svarbus vaidmuo visuomenės gyvenime ir daro įtaką kiekvienam atskiram jos nariui, net ir smulkmenose. Pavyzdžiui, jei dauguma žmonių tam tikrame mieste ar regione renkasi tamsias drabužių spalvas, vietinėse parduotuvėse bus labai sunku rasti ryškiai geltoną lietpaltį su gėlių raštu. Bet kokie dydžiai sudaro šiuos duomenis, kurie turi tokį poveikį? Pavyzdžiui, kas yra „statistiškai reikšminga“? Ką tiksliai reiškia šis apibrėžimas?

Kas tai?

Statistika kaip mokslas susideda iš įvairių dydžių ir sąvokų derinio. Viena iš jų – „statistinio reikšmingumo“ sąvoka. Tai yra kintamųjų reikšmės pavadinimas, kuriame kitų rodiklių atsiradimo tikimybė yra nereikšminga.

Pavyzdžiui, 9 iš 10 žmonių ryte eidami grybauti ant kojų užsideda guminius batus rudens miškas po lietingos nakties. Tikimybė, kad kažkuriuo momentu 8 iš jų užsidėjo drobinius mokasinus, yra nereikšminga. Taigi, šiame konkretus pavyzdys skaičius 9 yra reikšmė, kuri vadinama „statistiniu reikšmingumu“.

Atitinkamai, jei toliau plėtosime tai, kas išdėstyta aukščiau praktinis pavyzdys, batų parduotuvės iki vasaros sezono pabaigos guminius batus perka dideliais kiekiais nei kitu metų laiku. Taigi, statistinės reikšmės dydis turi įtakos įprastam gyvenimui.

Žinoma, atliekant sudėtingus skaičiavimus, tarkime, prognozuojant virusų plitimą, atsižvelgiama į daugybę kintamųjų. Tačiau pati reikšmingo statistinių duomenų rodiklio nustatymo esmė yra panaši, nepaisant skaičiavimų sudėtingumo ir nepastovių verčių skaičiaus.

Kaip jis apskaičiuojamas?

Naudojamas skaičiuojant lygties rodiklio „statistinis reikšmingumas“ reikšmę. Tai yra, galima teigti, kad šiuo atveju viską sprendžia matematika. daugiausia paprastas variantas skaičiavimas yra matematinių operacijų grandinė, kurioje dalyvauja šie parametrai:

dviejų tipų rezultatai, gauti atlikus apklausas arba tiriant objektyvius duomenis, pavyzdžiui, sumos, už kurias perkama, žymimos a ir b;
abiejų grupių rodiklis – n;
jungtinės imties dalies vertė - p;
koncepcija" Standartinė klaida» - SE.

Kitas žingsnis – nustatyti bendrą testo rodiklį – t, jo reikšmė lyginama su skaičiumi 1,96. 1,96 yra vidutinė vertė, atitinkanti 95 % intervalą pagal Stjudento t skirstinį.

Dažnai kyla klausimas, kuo skiriasi n ir p reikšmės. Šį niuansą lengva paaiškinti pavyzdžiu. Tarkime, apskaičiuojama vyrų ir moterų lojalumo kokiai nors prekei ar prekės ženklui statistinė reikšmė.

Šiuo atveju po raidžių bus rašoma:

n – respondentų skaičius;
p – patenkintų preke skaičius.

Šiuo atveju apklaustų moterų skaičius bus n1. Atitinkamai, vyrai – n2. Ta pati reikšmė turės skaičius „1“ ir „2“ prie simbolio p.

Testo rodiklio palyginimas su Studento skaičiavimo lentelių vidutinėmis reikšmėmis tampa vadinamuoju „statistiniu reikšmingumu“.

Ką reiškia patvirtinimas?

Bet kurio matematinio skaičiavimo rezultatus visada galima patikrinti, vaikai to mokomi pradinėse klasėse. Logiška manyti, kad kadangi statistiniai rodikliai nustatomi naudojant skaičiavimų grandinę, jie yra tikrinami.

Tačiau statistinio reikšmingumo tikrinimas nėra tik matematika. Statistika susijusi su didelis kiekis kintamieji ir įvairios tikimybės, kurias ne visada galima apskaičiuoti. Tai yra, jei grįšime prie guminių batų pavyzdžio straipsnio pradžioje, tai logišką statistinių duomenų konstravimą, kuriais remsis prekių parduotuvėms pirkėjai, gali sujaukti rudeniui nebūdingi sausi ir karšti orai. . Dėl šio reiškinio įsigyjančių žmonių skaičius guminiai batai, sumažės ir išparduotuvių patirs nuostolių. Žinoma, matematinė formulė negali numatyti oro anomalijos. Šis momentas vadinamas „klaida“.

Tikrinant apskaičiuoto reikšmingumo lygį atsižvelgiama būtent į tokių klaidų tikimybę. Jame atsižvelgiama tiek į apskaičiuotus rodiklius, tiek į priimtus reikšmingumo lygius, tiek į kiekius, paprastai vadinamus hipotezėmis.

Kas yra reikšmingumo lygis?

„Lygio“ sąvoka įtraukta į pagrindinius statistinio reikšmingumo kriterijus. Jis naudojamas taikomojoje ir praktinėje statistikoje. Tai tam tikra vertė, kurioje atsižvelgiama į galimų nukrypimų ar klaidų tikimybę.

Lygis pagrįstas paruoštų mėginių skirtumų nustatymu, leidžia nustatyti jų reikšmingumą arba, atvirkščiai, atsitiktinumą. Ši sąvoka turi ne tik skaitmenines reikšmes, bet ir savitas jų interpretacijas. Jie paaiškina, kaip suprasti reikšmę, o pats lygis nustatomas lyginant rezultatą su vidutiniu indeksu, tai atskleidžia skirtumų patikimumo laipsnį.

Taigi lygmens sąvoką galima pateikti paprastai – tai priimtinos, tikėtinos klaidos ar klaidos rodiklis išvadose, padarytose iš gautų statistinių duomenų.

Kokie reikšmingumo lygiai naudojami?

Klaidų tikimybės koeficientų statistinis reikšmingumas praktikoje grindžiamas trimis pagrindiniais lygiais.

Pirmasis lygis yra riba, kurią pasiekus vertė yra 5%. Tai yra, paklaidos tikimybė neviršija 5% reikšmingumo lygio. Tai reiškia, kad pasitikėjimas išvadų, padarytų remiantis statistinių tyrimų duomenimis, nepriekaištingumu ir neklystamumu siekia 95 proc.

Antrasis lygis yra 1% riba. Atitinkamai, šis skaičius reiškia, kad 99% patikimumu galima vadovautis duomenimis, gautais atliekant statistinius skaičiavimus.

Trečias lygis yra 0,1%. Su šia verte klaidos tikimybė yra lygi procento daliai, tai yra, klaidos praktiškai pašalinamos.

Kas yra statistikos hipotezė?

Klaidos kaip sąvoka yra suskirstytos į dvi sritis, susijusias su nulinės hipotezės priėmimu arba atmetimu. Hipotezė – tai sąvoka, už kurios pagal apibrėžimą slepiasi aibė kitų duomenų ar teiginių. Tai yra kažko, kas susiję su statistinės apskaitos dalyku, tikimybių pasiskirstymo aprašymas.

Paprastuose skaičiavimuose yra dvi hipotezės – nulinė ir alternatyvioji. Skirtumas tarp jų yra tas, kad nulinė hipotezė grindžiama idėja, kad tarp imčių, dalyvaujančių nustatant statistinį reikšmingumą, nėra esminių skirtumų, o alternatyvioji yra visiškai priešinga. Tai yra, alternatyvi hipotezė yra pagrįsta reikšmingu šių mėginių skirtumu.

Kokios yra klaidos?

Klaidos kaip statistikos sąvoka tiesiogiai priklauso nuo vienos ar kitos hipotezės pripažinimo teisinga. Jie gali būti suskirstyti į dvi kryptis arba tipus:

pirmasis tipas yra dėl to, kad buvo priimta nulinė hipotezė, kuri pasirodė esanti neteisinga;
antrasis atsiranda dėl alternatyvos laikymosi.

Pirmojo tipo klaidos vadinamos klaidingai teigiama ir yra gana paplitusios visose srityse, kuriose naudojama statistika. Atitinkamai, antrojo tipo klaida vadinama klaidingai neigiama.

Kodėl statistikoje svarbi regresija?

Regresijos statistinė reikšmė ta, kad pagal ją galima nustatyti, kiek duomenų pagrindu apskaičiuotas įvairių priklausomybių modelis atitinka tikrovę; leidžia nustatyti faktorių pakankamumą ar trūkumą apskaitai ir išvadoms.

Regresijos reikšmė nustatoma lyginant rezultatus su Fisher lentelėse nurodytais duomenimis. Arba naudojant dispersijos analizę. Regresijos rodikliai yra svarbūs atliekant sudėtingus statistinius tyrimus ir skaičiavimus, kuriuose dalyvauja daug kintamųjų, atsitiktinių duomenų ir tikėtinų pokyčių.

Šiandien tai tikrai per lengva: galite prieiti prie kompiuterio ir mažai žinodami apie tai, ką darote, arba visai nežinant, ką darote, kurti sveiko proto ir nesąmones tikrai nuostabiu greičiu. (J. Box)

Pagrindiniai medicinos statistikos terminai ir sąvokos

Šiame straipsnyje pateikiame keletą pagrindinių statistikos sąvokų, kurios yra svarbios medicinos tyrimams. Sąlygos išsamiau aptariamos atitinkamuose straipsniuose.

Variacija

Apibrėžimas. Duomenų (ženklo reikšmių) sklaidos laipsnis reikšmių diapazone

Tikimybė

Apibrėžimas. Tikimybė yra laipsnis, kuriuo tam tikromis sąlygomis gali įvykti tam tikras įvykis.

Pavyzdys. Paaiškinkime termino apibrėžimą sakinyje „Atkūrimo tikimybė naudojant vaistinis preparatas Arimidex lygus 70%. Įvykis – „paciento pasveikimas“, būklė „pacientas vartoja Arimidex“, tikimybės laipsnis – 70% (grubiai tariant, iš 100 Arimidex vartojančių žmonių pasveiksta 70).

Kaupiamoji tikimybė

Apibrėžimas. Kaupiamoji tikimybė išgyventi laiku t yra tokia pati kaip tuo metu išgyvenusių pacientų dalis.

Pavyzdys. Jei sakoma, kad suminė tikimybė išgyventi po penkerių metų gydymo kurso yra 0,7, tai reiškia, kad iš nagrinėjamos pacientų grupės 70% pradinio skaičiaus liko gyvi, o 30% mirė. Kitaip tariant, 30 iš šimto žmonių mirė per pirmuosius 5 metus.

Laikas renginiui

Apibrėžimas. Laikas iki įvykio – tai laikas, išreikštas kai kuriais vienetais, praėjęs nuo tam tikro pradinio laiko iki kokio nors įvykio įvykio.

Paaiškinimas. kaip laiko vienetai medicininiai tyrimai yra dienos, mėnesiai ir metai.

Tipiški pradinių laikų pavyzdžiai:

paciento stebėjimo pradžia

chirurginis gydymas

Tipiški svarstomų įvykių pavyzdžiai:

ligos progresavimas

pasikartojimas

paciento mirtis

Pavyzdys

Apibrėžimas. Atrankos būdu gautos populiacijos dalis.

Remiantis imties analizės rezultatais, daromos išvados apie visą populiaciją, kurios galioja tik tuo atveju, jei atranka buvo atsitiktinė. Kadangi atsitiktinė atranka iš populiacijos praktiškai neįmanoma, reikėtų stengtis, kad imtis būtų bent reprezentatyvi populiacijai.

Priklausomi ir nepriklausomi pavyzdžiai

Apibrėžimas. Pavyzdžiai, kuriuose tyrimo objektai buvo įdarbinti nepriklausomai vienas nuo kito. Alternatyva nepriklausomi pavyzdžiai- priklausomi (sujungti, suporuoti) mėginiai.

Hipotezė

Dvišalės ir vienpusės hipotezės

Pirmiausia paaiškinkime termino hipotezė vartojimą statistikoje.

Daugumos tyrimų tikslas yra patikrinti kurio nors teiginio teisingumą. Vaistų testavimo tikslas dažniausiai yra patikrinti hipotezę, kad vienas vaistas yra veiksmingesnis už kitą (pavyzdžiui, Arimidex yra veiksmingesnis už tamoksifeną).

Siekiant perteikti tyrimo griežtumą, tikrinamas teiginys išreiškiamas matematiškai. Pavyzdžiui, jei A yra Arimidex gydomo paciento gyvenimo metų skaičius, o T yra tamoksifeno vartojančio paciento gyvenimo metų skaičius, tada hipotezė, kurią reikia patikrinti, gali būti parašyta kaip A>T.

Apibrėžimas. Hipotezė vadinama dvipuse, jei ji susideda iš dviejų dydžių lygybės.

Dvipusės hipotezės pavyzdys: A=T.

Apibrėžimas. Hipotezė vadinama vienpuse (vienpuse), jei ji susideda iš dviejų dydžių nelygybės.

Vienpusių hipotezių pavyzdžiai:

Dichotominiai (dvejetainiai) duomenys

Apibrėžimas. Duomenys išreikšti tik dviem galiojančiomis alternatyviomis reikšmėmis

Pavyzdys: pacientas „sveikas“ – „serga“. Edema "yra" - "nėra".

Pasitikėjimo intervalas

Apibrėžimas. Tam tikro dydžio pasikliautinasis intervalas yra diapazonas, esantis maždaug dydžio, kuriame yra tikroji vertėši vertė (su tam tikru pasitikėjimo lygiu).

Pavyzdys. Tegul tiriamas kiekis yra pacientų skaičius per metus. Vidutiniškai jų skaičius yra 500, o 95% - pasitikėjimo intervalas- (350, 900). Tai reiškia, kad greičiausiai (95 proc. tikimybe) į kliniką per metus kreipsis ne mažiau kaip 350 ir ne daugiau kaip 900 žmonių.

Paskyrimas. Labai dažnas santrumpa yra: 95 % PI (95 % PI) yra pasikliautinasis intervalas, kurio patikimumo lygis yra 95 %.

Patikimumas, statistinis reikšmingumas (P – lygis)

Apibrėžimas. Statistinis rezultato reikšmingumas yra pasitikėjimo jo „tiesa“ matas.

Bet koks tyrimas grindžiamas tik dalimi objektų. Vaisto veiksmingumo tyrimas atliekamas ne pagal visus planetos pacientus apskritai, o tik su tam tikra pacientų grupe (visų pacientų analizės atlikti tiesiog neįmanoma).

Tarkime, kad atlikus analizę buvo padaryta tam tikra išvada (pavyzdžiui, Arimidex kaip tinkamo gydymo naudojimas yra 2 kartus veiksmingesnis nei tamoksifenas).

Klausimas, kurį reikia užduoti: "Kiek galite pasitikėti šiuo rezultatu?".

Įsivaizduokite, kad atlikome tyrimą, pagrįstą tik dviem pacientais. Žinoma, tokiu atveju rezultatus reikėtų vertinti su nerimu. Jei buvo tiriamas didelis pacientų skaičius (skaitinė reikšmė " didelis skaičius“ priklauso nuo situacijos), tuomet padarytomis išvadomis jau galima pasitikėti.

Taigi, pasitikėjimo laipsnį lemia p-lygio reikšmė (p-reikšmė).

Aukštesnis p lygis atitinka mažesnį rezultatų, gautų analizuojant mėginį, pasitikėjimo lygį. Pavyzdžiui, p-lygis, lygus 0,05 (5%), rodo, kad tam tikros grupės analizės metu padaryta išvada yra tik atsitiktinis šių objektų požymis, kurio tikimybė yra tik 5%.

Kitaip tariant, labai didele tikimybe (95%) išvada gali būti išplėsta į visus objektus.

Daugelyje tyrimų 5% laikoma priimtina p reikšme. Tai reiškia, kad jei, pavyzdžiui, p=0,01, tai rezultatais galima pasitikėti, bet jei p=0,06, tai neįmanoma.

Studijuoti

perspektyvinis tyrimas yra tyrimas, kurio metu imtys atrenkamos pagal įvesties faktorių, o mėginiuose analizuojamas koks nors gautas veiksnys.

Retrospektyvus tyrimas yra tyrimas, kurio metu imtys atrenkamos pagal gautą faktorių, o mėginiuose analizuojamas tam tikras įvesties faktorius.

Pavyzdys. Pradinis veiksnys yra nėščia moteris, jaunesnė / vyresnė nei 20 metų. Dėl to vaikas yra lengvesnis/sunkesnis nei 2,5 kg. Analizuojame, ar vaiko svoris priklauso nuo mamos amžiaus.

Jei paimtume 2 mėginius, kurių viena yra jaunesnė nei 20 metų motina, kita - vyresni, ir tada analizuojame vaikų masę kiekvienoje grupėje, tai yra perspektyvinis tyrimas.

Jei surinktume 2 mėginius, viename - mamos, kurios pagimdė lengvesnius nei 2,5 kg vaikučius, kitame - sunkesnius, o tada analizuojame kiekvienos grupės mamų amžių, tai ši retrospektyvus tyrimas(natūralu, kad tokį tyrimą galima atlikti tik eksperimentui pasibaigus, t.y. gimus visi vaikai).

Išėjimas

Apibrėžimas. Kliniškai reikšmingas įvykis, laboratorinė vertė ar požymis, kuris domina tyrėją. Klinikinių tyrimų metu rezultatai yra terapinės ar profilaktinės intervencijos veiksmingumo vertinimo kriterijai.

Klinikinė epidemiologija

Apibrėžimas. Mokslas, leidžiantis numatyti konkretų rezultatą kiekvienam konkrečiam pacientui, remiantis klinikinės ligos eigos tyrimu panašiais atvejais taikant griežtą mokslinius metodus pacientų tyrimas, siekiant užtikrinti prognozių tikslumą.

Kohorta

Apibrėžimas. Tyrimo dalyvių grupė, kurią jo formavimosi metu vienija kažkoks bendras bruožas ir studijavo ilgą laiką.

Kontrolė

Istorinė kontrolė

Apibrėžimas. Kontrolinė grupė buvo suformuota ir ištirta laikotarpiu prieš tyrimą.

Lygiagretus valdymas

Apibrėžimas. Kontrolinė grupė, suformuota kartu su pagrindinės grupės formavimu.

Koreliacija

Apibrėžimas. Statistinis dviejų ženklų (kiekybinio arba eilės) ryšys, parodantis, kad didesnė vieno ženklo reikšmė tam tikra dalimi atvejų atitinka didesnę – teigiamos (tiesioginės) koreliacijos atveju – kito ženklo reikšmę arba mažesnę reikšmę. - esant neigiamai (atvirkščiai) koreliacijai.

Pavyzdys. Nustatyta reikšminga koreliacija tarp trombocitų ir leukocitų kiekio paciento kraujyje. Koreliacijos koeficientas yra 0,76.

Rizikos koeficientas (CR)

Apibrėžimas. Rizikos koeficientas (hazard ratio) – tai tam tikro („blogo“) įvykio tikimybės pirmajai objektų grupei ir to paties įvykio tikimybės antrajai objektų grupei santykis.

Pavyzdys. Jei nerūkantys asmenys turi 20 % tikimybę susirgti plaučių vėžiu, o rūkantiems – 100 %, tada CR bus penktadalis. Šiame pavyzdyje pirmoji objektų grupė yra nerūkantieji, antroji grupė – rūkaliai, o plaučių vėžio atsiradimas laikomas „blogu“ įvykiu.

Akivaizdu, kad:

1) jei КР=1, tai įvykio tikimybė grupėse yra tokia pati

2) jei КР>1, tai įvykis įvyksta dažniau su pirmos grupės objektais nei iš antrosios

3) jei CR<1, то событие чаще происходит с объектами из второй группы, чем из первой

Metaanalizė

Apibrėžimas. Su statistinė analizė, apibendrinanti kelių tyrimų, tiriančių tą pačią problemą, rezultatus (dažniausiai gydymo, profilaktikos, diagnostikos metodų efektyvumą). Sujungus tyrimus gaunama didesnė analizės imtis ir didesnė bendrų tyrimų statistinė galia. Naudojamas siekiant padidinti įrodymus ar pasitikėjimą išvada apie tyrimo metodo veiksmingumą.

Kaplan-Meier metodas (keli Kaplan-Meier įverčiai)

Šį metodą išrado statistikai E. L. Kaplanas ir Paulas Meyeris.

Metodas naudojamas įvairiems dydžiams, susijusiems su paciento stebėjimo laiku, apskaičiuoti. Tokių verčių pavyzdžiai:

galimybė pasveikti per vienerius metus vartojant vaistą

pasikartojimo tikimybė po operacijos per trejus metus po operacijos

kumuliacinė penkerių metų išgyvenamumo tikimybė pacientams, sergantiems prostatos vėžiu po organo amputacijos

Paaiškinkime Kaplan-Meier metodo naudojimo pranašumus.

„Įprastos“ analizės (nenaudojant Kaplan-Meier metodo) verčių reikšmė apskaičiuojama padalijus nagrinėjamą laiko intervalą į intervalus.

Pavyzdžiui, jei tiriame paciento mirties tikimybę per 5 metus, tai laiko intervalą galima suskirstyti į 5 dalis (mažiau nei 1 metai, 1-2 metai, 2-3 metai, 3-4 metai, 4- 5 metai), taip ir 10 (po pusę metų) arba kitas intervalų skaičius. Skirtingų skaidinių rezultatai bus skirtingi.

Pasirinkti tinkamiausią skaidinį nėra lengva užduotis.

Kaplan-Meier metodu gautų dydžių verčių įverčiai nepriklauso nuo stebėjimo laiko padalijimo į intervalus, o priklauso tik nuo kiekvieno atskiro paciento gyvenimo trukmės.

Todėl tyrėjui lengviau atlikti analizę, o rezultatai dažnai pasirodo kokybiškesni nei „įprastos“ analizės rezultatai.

Kaplan-Meier kreivė yra išgyvenimo kreivės grafikas, gautas naudojant Kaplan-Meier metodą.

Cox modelis

Šį modelį išrado seras Davidas Roxby Coxas (g. 1924 m.), garsus anglų statistas, daugiau nei 300 straipsnių ir knygų autorius.

Cox modelis naudojamas tais atvejais, kai išgyvenamumo analizėje tiriami kiekiai priklauso nuo laiko funkcijų. Pavyzdžiui, pasikartojimo tikimybė po t metų (t=1,2,…) gali priklausyti nuo laiko log(t) logaritmo.

Svarbus Cox pasiūlyto metodo privalumas yra šio metodo pritaikomumas daugelyje situacijų (modelis nenustato griežtų apribojimų tikimybių skirstinio pobūdžiui ar formai).

Remiantis Cox modeliu, galima atlikti analizę (vadinamą Kokso analize), kurios rezultatas yra rizikos koeficiento reikšmė ir rizikos santykio pasikliautinasis intervalas.

Neparametriniai statistikos metodai

Apibrėžimas. Klasė statistinių metodų, kurie pirmiausia naudojami nenormaliai paskirstytų kiekybinių duomenų analizei, taip pat kokybinių duomenų analizei.

Pavyzdys. Norėdami nustatyti pacientų sistolinio spaudimo skirtumų reikšmę, priklausomai nuo gydymo tipo, naudosime neparametrinį Mann-Whitney testą.

Funkcija (kintama)

Apibrėžimas. X tyrimo objekto (stebėjimo) charakteristikos. Yra kokybinės ir kiekybinės charakteristikos.

Randomizavimas

Apibrėžimas. Atsitiktinio tyrimo objektų paskirstymo į pagrindinę ir kontrolinę grupes metodas naudojant specialias priemones (lenteles ar atsitiktinių skaičių skaitiklį, monetos metimą ir kitus metodus, kaip atsitiktinai priskirti grupės numerį įtrauktam stebėjimui). Atsitiktinis nustatymas sumažina skirtumus tarp grupių pagal žinomus ir nežinomus bruožus, kurie gali turėti įtakos tiriamam rezultatui.

Rizika

Atributika- papildoma nepalankaus rezultato (pavyzdžiui, ligos) rizika dėl tam tikros charakteristikos (rizikos veiksnio) buvimo tyrimo objekte. Tai yra ta ligos išsivystymo rizikos dalis, kuri yra susijusi su šiuo rizikos veiksniu, paaiškinama tuo ir gali būti pašalinta, jei šis rizikos veiksnys būtų pašalintas.

Santykinė rizika- vienos grupės nepalankios būklės rizikos santykis su šios būklės rizika kitoje grupėje. Jis naudojamas prospektyviniuose ir stebėjimo tyrimuose, kai grupės formuojamos iš anksto, o tiriamos būklės atsiradimas dar nėra įvykęs.

slenkantis egzaminas

Apibrėžimas. Metodas, skirtas statistinio modelio stabilumui, patikimumui, našumui (galiojimui) patikrinti, nuosekliai ištrinant stebėjimus ir perskaičiuojant modelį. Kuo panašesni modeliai, tuo stabilesnis ir patikimesnis modelis.

Renginys

Apibrėžimas. Tyrimo metu pastebėtas klinikinis rezultatas, pvz., komplikacijų atsiradimas, atkrytis, pasveikimas, mirtis.

Stratifikacija

Apibrėžimas. M atrankos metodas, kai visų dalyvių, atitinkančių įtraukimo į tyrimą kriterijus, populiacija pirmiausia suskirstoma į grupes (sluoksnius) pagal vieną ar daugiau požymių (dažniausiai lytį, amžių), galinčių turėti įtakos tiriamam rezultatui, o vėliau – į kiekvieną iš šios grupės (sluoksnis), dalyviai yra nepriklausomai verbuojami į eksperimentines ir kontrolines grupes. Tai leidžia tyrėjui subalansuoti svarbias eksperimentinės ir kontrolinės grupės charakteristikas.

Nenumatytų atvejų lentelė

Apibrėžimas. Stebėjimų absoliučių dažnių (skaičių) lentelė, kurios stulpeliai atitinka vieno požymio reikšmes, o eilutės – kito požymio reikšmes (jeigu dvimatė nenumatytų atvejų lentelė). Absoliučių dažnių reikšmės yra ląstelėse, esančiose eilučių ir stulpelių sankirtoje.

Pateiksime nenumatytų atvejų lentelės pavyzdį. Aneurizmos operacija atlikta 194 pacientams. Žinomas edemos sunkumo rodiklis pacientams prieš operaciją.

Edema \ Rezultatas
nėra edemos	20	6	26
vidutinio sunkumo patinimas	27	15	42
ryški edema	8	21	29
mj	55	42	194

Taigi iš 26 ligonių be edemos 20 ligonių išgyveno po operacijos, 6 ligoniai mirė. Iš 42 sergančiųjų vidutinio sunkumo edema išgyveno 27, mirė 15 ir kt.

Chi kvadrato testas nenumatytų atvejų lentelėms

Norint nustatyti vieno ženklo skirtumų, priklausančių nuo kito, reikšmingumą (patikimumą) (pavyzdžiui, operacijos baigtį, priklausomai nuo edemos sunkumo), nenumatytų atvejų lentelėms naudojamas chi kvadrato testas:

Tikimybė

Tegu kurio nors įvykio tikimybė lygi p. Tada tikimybė, kad įvykis neįvyks, yra 1 p.

Pavyzdžiui, jei tikimybė, kad pacientas dar bus gyvas po penkerių metų, yra 0,8 (80 %), tai tikimybė, kad per šį laikotarpį jis mirs, yra 0,2 (20 %).

Apibrėžimas. Tikimybė yra tikimybės, kad įvykis įvyks, ir tikimybės, kad įvykis neįvyks, santykis.

Pavyzdys. Mūsų pavyzdyje (apie pacientą) tikimybė yra 4, nes 0,8/0,2=4

Taigi, pasveikimo tikimybė yra 4 kartus didesnė už mirties tikimybę.

Kiekio vertės aiškinimas.

1) Jei Tikimybė=1, tai įvykio tikimybė lygi tikimybei, kad įvykis neįvyks;

2) jei Tikimybė >1, tai įvykio tikimybė yra didesnė už tikimybę, kad įvykis neįvyks;

3) jei yra galimybė<1, то вероятность наступления события меньше вероятности того, что событие не произойдёт.

šansų santykis

Apibrėžimas.Šansų santykis yra pirmosios objektų grupės šansų santykis su antrosios objektų grupės šansų santykiu.

Pavyzdys. Tarkime, kad tiek vyrai, tiek moterys yra gydomi.

Tikimybė, kad vyras po penkerių metų vis dar bus gyvas, yra 0,6 (60%); tikimybė, kad per šį laikotarpį jis mirs, yra 0,4 (40%).

Panašios tikimybės moterims yra 0,8 ir 0,2.

Šansų santykis šiame pavyzdyje yra

Kiekio vertės aiškinimas.

1) Jei šansų santykis = 1, tada pirmos grupės tikimybė yra lygi antros grupės tikimybei

2) Jei šansų santykis yra >1, tada pirmos grupės tikimybė yra didesnė nei antrosios grupės tikimybė

3) Jei šansų santykis<1, то шанс для первой группы меньше шанса для второй группы