Statistinis patikimumas. Statistinis reikšmingumas

Pagrindinės bet kokios priklausomybės tarp kintamųjų bruožai.

Du iš labiausiai paprastos savybės santykiai tarp kintamųjų: (a) ryšio dydis ir (b) ryšio patikimumas.

- Didumas ... Santykių mastą lengviau suprasti ir išmatuoti nei patikimumą. Pavyzdžiui, jei kurio nors vyro baltųjų kraujo kūnelių skaičius buvo didesnis nei bet kurios moters, galite sakyti, kad ryšys tarp dviejų kintamųjų (lyties ir WCC) yra labai didelis. Kitaip tariant, galite numatyti vieno kintamojo reikšmes iš kito reikšmių.

- Patikimumas ("tiesa"). Tarpusavio priklausomybės patikimumas yra mažiau intuityvi sąvoka nei priklausomybės dydis, tačiau ji yra nepaprastai svarbi. Ryšio patikimumas yra tiesiogiai susijęs su konkrečios imties reprezentatyvumu, kurio pagrindu daromos išvados. Kitaip tariant, patikimumas parodo, kokia tikimybė, kad ryšys bus atrastas iš naujo (kitaip tariant, patvirtintas) remiantis kitos imties, paimtos iš tos pačios populiacijos, duomenimis.

Reikia atsiminti, kad galutinis tikslas beveik niekada nėra išnagrinėti tos konkrečios vertybių imties; imtis yra įdomi tik tiek, kiek ji suteikia informacijos apie visą populiaciją. Jei tyrimas atitinka kai kuriuos specialius kriterijus, rastų ryšių tarp imties kintamųjų patikimumą galima kiekybiškai įvertinti ir pateikti naudojant standartinį statistinį matą.

Priklausomybės ir patikimumo mastai yra du įvairių savybių priklausomybės tarp kintamųjų. Tačiau negalima teigti, kad jie yra visiškai nepriklausomi. Kuo didesnė įprasto dydžio imties kintamųjų ryšio (ryšio) reikšmė, tuo ji patikimesnė (žr. kitą skyrių).

Statistinis rezultato reikšmingumas (p lygis) yra įvertintas pasitikėjimo jo „tiesa“ matas („imties reprezentatyvumo“ prasme). Techniškai kalbant, p lygis yra rodiklis, kuris mažėja didėjant rezultato patikimumui. Daugiau aukštas p lygis atitinka mažesnį imtyje rastų kintamųjų priklausomybės pasitikėjimo lygį. Būtent p-lygis yra paklaidos tikimybė, susijusi su stebimo rezultato išplėtimu į visą populiaciją.

Pavyzdžiui, p lygis = 0,05(t. y. 1/20) rodo, kad yra 5 % tikimybė, kad ryšys tarp imtyje rastų kintamųjų yra tik atsitiktinis duotosios imties požymis. Daugelyje tyrimų p-lygis 0,05 laikomas „priimtina klaidos lygio riba“.

Jokiu būdu negalima išvengti savivalės sprendžiant, koks reikšmingumo lygis iš tikrųjų turėtų būti laikomas „reikšmingu“. Tam tikro reikšmingumo lygio, kurį viršijus rezultatai atmetami kaip klaidingi, pasirinkimas yra gana savavališkas.



Praktikoje galutinis sprendimas dažniausiai priklauso nuo to, ar rezultatas buvo prognozuojamas a priori (ty prieš eksperimentą), ar rastas a posteriori dėl daugybės analizių ir palyginimų, atliktų naudojant daug duomenų, taip pat nuo tradicijos duotoje tyrimų srityje.

Paprastai daugelyje sričių p.05 yra priimtina riba statistinis reikšmingumas tačiau reikia atsiminti, kad šis lygis vis dar apima gana didelę klaidos tikimybę (5%).

Rezultatai, reikšmingi p 0,01 lygiu, paprastai laikomi statistiškai reikšmingais, o rezultatai, kurių p 0,005 arba p. 001 kaip labai reikšmingas. Tačiau reikia suprasti, kad toks reikšmingumo lygių klasifikavimas yra gana savavališkas ir tėra neformalus susitarimas, priimtas remiantis praktine patirtimi. tam tikroje tyrimų srityje.

Akivaizdu, kad kuo daugiau analizių bus atlikta su surinktų duomenų rinkiniu, tuo reikšmingesni (pasirinktu lygiu) rezultatai bus atrasti grynai atsitiktinai.

Kai kurie statistiniais metodais kuriuose yra daug palyginimų ir todėl yra didelė tikimybė, kad tokia klaida pasikartos, atlikite specialų pataisymą arba pataisymą iš viso palyginimai. Tačiau daugelis statistinių metodų (ypač paprasti metodai tiriamoji duomenų analizė) nesiūlo jokio šios problemos sprendimo.

Jei ryšys tarp kintamųjų yra „objektyviai“ silpnas, tai nėra kito būdo tokį ryšį patikrinti, kaip tik tiriant didelę imtį. Net jei imtis yra visiškai reprezentatyvi, poveikis nebus statistiškai reikšmingas, jei imtis yra maža. Panašiai, jei priklausomybė "objektyviai" yra labai stipri, tada ją galima rasti aukštas laipsnis reikšmė net ir labai mažoje imtyje.

Kuo silpnesnis ryšys tarp kintamųjų, tuo didesnis imties dydis reikalingas norint jį prasmingai aptikti.

Daug skirtingų sąsajas tarp kintamųjų. Tam tikro matavimo pasirinkimas konkrečiame tyrime priklauso nuo kintamųjų skaičiaus, naudojamų matavimo skalių, priklausomybių pobūdžio ir kt.

Tačiau daugumai šių priemonių taikomos bendras principas Jie bando įvertinti pastebėtą ryšį lygindami jį su „maksimaliu įmanomu ryšiu“ tarp aptariamų kintamųjų. Techniškai kalbant, įprastu būdu Norint atlikti tokius įvertinimus, reikia pažiūrėti, kaip kintamųjų reikšmės kinta, ir tada apskaičiuoti, kiek viso galimo svyravimų galima paaiškinti „bendra“ („bendra“) dviejų (ar daugiau) variacijų buvimu. kintamieji.

Reikšmė daugiausia priklauso nuo imties dydžio. Kaip jau buvo paaiškinta, labai didelėse imtyse net labai silpni ryšiai tarp kintamųjų bus reikšmingi, o mažose imtyse net labai stiprūs ryšiai nėra patikimi.

Taigi, norint nustatyti statistinio reikšmingumo lygį, reikia funkcijos, kuri atspindėtų ryšį tarp kintamųjų „dydžio“ ir „reikšmingumo“ kiekvienam imties dydžiui.

Tokia funkcija tiksliai nurodytų, „kaip tikimybė gauti tam tikros reikšmės (ar didesnės) priklausomybę tam tikro dydžio imtyje, darant prielaidą, kad populiacijoje tokios priklausomybės nėra“. Kitaip tariant, ši funkcija suteiktų reikšmingumo lygį
(p lygis), taigi ir tikimybė klaidingai atmesti prielaidą, kad šio ryšio populiacijoje nėra.

Tokia „alternatyvioji“ hipotezė (kad populiacijoje nėra priklausomybės) paprastai vadinama nulinė hipotezė.

Būtų idealu, jei funkcija, apskaičiuojanti paklaidos tikimybę, būtų tiesinė ir turėtų skirtingus nuolydžius skirtingoms imties dydžiams. Deja, ši funkcija yra daug sudėtingesnė ir ne visada lygiai tokia pati. Tačiau daugeliu atvejų jo forma yra žinoma ir gali būti naudojama reikšmingumo lygiams nustatyti tiriant tam tikro dydžio mėginius. Dauguma šių funkcijų yra susietos su paskirstymo klase, vadinama normalus .

3 užduotis. Penkiems ikimokyklinukams pateikiamas testas. Kiekvienos užduoties sprendimo laikas yra fiksuojamas. Ar bus statistiškai reikšmingų skirtumų tarp sprendimo laikų pirmieji trys bandomieji elementai?

Dalykų skaičius

Pamatinė medžiaga

Ši užduotis pagrįsta dispersinės analizės teorija. Apskritai dispersinės analizės uždavinys yra nustatyti tuos veiksnius, kurie turi reikšmingos įtakos eksperimento rezultatui. ANOVA gali būti naudojama kelių mėginių vidurkiams palyginti, jei mėginių skaičius yra didesnis nei du. Tam naudojama vienpusė dispersinė analizė.

Siekiant išspręsti iškeltus uždavinius, imamasi taip. Jei optimizavimo parametro gautų verčių dispersijos veiksnių įtakos atveju skiriasi nuo rezultatų dispersijų, kai veiksnių įtakos nėra, toks veiksnys pripažįstamas reikšmingu.

Kaip matyti iš problemos formuluotės, čia naudojami statistinių hipotezių tikrinimo metodai, būtent dviejų empirinių dispersijų tikrinimo problema. Todėl dispersijos analizė yra pagrįsta dispersijų tikrinimu Fišerio testu. Atliekant šią užduotį, reikia patikrinti, ar skirtumai tarp kiekvieno iš šešių ikimokyklinukų pirmųjų trijų testo užduočių sprendimo laiko yra statistiškai reikšmingi.

Nulinė (pagrindinė) hipotezė vadinama H о. E esmė redukuojama iki prielaidos, kad skirtumas tarp lyginamų parametrų yra lygus nuliui (iš čia ir kilęs hipotezės pavadinimas – nulis) ir kad stebimi skirtumai yra atsitiktiniai.

Konkuruojanti (alternatyvi) hipotezė vadinama hipoteze H 1, kuri prieštarauja nuliniam vienetui.

Sprendimas:

Naudodami dispersinės analizės metodą, kurio reikšmingumo lygis α = 0,05, patikrinsime nulinę hipotezę (H о) apie statistiškai reikšmingų skirtumų egzistavimą tarp pirmųjų trijų testo klausimų sprendimo laiko šešiuose ikimokyklinukuose.

Apsvarstykite užduoties sąlygų lentelę, kurioje randame vidutinį kiekvienos iš trijų testo užduočių sprendimo laiką

Dalykų skaičius

Faktorių lygiai

Laikas išspręsti pirmąją testo užduotį (sekundėmis).

Laikas išspręsti antrąją testo užduotį (sekundėmis).

Trečiosios testo užduoties sprendimo laikas (sekundėmis).

Grupės vidurkis

Raskite bendrą vidurkį:

Siekiant atsižvelgti į kiekvieno testo laiko skirtumų reikšmingumą, bendra imties dispersija yra padalinta į dvi dalis, iš kurių pirmoji vadinama faktorialiąja, o antroji – likutine.

Suminę varianto nuokrypių kvadratų sumą nuo bendro vidurkio apskaičiuokime pagal formulę

arba , kur p – testo užduočių sprendimo laiko matavimų skaičius, q – tiriamųjų skaičius. Norėdami tai padaryti, sudarykite kvadratų lentelę

Dalykų skaičius

Faktorių lygiai

Laikas išspręsti pirmąją testo užduotį (sekundėmis).

Laikas išspręsti antrąją testo užduotį (sekundėmis).

Trečiosios testo užduoties sprendimo laikas (sekundėmis).

Statistikos reikšmingumo lygis yra svarbus rodiklis, atspindintis pasitikėjimo gautų (numatytų) duomenų tikslumu ir tikrumu laipsnį. Sąvoka plačiai naudojama įvairiose srityse: nuo sociologinių tyrimų iki statistinio mokslinių hipotezių tikrinimo.

Apibrėžimas

Statistinio reikšmingumo lygis (arba statistiškai reikšmingas rezultatas) parodo, kokia yra tiriamų rodiklių atsitiktinio atsiradimo tikimybė. Bendras statistinis reiškinio reikšmingumas išreiškiamas p reikšmės (p lygio) koeficientu. Atliekant bet kokį eksperimentą ar stebėjimą, yra tikimybė, kad gauti duomenys yra dėl atrankos klaidų. Tai ypač pasakytina apie sociologiją.

Tai yra, statistiškai reikšminga reikšmė yra reikšmė, kurios atsitiktinio įvykimo tikimybė yra labai maža arba linkusi į kraštutinumą. Kraštutinis šiame kontekste yra statistinių duomenų nukrypimo nuo nulinės hipotezės laipsnis (hipotezė, kuri tikrinama, ar jos atitinka gautus imties duomenis). Mokslinėje praktikoje reikšmingumo lygis pasirenkamas prieš renkant duomenis ir, kaip taisyklė, jo koeficientas yra 0,05 (5%). Sistemoms, kuriose tikslios vertės, šis skaičius gali būti 0,01 (1 %) arba mažesnis.

Problemos istorija

Reikšmingumo lygio sąvoką britų statistikas ir genetikas Ronaldas Fisheris pristatė 1925 m., kurdamas statistinių hipotezių tikrinimo metodą. Analizuojant procesą, yra tam tikra tam tikrų reiškinių tikimybė. Sunkumai kyla dirbant su mažomis (arba neaiškiomis) tikimybės procentais, kurios patenka į „matavimo paklaidos“ sąvoką.

Dirbdami su statistiniais duomenimis, kurie nėra pakankamai konkretūs jiems patikrinti, mokslininkai susiduria su nulinės hipotezės problema, kuri „neleidžia“ veikti su mažomis reikšmėmis. Fisheris pasiūlė tokioms sistemoms nustatyti įvykių tikimybę esant 5% (0,05), kaip patogią imties pjūvį, kad būtų atmesta nulinė hipotezė skaičiavimuose.

Fiksuoto koeficiento įvedimas

1933 metais mokslininkai Jerzy Neumannas ir Egonas Pearsonas savo darbuose rekomendavo iš anksto (prieš renkant duomenis) nustatyti tam tikrą reikšmingumo lygį. Šių taisyklių naudojimo pavyzdžiai aiškiai matomi per rinkimus. Tarkime, yra du kandidatai, kurių vienas yra labai populiarus, o kitas mažai žinomas. Akivaizdu, kad pirmasis kandidatas laimės rinkimus, o antrojo šansai linkę nuliui. Jie siekia – bet ne lygiaverčiai: visada yra force majeure, sensacingos informacijos, netikėtų sprendimų, galinčių pakeisti prognozuojamus rinkimų rezultatus, galimybė.

Neumannas ir Pearsonas sutiko, kad Fišerio 0,05 reikšmingumo lygis (žymimas simboliu α) yra patogiausias. Tačiau pats Fischeris 1956 m. nepritarė šios vertės fiksavimui. Jis manė, kad α lygis turėtų būti nustatytas atsižvelgiant į konkrečias aplinkybes. Pavyzdžiui, dalelių fizikoje jis yra 0,01.

P lygio vertė

Terminą p vertė pirmą kartą panaudojo Brownlee 1960 m. P reikšmė (p vertė) yra matas, atvirkščiai susijęs su rezultatų tikrumu. Didžiausia p reikšmė atitinka mažiausią patikimumo lygį kintamųjų priklausomybių imtyje.

Ši reikšmė atspindi klaidų, susijusių su rezultatų interpretavimu, tikimybę. Tarkime, p lygis = 0,05 (1/20). Tai rodo penkių procentų tikimybę, kad ryšys tarp imtyje rastų kintamųjų yra tik atsitiktinė imties ypatybė. Tai yra, jei šios priklausomybės nėra, pakartotinai atliekant panašius eksperimentus, vidutiniškai kas dvidešimtame tyrime, galima tikėtis tokios pat arba didesnės priklausomybės tarp kintamųjų. Dažnai p lygis laikomas klaidų lygio „priimtina riba“.

Beje, p reikšmė gali neatspindėti tikrojo ryšio tarp kintamųjų, o tik parodo tam tikrą vidutinę reikšmę prielaidų ribose. Visų pirma galutinė duomenų analizė taip pat priklausys nuo pasirinktų šio koeficiento verčių. Kai p lygis = 0,05, bus vieni rezultatai, o esant 0,01 koeficientui, kiti.

Statistinių hipotezių tikrinimas

Statistinio reikšmingumo lygis ypač svarbus tikrinant hipotezes. Pavyzdžiui, skaičiuojant dvipusį testą, atmetimo plotas padalijamas po lygiai abiejuose imties skirstinio galuose (nulinės koordinatės atžvilgiu) ir apskaičiuojamas gautų duomenų teisingumas.

Tarkime, stebint procesą (reiškinį), paaiškėjo, kad nauja statistinė informacija rodo nedidelius pokyčius, palyginti su ankstesnėmis reikšmėmis. Tuo pačiu metu rezultatų neatitikimai yra nedideli, neryškūs, bet svarbūs tyrimams. Specialistas susiduria su dilema: ar pokyčiai iš tikrųjų atsiranda, ar tai atrankos klaidos (matavimo netikslumas)?

Tokiu atveju nulinė hipotezė arba pritaikoma, arba atmetama (viskas nurašoma į klaidą arba sistemos pasikeitimas pripažįstamas fait accompli). Problemos sprendimo procesas grindžiamas bendro statistinio reikšmingumo (p reikšmės) ir reikšmingumo lygio (α) santykiu. Jei p lygio< α, значит, нулевую гипотезу отвергают. Чем меньше р-value, тем более значимой является тестовая статистика.

Naudotos vertės

Reikšmingumo lygis priklauso nuo analizuojamos medžiagos. Praktiškai naudojamos šios fiksuotos vertės:

  • α = 0,1 (arba 10%);
  • α = 0,05 (arba 5%);
  • α = 0,01 (arba 1%);
  • α = 0,001 (arba 0,1 %).

Kuo tikslesni skaičiavimai reikalingi, tuo mažesnis koeficientas α naudojamas. Natūralu, kad statistinės prognozės fizikos, chemijos, farmacijos, genetikos srityse reikalauja didesnio tikslumo nei politikos mokslų ir sociologijos srityse.

Reikšmingumo slenksčiai konkrečiose srityse

Didelio tikslumo srityse, tokiose kaip dalelių fizika ir gamybinę veiklą, statistinis reikšmingumas dažnai išreiškiamas standartinio nuokrypio (žymimo sigmos koeficientu – σ) santykiu, palyginti su normaliuoju tikimybių skirstiniu (Gauso skirstiniu). σ yra statistinis rodiklis, nustatantis tam tikro dydžio verčių sklaidą, palyginti su matematiniai lūkesčiai... Naudojamas įvykių tikimybei nubraižyti.

Priklausomai nuo žinių srities, koeficientas σ labai skiriasi. Pavyzdžiui, prognozuojant Higso bozono egzistavimą, parametras σ yra lygus penkiems (σ = 5), o tai atitinka p reikšmę = 1 / 3,5 mln.. Genomo tyrimuose reikšmingumo lygis gali būti 5 × 10 - 8, kas nėra neįprasta šioje srityje.

Efektyvumas

Reikia turėti omenyje, kad koeficientai α ir p reikšmė nėra tikslios charakteristikos. Kad ir koks būtų reikšmingumo lygis tiriamo reiškinio statistikoje, tai nėra besąlyginis pagrindas hipotezei priimti. Pavyzdžiui, kuo mažesnė α reikšmė, tuo didesnė tikimybė, kad hipotezė bus reikšminga. Tačiau yra klaidų rizika, dėl kurios sumažėja tyrimo statistinė galia (reikšmingumas).

Tyrėjai, kurie sutelkia dėmesį tik į statistiškai reikšmingus rezultatus, gali gauti klaidinančių išvadų. Tuo pačiu metu sunku dar kartą patikrinti jų darbą, nes jie taiko prielaidas (kurios iš tikrųjų yra α ir p reikšmės). Todėl visada rekomenduojama kartu su statistinio reikšmingumo skaičiavimu nustatyti ir kitą rodiklį – statistinio efekto dydį. Poveikio dydis yra kiekybinis poveikio stiprumo matas.

Statistinis patikimumas yra būtinas FCC atsiskaitymų praktikoje. Anksčiau buvo pažymėta, kad iš tos pačios bendrosios populiacijos galima pasirinkti kelis mėginius:

Jei jie parinkti teisingai, tai jų vidutiniai rodikliai ir bendrosios visumos rodikliai vienas nuo kito šiek tiek skiriasi reprezentatyvumo paklaidos dydžiu, atsižvelgiant į priimtą patikimumą;

Jei jie pasirenkami iš skirtingų populiacijų, skirtumas tarp jų yra reikšmingas. Imčių palyginimas plačiai svarstomas statistikoje;

Jeigu jie skiriasi nežymiai, ne iš esmės, nežymiai, tai yra iš tikrųjų priklauso tai pačiai bendrajai populiacijai, skirtumas tarp jų vadinamas statistiškai nepatikimu.

Statistiškai patikimas Imčių skirtumas yra labai ir iš esmės besiskirianti imtis, tai yra, priklauso skirtingoms bendroms populiacijoms.

FCC imčių skirtumų statistinio patikimumo vertinimas reiškia įvairių praktinių problemų sprendimą. Pavyzdžiui, naujų mokymo metodų, programų, pratimų rinkinių, testų diegimas, kontrolės pratimai susiję su jų eksperimentiniu patikrinimu, kuris turėtų parodyti, kad bandomoji grupė iš esmės skiriasi nuo kontrolinės grupės. Todėl naudojami specialūs statistiniai metodai, vadinami statistinio patikimumo kriterijais, kurie leidžia nustatyti statistiškai reikšmingo skirtumo tarp imčių buvimą ar nebuvimą.

Visi kriterijai skirstomi į dvi grupes: parametrinius ir neparametrinius. Parametriniai kriterijai reikalauja normalaus skirstinio dėsnio buvimo, t.y. Turiu omenyje privalomą pagrindinių normaliojo dėsnio rodiklių apibrėžimą - aritmetinį vidurkį ir standartinį nuokrypį s. Parametriniai kriterijai yra tiksliausi ir teisingiausi. Neparametriniai testai yra pagrįsti rango (eilės) skirtumais tarp imties elementų.

Štai pagrindiniai statistinio patikimumo kriterijai, naudojami FCC praktikoje: Studento testas ir Fišerio testas.

Studento kriterijus pavadintas anglų mokslininko K. Gosseto vardu (Student – ​​pseudonimas), atradusio šį metodą. Studento testas yra parametrinis, naudojamas palyginimui absoliutūs rodikliai pavyzdžiai. Mėginiai gali būti skirtingo dydžio.

Studento kriterijus apibrėžiamas taip.

1. Raskite Studento t testą pagal šią formulę:


kur yra lyginamų imčių aritmetiniai vidurkiai; t 1, t 2 - reprezentatyvumo paklaidos, atskleistos remiantis lyginamų imčių rodikliais.

2. FCC praktika parodė, kad sportiniam darbui užtenka priimti balo P = 0,95 patikimumą.

Skaičiavimo patikimumui: P = 0,95 (a = 0,05), su laisvės laipsnių skaičiumi

k = n 1 + n 2 - 2 pagal 4 priedo lentelę randame kriterijaus ribinės reikšmės ( t gr).

3. Remiantis normaliojo skirstinio dėsnio savybėmis Stjudento kriterijuje, atliekamas t ir t gr palyginimas.

Darome išvadas:

jei t t gr, tai skirtumas tarp lyginamų imčių yra statistiškai reikšmingas;

jei t t gr, tai skirtumas statistiškai nereikšmingas.

FCC srities mokslininkams statistinio patikimumo įvertinimas yra pirmas žingsnis sprendžiant konkrečią problemą: lyginamos imtys skiriasi iš esmės arba ne iš esmės. Kitas žingsnis – įvertinti šį skirtumą pedagoginiu požiūriu, kurį lemia problemos būklė.

Panagrinėkime Mokinio kriterijaus taikymą konkrečiame pavyzdyje.

2.14 pavyzdys. 18 asmenų grupės tiriamųjų buvo įvertintas širdies susitraukimų dažnis (bpm) prieš x i ir po jo. y i apšilimas.

Įvertinkite apšilimo efektyvumą pagal širdies ritmą. Pradiniai duomenys ir skaičiavimai pateikti lentelėje. 2.30 ir 2.31 val.

2.30 lentelė

Širdies ritmo rodiklių apdorojimas prieš apšilimą


Abiejų grupių klaidos sutapo, nes imčių dydžiai yra vienodi (tiriama ta pati grupė su skirtingos sąlygos), ir vidurkį kvadratiniai nuokrypiai buvo s x = s y = 3 dūžiai / min. Mes pereiname prie Studento kriterijaus apibrėžimo:

Nustatome sąskaitos patikimumą: P = 0,95.

Laisvės laipsnių skaičius k 1 = n 1 + n 2 - 2 = 18 + 18 - 2 = 34. Pagal 4 priedo lentelę randame t gr= 2,02.

Statistinė išvada. Kadangi t = 11,62, o riba t gr = 2,02, tai 11,62> 2,02, t.y. t> t gr, todėl skirtumas tarp imčių yra statistiškai reikšmingas.

Pedagoginė išvada. Nustatyta, kad pagal širdies ritmą skirtumas tarp grupės būklės prieš ir po apšilimo yra statistiškai reikšmingas, t.y. reikšmingas, esminis. Taigi pagal pulso rodiklį galime daryti išvadą, kad apšilimas yra efektyvus.

Fisherio kriterijus yra parametrinis. Jis naudojamas lyginant mėginių sklaidos greitį. Tai, kaip taisyklė, reiškia palyginimą pagal sportinio darbo stabilumą arba funkcinių ir techninių rodiklių stabilumą kūno kultūros ir sporto praktikoje. Mėginiai gali būti įvairaus dydžio.

Fišerio kriterijus apibrėžtas toliau pateikta seka.

1. Pagal formulę raskite Fišerio kriterijų F


kur yra lyginamų imčių dispersijos.

Fišerio kriterijaus sąlygos numato, kad formulės skaitiklyje F randama didelė dispersija, t.y. F skaičius visada yra didesnis už vieną.

Nustatome skaičiavimo patikimumą: P = 0,95 - ir nustatome abiejų imčių laisvės laipsnių skaičių: k 1 = n 1 - 1, k 2 = n 2 - 1.

Pagal 4 priedo lentelę randame F kriterijaus ribinę reikšmę gr.

F ir F kriterijų palyginimas gr leidžia suformuluoti išvadas:

jei F> F gr, tai skirtumas tarp imčių yra statistiškai reikšmingas;

jei F< F гр, то различие между выборками статически недо­стоверно.

Pateikime konkretų pavyzdį.

2.15 pavyzdys. Išanalizuokime dvi rankininkų grupes: x i (n 1= 16 žmonių) ir y i (n 2 = 18 žmonių). Šios sportininkų grupės buvo tiriamos kilimo laikui (-ams) metant kamuolį į vartus.

Ar atstūmimo rodikliai vienodi?

Pradiniai duomenys ir pagrindiniai skaičiavimai pateikti lentelėje. 2,32 ir 2,33.

2.32 lentelė

Pirmos grupės rankininkų atstūmimo rodiklių apdorojimas


Apibrėžkime Fišerio kriterijų:





Pagal 6 priedo lentelėje pateiktus duomenis randame Fgr: Fgr = 2,4

Atkreipkite dėmesį, kad 6 priedo lentelėje pateikiami didesnės ir mažesnės dispersijos laisvės laipsnių skaičiai artėjant dideli skaičiai vis grubesnis. Taigi, didesnės dispersijos laisvės laipsnių skaičius yra tokia tvarka: 8, 9, 10, 11, 12, 14, 16, 20, 24 ir tt, o mažesnis - 28, 29, 30, 40 , 50 ir tt ir tt

Taip yra dėl to, kad padidėjus imties dydžiui, F testo skirtumai mažėja ir galite naudoti lentelės reikšmes, kurios yra artimos pradiniams duomenims. Taigi, pavyzdyje 2.15 = 17 nėra ir galime paimti artimiausią jam reikšmę k = 16, iš kur gauname Fgr = 2.4.

Statistinė išvada. Kadangi Fišerio testas yra F = 2,5> F = 2,4, imtys yra statistiškai reikšmingos.

Pedagoginė išvada. Kilimo laiko (-ų) reikšmės metant kamuolį į vartus abiejų grupių rankininkams labai skiriasi. Šios grupės turėtų būti vertinamos kaip atskiros.

Tolesni tyrimai turėtų parodyti, kokia šio skirtumo priežastis.

2.20 pavyzdys.(apie imties statistinį patikimumą ). Ar pagerėjo žaidėjo kvalifikacija, jei laikas (-ai) nuo signalizacijos iki kamuolio atmušimo treniruotės pradžioje buvo x i, o pabaigoje – i.

Pradiniai duomenys ir pagrindiniai skaičiavimai pateikti lentelėje. 2.40 ir 2.41.

2.40 lentelė

Laiko rodiklių apdorojimas nuo signalizacijos iki kamuolio smūgio treniruotės pradžioje


Nustatykime skirtumą tarp rodiklių grupių pagal Studento kriterijų:

Kai patikimumas P = 0,95 ir laisvės laipsniai k = n 1 + n 2 - 2 = 22 + 22 - 2 = 42 pagal 4 priedo lentelę, randame t gr= 2,02. Kadangi t = 8,3> t gr= 2,02 – skirtumas statistiškai reikšmingas.

Nustatykime skirtumą tarp rodiklių grupių pagal Fisher kriterijų:


Pagal 2 priedo lentelę, kai patikimumas P = 0,95 ir laisvės laipsniai k = 22 - 1 = 21, reikšmė F gr = 21. Kadangi F = 1,53< F гр = = 2,1, различие в рассеивании исходных данных статистически недостоверно.

Statistinė išvada. Pagal aritmetinį vidurkį skirtumas tarp rodiklių grupių yra statistiškai reikšmingas. Kalbant apie sklaidą (sklaidą), skirtumas tarp rodiklių grupių yra statistiškai nereikšmingas.

Pedagoginė išvada. Futbolininko kvalifikacija gerokai pakilo, tačiau reikėtų atkreipti dėmesį į jo parodymų stabilumą.

Pasiruošimas darbui

Prieš atlikdami tai laboratoriniai darbai disciplinoje „Sportinė metrologija“ visi studijų grupės studentai turi sudaryti darbo komandas po 3-4 studentus, už bendrą visų laboratorinių darbų darbo užduoties atlikimą.

Ruošiantis darbui perskaitykite atitinkamus rekomenduojamos literatūros skyrius (žr. 6 duomenų skyrių). Gairės) ir paskaitų konspektai. Išstudijuokite šio laboratorinio darbo 1 ir 2 dalis, taip pat darbo užduotį šiam darbui (4 skyrius).

Paruoškite ataskaitos formą ant standartiniai lakštai A4 formato rašomasis popierius ir į jį įveskite darbui reikalingas medžiagas.

Ataskaitoje turi būti :

Titulinis puslapis nurodant katedrą (UK ir TR), studijų grupę, studento pavardę, vardą, patronimą, laboratorinio darbo numerį ir pavadinimą, jo atlikimo datą, taip pat priimančiojo dėstytojo pavardę, mokslo laipsnį, akademinį rangą ir pareigas. darbas;

Tikslas;

Formulės su skaitinėmis reikšmėmis, kurios paaiškina tarpinius ir galutinius skaičiavimų rezultatus;

Išmatuotų ir apskaičiuotų verčių lentelės;

Užduočiai reikalinga grafinė medžiaga;

Trumpos išvados apie kiekvieno darbo užduoties etapo rezultatus ir apskritai apie atliktus darbus.

Visi grafikai ir lentelės nubraižytos tvarkingai naudojant piešimo priemones. Sąlyginiai grafiniai ir raidžių žymėjimai turi atitikti GOST. Ataskaitą leidžiama surašyti naudojant kompiuterinę (kompiuterinę) įrangą.

Darbo pavedimas

Prieš atlikdamas visus matavimus, kiekvienas komandos narys turi susipažinti su sporto šakų naudojimo taisyklėmis smiginio žaidimai pateiktus 7 priede, kurie būtini tolesniems tyrimo etapams atlikti.

I – tyrimo etapas„Pataikymo į taikinį rezultatų tyrimas sportinis žaidimas Smiginis kiekvieno brigados nario už normalaus paskirstymo įstatymo laikymąsi pagal kriterijų χ 2 Pearsonas ir trijų sigmų kriterijus“

1. išmatuoti (išbandyti) savo (asmeninį) greitį ir veiksmų koordinavimą, metant smiginį 30-40 kartų į apskritą sportinio žaidimo Smiginis taikinį.

2. Matavimų (bandymų) rezultatai x i(su akiniais) išdėlioti formoje variacijų serija ir įveskite į 4.1 lentelę (stulpeliai, darykite viską būtini skaičiavimai, užpildykite reikiamas lenteles ir padarykite atitinkamas išvadas dėl gauto empirinio skirstinio atitikimo normaliajam skirstymo dėsniui, pagal analogiją su panašiais skaičiavimais, 2.12 pavyzdžio lentelėmis ir išvadomis, pateiktomis šių rekomendacijų 2 skyriuje 7-10 puslapiuose. .

4.1 lentelė

Subjektų veiksmų greičio ir koordinavimo laikymasis normalaus paskirstymo dėsnio

P/p Nr. apvaliai
Iš viso

II tyrimo etapas

„Visų tiriamosios grupės mokinių sportinio žaidimo Smiginio taikinį bendrosios populiacijos vidutinių rodiklių įvertinimas pagal vienos brigados narių matavimų rezultatus“.

Įvertinti visų tiriamosios grupės mokinių (pagal klasės žurnalo mokymosi grupės sąrašą) greitumo ir veiksmų koordinacijos rodiklius pagal visų narių sportinio žaidimo Smiginio pataikymo į taikinį rezultatus. brigados, gautos pirmajame šio laboratorinio darbo tyrimo etape.

1. Išduoti greičio ir veiksmų koordinavimo matavimų rezultatus metant smiginį į apskritą sportinio žaidimo Smiginį taikinį visų savo komandos narių (2–4 žmonių), kurie atspindi matavimo rezultatų imtį iš bendros populiacijos (visų ugdymo grupės mokinių matavimo rezultatai, pvz., 15 žmonių), įrašant juos į antrą ir trečią stulpelius 4.2 lentelė.

4.2 lentelė

Greitumo ir veiksmų koordinavimo rodiklių apdorojimas

brigados nariai

P/p Nr.
Iš viso

4.2 lentelėje žemiau reikėtų suprasti , atitiko vidutinį balą (žr. skaičiavimų rezultatus pagal 4.1 lentelę) jūsų komandos nariai ( , gautas pirmajame tyrimo etape. Reikėtų pažymėti, kad paprastai, 4.2 lentelėje pateikta skaičiuojama matavimo rezultatų, gautų vieno komandos nario pirmajame tyrimo etape, vidutinė vertė. , nes tikimybė, kad skirtingų komandos narių matavimų rezultatai sutaps, yra labai maža. Tada dažniausiai vertybes stulpelyje 4.2 lentelė kiekvienai eilutei – lygi 1, a eilutėje „Iš viso Rašoma „Stulpeliai“. jūsų komandos narių skaičius.

2. Atlikite visus 4.2 lentelės užpildymui reikalingus skaičiavimus ir kitus skaičiavimus bei išvadas, panašius į 2.13 pavyzdžio skaičiavimus ir išvadas, pateiktus šio straipsnio 2 dalyje. metodinė plėtra 13-14 puslapiuose. Į tai reikia atsižvelgti apskaičiuojant reprezentatyvumo paklaidą "M" būtina naudoti 2.4 formulę, pateiktą šios metodikos plėtotės 13 puslapyje, nes imtis nedidelė (n, o bendrosios visumos elementų skaičius N yra žinomas ir lygus tiriamosios grupės mokinių skaičiui , pagal tiriamosios grupės žurnalo sąrašą.

III tyrimo etapas

Kiekvieno komandos nario apšilimo efektyvumo įvertinimas pagal rodiklį „Veiksmų greitis ir koordinavimas“ naudojant Studento t testą.

Įvertinkite kiekvieno komandos nario apšilimo, metant smiginį į sportinio žaidimo „Smiginis“ taikinį, atlikto pirmame šio laboratorinio darbo tyrimo etape, efektyvumą pagal rodiklį „Greitis ir. veiksmų koordinavimas“, naudojant Stjudento kriterijų – empirinio skirstinio dėsnio statistinio patikimumo normaliojo skirstinio dėsniui parametrinį kriterijų...

… Iš viso

2. dispersija ir RMS , rodiklio „Greitis ir veiksmų koordinavimas“ matavimų rezultatai pagal apšilimo rezultatus, pateikta 4.3 lentelėje, (žr. panašius skaičiavimus, pateiktus iš karto po 2.14 pavyzdžio 2.30 lentelės šio metodologinio tobulinimo 16 puslapyje).

3. Kiekvienas darbo komandos narys išmatuoti (išmatuoti) savo (asmeninį) greitį ir veiksmų koordinaciją po apšilimo,

… Iš viso

5. Apskaičiuokite vidurkį dispersija ir RMS ,rodiklio „Greitis ir veiksmų koordinavimas“ matavimų rezultatai po apšilimo, pateikta 4.4 lentelėje, užrašykite visą matavimo rezultatą pagal apšilimo rezultatus (žr. panašius skaičiavimus, pateiktus iš karto po 2.14 pavyzdžio 2.31 lentelės šio metodologinio tobulinimo 17 puslapyje).

6. Atlikite visus reikiamus skaičiavimus ir išvadas, panašius į 2.14 pavyzdžio skaičiavimus ir išvadas, pateiktus 2-ame šio metodinio tobulinimo skyriuje 16-17 puslapiuose. Į tai reikia atsižvelgti apskaičiuojant reprezentatyvumo paklaidą "M" būtina naudoti 2.1 formulę, pateiktą šio metodologinio tobulinimo 12 puslapyje, nes imtis yra n, o elementų skaičius bendrojoje aibėje yra N (nežinoma.

IV – tyrimo etapas

Dviejų komandos narių rodiklių „Greitis ir veiksmų koordinavimas“ vienodumo (stabilumo) įvertinimas naudojant Fisher kriterijų

Įvertinkite dviejų komandos narių rodiklių „Greitis ir veiksmų koordinavimas“ vienodumą (stabilumą) pagal Fisher kriterijų pagal matavimų rezultatus, gautus trečiajame šio laboratorinio darbo tyrimo etape.

Norėdami tai padaryti, turite atlikti šiuos veiksmus.

Naudojantis 4.3 ir 4.4 lentelių duomenimis, dispersijų skaičiavimo pagal šias lenteles rezultatai, gauti trečiajame tyrimo etape, bei Fišerio kriterijaus apskaičiavimo ir taikymo metodika vertinant sporto vienodumą (stabilumą) rodikliai, pateikti 2.15 pavyzdyje šios metodinės plėtros 18-19 puslapiuose, padaryti atitinkamas statistines ir pedagogines išvadas.

V-tas tyrimo etapas

Vieno komandos nario rodiklių grupių „Greitis ir veiksmų koordinavimas“ įvertinimas prieš ir po apšilimo.

Hipotezių tikrinimas atliekamas naudojant statistinę analizę. Statistinis reikšmingumas randamas naudojant P reikšmę, kuri atitinka tam tikro įvykio tikimybę, darant prielaidą, kad koks nors teiginys (nulinė hipotezė) yra teisingas. Jei P reikšmė yra mažesnė už nurodytą statistinio reikšmingumo lygį (paprastai 0,05), eksperimentatorius gali saugiai padaryti išvadą, kad nulinė hipotezė yra neteisinga, ir pradėti svarstyti alternatyvią hipotezę. Stjudento t testas gali būti naudojamas P reikšmei apskaičiuoti ir dviejų duomenų rinkinių reikšmingumui nustatyti.

Žingsniai

1 dalis

Eksperimento nustatymas

    Apibrėžkite savo hipotezę. Pirmas žingsnis vertinant statistinį reikšmingumą – pasirinkti klausimą, į kurį norite atsakyti, ir suformuluoti hipotezę. Hipotezė yra teiginys apie eksperimentinius duomenis, jų pasiskirstymą ir savybes. Kiekvienam eksperimentui yra ir nulinė hipotezė, ir alternatyvi hipotezė. Paprastai tariant, turėsite palyginti du duomenų rinkinius, kad nustatytumėte, ar jie yra panašūs, ar skirtingi.

    • Nulinė hipotezė (H 0) paprastai teigia, kad tarp dviejų duomenų rinkinių nėra skirtumo. Pavyzdžiui: tie mokiniai, kurie perskaitė medžiagą prieš pamoką, negauna aukštesnių pažymių.
    • Alternatyvi hipotezė (H a) yra priešinga nulinei hipotezei ir yra teiginys, kurį reikia patvirtinti naudojant eksperimentinius duomenis. Pavyzdžiui: tie mokiniai, kurie perskaitė medžiagą prieš pamoką, gauna aukštesnius pažymius.
  1. Nustatykite reikšmingumo lygį, kad nustatytumėte, kiek duomenų paskirstymas turi skirtis nuo įprasto, kad jis būtų laikomas reikšmingu rezultatu. Reikšmingumo lygis (taip pat vadinamas α (\ ekrano stilius \ alfa)-level) yra statistinio reikšmingumo riba, kurią nustatote. Jei P reikšmė yra mažesnė arba lygi reikšmingumo lygiui, duomenys laikomi statistiškai reikšmingais.

    • Kaip taisyklė, reikšmingumo lygis (reikšmė α (\ ekrano stilius \ alfa)) yra 0,05, tokiu atveju tikimybė aptikti atsitiktinį skirtumą tarp skirtingų duomenų rinkinių yra tik 5%.
    • Kuo didesnis reikšmingumo lygis (ir atitinkamai mažesnė P reikšmė), tuo patikimesni rezultatai.
    • Jei norite gauti daugiau patikimi rezultatai, sumažinkite P reikšmę iki 0,01. Paprastai gamyboje naudojamos mažesnės P vertės, kai reikia nustatyti gaminių defektus. Šiuo atveju reikalingas didelis pasitikėjimas, kad visos dalys veiktų taip, kaip tikėtasi.
    • Daugumai eksperimentų su hipotezėmis pakanka 0,05 reikšmingumo lygio.
  2. Nuspręskite, kurį kriterijų naudosite: vienpusis arba dvipusis. Viena iš Studento t testo prielaidų yra ta, kad duomenys paskirstomi įprastu būdu. Normalus pasiskirstymas yra varpo formos kreivė su maksimalus skaičius rezultatai kreivės viduryje. Studento t testas yra matematinis metodas duomenų patvirtinimas, leidžiantis nustatyti, ar duomenys nepatenka už normalaus skirstinio (daugiau, mažiau ar kreivės „uodegose“).

    • Jei nesate tikri, ar duomenys yra didesni, ar mažesni už atskaitos grupę, naudokite dviejų krypčių testą. Tai leis jums nustatyti reikšmę abiem kryptimis.
    • Jei žinote, kuria kryptimi duomenys gali būti už įprasto pasiskirstymo ribų, naudokite vienpusį testą. Aukščiau pateiktame pavyzdyje tikimės, kad mokinių pažymiai pagerės, todėl galima naudoti vienpusį testą.
  3. Naudodami statistinę galią, nustatykite imties dydį. Statistinė tyrimo galia yra tikimybė, kad tam tikras imties dydis duos laukiamą rezultatą. Bendra galios riba (arba β) yra 80%. Galios analizė be išankstinių duomenų gali būti sudėtinga, nes reikia tam tikros informacijos apie numatomas vidutines kiekvieno duomenų rinkinio vertes ir jų standartinius nuokrypius. Norėdami nustatyti optimalų duomenų imties dydį, naudokite internetinį galios analizės skaičiuotuvą.

    • Mokslininkai paprastai atlieka nedidelį bandomąjį tyrimą, kuriame pateikiami duomenys galios analizei ir imties dydis, reikalingas išsamesniam ir išsamesniam tyrimui.
    • Jei neturite galimybės atlikti bandomojo tyrimo, pabandykite įvertinti galimus vidurkius, remdamiesi literatūra ir kitų žmonių rezultatais. Tai gali padėti nustatyti optimalų imties dydį.

    2 dalis

    Apskaičiuoti standartinis nuokrypis
    1. Užrašykite standartinio nuokrypio formulę. Standartinis nuokrypis yra tai, kiek duomenys yra išsklaidyti. Tai leidžia daryti išvadą, kiek artimi tam tikros imties duomenys. Iš pirmo žvilgsnio formulė atrodo gana sudėtinga, tačiau žemiau pateikti paaiškinimai padės ją suprasti. Formulė yra tokia: s = √∑ ((x i - µ) 2 / (N - 1)).

      • s yra standartinis nuokrypis;
      • ∑ ženklas rodo, kad reikia pridėti visus imties duomenis;
      • x i atitinka i-ąją reikšmę, tai yra atskiras gautas rezultatas;
      • µ yra šios grupės vidurkis;
      • N yra bendras duomenų skaičius imtyje.
    2. Raskite kiekvienos grupės vidurkį. Norėdami apskaičiuoti standartinį nuokrypį, pirmiausia turite rasti kiekvienos tiriamosios grupės vidurkį. Vidurkis žymimas graikiška raide µ (mu). Norėdami rasti vidurkį, tiesiog pridėkite visas gautas reikšmes ir padalykite iš duomenų kiekio (imties dydžio).

      • Pavyzdžiui, apsvarstykite nedidelį duomenų rinkinį, kad surastumėte priešklasių mokinių grupės vidurkį. Paprastumo dėlei naudosime penkių taškų rinkinį: 90, 91, 85, 83 ir 94.
      • Sudėkime visas reikšmes kartu: 90 + 91 + 85 + 83 + 94 = 443.
      • Padalinkite sumą iš reikšmių skaičiaus, N = 5: 443/5 = 88,6.
      • Taigi šios grupės vidurkis yra 88,6.
    3. Iš vidurkio atimkite kiekvieną gautą vertę. Kitas žingsnis susideda iš skirtumo (x i - µ) apskaičiavimo. Norėdami tai padaryti, atimkite kiekvieną gautą vertę iš vidutinės rastos vertės. Mūsų pavyzdyje turime rasti penkis skirtumus:

      • (90 - 88,6), (91 - 88,6), (85 - 88,6), (83 - 88,6) ir (94 - 88,6).
      • Dėl to gauname tokias reikšmes: 1,4, 2,4, -3,6, -5,6 ir 5,4.
    4. Kiekvieną gautą vertę sudėkite į kvadratą ir sudėkite. Kiekvienas iš ką tik rastų kiekių turi būti padalytas kvadratu. Šiame žingsnyje visos neigiamos reikšmės išnyks. Jei po šio veiksmo vis dar turite neigiamų skaičių, pamiršote juos padalyti kvadratu.

      • Mūsų pavyzdyje gauname 1,96, 5,76, 12,96, 31,36 ir 29,16.
      • Sudėkite gautas reikšmes: 1,96 + 5,76 + 12,96 + 31,36 + 29,16 = 81,2.
    5. Padalinkite iš mėginio dydžio atėmus 1. Formulėje suma dalijama iš N - 1 dėl to, kad neatsižvelgiame į bendrą aibę, o vertinimui imame visų mokinių imtį.

      • Atimti: N – 1 = 5 – 1 = 4
      • Padalijimas: 81,2 / 4 = 20,3
    6. Atgauti Kvadratinė šaknis. Padalinę sumą iš imties dydžio atėmus vieną, iš rastos vertės ištraukite kvadratinę šaknį. Tai yra paskutinis standartinio nuokrypio skaičiavimo etapas. Yra statistikos programos, kurios, suvedusios pradinius duomenis, atlieka visus reikiamus skaičiavimus.

      • Mūsų pavyzdyje tų mokinių, kurie perskaitė medžiagą prieš pamoką, pažymių standartinis nuokrypis yra s = √20,3 = 4,51.

      3 dalis

      Nustatykite aktualumą
      1. Apskaičiuokite dispersiją tarp dviejų duomenų grupių. Iki šio veiksmo nagrinėjome tik vienos duomenų grupės pavyzdį. Jei norite palyginti dvi grupes, akivaizdu, kad turėtumėte paimti abiejų grupių duomenis. Apskaičiuokite antrosios duomenų grupės standartinį nuokrypį ir raskite dispersiją tarp dviejų eksperimentinių grupių. Dispersija apskaičiuojama pagal šią formulę: s d = √ ((s 1 / N 1) + (s 2 / N 2)).