Նկարագրություն ուսանողի t թեստ անկախ նմուշների համար: Տարբերությունների հավաստիության որոշում t-ով - Student's t թեստ

Մեթոդը թույլ է տալիս ստուգել այն վարկածը, որ երկու ընդհանուր բնակչության միջին արժեքները, որոնցից համեմատվում են կախյալնմուշները տարբերվում են միմյանցից. Կախվածության ենթադրությունը ամենից հաճախ նշանակում է, որ հատկանիշը չափվում է նույն նմուշի վրա երկու անգամ, օրինակ՝ ազդեցությունից առաջ և հետո: Ընդհանուր դեպքում, մի նմուշի յուրաքանչյուր ներկայացուցչի նշանակվում է ներկայացուցիչ մյուս ընտրանքից (դրանք միավորված են զույգերով), որպեսզի երկու տվյալների շարքերը դրականորեն փոխկապակցված լինեն միմյանց հետ: Ընտրանքային կախվածության ավելի թույլ տեսակներ. նմուշ 1 - ամուսիններ, նմուշ 2 - նրանց կանայք; նմուշ 1 - մեկ տարեկան երեխաներ, նմուշ 2-ը կազմված է 1-ին նմուշի երեխաների երկվորյակներից և այլն:

Ստուգվող վիճակագրական վարկած,ինչպես նախորդ դեպքում, H 0: M 1 = M 2(1-ին և 2-րդ նմուշներում միջին արժեքները հավասար են): Եթե այն մերժվում է, ապա ընդունվում է այլընտրանքային վարկած, որ Մ 1ավելի քիչ) Մ 2.

Նախնական ենթադրություններվիճակագրական ստուգման համար.

□ մեկ ընտրանքի յուրաքանչյուր ներկայացուցչի (մեկ ընդհանուր բնակչությունից) նշանակվում է մեկ այլ ընտրանքի ներկայացուցիչ (մեկ այլ ընդհանուր բնակչությունից).

□ Երկու նմուշների տվյալները դրականորեն փոխկապակցված են (ձևավորել զույգեր);

□ Երկու նմուշներում էլ ուսումնասիրված հատկանիշի բաշխումը համապատասխանում է նորմալ օրենքին:

Աղբյուրի տվյալների կառուցվածքը.Յուրաքանչյուր օբյեկտի համար կա ուսումնասիրված հատկանիշի երկու արժեք (յուրաքանչյուր զույգի համար):

Սահմանափակումներ:հատկանիշի բաշխվածությունը երկու նմուշներում էլ չպետք է էականորեն տարբերվի սովորականից. Երկու նմուշներին համապատասխանող երկու չափումների տվյալները դրականորեն փոխկապակցված են:

Այլընտրանքները: Wilcoxon-ի T թեստ, եթե առնվազն մեկ նմուշի բաշխումը զգալիորեն տարբերվում է նորմալից. Ուսանողի t-թեստ անկախ նմուշների համար. եթե երկու նմուշների տվյալները դրականորեն չեն փոխկապակցված:

Բանաձև Student-ի t-թեստի էմպիրիկ արժեքի համար արտացոլում է այն փաստը, որ տարբերությունների վերլուծության միավորն է տարբերություն (հերթափոխ)բնորոշ արժեքներ յուրաքանչյուր զույգ դիտարկումների համար: Համապատասխանաբար, N զույգ հատկանիշների արժեքներից յուրաքանչյուրի համար նախ հաշվարկվում է տարբերությունը d i = x 1 i - x 2 i.

(3) որտեղ M d-ը արժեքների միջին տարբերությունն է. σ d-ն տարբերությունների ստանդարտ շեղումն է:

Հաշվարկի օրինակ.

Ենթադրենք, թրեյնինգի արդյունավետությունը ստուգելու ընթացքում խմբի 8 անդամներից յուրաքանչյուրին տրվել է «Որքա՞ն հաճախ են ձեր կարծիքները համընկնում խմբի կարծիքների հետ» հարցը։ - երկու անգամ՝ մարզումից առաջ և հետո։ Պատասխանների համար օգտագործվել է 10 բալանոց սանդղակ՝ 1 - երբեք, 5 - կես անգամ, 10 - միշտ: Փորձարկվել է այն վարկածը, որ թրեյնինգի արդյունքում մասնակիցների մոտ կբարձրանա կոնֆորմիզմի ինքնագնահատականը (խմբում մյուսներին նմանվելու ցանկությունը) (α = 0,05): Կազմենք աղյուսակ միջանկյալ հաշվարկների համար (աղյուսակ 3):

Աղյուսակ 3

Մ d = (-6) / 8 = -0,75 տարբերության թվաբանական միջինը: Այս արժեքը հանեք յուրաքանչյուր d-ից (աղյուսակի նախավերջին սյունակը):

Ստանդարտ շեղման բանաձևը տարբերվում է միայն նրանով, որ X-ի փոխարեն հայտնվում է դ. Բոլոր պահանջվող արժեքները փոխարինելով՝ մենք ստանում ենք.

σ d = = 0,886:

Քայլ 1. Հաշվեք չափանիշի էմպիրիկ արժեքը՝ օգտագործելով (3) բանաձևը՝ միջին տարբերությունը Մ դ= -0,75; ստանդարտ շեղում σ d = 0,886; t e = 2,39; Դ Ֆ = 7.

Քայլ 2. Ուսանողի t-չափանիշի կրիտիկական արժեքների աղյուսակից որոշեք նշանակության p-մակարդակը: df = 7-ի համար էմպիրիկ արժեքը գտնվում է p = 0,05 և p - 0,01 կրիտիկական արժեքների միջև: Հետեւաբար, պ< 0,05.

Դ Ֆ Ռ
0,05 0,01 0,001
2,365 3,499 5,408

Քայլ 3. Մենք կայացնում ենք վիճակագրական որոշում և ձևակերպում եզրակացություն. Միջոցների հավասարության վիճակագրական վարկածը մերժվում է։ Եզրակացություն. դասընթացից հետո մասնակիցների կոնֆորմիզմի ինքնագնահատականը վիճակագրորեն զգալիորեն աճել է (նշանակության մակարդակով էջ< 0,05).

Պարամետրային մեթոդները ներառում են երկու նմուշների շեղումների համեմատությունը չափանիշով Ֆ-Ֆիշեր.Երբեմն այս մեթոդը հանգեցնում է արժեքավոր, իմաստալից եզրակացությունների, իսկ անկախ նմուշների համար միջոցների համեմատության դեպքում, շեղումների համեմատությունը կատարվում է. պարտադիրընթացակարգը.

Հաշվարկելու համար F empանհրաժեշտ է գտնել երկու նմուշների շեղումների հարաբերակցությունը և այնպես, որ ավելի մեծ շեղումը լինի համարիչում, իսկ փոքրը՝ հայտարարի մեջ։

Տարբերությունների համեմատություն... Մեթոդը թույլ է տալիս ստուգել այն վարկածը, որ երկու ընդհանուր պոպուլյացիաների շեղումները, որոնցից ստացվել են համեմատվող նմուշները, տարբերվում են միմյանցից: Փորձարկված վիճակագրական վարկածը՝ H 0: σ 1 2 = σ 2 2 (1-ին նմուշի շեղումը հավասար է 2-րդ նմուշի շեղմանը): Եթե ​​այն մերժվում է, ապա ընդունվում է այլընտրանքային վարկած, որ մի շեղումն ավելի մեծ է, քան մյուսը:

Նախնական ենթադրություններԵրկու նմուշ պատահականորեն վերցված են տարբեր ընդհանուր պոպուլյացիաներից՝ ուսումնասիրվող հատկանիշի նորմալ բաշխմամբ:

Աղբյուրի տվյալների կառուցվածքը.ուսումնասիրվող հատկանիշը չափվում է առարկաներով (առարկաներով), որոնցից յուրաքանչյուրը պատկանում է երկու համեմատվող նմուշներից մեկին:

Սահմանափակումներ:հատկանիշի բաշխվածությունը երկու նմուշներում էապես չի տարբերվում նորմալից:

Մեթոդի այլընտրանք. Levene «sTest», որի կիրառումը չի պահանջում նորմալության ենթադրության թեստավորում (օգտագործվում է SPSS ծրագրում)։

Բանաձև F-Fisher չափանիշի էմպիրիկ արժեքի համար.

(4)

որտեղ σ 1 2 - մեծ շեղում, a σ 2 2- ավելի փոքր շեղում: Քանի որ նախապես հայտնի չէ, թե որ շեղումն է ավելի մեծ, ապա p-մակարդակը որոշելու համար մենք օգտագործում ենք Ոչ ուղղորդված այլընտրանքների համար կրիտիկական արժեքների աղյուսակ:Եթե F e> F Kpազատության աստիճանների համապատասխան քանակի համար, ապա Ռ < 0,05 и статистическую гипотезу о равенстве дисперсий можно отклонить (для α = 0,05).

Հաշվարկի օրինակ.

Երեխաներին տրվեցին սովորական թվաբանական առաջադրանքներ, որից հետո պատահականության սկզբունքով ընտրված աշակերտների մեկ կեսին ասացին, որ նրանք չեն անցել թեստը, իսկ մնացածին՝ հակառակը։ Այնուհետև յուրաքանչյուր երեխայի հարցրեցին, թե քանի վայրկյան կպահանջվի նմանատիպ խնդիր լուծելու համար: Փորձարարը հաշվարկել է երեխայի զանգի ժամանակի և կատարված առաջադրանքի արդյունքի տարբերությունը (վայրկյաններով): Ակնկալվում էր, որ անհաջողության մասին հայտնելը երեխայի ինքնագնահատականի որոշակի անբավարարություն կառաջացնի: Փորձարկվող վարկածը (α = 0,005 մակարդակում) այն էր, որ ինքնագնահատումների բազմության շեղումը կախված չէ հաջողության կամ ձախողման մասին հաշվետվություններից (Н 0: σ 1 2 = σ 2 2):

Ստացվել են հետևյալ տվյալները.


Քայլ 1. Չափանիշի էմպիրիկ արժեքը և ազատության աստիճանների թիվը հաշվարկենք բանաձևերով (4).

Քայլ 2. Համաձայն f-Fisher չափանիշի կրիտիկական արժեքների աղյուսակի անուղղորդվածայլընտրանքները կրիտիկական արժեք են գտնում df համարը = 11; df պաստառ= 11. Այնուամենայնիվ, կա միայն կրիտիկական արժեք df համարը= 10 և df դրոշ = 12. Անհնար է վերցնել ավելի մեծ թվով ազատության աստիճաններ, հետևաբար մենք ընդունում ենք դրա համար կրիտիկական արժեքը df համարը= 10: Համար Ռ = 0,05 F Kp = 3.526; համար Ռ = 0,01 F Kp = 5,418.

Քայլ 3. Վիճակագրական որոշում և իմաստալից եզրակացություն կայացնելը. Քանի որ էմպիրիկ արժեքը գերազանցում է կրիտիկական արժեքը Ռ= 0.01 (և նույնիսկ ավելին `համար p = 0.05), ապա այս դեպքում էջ< 0,01 и принимается альтернативная гипо­теза: дисперсия в группе 1 превышает дисперсию в группе 2 (Ռ< 0.01): Հետևաբար, անհաջողության մասին հայտնելուց հետո ինքնագնահատականի անբավարարությունն ավելի բարձր է, քան հաջողության մասին հայտնելուց հետո:

/ սեմինար-վիճակագրություն / տեղեկատու նյութ / ուսանողական t-test արժեքներ

Իմաստըտ - Ուսանողի չափանիշը 0,10, 0,05 և 0,01 նշանակության մակարդակներում.

ν - տատանումների ազատության աստիճաններ

Ուսանողի թեստի ստանդարտ արժեքներ

Ազատության աստիճանների քանակը

Նշանակության մակարդակները

Ազատության աստիճանների քանակը

Նշանակության մակարդակները

սեղան XI

Ֆիշերի թեստի ստանդարտ արժեքները օգտագործվում են երկու նմուշների միջև տարբերությունների նշանակությունը գնահատելու համար

Ազատության աստիճաններ

Նշանակության մակարդակ

Ազատության աստիճաններ

Նշանակության մակարդակ

Ուսանողի t-չափանիշ

Ուսանողի t-test- Ուսանողի բաշխվածության հիման վրա հիպոթեզների (վիճակագրական թեստեր) վիճակագրական փորձարկման մեթոդների դասի ընդհանուր անվանում: T-թեստի օգտագործման ամենատարածված դեպքերը կապված են երկու նմուշներում միջին արժեքների հավասարության ստուգման հետ:

տ- Վիճակագրությունը սովորաբար կառուցվում է հետևյալ ընդհանուր սկզբունքով. համարիչում կա զրոյական մաթեմատիկական ակնկալիքով պատահական փոփոխական (երբ կատարվում է զրոյական վարկածը), իսկ հայտարարում՝ այս պատահական փոփոխականի ստանդարտ շեղման նմուշը, որը ստացվում է որպես Չխառնված շեղումների գնահատման քառակուսի արմատը:

Պատմություն

Այս չափանիշը մշակվել է Ուիլյամ Գոսեթի կողմից՝ Գինեսում գարեջրի որակը գնահատելու համար: Ընկերության առևտրային գաղտնիքները չհրապարակելու պարտավորության հետ կապված (Գինեսի ղեկավարությունը համարում էր վիճակագրական ապարատի օգտագործումն իրենց աշխատանքում), Գոսեթի հոդվածը հրապարակվել է 1908 թվականին «Biometrics» ամսագրում «Ուսանող» կեղծանունով։ «.

Տվյալների պահանջներ

Այս չափանիշը կիրառելու համար անհրաժեշտ է, որ սկզբնական տվյալները ունենան նորմալ բաշխում։ Անկախ նմուշների համար երկու նմուշով թեստ օգտագործելու դեպքում պետք է պահպանվի նաև շեղումների հավասարության պայմանը։ Այնուամենայնիվ, կան այլընտրանքներ Ուսանողի թեստին անհավասար շեղումներ ունեցող իրավիճակների համար:

Տվյալների բաշխման նորմալության պահանջը անհրաժեշտ է ճշգրիտ t (\ displaystyle t) -թեստի համար: Այնուամենայնիվ, նույնիսկ այլ տվյալների բաշխման դեպքում, t (\ displaystyle t) -վիճակագրությունը կարող է օգտագործվել: Շատ դեպքերում այս վիճակագրությունը ասիմպտոտիկ կերպով ունի ստանդարտ նորմալ բաշխում՝ N (0, 1) (\ displaystyle N (0,1)), այնպես որ կարող եք օգտագործել այս բաշխման քվենտիլները: Այնուամենայնիվ, հաճախ նույնիսկ այս դեպքում քվանտիլները օգտագործվում են ոչ թե ստանդարտ նորմալ բաշխման, այլ համապատասխան Student բաշխման համար, ինչպես ճշգրիտ t (\ displaystyle t) -թեստում։ Ասիմպտոտիկորեն դրանք համարժեք են, սակայն փոքր նմուշների վրա Ուսանողի բաշխման վստահության միջակայքերը ավելի լայն են և հուսալի:

Մեկ նմուշի t-test

Օգտագործվում է զրոյական վարկածը ստուգելու համար H 0: E (X) = m (\ displaystyle H_ (0): E (X) = m), որ մաթեմատիկական ակնկալիքը E (X) (\ ցուցադրման ոճը E (X)) հավասար է որոշի հայտնի արժեք m (\ displaystyle m):

Ակնհայտ է, որ զրոյական վարկածի ներքո E (X ¯) = m (\ displaystyle E ((\ overline (X))) = m): Ենթադրելով դիտարկումների ենթադրյալ անկախությունը՝ V (X ¯) = σ 2 / n (\ displaystyle V ((\ overline (X))) = \ սիգմա ^ (2) / n): Օգտագործելով անաչառ շեղումների գնահատումը s X 2 = ∑ t = 1 n (X t - X ¯) 2 / (n - 1) (\ ցուցադրման ոճ s_ (X) ^ (2) = \ գումար _ (t = 1) ^ ( n ) (X_ (t) - (\ overline (X))) ^ (2) / (n-1)) մենք ստանում ենք հետևյալ t-վիճակագրությունը.

t = X ¯ - m s X / n (\ ցուցադրման ոճ t = (\ frac ((\ overline (X)) - m) (s_ (X) / (\ sqrt (n)))))

Զրոյական վարկածի համաձայն այս վիճակագրության բաշխումը t (n - 1) է (\ displaystyle t (n-1)): Հետևաբար, եթե վիճակագրության բացարձակ արժեքը գերազանցում է տվյալ բաշխման կրիտիկական արժեքը (նշանակության տվյալ մակարդակում), ապա զրոյական վարկածը մերժվում է։

Երկու նմուշի t-թեստ անկախ նմուշների համար

Թող լինեն n 1, n 2 չափերի երկու անկախ նմուշներ (\ displaystyle n_ (1) ~, ~ n_ (2)) սովորաբար բաշխված պատահական փոփոխականներ X 1, X 2 (\ displaystyle X_ (1), ~ X_ (2) ): Անհրաժեշտ է ստուգել այս պատահական փոփոխականների մաթեմատիկական ակնկալիքների հավասարության զրոյական վարկածը H 0: M 1 = M 2 (\ displaystyle H_ (0): ~ M_ (1) = M_ (2)) օգտագործելով ընտրանքի տվյալները: .

Դիտարկենք նմուշի միջոցների տարբերությունը Δ = X ¯ 1 - X ¯ 2 (\ ցուցադրման ոճ \ Դելտա = (\ overline (X)) _ (1) - (\ overline (X)) _ (2)): Ակնհայտ է, որ եթե զրոյական վարկածը ճշմարիտ է E (Δ) = M 1 - M 2 = 0 (\ displaystyle E (\ Delta) = M_ (1) -M_ (2) = 0): Այս տարբերության տարբերությունը, հիմնված նմուշների անկախության վրա, V (Δ) = σ 1 2 n 1 + σ 2 2 n 2 (\ ցուցադրման ոճ V (\ Դելտա) = (\ ֆրակ (\ սիգմա _ (1) ^ (2)) (n_ (1))) + (\ frac (\ sigma _ (2) ^ (2)) (n_ (2)))). Այնուհետև օգտագործելով անաչառ շեղումների գնահատումը s 2 = ∑ t = 1 n (X t - X ¯) 2 n - 1 (\ displaystyle s ^ (2) = (\ frac (\ sum _ (t = 1) ^ (n) (X_ (t) - (\ overline (X))) ^ (2)) (n-1))) մենք ստանում ենք ընտրանքային միջոցների տարբերության անկողմնակալ գնահատում. s Δ 2 = s 1 2 n 1 + s 2 2 n 2 (\ displaystyle s _ (\ Delta) ^ (2) = (\ frac (s_ (1) ^ (2)) (n_ (1))) + (\ frac (s_ (2)) ^ (2)) (n_ (2) ))). Հետևաբար, t-վիճակագրությունը զրոյական վարկածի փորձարկման համար է

T = X ¯ 1 - X ¯ 2 s 1 2 n 1 + s 2 2 n 2 (\ ցուցադրման ոճ t = (\ frac ((\ overline (X)) _ (1) - (\ overline (X)) _ ( 2)) (\ sqrt ((\ frac (s_ (1) ^ (2)) (n_ (1))) + (\ frac (s_ (2) ^ (2)) (n_ (2))))) ))

Զրոյական վարկածի ներքո այս վիճակագրությունն ունի t (df) (\ displaystyle t (df)) բաշխում, որտեղ df = (s 1 2 / n 1 + s 2 2 / n 2) 2 (s 1 2 / n 1) 2 / (n 1 - 1) + (s 2 2 / n 2) 2 / (n 2 - 1) (\ displaystyle df = (\ frac ((s_ (1) ^ (2) / n_ (1) + s_ (2) ^ (2) / n_ (2)) ^ (2)) ((s_ (1) ^ (2) / n_ (1)) ^ (2) / (n_ (1) -1) + (s_) (2) ^ (2) / n_ (2)) ^ (2) / (n_ (2) -1))))

Նույն շեղման դեպքը

Եթե ​​ենթադրվում է, որ նմուշների շեղումները նույնն են, ապա

V (Δ) = σ 2 (1 n 1 + 1 n 2) (\ ցուցադրման ոճ V (\ Դելտա) = \ սիգմա ^ (2) \ ձախ ((\ ֆրակ (1) (n_ (1))) + (\ ֆրակ (1) (n_ (2))) \ աջ))

Այնուհետև t-վիճակագրությունը հավասար է.

T = X ¯ 1 - X ¯ 2 s X 1 n 1 + 1 n 2, s X = (n 1 - 1) s 1 2 + (n 2 - 1) s 2 2 n 1 + n 2 - 2 (\ ցուցադրման ոճ t = (\ frac ((\ overline (X)) _ (1) - (\ overline (X)) _ (2)) (s_ (X) (\ sqrt ((\ frac (1) (n_ (1) ))) + (\ frac (1) (n_ (2))))))) ~, ~~ s_ (X) = (\ sqrt (\ frac ((n_ (1) -1) s_ (1) ^ (2) + (n_ (2) -1) s_ (2) ^ (2)) (n_ (1) + n_ (2) -2))))

Այս վիճակագրությունն ունի t բաշխում (n 1 + n 2 - 2) (\ displaystyle t (n_ (1) + n_ (2) -2))

Երկու նմուշի t-թեստ կախյալ նմուշների համար

t (\ displaystyle t) -թեստի էմպիրիկ արժեքը հաշվարկելու համար երկու կախյալ նմուշների տարբերության վերաբերյալ հիպոթեզի թեստում (օրինակ՝ նույն թեստի երկու նմուշ ժամանակային ընդմիջումով), օգտագործվում է հետևյալ բանաձևը.

T = M d s d / n (\ displaystyle t = (\ frac (M_ (d)) (s_ (d) / (\ sqrt (n)))))

որտեղ M d (\ displaystyle M_ (d)) միջին տարբերությունն է, s d (\ displaystyle s_ (d)) տարբերությունների ստանդարտ շեղումն է, իսկ n-ը դիտարկումների թիվն է։

Այս վիճակագրությունը ունի t (n - 1) (\ displaystyle t (n-1)) բաշխում:

Գծային սահմանափակման փորձարկում գծային ռեգրեսիայի պարամետրերի վրա

t-թեստը կարող է նաև փորձարկել կամայական (մեկ) գծային սահմանափակում գծային ռեգրեսիայի պարամետրերի վրա, որոնք գնահատվում են սովորական նվազագույն քառակուսիների մեթոդով: Ենթադրենք, դուք ցանկանում եք ստուգել H 0 վարկածը. c T b = a (\ displaystyle H_ (0): c ^ (T) b = a): Ակնհայտ է, որ զրոյական վարկածի ներքո E (c T b ^ - a) = c TE (b ^) - a = 0 (\ displaystyle E (c ^ (T) (\ hat (b)) - a) = c ^ ( T) E ((\ գլխարկ (բ))) - a = 0): Այստեղ մենք օգտագործեցինք մոդելի պարամետրերի OLS գնահատումների անաչառության հատկությունը E (b ^) = b (\ displaystyle E ((\ hat (b))) = b): Բացի այդ, V (c T b ^ - a) = c TV (b ^) c = σ 2 c T (XTX) - 1 c (\ displaystyle V (c ^ (T) (\ hat (b)) - a ) = c ^ (T) V ((\ hat (b))) c = \ սիգմա ^ (2) c ^ (T) (X ^ (T) X) ^ (- 1) գ). Օգտագործելով իր անաչառ գնահատականը s 2 = E S S / (n - k) (\ displaystyle s ^ (2) = ESS / (n-k)) անհայտ շեղման փոխարեն, մենք ստանում ենք հետևյալ t-վիճակագրությունը.

T = c T b ^ - asc T (XTX) - 1 c (\ displaystyle t = (\ frac (c ^ (T) (\ hat (b)) - a) (s (\ sqrt (c ^ (T) (X ^ (T) X) ^ (- 1) գ)))))

Այս վիճակագրությունը զրոյական հիպոթեզի ներքո ունի t (n - k) (\ displaystyle t (n-k)) բաշխում, ուստի, եթե վիճակագրությունը կրիտիկական արժեքից բարձր է, ապա գծային սահմանափակման զրոյական վարկածը մերժվում է:

Գծային ռեգրեսիայի հարաբերակցության հիպոթեզի փորձարկում

Գծային սահմանափակման հատուկ դեպք է ստուգել այն վարկածը, որ ռեգրեսիայի գործակիցը b j (\ displaystyle b_ (j)) հավասար է a (\ displaystyle a) որոշ արժեքի: Այս դեպքում համապատասխան t-վիճակագրությունը հետևյալն է.

T = b ^ j - asb ^ j (\ displaystyle t = (\ frac ((\ hat (b)) _ (j) -a) (s _ ((\ hat (b)) _ (j)))) )

որտեղ s b ^ j (\ displaystyle s _ ((\ hat (b)) _ (j))) գործակիցների գնահատման ստանդարտ սխալն է, որը գործակիցների գնահատման կովարիանսի մատրիցայի համապատասխան անկյունագծային տարրի քառակուսի արմատն է:

Զրոյական վարկածի համաձայն այս վիճակագրության բաշխումը t (n - k) է (\ displaystyle t (n-k)): Եթե ​​վիճակագրության բացարձակ արժեքը կրիտիկական արժեքից բարձր է, ապա գործակցի և a (\ displaystyle a) տարբերությունը վիճակագրորեն նշանակալի է (ոչ պատահական), հակառակ դեպքում՝ աննշան (պատահական, այսինքն՝ իրական գործակիցը հավանաբար հավասար կամ շատ մոտ է a-ի ենթադրյալ արժեքին (\ displaystyle a))

Մեկնաբանություն

Մաթեմատիկական ակնկալիքների մեկ օրինակով թեստը կարող է կրճատվել մինչև գծային ռեգրեսիայի պարամետրերի գծային սահմանափակումը ստուգելու համար: Մեկ օրինակով թեստում սա «հետընթաց» է հաստատունի համար: Հետևաբար, ռեգրեսիայի s 2 (\ displaystyle s ^ (2)) ուսումնասիրվող պատահական փոփոխականի շեղման նմուշի գնահատումն է, XTX մատրիցը (\ displaystyle X ^ (T) X) n է (\ displaystyle n ), իսկ մոդելի «գործակիցի» գնահատականը ընտրանքային միջինն է։ Դրանից մենք ստանում ենք վերը նշված t-վիճակագրության արտահայտությունը ընդհանուր դեպքի համար:

Նմանապես, կարելի է ցույց տալ, որ երկու նմուշի թեստը հավասար ընտրանքային տարբերություններով նույնպես հանգում է գծային սահմանափակումների ստուգմանը: Երկու նմուշով փորձարկման ժամանակ սա «հետընթաց» է հաստատուն և կեղծ փոփոխականի վրա, որը նույնացնում է ենթանմուշը՝ կախված արժեքից (0 կամ 1). y = a + b D (\ displaystyle y = a + bD): Նմուշների մաթեմատիկական ակնկալիքների հավասարության մասին վարկածը կարելի է ձևակերպել որպես այս մոդելի b գործակցի զրոյի հավասարության վարկած։ Կարելի է ցույց տալ, որ այս վարկածը ստուգելու համար համապատասխան t-վիճակագրությունը հավասար է երկու նմուշի թեստի համար տրված t-վիճակագրությանը:

Այն կարող է կրճատվել նաև տարբեր շեղումների դեպքում գծային սահմանափակումների ստուգմամբ: Այս դեպքում մոդելի սխալների շեղումը երկու արժեք է վերցնում: Դրա հիման վրա կարելի է նաև ստանալ t-վիճակագրություն, որը նման է երկու նմուշի թեստի համար ցուցադրվածին:

Ոչ պարամետրային անալոգներ

Անկախ նմուշների համար երկու նմուշի թեստի անալոգը Mann-Whitney U-թեստն է: Կախված նմուշների հետ կապված իրավիճակի համար անալոգներն են նշանների թեստը և Wilcoxon T թեստը

գրականություն

Ուսանող.Միջինի հավանական սխալը. // Biometrika. 1908. Թիվ 6 (1). P. 1-25.

Հղումներ

Նովոսիբիրսկի պետական ​​տեխնիկական համալսարանի կայքում միջոցների միատարրության մասին վարկածների փորձարկման չափանիշների մասին

Թեստի արդյունքների մեկնաբանման համարժեք մոտեցումը հետևյալն է. Եթե զրոյական վարկածը ճիշտ է, մենք կարող ենք հաշվարկել, թե որքան մեծ է հավանականությունըստանալ տ- չափանիշ, որը հավասար է կամ մեծ է իրական արժեքից, որը մենք հաշվարկել ենք առկա նմուշի տվյալների հիման վրա: Եթե ​​պարզվի, որ այս հավանականությունը ավելի քիչ է, քան նախկինում ընդունված նշանակության մակարդակը (օրինակ՝ Պ< 0.05), мы вправе отклонить проверяемую нулевую гипотезу. Именно такой подход сегодня используется чаще всего: исследователи приводят в своих работах P-значение, которое легко рассчитывается при помощи статистических программ. Рассмотрим, как это можно сделать в системе R.

Ենթադրենք, մենք ունենք տվյալներ 11 կնոջ համար սննդից էներգիայի օրական ընդունման վերաբերյալ (կՋ/օր) (օրինակ՝ վերցված գրքից. Altman D. G. (1981) Բժշկական հետազոտությունների գործնական վիճակագրություն, Chapman & Hall, Լոնդոն):


Այս 11 դիտարկումների միջինը հետևյալն է.


Հարց. այս նմուշի միջինը տարբերվու՞մ է սահմանված 7725 կՋ/օր նորմայից: Մեր նմուշի արժեքի և այս ստանդարտի միջև տարբերությունը բավականին պարկեշտ է. 7725 - 6753.6 = 971.4: Բայց որքա՞ն մեծ է այս տարբերությունը վիճակագրորեն: Մեկ նմուշ տ-փորձարկում. Ինչպես մյուս տարբերակները տ-թեստ, Ուսանողի մեկ օրինակով թեստը կատարվում է R-ում՝ օգտագործելով t.test () ֆունկցիան.


Հարցն այն է, թե արդյոք այս միջին ցուցանիշները վիճակագրորեն տարբեր են: Եկեք փորձարկենք այն վարկածը, որ օգտագործելով տարբերություն չկա տ-փորձարկում:

Բայց ինչպե՞ս, նման դեպքերում, վիճակագրորեն գնահատել ազդեցության ազդեցության առկայությունը: Ընդհանուր առմամբ, Ուսանողի չափանիշը կարող է ներկայացվել որպես

/-Ուսանողի չափանիշը վերաբերում է պարամետրային, հետեւաբար դրա կիրառումը հնարավոր է միայն այն դեպքում, երբ փորձի արդյունքները ներկայացված են չափումների տեսքով վերջին երկու սանդղակով՝ ինտերվալ եւ հարաբերակցություն։ Եկեք պատկերացնենք Ուսանողի չափանիշի հնարավորությունները կոնկրետ օրինակով:

Ենթադրենք, դուք պետք է պարզեք հրաձգության մարզման արդյունավետությունը որոշակի մեթոդի համաձայն: Այդ նպատակով կատարվում է համեմատական ​​մանկավարժական փորձ, որտեղ մի խումբը (փորձարարական), որը բաղկացած է 8 հոգուց, զբաղվում է առաջարկվող փորձարարական մեթոդով, իսկ մյուսը (հսկողություն)՝ ըստ ավանդական, ընդհանուր ընդունվածի։ Աշխատանքային վարկածն այն է, որ ձեր առաջարկած նոր տեխնիկան ավելի արդյունավետ կլինի: Փորձի արդյունքը հինգ կրակոցների հսկիչ նկարահանումն է, որի արդյունքների համաձայն (Աղյուսակ 6) անհրաժեշտ է հաշվարկել տարբերությունների հավաստիությունը և ստուգել առաջ քաշված վարկածի ճիշտությունը։

Աղյուսակ 6

Ի՞նչ է պետք անել՝ ըստ Student-ի t-չափանիշի տարբերությունների հավաստիությունը հաշվարկելու համար:

1. Հաշվեք X միջին թվաբանական արժեքները յուրաքանչյուր խմբի համար առանձին՝ օգտագործելով հետևյալ բանաձևը.

որտեղ Xt -անհատական ​​չափման արժեքը; i-ը խմբում չափումների ընդհանուր թիվն է:

Բանաձևում դնելով աղյուսակի փաստացի արժեքները: 6, մենք ստանում ենք.

Միջին թվաբանական արժեքների համեմատությունը ցույց է տալիս, որ փորձարարական խմբում այս արժեքը (X, = 35) ավելի բարձր է, քան վերահսկիչ խմբում: (Xk= 27): Այնուամենայնիվ, վերջնական հայտարարության համար, որ փորձարարական խմբի մասնակիցները սովորել են ավելի լավ կրակել, պետք է համոզվել, որ հաշվարկված միջին թվաբանական արժեքների միջև տարբերությունները (/) վիճակագրորեն նշանակալի են:

2. Երկու խմբերում էլ հաշվարկեք ստանդարտ շեղումը (5)՝ օգտագործելով հետևյալ բանաձևը.

դե Ximax- ամենաբարձր ցուցանիշը; Ximmm- ամենափոքր ցուցանիշը; TO- աղյուսակային գործակից. Ստանդարտ շեղումը (5) հաշվարկելու կարգը՝ - որոշել Քսիտրաքսերկու խմբերում; -- սահմանել Քսիմիաայս խմբերում; - որոշել յուրաքանչյուր խմբում չափումների քանակը (l); - գտնել գործակցի արժեքը ըստ հատուկ աղյուսակի (Հավելված 12) TO,որը համապատասխանում է (8) խմբի չափումների քանակին։ Դա անելու համար ինդեքսի տակ գտնվող ձախ սյունակում (և) մենք գտնում ենք 0 թիվը, քանի որ մեր օրինակում չափումների թիվը 10-ից պակաս է, իսկ վերևի տողում՝ 8 համարը; Այս տողերի խաչմերուկում - 2,85, որը համապատասխանում է գործակցի արժեքին: AG 8 թեստում --- ստացված արժեքները փոխարինեք բանաձևով և կատարեք անհրաժեշտ հաշվարկները.

3. Հաշվե՛ք թվաբանական միջինի ստանդարտ սխալը (t) բանաձևով.

Մեր օրինակի համար առաջին բանաձեւը հարմար է, քանի որ Ն.Ս< 30. Вычислим для каждой группы значения:

4. Հաշվեք տարբերության միջին սխալը՝ օգտագործելով բանաձևը.

5. Որոշե՛ք տարբերությունների նշանակությունը հատուկ աղյուսակի միջոցով (Հավելված 13): Դրա համար ստացված արժեքը (t) 5% նշանակության մակարդակի կտրվածքի համեմատ (t0fi5)Ազատության աստիճանների քանակի ՀԱՄԱՐ / = pe + հատ- 2, որտեղ pack pc ~անհատական ​​արդյունքների ընդհանուր թիվը, համապատասխանաբար, փորձարարական և վերահսկիչ խմբերում: Եթե ​​պարզվի, որ փորձը ստացվել է տսահմանային արժեքից մեծ է (/ 0) o5)> m0, դիտարկվում են երկու խմբերի թվաբանական միջինների տարբերությունները. վստահելի 50% նշանակության մակարդակով, և հակառակը՝ այն դեպքում, երբ ստացված t պակասսահմանային արժեքը t0<05, ենթադրվում է, որ տարբերությունները անվստահելիիսկ խմբերի թվաբանական միջինների տարբերությունը պատահական է։ Անջատման արժեքը 5% նշանակության մակարդակում (G0> 05) որոշվում է հետևյալ կերպ.

հաշվարկել ազատության աստիճանների քանակը / = 8 + 8 - 2 = 14;

աղյուսակից (Հավելված 13) գտեք սահմանային արժեքը tofi5ժամը / = 14.

Մեր օրինակում աղյուսակի արժեքը tQ<05 = 2.15, համեմատեք այն հաշվարկվածի հետ Գ,որը 1.7 է, այսինքն. սահմանային արժեքից պակաս (2.15): Հետևաբար, հաշվի են առնվում փորձի արդյունքում ստացված միջին թվաբանական արժեքների միջև եղած տարբերությունները. անվստահելիինչը նշանակում է, որ բավարար հիմքեր չկան ասելու, որ հրաձգության մարզման մի մեթոդն ավելի արդյունավետ է ստացվել, քան մյուսը։ Այս դեպքում կարող ենք գրել՝ / = 1,7 համար / »> 0,05, սա նշանակում է, որ 100 նմանատիպ փորձեր կատարելու դեպքում հավանականությունը. (R)ստանալով նմանատիպ արդյունքներ, երբ փորձարարական խմբերի միջին թվաբանական արժեքները ավելի բարձր են, քան վերահսկիչները, ավելի քան 5% նշանակության մակարդակ կամ 100-ից 95 դեպքից պակաս: Աղյուսակի վերջնական ձևավորումը, հաշվի առնելով. ստացված և համապատասխան պարամետրերով հաշվարկները կարող են ունենալ հետևյալ տեսքը.

Համեմատաբար մեծ քանակությամբ չափումների դեպքում պայմանականորեն ենթադրվում է, որ եթե թվաբանական միջինի տարբերությունը հավասար է կամ ավելի մեծ է, քան դրա երեք սխալները, ապա տարբերությունները համարվում են հուսալի: Այս դեպքում տարբերությունների նշանակությունը որոշվում է հետևյալ հավասարմամբ.

Ինչպես նշվեց այս բաժնի սկզբում, Student-ի t-թեստը կարող է կիրառվել միայն այն դեպքում, երբ չափումները կատարվում են ընդմիջումներով և հարաբերակցություններով: Այնուամենայնիվ, մանկավարժական հետազոտություններում հաճախ անհրաժեշտություն է առաջանում պարզել ստացված արդյունքների միջև եղած տարբերությունների հավաստիությունը՝ ըստ անվանումների կամ կարգի սանդղակի: Նման դեպքերում օգտագործեք ոչ պարամետրիկչափանիշները։ Ի տարբերություն պարամետրային, ոչ պարամետրային չափանիշները չեն պահանջում ստացված արդյունքների որոշակի պարամետրերի (միջին թվաբանական, ստանդարտ շեղում և այլն) հաշվարկ, ինչի հետ հիմնականում կապված են դրանց անվանումները։ Այժմ դիտարկենք երկու ոչ պարամետրային չափորոշիչներ՝ որոշելու կարգի և անվանումների սանդղակով ստացված անկախ արդյունքների տարբերությունների հուսալիությունը:

Թեստի արդյունքների մեկնաբանման համարժեք մոտեցումը հետևյալն է. Եթե զրոյական վարկածը ճիշտ է, մենք կարող ենք հաշվարկել, թե որքան մեծ է հավանականությունըստանալ տ- չափանիշ, որը հավասար է կամ մեծ է իրական արժեքից, որը մենք հաշվարկել ենք առկա նմուշի տվյալների հիման վրա: Եթե ​​պարզվի, որ այս հավանականությունը ավելի քիչ է, քան նախկինում ընդունված նշանակության մակարդակը (օրինակ՝ Պ< 0.05), мы вправе отклонить проверяемую нулевую гипотезу. Именно такой подход сегодня используется чаще всего: исследователи приводят в своих работах P-значение, которое легко рассчитывается при помощи статистических программ. Рассмотрим, как это можно сделать в системе R.

Ենթադրենք, մենք ունենք տվյալներ 11 կնոջ համար սննդից էներգիայի օրական ընդունման վերաբերյալ (կՋ/օր) (օրինակ՝ վերցված գրքից. Altman D. G. (1981) Բժշկական հետազոտությունների գործնական վիճակագրություն, Chapman & Hall, Լոնդոն):


Այս 11 դիտարկումների միջինը հետևյալն է.


Հարց. այս նմուշի միջինը տարբերվու՞մ է սահմանված 7725 կՋ/օր նորմայից: Մեր նմուշի արժեքի և այս ստանդարտի միջև տարբերությունը բավականին պարկեշտ է. 7725 - 6753.6 = 971.4: Բայց որքա՞ն մեծ է այս տարբերությունը վիճակագրորեն: Մեկ նմուշ տ-փորձարկում. Ինչպես մյուս տարբերակները տ-թեստ, Ուսանողի մեկ օրինակով թեստը կատարվում է R-ում՝ օգտագործելով t.test () ֆունկցիան.


Հարցն այն է, թե արդյոք այս միջին ցուցանիշները վիճակագրորեն տարբեր են: Եկեք փորձարկենք այն վարկածը, որ օգտագործելով տարբերություն չկա տ-փորձարկում:

Բայց ինչպե՞ս, նման դեպքերում, վիճակագրորեն գնահատել ազդեցության ազդեցության առկայությունը: Ընդհանուր առմամբ, Ուսանողի չափանիշը կարող է ներկայացվել որպես

Ամենահայտնի վիճակագրական գործիքներից մեկը Student's t թեստն է: Այն օգտագործվում է տարբեր զուգակցված մեծությունների վիճակագրական նշանակությունը չափելու համար։ Այս ցուցանիշը հաշվարկելու համար Microsoft Excel-ն ունի հատուկ գործառույթ: Եկեք պարզենք, թե ինչպես կարելի է հաշվարկել Student-ի t-test-ը Excel-ում:

Բայց, նախ, դեռ պարզենք, թե որն է Ուսանողի չափանիշն ընդհանրապես։ Այս ցուցանիշը օգտագործվում է երկու նմուշների միջին արժեքների հավասարությունը ստուգելու համար: Այսինքն, այն որոշում է տվյալների երկու խմբերի միջև եղած տարբերությունների հուսալիությունը։ Միևնույն ժամանակ, այս չափանիշը որոշելու համար օգտագործվում է մեթոդների մի ամբողջ շարք: Ցուցանիշը կարող է հաշվարկվել՝ հաշվի առնելով միակողմանի կամ երկկողմանի բաշխումը:

Ցուցանիշի հաշվարկ Excel-ում

Այժմ եկեք ուղղակիորեն անցնենք այն հարցին, թե ինչպես հաշվարկել այս ցուցանիշը Excel-ում: Այն կարող է արտադրվել ֆունկցիայի միջոցով ՈՒՍԱՆՈՂԱԿԱՆ ԹԵՍՏ... Excel 2007 և ավելի վաղ տարբերակներում այն ​​կոչվում էր ԹԵՍՏ... Այնուամենայնիվ, այն մնաց հետագա տարբերակներում համատեղելիության նպատակներով, բայց դեռ խորհուրդ է տրվում դրանցում օգտագործել ավելի ժամանակակից տարբերակ. ՈՒՍԱՆՈՂԱԿԱՆ ԹԵՍՏ... Այս ֆունկցիան կարող է օգտագործվել երեք եղանակով, որոնք մանրամասն կքննարկվեն ստորև։

Մեթոդ 1. Function Wizard

Այս ցուցանիշը հաշվարկելու ամենադյուրին ճանապարհը Function Wizard-ն է:


Հաշվարկը կատարվում է, և արդյունքը ցուցադրվում է նախապես ընտրված բջիջում:

Մեթոդ 2. աշխատել «Բանաձևեր» ներդիրի հետ

Գործառույթ ՈՒՍԱՆՈՂԱԿԱՆ ԹԵՍՏկարելի է նաև զանգահարել՝ անցնելով ներդիրին «Բանաձևեր»ժապավենի վրա հատուկ կոճակ օգտագործելով:


Մեթոդ 3. ձեռքով մուտքագրում

Բանաձև ՈՒՍԱՆՈՂԱԿԱՆ ԹԵՍՏԴուք կարող եք նաև ձեռքով մուտքագրել աշխատաթերթի ցանկացած բջիջ կամ ֆունկցիայի տող: Դրա շարահյուսական ձևը հետևյալն է.

STUDENT.TEST (Array1; Array2; Tails; Type)

Թե ինչ է նշանակում փաստարկներից յուրաքանչյուրը, հաշվի է առնվել առաջին մեթոդը վերլուծելիս: Այս արժեքները պետք է փոխարինվեն այս գործառույթով:

Տվյալները մուտքագրելուց հետո սեղմեք կոճակը Մուտքագրեքարդյունքը էկրանին ցուցադրելու համար:

Ինչպես տեսնում եք, Excel-ում Ուսանողի չափանիշը հաշվարկելը շատ պարզ է և արագ: Հիմնական բանը այն է, որ հաշվարկներ կատարող օգտատերը պետք է հասկանա, թե ինչ է ինքը և ինչ մուտքային տվյալներ են պատասխանատու: Ծրագիրն ինքն է կատարում ուղղակի հաշվարկը: