توضیحات آزمون تی دانشجویی برای نمونه های مستقل. تعیین پایایی تفاوت ها با آزمون t - استودیو

این روش به شما امکان می دهد این فرضیه را آزمایش کنید که مقادیر میانگین دو جمعیت کلی که از آن مقایسه می شود وابستهنمونه ها با یکدیگر تفاوت دارند فرض وابستگی اغلب به این معنی است که این صفت در یک نمونه دو بار اندازه گیری می شود، به عنوان مثال، قبل و بعد از قرار گرفتن در معرض. در حالت کلی، به هر نماینده یک نمونه، نماینده ای از نمونه دیگر اختصاص داده می شود (آنها به صورت جفتی ترکیب می شوند) به طوری که دو سری داده با یکدیگر همبستگی مثبت دارند. انواع ضعیف‌تر وابستگی نمونه: نمونه 1 - شوهران، نمونه 2 - همسرانشان. نمونه 1 - کودکان یک ساله، نمونه 2 از دوقلوهای کودکان نمونه 1 و غیره تشکیل شده است.

فرضیه آماری قابل آزمایش،مانند مورد قبلی، H 0: M 1 = M 2(مقادیر میانگین در نمونه های 1 و 2 برابر است) اگر رد شود، فرضیه جایگزین پذیرفته می شود که M 1کم و بیش) M 2.

مفروضات اولیهبرای تایید آماری:

□ به هر نماینده یک نمونه (از یک جمعیت عمومی) نماینده ای از نمونه دیگر (از یک جامعه عمومی دیگر) اختصاص داده می شود.

□ داده های دو نمونه همبستگی مثبت دارند (جفت فرم).

□ توزیع صفت مورد مطالعه در هر دو نمونه با قانون نرمال مطابقت دارد.

ساختار داده منبع:دو مقدار از ویژگی مورد مطالعه برای هر شی (برای هر جفت) وجود دارد.

محدودیت های:توزیع صفت در هر دو نمونه نباید تفاوت قابل توجهی با نمونه نرمال داشته باشد. داده های دو اندازه گیری مربوط به هر دو نمونه همبستگی مثبت دارند.

جایگزین، گزینه ها:تست T Wilcoxon، اگر توزیع حداقل یک نمونه به طور قابل توجهی با نمونه نرمال متفاوت باشد. آزمون تی دانشجویی برای نمونه های مستقل - اگر داده های دو نمونه همبستگی مثبت نداشته باشند.

فرمولزیرا ارزش تجربی آزمون t دانشجویی نشان دهنده این واقعیت است که واحد تجزیه و تحلیل تفاوت ها است تفاوت (تغییر)مقادیر مشخصه برای هر جفت مشاهدات. بر این اساس، برای هر یک از جفت N از مقادیر ویژگی، ابتدا تفاوت محاسبه می شود d i = x 1 i - x 2 i.

(3) که در آن M d میانگین تفاوت در مقادیر است. σ d انحراف استاندارد تفاوت ها است.

مثال محاسبه:

فرض کنید در حین بررسی اثربخشی آموزش، از هر یک از 8 عضو گروه این سوال پرسیده شد که "نظرات شما هر چند وقت یک بار با نظرات گروه مطابقت دارد؟" - دو بار، قبل و بعد از آموزش. برای پاسخ از مقیاس 10 درجه ای استفاده شد: 1 - هرگز، 5 - نیمی از زمان، 10 - همیشه. این فرضیه آزمایش شد که در نتیجه آموزش، عزت نفس همنوایی (میل به شبیه بودن به دیگران در گروه) شرکت کنندگان افزایش می یابد (05/0 = α). بیایید یک جدول برای محاسبات میانی بسازیم (جدول 3).

جدول 3

میانگین حسابی برای تفاوت M d = (-6) / 8 = -0.75. این مقدار را از هر d (ستون ماقبل آخر جدول) کم کنید.

فرمول انحراف استاندارد فقط از این جهت متفاوت است که به جای X ظاهر می شود d. با جایگزینی تمام مقادیر مورد نیاز، به دست می آوریم

σ d = 0.886.

مرحله 1. مقدار تجربی معیار را با استفاده از فرمول (3) محاسبه کنید: اختلاف میانگین ام دی= -0.75; انحراف معیار σ d = 0,886; t e = 2,39; df = 7.

مرحله 2. سطح p اهمیت را از جدول مقادیر بحرانی معیار t دانش آموز تعیین کنید. برای df = 7، مقدار تجربی بین مقادیر بحرانی برای p = 0.05 و p - 0.01 است. بنابراین، ص< 0,05.

df آر
0,05 0,01 0,001
2,365 3,499 5,408

مرحله 3. ما یک تصمیم آماری می گیریم و یک نتیجه گیری را تدوین می کنیم. فرضیه آماری برابری میانگین ها رد می شود. نتیجه گیری: عزت نفس سازگاری شرکت کنندگان پس از آموزش به طور معنی داری افزایش یافت. (در سطح معناداری ص< 0,05).

روش های پارامتریک شامل مقایسه واریانس دو نمونه بر اساس معیار اف فیشر.گاهی اوقات این روش به نتایج معنادار ارزشمندی منجر می‌شود و در مورد مقایسه میانگین‌ها برای نمونه‌های مستقل، مقایسه واریانس‌ها انجام می‌شود. اجباریروش.

برای محاسبه F empباید نسبت واریانس دو نمونه را پیدا کرد تا واریانس بزرگتر در صورت و کوچکتر در مخرج باشد.

مقایسه واریانس ها... این روش به شما امکان می‌دهد این فرضیه را آزمایش کنید که واریانس دو جمعیت کلی که نمونه‌های مقایسه شده از آنها مشتق شده‌اند با یکدیگر متفاوت هستند. فرضیه آماری آزمایش شده H 0: σ 1 2 = σ 2 2 (واریانس در نمونه 1 برابر است با واریانس نمونه 2). اگر رد شود، یک فرضیه جایگزین پذیرفته می شود که یک واریانس بیشتر از دیگری است.

مفروضات اولیه: دو نمونه به طور تصادفی از جمعیت های عمومی مختلف با توزیع نرمال صفت مورد مطالعه گرفته شد.

ساختار داده منبع:صفت مورد مطالعه در اشیا (موضوعاتی) اندازه گیری می شود که هر کدام متعلق به یکی از دو نمونه مقایسه شده است.

محدودیت های:توزیع صفت در هر دو نمونه تفاوت معنی داری با نمونه نرمال ندارد.

جایگزین روش: Levene "sTest"، که استفاده از آن نیازی به آزمایش فرض نرمال بودن (مورد استفاده در برنامه SPSS) ندارد.

فرمولبرای ارزش تجربی معیار F-Fisher:

(4)

جایی که σ 1 2 - واریانس بزرگ، a σ 2 2- واریانس کوچکتر. از آنجایی که از قبل مشخص نیست که کدام واریانس بیشتر است، برای تعیین سطح p از آن استفاده می کنیم جدول مقادیر بحرانی برای جایگزین های غیر جهت دار.اگر F e> F Kpبرای تعداد متناظر درجات آزادی، سپس آر < 0,05 и статистическую гипотезу о равенстве дисперсий можно отклонить (для α = 0,05).

مثال محاسبه:

به بچه ها وظایف محاسباتی معمول داده شد، پس از آن به نیمی از دانش آموزان که به طور تصادفی انتخاب شده بودند، گفته شد که امتحان را قبول نکرده اند و بقیه - برعکس. سپس از هر کودک پرسیده شد که حل یک مشکل مشابه چند ثانیه طول می کشد. آزمایشگر تفاوت بین زمان تماس کودک و نتیجه کار تکمیل شده (در ثانیه) را محاسبه کرد. انتظار می رفت که گزارش یک شکست باعث نارسایی در عزت نفس کودک شود. فرضیه مورد آزمایش (در سطح 0.005 = α) این بود که واریانس مجموعه خود ارزیابی ها به گزارش های موفقیت یا شکست بستگی ندارد (Н 0: σ 1 2 = σ 2 2).

داده های زیر به دست آمد:


مرحله 1. اجازه دهید ارزش تجربی معیار و تعداد درجات آزادی را با فرمول (4) محاسبه کنیم:

مرحله 2. با توجه به جدول مقادیر بحرانی معیار f-Fisher برای بدون جهتجایگزین ها ارزش حیاتی پیدا می کنند عدد df = 11; بنر df= 11. با این حال، یک مقدار بحرانی فقط برای وجود دارد عدد df= 10 و بنر df = 12. گرفتن تعداد بیشتری از درجات آزادی غیرممکن است، بنابراین ما مقدار بحرانی را برای آن در نظر می گیریم عدد df= 10: برای آر = 0,05 F Kp = 3.526; برای آر = 0,01 F Kp = 5,418.

مرحله 3. تصمیم گیری آماری و نتیجه گیری معنادار. از آنجایی که مقدار تجربی از مقدار بحرانی برای آر= 0.01 (و حتی بیشتر از آن - برای p = 0.05)، سپس در این مورد p< 0,01 и принимается альтернативная гипо­теза: дисперсия в группе 1 превышает дисперсию в группе 2 (ر< 0.01). بنابراین، پس از گزارش شکست، عدم کفایت عزت نفس بیشتر از پس از گزارش موفقیت است.

/ کارگاه-آمار / مطالب مرجع / مقادیر آزمون تی دانشجویی

معنیتی - معیار دانش آموز در سطح معناداری 0.10، 0.05 و 0.01

ν - درجات آزادی تنوع

مقادیر استاندارد آزمون دانشجویی

تعداد درجات آزادی

سطوح اهمیت

تعداد درجات آزادی

سطوح اهمیت

جدول XI

مقادیر استاندارد آزمون فیشر برای ارزیابی اهمیت تفاوت بین دو نمونه استفاده می شود

درجه آزادی

سطح اهمیت

درجه آزادی

سطح اهمیت

معیار تی دانشجویی

آزمون تی دانشجویی- نام کلی برای دسته ای از روش ها برای آزمون آماری فرضیه ها (آزمون های آماری) بر اساس توزیع دانش آموز. رایج ترین موارد استفاده از آزمون t مربوط به بررسی برابری مقادیر میانگین در دو نمونه است.

تیآمار معمولاً بر اساس اصل کلی زیر ساخته می شود: در صورت حساب یک متغیر تصادفی با انتظار ریاضی صفر وجود دارد (در صورت تحقق فرضیه صفر) و در مخرج نمونه انحراف استاندارد این متغیر تصادفی است که به عنوان جذر تخمین واریانس مخلوط نشده

تاریخ

این معیار توسط ویلیام گوست برای ارزیابی کیفیت آبجو در گینس ایجاد شد. در رابطه با تعهد به شرکت برای عدم افشای اسرار تجاری (رهبری گینس استفاده از دستگاه آماری در کار خود را چنین می دانست)، مقاله Gosset در سال 1908 در مجله Biometrics با نام مستعار Student منتشر شد.

الزامات داده

برای اعمال این معیار لازم است که داده های اصلی دارای توزیع نرمال باشند. در صورت استفاده از آزمون دو نمونه ای برای نمونه های مستقل، شرط برابری واریانس ها نیز باید رعایت شود. با این حال، جایگزین هایی برای آزمون دانش آموز برای موقعیت هایی با واریانس های نابرابر وجود دارد.

لازمه نرمال بودن توزیع داده ها برای یک آزمون t دقیق (\ displaystyle t) ضروری است. با این حال، حتی با سایر توزیع‌های داده، آمار t (\ displaystyle t) قابل استفاده است. در بسیاری از موارد، این آمار به صورت مجانبی دارای توزیع نرمال استاندارد است - N (0, 1) (\ displaystyle N (0,1))، بنابراین می توانید از چندک های این توزیع استفاده کنید. با این حال، اغلب حتی در این مورد، از چندک ها برای توزیع نرمال استاندارد استفاده نمی شود، بلکه برای توزیع Student مربوطه، مانند آزمون t دقیق (\ displaystyle t) -تست استفاده می شود. از نظر مجانبی، آنها معادل هستند؛ اما در نمونه های کوچک، فواصل اطمینان توزیع دانش آموز گسترده تر و قابل اعتمادتر است.

آزمون تی تک نمونه ای

برای آزمایش فرضیه صفر استفاده می شود H 0: E (X) = m (\ displaystyle H_ (0): E (X) = m) که انتظار ریاضی E (X) (\ displaystyle E (X)) برابر است مقدار شناخته شده m (\ displaystyle m).

بدیهی است که تحت فرض صفر E (X ¯) = m (\ displaystyle E ((\ overline (X))) = m). با فرض استقلال فرضی مشاهدات، V (X ¯) = σ 2 / n (\ displaystyle V ((\ overline (X))) = \ سیگما ^ (2) / n). با استفاده از برآورد واریانس بی طرفانه s X 2 = ∑ t = 1 n (X t - X ¯) 2 / (n - 1) (\ displaystyle s_ (X) ^ (2) = \ sum _ (t = 1) ^ ( n ) (X_ (t) - (\ overline (X))) ^ (2) / (n-1)) آمار t زیر را دریافت می کنیم:

t = X ¯ - m s X / n (\ sqrt (n)))

بر اساس فرضیه صفر، توزیع این آمار t (n - 1) (\ displaystyle t (n-1)) است. بنابراین، اگر قدر مطلق آمار از مقدار بحرانی توزیع داده شده (در سطح معینی از اهمیت) بیشتر شود، فرض صفر رد می شود.

آزمون t دو نمونه ای برای نمونه های مستقل

اجازه دهید دو نمونه مستقل از اندازه‌های n 1, n 2 (\ displaystyle n_ (1) ~, ~ n_ (2)) وجود داشته باشد که معمولاً متغیرهای تصادفی X 1, X 2 (\ displaystyle X_ (1), ~ X_ (2) هستند. ). لازم است فرضیه صفر برابری انتظارات ریاضی این متغیرهای تصادفی H 0: M 1 = M 2 (\ displaystyle H_ (0): ~ M_ (1) = M_ (2)) با استفاده از داده های نمونه آزمایش شود. .

تفاوت بین میانگین نمونه را در نظر بگیرید Δ = X ¯ 1 - X ¯ 2 (\ displaystyle \ Delta = (\ overline (X)) _ (1) - (\ overline (X)) _ (2)). بدیهی است که اگر فرضیه صفر درست باشد E (Δ) = M 1 - M 2 = 0 (\ displaystyle E (\ Delta) = M_ (1) -M_ (2) = 0). واریانس این تفاوت بر اساس استقلال نمونه ها، V (Δ) = σ 1 2 n 1 + σ 2 2 n 2 (\ نمایش سبک V (\ دلتا) = (\ فراک (\ سیگما _ (1) است. ^ (2)) (n_ (1))) + (\ frac (\ sigma _ (2) ^ (2)) (n_ (2)))). سپس با استفاده از برآورد واریانس بی طرفانه s 2 = ∑ t = 1 n (X t - X ¯) 2 n - 1 (\ displaystyle s ^ (2) = (\ frac (\ sum _ (t = 1) ^ (n) (X_ (t) - (\ overline (X))) ^ (2)) (n-1))) ما یک تخمین بی طرفانه از واریانس تفاوت میانگین نمونه بدست می آوریم: s Δ 2 = s 1 2 n 1 + s 2 2 n 2 (\ displaystyle s _ (\ Delta) ^ (2) = (\ frac (s_ (1) ^ (2)) (n_ (1))) + (\ frac (s_ (2) ^ (2)) (n_ (2) ))). بنابراین، آماره t برای آزمون فرضیه صفر می باشد

T = X ¯ 1 - X ¯ 2 s 1 2 n 1 + s 2 n 2 (\ displaystyle t = (\ frac ((\ overline (X)) _ (1) - (\ overline (X)) _ ( 2)) (\ sqrt ((\ frac (s_ (1) ^ (2)) (n_ (1))) + (\ frac (s_ (2) ^ (2)) (n_ (2))))) ))

تحت فرض صفر، این آمار دارای توزیع t (df) (\ displaystyle t (df)) است، که در آن df = (s 1 2 / n 1 + s 2 2 / n 2) 2 (s 1 2 / n 1) 2 / (n 1 - 1) + (s 2 2 / n 2) 2 / (n 2 - 1) (\ displaystyle df = (\ frac ((s_ (1) ^ (2) / n_ (1) + s_ (2) ^ (2) / n_ (2)) ^ (2)) ((s_ (1) ^ (2) / n_ (1)) ^ (2) / (n_ (1) -1) + (s_ (2) ^ (2) / n_ (2)) ^ (2) / (n_ (2) -1))))

مورد همان واریانس

اگر واریانس نمونه ها یکسان فرض شود، پس

V (Δ) = σ 2 (1 n 1 + 1 n 2) (\ نمایش سبک V (\ دلتا) = \ سیگما ^ (2) \ چپ ((\ فرک (1) (n_ (1))) + (\ فراکس (1) (n_ (2))) \ راست))

سپس آماره t برابر است با:

T = X ¯ 1 - X ¯ 2 s X 1 n 1 + 1 n 2، s X = (n 1 - 1) s 1 2 + (n 2 - 1) s 2 2 n 1 + n 2 - 2 (\ نمایش سبک t = (\ frac ((\ overline (X)) _ (1) - (\ overline (X)) _ (2)) (s_ (X) (\ sqrt ((\ frac (1) (n_ (1 ))) + (\ frac (1) (n_ (2))))))) ~, ~~ s_ (X) = (\ sqrt (\ frac ((n_ (1) -1) s_ (1) ^ (2) + (n_ (2) -1) s_ (2) ^ (2)) (n_ (1) + n_ (2) -2))))

این آمار دارای توزیع t است (n 1 + n 2 - 2) (\ displaystyle t (n_ (1) + n_ (2) -2))

آزمون t دو نمونه ای برای نمونه های وابسته

برای محاسبه مقدار تجربی آزمون t (\ displaystyle t) در یک آزمون فرضیه در مورد تفاوت بین دو نمونه وابسته (به عنوان مثال، دو نمونه از یک آزمون در یک بازه زمانی)، از فرمول زیر استفاده می شود:

T = M d s d / n (\ displaystyle t = (\ frac (M_ (d)) (s_ (d) / (\ sqrt (n)))))

که در آن M d (\ displaystyle M_ (d)) اختلاف میانگین است، s d (\ displaystyle s_ (d)) انحراف استاندارد تفاوت ها و n تعداد مشاهدات است.

این آمار دارای توزیع t (n - 1) (\ displaystyle t (n-1)) است.

آزمون محدودیت خطی بر روی پارامترهای رگرسیون خطی

آزمون t همچنین می تواند یک محدودیت خطی دلخواه (یک) بر روی پارامترهای رگرسیون خطی برآورد شده با استفاده از روش حداقل مربعات معمول را آزمایش کند. فرض کنید می خواهید فرضیه H 0 را آزمایش کنید: c T b = a (\ displaystyle H_ (0): c ^ (T) b = a). بدیهی است که تحت فرض صفر E (c T b ^ - a) = c TE (b ^) - a = 0 (\ displaystyle E (c ^ (T) (\ hat (b)) - a) = c ^ ( T) E ((\ کلاه (ب))) - a = 0). در اینجا از خاصیت بی طرفی برآوردهای OLS پارامترهای مدل E (b ^) = b (\ displaystyle E ((\ hat (b))) = b استفاده کردیم. علاوه بر این، V (c T b ^ - a) = c TV (b ^) c = σ 2 c T (XTX) - 1 c (\ displaystyle V (c ^ (T) (\ hat (b)) - a ) = c ^ (T) V ((\ کلاه (ب))) c = \ سیگما ^ (2) c ^ (T) (X ^ (T) X) ^ (- 1) ج). با استفاده از تخمین بی طرفانه آن s 2 = E S S / (n - k) (\ displaystyle s ^ (2) = ESS / (n-k)) به جای واریانس مجهول، آمار t زیر را دریافت می کنیم:

T = c T b ^ - asc T (XTX) - 1 c (\ displaystyle t = (\ frac (c ^ (T) (\ hat (b)) - a) (s (\ sqrt (c ^ (T) (X ^ (T) X) ^ (- 1) ج)))))

این آمار تحت فرض صفر دارای توزیع t (n - k) (\ displaystyle t (n-k)) است، بنابراین اگر آمار بالاتر از مقدار بحرانی باشد، فرض صفر محدودیت خطی رد می شود.

آزمون فرضیه نسبت رگرسیون خطی

یک مورد خاص از محدودیت خطی، آزمایش این فرضیه است که ضریب رگرسیون b j (\ displaystyle b_ (j)) برابر با مقداری a (\ displaystyle a) است. در این مورد، آماره t مربوطه به صورت زیر است:

T = b ^ j - asb ^ j (\ displaystyle t = (\ frac ((\ hat (b)) _ (j) -a) (s _ ((\ hat (b)) _ (j)))) )

که در آن s b ^ j (\ displaystyle s _ ((\ hat (b)) _ (j))) خطای استاندارد تخمین ضریب است که جذر عنصر مورب متناظر ماتریس کوواریانس برآورد ضریب است.

بر اساس فرضیه صفر، توزیع این آمار t (n - k) (\ displaystyle t (n-k)) است. اگر قدر مطلق آمار بالاتر از مقدار بحرانی باشد، آنگاه تفاوت بین ضریب و a (\ displaystyle a) از نظر آماری معنی‌دار است (تصادفی نیست)، در غیر این صورت ناچیز است (تصادفی، یعنی ضریب واقعی احتمالاً است. برابر یا بسیار نزدیک به مقدار فرضی a (\ displaystyle a))

اظهار نظر

آزمون تک نمونه ای برای انتظارات ریاضی را می توان به بررسی محدودیت خطی در پارامترهای رگرسیون خطی کاهش داد. در آزمون تک نمونه ای، این یک "رگرسیون" برای یک ثابت است. بنابراین، s 2 (\ displaystyle s ^ (2)) رگرسیون تخمین نمونه از واریانس متغیر تصادفی مورد مطالعه است، ماتریس XTX (\ displaystyle X ^ (T) X) n (\ displaystyle n است. ) و برآورد «ضریب» مدل، میانگین نمونه است. از این عبارت آماره t را برای حالت کلی به دست می آوریم.

به طور مشابه، می توان نشان داد که یک آزمون دو نمونه ای با واریانس نمونه برابر نیز به بررسی محدودیت های خطی می رسد. در یک آزمون دو نمونه ای، این یک "رگرسیون" روی یک متغیر ثابت و ساختگی است که نمونه فرعی را بسته به مقدار (0 یا 1) مشخص می کند: y = a + b D (\ displaystyle y = a + bD). فرضیه برابری انتظارات ریاضی نمونه ها را می توان به صورت فرضیه ای در مورد برابری ضریب b این مدل به صفر فرموله کرد. می توان نشان داد که آماره t متناظر برای آزمون این فرضیه برابر با آماره t داده شده برای آزمون دو نمونه است.

همچنین می توان آن را به بررسی محدودیت خطی در مورد واریانس های مختلف کاهش داد. در این حالت، واریانس خطاهای مدل دو مقدار می گیرد. بر این اساس، می توان یک آماره t مشابه با آنچه برای آزمون دو نمونه نشان داده شده است به دست آورد.

آنالوگ های ناپارامتری

آنالوگ آزمون دو نمونه ای برای نمونه های مستقل، آزمون U Mann-Whitney است. برای وضعیت نمونه های وابسته، آنالوگ ها تست علامت و تست ویلکاکسون T هستند

ادبیات

دانشجو.خطای احتمالی یک میانگین // بیومتریکا. 1908. شماره 6 (1). ص 1-25.

پیوندها

در مورد معیارهای آزمایش فرضیه ها در مورد همگنی ابزار در وب سایت دانشگاه فنی دولتی نووسیبیرسک

یک رویکرد معادل برای تفسیر نتایج آزمون این است: با فرض صحت فرضیه صفر، می‌توانیم محاسبه کنیم که چقدر بزرگ است. احتمالدريافت كردن تی- معیاری برابر یا بیشتر از مقدار واقعی که از داده های نمونه موجود محاسبه کردیم. اگر معلوم شود که این احتمال کمتر از سطح معناداری پذیرفته شده قبلی است (به عنوان مثال، P< 0.05), мы вправе отклонить проверяемую нулевую гипотезу. Именно такой подход сегодня используется чаще всего: исследователи приводят в своих работах P-значение, которое легко рассчитывается при помощи статистических программ. Рассмотрим, как это можно сделать в системе R.

فرض کنید ما اطلاعاتی در مورد انرژی دریافتی روزانه از غذا (کیلوژول در روز) برای 11 زن داریم (به عنوان مثال از کتاب به عاریت گرفته شده است. Altman D. G. (1981) آمار عملی برای تحقیقات پزشکی، چاپمن و هال، لندن):


میانگین این 11 مشاهده عبارت است از:


سوال: آیا این نمونه با هنجار تعیین شده 7725 کیلوژول در روز تفاوت دارد؟ تفاوت بین مقدار نمونه ما و این استاندارد بسیار مناسب است: 7725 - 6753.6 = 971.4. اما این تفاوت از نظر آماری چقدر است؟ یک نمونه تی-تست. مانند سایر گزینه ها تی-test، آزمون تک نمونه ای Student در R با استفاده از تابع t.test () انجام می شود:


سوال این است: آیا این میانگین ها از نظر آماری متفاوت هستند؟ اجازه دهید این فرضیه را آزمایش کنیم که با استفاده از آن هیچ تفاوتی وجود ندارد تی-تست:

اما در چنین مواردی چگونه می توان وجود اثر قرار گرفتن در معرض را از نظر آماری ارزیابی کرد؟ به طور کلی، معیار دانش آموز را می توان به صورت

/-معیار دانش آموز به پارامتری اشاره دارد، بنابراین استفاده از آن تنها زمانی امکان پذیر است که نتایج آزمایش به صورت اندازه گیری در دو مقیاس آخر - بازه و نسبت ارائه شود. اجازه دهید با مثالی مشخص، امکانات معیار دانشجویی را توضیح دهیم.

فرض کنید باید اثربخشی تمرین در تیراندازی را طبق یک روش خاص دریابید. برای این منظور، یک آزمایش آموزشی مقایسه ای انجام می شود، که در آن یک گروه (تجربی)، متشکل از 8 نفر، درگیر روش آزمایشی پیشنهادی هستند، و گروه دیگر (کنترل) - طبق روش سنتی، به طور کلی پذیرفته شده است. فرضیه کاری این است که تکنیک جدیدی که پیشنهاد می کنید موثرتر خواهد بود. نتیجه آزمایش یک تیراندازی کنترلی از پنج شات است که با توجه به نتایج آن (جدول 6) لازم است پایایی تفاوت ها محاسبه شود و صحت فرضیه ارائه شده بررسی شود.

جدول 6

برای محاسبه پایایی تفاوت ها با توجه به معیار t Student چه باید کرد؟

1. مقادیر میانگین حسابی X را برای هر گروه به طور جداگانه با استفاده از فرمول زیر محاسبه کنید:

جایی که Xt -ارزش یک بعد فردی؛ i تعداد کل اندازه گیری های گروه است.

با قرار دادن مقادیر واقعی از جدول در فرمول. 6، دریافت می کنیم:

مقایسه مقادیر میانگین حسابی نشان می دهد که در گروه آزمایش این مقدار (35 = X) بیشتر از گروه کنترل است. (Xk= 27). با این حال، برای بیان نهایی مبنی بر اینکه شرکت کنندگان در گروه آزمایشی تیراندازی را بهتر یاد گرفته اند، باید اطمینان حاصل کرد که تفاوت (/) بین مقادیر میانگین حسابی محاسبه شده از نظر آماری معنی دار است.

2. در هر دو گروه، انحراف معیار (5) را با استفاده از فرمول زیر محاسبه کنید:

: د Ximax- بالاترین نرخ؛ Ximmm- کوچکترین شاخص؛ به- ضریب جدولی روش محاسبه انحراف معیار (5): - تعیین کنید Xitraxدر هر دو گروه؛ -- تعريف كردن شیمیادر این گروه ها؛ - تعیین تعداد اندازه گیری ها در هر گروه (l)؛ - مقدار ضریب را طبق جدول مخصوص بیابید (پیوست 12) به،که با تعداد اندازه گیری های گروه (8) مطابقت دارد. برای انجام این کار، در سمت چپ ترین ستون زیر شاخص (و) عدد 0 را پیدا می کنیم، زیرا تعداد اندازه گیری ها در مثال ما کمتر از 10 است، و در خط بالا - عدد 8. در تقاطع این خطوط - 2.85، که مربوط به مقدار ضریب است. AG در تست 8 --- مقادیر به دست آمده را در فرمول جایگزین کرده و محاسبات لازم را انجام دهید:

3. خطای استاندارد میانگین حسابی (t) را با فرمول محاسبه کنید:

برای مثال ما، فرمول اول مناسب است، زیرا NS< 30. Вычислим для каждой группы значения:

4. میانگین خطای اختلاف را با استفاده از فرمول محاسبه کنید:

5. اهمیت تفاوت ها را با استفاده از جدول مخصوص تعیین کنید (پیوست 13). برای این، مقدار حاصل (t)در مقایسه با برش در سطح معنی داری 5 درصد (t0fi5)برای تعداد درجات آزادی / = pe + pc- 2، کجا بسته کامپیوتر ~تعداد کل نتایج فردی به ترتیب در گروه آزمایش و کنترل. اگر معلوم شود که آزمایش به دست آمده است تیبزرگتر از مقدار مرزی (/ 0) o5)> m0 اختلاف میانگین های حسابی دو گروه در نظر گرفته می شود. معتبردر سطح معنی داری 50% و بالعکس در موردی که به دست آمده است تی کمترمقدار مرزی t0<05, اعتقاد بر این است که تفاوت ها غیر قابل اعتمادو تفاوت میانگین های حسابی گروه ها تصادفی است. مقدار برش در سطح معنی داری 5% (G0> 05) به صورت زیر تعیین می شود:

محاسبه تعداد درجات آزادی / = 8 + 8 - 2 = 14.

از جدول (پیوست 13) مقدار مرزی را بیابید tofi5در / = 14.

در مثال ما، مقدار جدول tQ<05 = 2.15، آن را با محاسبه شده مقایسه کنید جی،که 1.7 است، یعنی. کمتر از مقدار مرزی (2.15). در نتیجه، تفاوت بین مقادیر میانگین حسابی به دست آمده در آزمایش در نظر گرفته می شود. غیر قابل اعتماداین بدان معناست که دلیل کافی وجود ندارد که بگوییم یکی از روش های تمرین در تیراندازی مؤثرتر از دیگری بوده است. در این حالت می توانیم بنویسیم: / = 1.7 برای / »> 0.05، به این معنی که در صورت انجام 100 آزمایش مشابه، احتمال (R)به دست آوردن نتایج مشابه زمانی که مقادیر میانگین حسابی گروه‌های آزمایشی بالاتر از گروه‌های کنترل، سطح معنی‌داری بیش از 5 درصد یا کمتر از 95 مورد از 100 باشد.

با تعداد نسبتاً زیادی اندازه گیری، به طور معمول فرض می شود که اگر تفاوت بین میانگین حسابی برابر یا بیشتر از سه خطای آن باشد، تفاوت ها قابل اعتماد در نظر گرفته می شوند. در این مورد، اهمیت تفاوت ها با معادله زیر تعیین می شود:

همانطور که در ابتدای این بخش ذکر شد، آزمون t استودیو تنها زمانی قابل استفاده است که اندازه گیری ها بر اساس مقیاس فواصل و نسبت ها انجام شود. با این حال، در تحقیقات آموزشی، اغلب نیاز به تعیین پایایی تفاوت بین نتایج به دست آمده با توجه به مقیاس نام ها یا ترتیب وجود دارد. در چنین مواردی استفاده کنید ناپارامتریکشاخص. بر خلاف پارامتری، معیارهای ناپارامتریک نیازی به محاسبه پارامترهای خاصی از نتایج به دست آمده (میانگین حسابی، انحراف معیار و غیره) ندارند که اساساً نام آنها به آن مربوط می شود. اجازه دهید اکنون دو معیار ناپارامتریک را برای تعیین پایایی تفاوت‌های بین نتایج مستقل به‌دست‌آمده در مقیاس ترتیب و نام در نظر بگیریم.

یک رویکرد معادل برای تفسیر نتایج آزمون این است: با فرض صحت فرضیه صفر، می‌توانیم محاسبه کنیم که چقدر بزرگ است. احتمالدريافت كردن تی- معیاری برابر یا بیشتر از مقدار واقعی که از داده های نمونه موجود محاسبه کردیم. اگر معلوم شود که این احتمال کمتر از سطح معناداری پذیرفته شده قبلی است (به عنوان مثال، P< 0.05), мы вправе отклонить проверяемую нулевую гипотезу. Именно такой подход сегодня используется чаще всего: исследователи приводят в своих работах P-значение, которое легко рассчитывается при помощи статистических программ. Рассмотрим, как это можно сделать в системе R.

فرض کنید ما اطلاعاتی در مورد انرژی دریافتی روزانه از غذا (کیلوژول در روز) برای 11 زن داریم (به عنوان مثال از کتاب به عاریت گرفته شده است. Altman D. G. (1981) آمار عملی برای تحقیقات پزشکی، چاپمن و هال، لندن):


میانگین این 11 مشاهده عبارت است از:


سوال: آیا این نمونه با هنجار تعیین شده 7725 کیلوژول در روز تفاوت دارد؟ تفاوت بین مقدار نمونه ما و این استاندارد بسیار مناسب است: 7725 - 6753.6 = 971.4. اما این تفاوت از نظر آماری چقدر است؟ یک نمونه تی-تست. مانند سایر گزینه ها تی-test، آزمون تک نمونه ای Student در R با استفاده از تابع t.test () انجام می شود:


سوال این است: آیا این میانگین ها از نظر آماری متفاوت هستند؟ اجازه دهید این فرضیه را آزمایش کنیم که با استفاده از آن هیچ تفاوتی وجود ندارد تی-تست:

اما در چنین مواردی چگونه می توان وجود اثر قرار گرفتن در معرض را از نظر آماری ارزیابی کرد؟ به طور کلی، معیار دانش آموز را می توان به صورت

یکی از معروف ترین ابزارهای آماری، آزمون t Student است. برای اندازه گیری اهمیت آماری مقادیر مختلف جفتی استفاده می شود. مایکروسافت اکسل یک عملکرد ویژه برای محاسبه این اندیکاتور دارد. بیایید دریابیم که چگونه آزمون t Student را در اکسل محاسبه کنیم.

اما، اول، اجازه دهید هنوز دریابیم که معیار دانشجو به طور کلی چیست. این شاخص برای بررسی برابری مقادیر میانگین دو نمونه استفاده می شود. یعنی قابلیت اطمینان تفاوت بین دو گروه داده را تعیین می کند. در عین حال، مجموعه ای کامل از روش ها برای تعیین این معیار استفاده می شود. شاخص را می توان با در نظر گرفتن توزیع یک طرفه یا دو طرفه محاسبه کرد.

محاسبه اندیکاتور در اکسل

حالا بیایید مستقیماً به این سؤال برویم که چگونه این شاخص را در اکسل محاسبه کنیم. می توان آن را از طریق تابع تولید کرد آزمون دانش آموزی... در نسخه های اکسل 2007 و قبل از آن نامیده می شد تست... با این حال، در نسخه های بعدی برای اهداف سازگاری باقی مانده است، اما همچنان توصیه می شود از نسخه مدرن تر در آنها استفاده کنید - آزمون دانش آموزی... این تابع به سه صورت قابل استفاده است که در ادامه به تفصیل توضیح داده خواهد شد.

روش 1: Function Wizard

ساده ترین راه برای محاسبه این اندیکاتور از طریق Function Wizard است.


محاسبه انجام می شود و نتیجه در یک سلول از پیش انتخاب شده نمایش داده می شود.

روش 2: کار با برگه "Formulas".

عملکرد آزمون دانش آموزیهمچنین می توان با جابجایی به برگه تماس گرفت "فرمول ها"با استفاده از دکمه مخصوص روی روبان.


روش 3: ورود دستی

فرمول آزمون دانش آموزیهمچنین می توانید به صورت دستی در هر سلولی در یک کاربرگ یا در نوار تابع وارد کنید. شکل نحوی آن به شرح زیر است:

STUDENT.TEST (Array1; Array2; Tails; Type)

معنی هر یک از آرگومان ها هنگام تجزیه روش اول در نظر گرفته شد. این مقادیر باید در این تابع جایگزین شوند.

پس از وارد کردن داده ها، دکمه را فشار دهید واردبرای نمایش نتیجه روی صفحه

همانطور که مشاهده می کنید، محاسبه معیار Student در اکسل بسیار ساده و سریع است. نکته اصلی این است که کاربری که محاسبات را انجام می دهد باید بفهمد که او چیست و چه داده های ورودی مسئول چه چیزی است. برنامه خود محاسبه مستقیم را انجام می دهد.