Опишете студентския t тест за независими проби. Определяне на надеждността на разликите чрез t - Student's t тест

Методът ви позволява да тествате хипотезата, че средните стойности на две общи популации, от които се сравняват зависимпробите се различават една от друга. Предположението за зависимост най -често означава, че характеристиката се измерва върху една и съща проба два пъти, например преди и след експозиция. В общия случай на всеки представител на една извадка се присъединява представител от другата извадка (те са комбинирани по двойки), така че двете серии от данни да са положително свързани помежду си. По -слаби видове пробна зависимост: извадка 1 - съпрузи, извадка 2 - техните съпруги; извадка 1-едногодишни деца, извадка 2 се състои от близнаци от деца в извадка 1 и т.н.

Проверяема статистическа хипотеза,както в предишния случай, H 0: M 1 = M 2(средните стойности в проби 1 и 2 са равни) Ако бъде отхвърлена, се приема алтернативна хипотеза, че М 1повече по -малко) М 2.

Първоначални предположенияза статистическа проверка:

□ на всеки представител на една извадка (от една обща популация) се определя представител на друга извадка (от друга обща популация);

□ данните от две проби са положително свързани (двойки от форми);

□ разпределението на изследваната черта и в двете проби съответства на нормалния закон.

Структура на изходните данни:има две стойности на изследвания атрибут за всеки обект (за всяка двойка).

Ограничения:разпределението на признака и в двете извадки не трябва да се различава значително от нормалното; данните от две измервания, съответстващи на двете проби, са положително корелирани.

Алтернативи:Т тест на Уилкоксон, ако разпределението за поне една проба се различава значително от нормалното; T тест на Студент за независими извадки - ако данните за двете проби не корелират положително.

Формулаза емпиричната стойност на t-теста на Студент отразява факта, че единицата за анализ на разликите е разлика (смяна)характерни стойности за всяка двойка наблюдения. Съответно, за всяка от N двойки стойности на характеристиките първо се изчислява разликата d i = x 1 i - x 2 i.

(3) където M d е средната разлика в стойностите; σ d е стандартното отклонение на разликите.

Пример за изчисление:

Да предположим, че в хода на проверката на ефективността на обучението, на всеки от 8 -те членове на групата беше зададен въпросът „Колко често вашите мнения съвпадат с тези на групата?“. - два пъти, преди и след тренировката. За отговорите беше използвана 10 -степенна скала: 1 - никога, 5 - половината от времето, 10 - винаги. Хипотезата беше тествана, че в резултат на обучението самочувствието на конформизма (желанието да бъдат като другите в групата) на участниците ще се повиши (α = 0,05). Нека направим таблица за междинни изчисления (таблица 3).

Таблица 3

Средното аритметично за разликата M d = (-6) / 8 = -0,75. Извадете тази стойност от всеки d (предпоследната колона на таблицата).

Формулата за стандартното отклонение се различава само по това, че вместо X се появява d. Замествайки всички необходими стойности, получаваме

σ d = = 0,886.

Стъпка 1. Изчислете емпиричната стойност на критерия, като използвате формулата (3): средната разлика М д= -0,75; стандартно отклонение σ d = 0,886; t e = 2,39; df = 7.

Стъпка 2. Определете р-нивото на значимост от таблицата с критични стойности на t-критерия на Студент. За df = 7 емпиричната стойност е между критичните стойности за р = 0,05 и р - 0,01. Следователно, стр< 0,05.

df R
0,05 0,01 0,001
2,365 3,499 5,408

Стъпка 3. Взимаме статистическо решение и формулираме заключение. Статистическата хипотеза за равенство на средствата се отхвърля. Заключение: самочувствието на конформизма на участниците след обучението се е увеличило статистически значително (на ниво значимост стр< 0,05).

Параметричните методи включват сравнение на вариациите на две проби по критерий F-FisherПонякога този метод води до ценни смислени заключения, а в случай на сравняване на средствата за независими извадки, сравнението на отклоненията е задължителнопроцедура.

Да изчисля F емпнеобходимо е да се намери съотношението на дисперсиите на двете извадки и така, че по -голямата вариация да е в числителя, а по -малката в знаменателя.

Сравнение на отклоненията... Методът ви позволява да тествате хипотезата, че вариациите на двете общи популации, от които са получени сравнените проби, се различават една от друга. Тестваната статистическа хипотеза H 0: σ 1 2 = σ 2 2 (дисперсията в извадка 1 е равна на дисперсията в извадка 2). Ако бъде отхвърлена, се приема алтернативна хипотеза, че едната вариация е по -голяма от другата.

Първоначални предположения: две проби са взети на случаен принцип от различни общи популации с нормално разпределение на изследваната черта.

Структура на изходните данни:изследваната черта се измерва в обекти (субекти), всеки от които принадлежи към една от двете сравнени проби.

Ограничения:разпределението на признака и в двете проби не се различава значително от нормалното.

Алтернатива на метода:тестът Levene "sTest", който не изисква тестване на предположението за нормалност (използва се в програмата SPSS).

Формулаза емпиричната стойност на критерия F-Fisher:

(4)

където σ 1 2 - голяма дисперсия, a σ 2 2- по-малка дисперсия. Тъй като не се знае предварително коя дисперсия е по-голяма, тогава за определяне на р-нивото използваме Таблица с критични стойности за ненасочени алтернативи.Ако F e> F Kpза съответния брой степени на свобода, тогава R < 0,05 и статистическую гипотезу о равенстве дисперсий можно отклонить (для α = 0,05).

Пример за изчисление:

На децата бяха дадени обичайните аритметични задачи, след което на една произволно избрана половина от учениците беше казано, че не са преминали теста, а на останалите - обратното. След това всяко дете беше попитано колко секунди ще отнеме да реши подобен проблем. Експериментаторът изчисли разликата между времето, в което детето се обади, и резултата от изпълнената задача (в секунди). Очакваше се докладването за провал да доведе до известна неадекватност в самочувствието на детето. Тестваната хипотеза (на ниво α = 0,005) беше, че вариацията на набора от самооценки не зависи от докладите за успех или неуспех (Н 0: σ 1 2 = σ 2 2).

Получени са следните данни:


Стъпка 1. Нека изчислим емпиричната стойност на критерия и броя на степента на свобода по формулите (4):

Стъпка 2. Според таблицата с критични стойности на критерия f-Fisher за ненасочениалтернативите намират критична стойност за df номер = 11; df банер= 11. Има обаче критична стойност само за df номер= 10 и df банер = 12. Невъзможно е да се вземе по -голям брой степени на свобода, затова приемаме критичната стойност за df номер= 10: За R = 0,05 F Kp = 3,526; за R = 0,01 F Kp = 5,418.

Стъпка 3. Вземане на статистическо решение и смислен извод. Тъй като емпиричната стойност надвишава критичната стойност за R= 0,01 (и още повече - за р = 0,05), тогава в този случай p< 0,01 и принимается альтернативная гипо­теза: дисперсия в группе 1 превышает дисперсию в группе 2 (R< 0,01). Следователно, след отчитане на неуспех, неадекватността на самочувствието е по-висока, отколкото след успеха на отчитането.

/ работилница-статистика / справочен материал / стойности на t-тест на студента

ЗначениеT - Критерий на студента при ниво на значимост 0,10, 0,05 и 0,01

ν - степен на свобода на вариации

Стандартни стойности на теста на Студент

Брой степени на свобода

Нива на значимост

Брой степени на свобода

Нива на значимост

маса XI

Стандартни стойности на теста на Фишър, използвани за оценка на значимостта на разликите между две проби

Степени на свобода

Ниво на значимост

Степени на свобода

Ниво на значимост

Студентски t-критерий

Студентски t-тест- общо име за клас методи за статистическо тестване на хипотези (статистически тестове) въз основа на разпределението на Студента. Най-честите случаи на използване на t-теста са свързани с проверка на равенството на средните стойности в две проби.

T-Статистиката обикновено се изгражда съгласно следния общ принцип: числителят съдържа произволна променлива с нулеви математически очаквания (когато нулевата хипотеза е изпълнена), а знаменателят съдържа примерното стандартно отклонение на тази случайна величина, получено като квадратен корен от несмесената оценка на дисперсията.

История

Този критерий е разработен от Уилям Госет за оценка на качеството на бирата в Гинес. Във връзка със задължението към компанията за неразкриване на търговски тайни (ръководството на Гинес смята, че използването на статистическия апарат в тяхната работа), статията на Госет е публикувана през 1908 г. в списание „Биометрия“ под псевдонима „Студент“ (Студент).

Изисквания за данни

За да се приложи този критерий, е необходимо първоначалните данни да имат нормално разпределение. В случай на използване на тест с две проби за независими проби, също е необходимо да се спази условието за равенство на дисперсиите. Съществуват обаче алтернативи на теста на Студент за ситуации с неравни отклонения.

Изискването за нормалност при разпределението на данните е необходимо за точен t (\ displaystyle t) -тест. Въпреки това, дори и при други разпределения на данни, може да се използва t (\ displaystyle t) -статистика. В много случаи тази статистика асимптотично има стандартно нормално разпределение - N (0, 1) (\ displaystyle N (0,1)), така че можете да използвате квантилите на това разпределение. Често обаче дори и в този случай квантилите не се използват за стандартното нормално разпределение, а за съответното разпределение на Студент, както в точния t (\ displaystyle t) -тест. Те са асимптотично еквивалентни; обаче при малки извадки доверителните интервали на разпределението на Студент са по -широки и по -надеждни.

Т-тест с една проба

Използва се за проверка на нулевата хипотеза H 0: E (X) = m (\ displaystyle H_ (0): E (X) = m), че математическото очакване E (X) (\ displaystyle E (X)) е равно на някои известна стойност m (\ displaystyle m).

Очевидно при нулевата хипотеза E (X ¯) = m (\ displaystyle E ((\ overline (X))) = m). Предвид предполагаемата независимост на наблюденията, V (X ¯) = σ 2 / n (\ displaystyle V ((\ overline (X))) = \ sigma ^ (2) / n). Използвайки безпристрастната оценка на вариацията s X 2 = ∑ t = 1 n (X t - X ¯) 2 / (n - 1) (\ displaystyle s_ (X) ^ (2) = \ sum _ (t = 1) ^ ( n) (X_ (t)-(\ overline (X))) ^ (2) / (n-1)) получаваме следната t-статистика:

t = X ¯ - m s X / n (\ displaystyle t = (\ frac ((\ overline (X)) - m) (s_ (X) / (\ sqrt (n))))))

При нулевата хипотеза разпределението на тази статистика е t (n - 1) (\ displaystyle t (n -1)). Следователно, ако абсолютната стойност на статистиката надвишава критичната стойност на даденото разпределение (при дадено ниво на значимост), нулевата хипотеза се отхвърля.

Т-тест с две проби за независими проби

Нека има две независими извадки с размери n 1, n 2 (\ displaystyle n_ (1) ~, ~ n_ (2)) нормално разпределени случайни променливи X 1, X 2 (\ displaystyle X_ (1), ~ X_ (2) ). Необходимо е да се провери нулевата хипотеза за равенството на математическите очаквания на тези случайни променливи H 0: M 1 = M 2 (\ displaystyle H_ (0): ~ M_ (1) = M_ (2)), използвайки примерните данни .

Помислете за разликата между примерните средства Δ = X ¯ 1 - X ¯ 2 (\ displaystyle \ Delta = (\ overline (X)) _ (1) - (\ overline (X)) _ (2)). Очевидно, ако нулевата хипотеза е вярна E (Δ) = M 1 - M 2 = 0 (\ displaystyle E (\ Delta) = M_ (1) -M_ (2) = 0). Дисперсията на тази разлика е еднаква, въз основа на независимостта на пробите: V (Δ) = σ 1 2 n 1 + σ 2 2 n 2 (\ displaystyle V (\ Delta) = (\ frac (\ sigma _ (1 ) ^ (2)) (n_ (1))) + (\ frac (\ sigma _ (2) ^ (2)) (n_ (2)))). След това използвайки безпристрастната оценка на вариацията s 2 = ∑ t = 1 n (X t - X ¯) 2 n - 1 (\ displaystyle s ^ (2) = (\ frac (\ sum _ (t = 1) ^ (n) (X_ (t) - (\ overline (X))) ^ (2)) (n -1))) получаваме безпристрастна оценка на дисперсията на разликата в средната проба: s Δ 2 = s 1 2 n 1 + s 2 2 n 2 (\ displaystyle s _ (\ Delta) ^ (2) = (\ frac (s_ (1) ^ (2)) (n_ (1))) + (\ frac (s_ (2) ^ (2)) (n_ (2)))). Следователно t-статистиката за тестване на нулевата хипотеза е

T = X ¯ 1 - X ¯ 2 s 1 2 n 1 + s 2 2 n 2 (\ displaystyle t = (\ frac ((\ overline (X)) _ (1) - (\ overline (X)) _ ( 2)) (\ sqrt ((\ frac (s_ (1) ^ (2)) (n_ (1))) + (\ frac (s_ (2) ^ (2)) (n_ (2))))) ))

При нулевата хипотеза тази статистика има разпределение t (df) (\ displaystyle t (df)), където df = (s 1 2 / n 1 + s 2 2 / n 2) 2 (s 1 2 / n 1) 2 / (n 1 - 1) + (s 2 2 / n 2) 2 / (n 2 - 1) (\ displaystyle df = (\ frac ((s_ (1) ^ (2) / n_ (1) + s_ (2) ^ (2) / n_ (2)) ^ (2)) ((s_ (1) ^ (2) / n_ (1)) ^ (2) / (n_ (1) -1) + (s_ (2) ^ (2) / n_ (2)) ^ (2) / (n_ (2) -1))))

Случаят със същата дисперсия

Ако се приеме, че отклоненията на пробите са еднакви, тогава

V (Δ) = σ 2 (1 n 1 + 1 n 2) (\ displaystyle V (\ Delta) = \ sigma ^ (2) \ наляво ((\ frac (1) (n_ (1))) + (\ frac (1) (n_ (2))) \ вдясно))

Тогава t-статистиката е равна на:

T = X ¯ 1 - X ¯ 2 s X 1 n 1 + 1 n 2, s X = (n 1 - 1) s 1 2 + (n 2 - 1) s 2 2 n 1 + n 2 - 2 (\ displaystyle t = (\ frac ((\ overline (X)) _ (1) - (\ overline (X)) _ (2)) (s_ (X) (\ sqrt ((\ frac (1) (n_ (1 ))) + (\ frac (1) (n_ (2))))))) ~, ~~ s_ (X) = (\ sqrt (\ frac ((n_ (1) -1) s_ (1) ^ (2) + (n_ (2) -1) s_ (2) ^ (2)) (n_ (1) + n_ (2) -2))))

Тази статистика има разпределение t (n 1 + n 2 - 2) (\ displaystyle t (n_ (1) + n_ (2) -2))

Т-тест с две проби за зависими проби

За да се изчисли емпиричната стойност на t (\ displaystyle t) теста в тест за хипотеза за разликата между две зависими проби (например две проби от един и същ тест в интервал от време), се използва следната формула:

T = M d s d / n (\ displaystyle t = (\ frac (M_ (d)) (s_ (d) / (\ sqrt (n))))))

където M d (\ displaystyle M_ (d)) е средната разлика, s d (\ displaystyle s_ (d)) е стандартното отклонение на разликите и n е броят на наблюденията

Тази статистика има разпределение на t (n - 1) (\ displaystyle t (n -1)).

Тест за линейно ограничение на параметрите на линейна регресия

T-тестът може също да тества произволно (едно) линейно ограничение на параметрите на линейна регресия, оценени по обичайния метод на най-малките квадрати. Да предположим, че искате да проверите хипотезата H 0: c T b = a (\ displaystyle H_ (0): c ^ (T) b = a). Очевидно при нулевата хипотеза E (c T b ^ - a) = c TE (b ^) - a = 0 (\ displaystyle E (c ^ (T) (\ hat (b)) - a) = c ^ ( T) E ((\ hat (b))) - a = 0). Тук използвахме свойството на безпристрастност на OLS оценките на параметрите на модела E (b ^) = b (\ displaystyle E ((\ hat (b))) = b). В допълнение, V (c T b ^ - a) = c TV (b ^) c = σ 2 c T (XTX) - 1 c (\ displaystyle V (c ^ (T) (\ hat (b)) - a ) = c ^ (T) V ((\ hat (b))) c = \ sigma ^ (2) c ^ (T) (X ^ (T) X) ^ (- 1) c). Използвайки неговата безпристрастна оценка s 2 = E S S / (n-k) (\ displaystyle s ^ (2) = ESS / (n-k)) вместо неизвестната дисперсия, получаваме следната t-статистика:

T = c T b ^ - възход T (XTX) - 1 c (\ displaystyle t = (\ frac (c ^ (T) (\ hat (b)) - a) (s (\ sqrt (c ^ (T) (X ^ (T) X) ^ (- 1) в)))))

Тази статистика при нулевата хипотеза има разпределение t (n - k) (\ displaystyle t (n -k)), така че ако статистиката е над критичната стойност, тогава нулевата хипотеза за линейното ограничение се отхвърля.

Тестване на хипотези за коефициент на линейна регресия

Специален случай на линейно ограничение е да се провери хипотезата, че коефициентът на регресия b j (\ displaystyle b_ (j)) е равен на някаква стойност a (\ displaystyle a). В този случай съответната t-статистика е:

T = b ^ j - asb ^ j (\ displaystyle t = (\ frac ((\ hat (b)) _ (j) -a) (s _ ((\ hat (b)) _ (j)))) )

където s b ^ j (\ displaystyle s _ ((\ hat (b)) _ (j))) е стандартната грешка на оценката на коефициента, която е квадратният корен от съответния диагонален елемент на ковариационната матрица за оценка на коефициента.

При нулевата хипотеза разпределението на тази статистика е t (n - k) (\ displaystyle t (n -k)). Ако абсолютната стойност на статистиката е по -висока от критичната стойност, тогава разликата между коефициента и a (\ displaystyle a) е статистически значима (не случайна), в противен случай е незначителна (произволна, тоест истинският коефициент вероятно е равна или много близка до предполагаемата стойност на a (\ displaystyle a))

Коментирайте

Еднопробният тест за математически очаквания може да се сведе до проверка на линейното ограничение на параметрите на линейната регресия. В тест с една проба това е "регресия" за константа. Следователно s 2 (\ displaystyle s ^ (2)) на регресията е примерната оценка на дисперсията на изследваната случайна величина, матрицата XTX (\ displaystyle X ^ (T) X) е n (\ displaystyle n ), а оценката на "коефициента" на модела е средната извадка. Следователно получаваме израза за t-статистиката, даден по-горе за общия случай.

По подобен начин може да се покаже, че тест с две проби с равни вариации на извадката също намалява до проверка на линейни ограничения. В тест с две проби това е "регресия" на константа и фиктивна променлива, която идентифицира подпробата в зависимост от стойността (0 или 1): y = a + b D (\ displaystyle y = a + bD). Хипотезата за равенството на математическите очаквания на извадките може да се формулира като хипотеза за равенството на коефициента b на този модел към нула. Може да се покаже, че съответната t-статистика за тестване на тази хипотеза е равна на t-статистиката, дадена за теста с две проби.

Тя може също да се сведе до проверка на линейното ограничение в случай на различни отклонения. В този случай вариацията на грешките в модела приема две стойности. Въз основа на това може да се получи и t-статистика, подобна на показаната за теста с две проби.

Непараметрични аналози

Аналог на теста с две проби за независими проби е U-тестът на Ман-Уитни. За ситуацията със зависими проби, аналозите са тестът на знака и тестът на Wilcoxon T.

Литература

Студент.Вероятната грешка на средната стойност. // Биометрика. 1908. № 6 (1). Стр. 1-25.

Връзки

За критериите за тестване на хипотези за хомогенността на средствата на уебсайта на Новосибирския държавен технически университет

Еквивалентен подход за интерпретиране на резултатите от тестовете е следният: Ако приемем, че нулевата хипотеза е вярна, можем да изчислим колко голяма вероятностполучавам T- критерий, равен или по -голям от реалната стойност, която сме изчислили от наличните примерни данни. Ако тази вероятност се окаже по -малка от приетото по -рано ниво на значимост (например P< 0.05), мы вправе отклонить проверяемую нулевую гипотезу. Именно такой подход сегодня используется чаще всего: исследователи приводят в своих работах P-значение, которое легко рассчитывается при помощи статистических программ. Рассмотрим, как это можно сделать в системе R.

Да предположим, че имаме данни за дневния прием на енергия от храната (kJ / ден) за 11 жени (пример заимстван от книгата Altman D. G. (1981) Практическа статистика за медицински изследвания, Chapman & Hall, Лондон):


Средната стойност за тези 11 наблюдения е:


Въпрос: Различава ли се тази проба от установената норма от 7725 kJ / ден? Разликата между нашата пробна стойност и този стандарт е доста прилична: 7725 - 6753.6 = 971.4. Но колко голяма е тази разлика статистически? Една проба T-тест. Както и другите опции T-test, тестът на Student с една проба се извършва в R, използвайки функцията t.test ():


Въпросът е: тези средни стойности статистически различни ли са? Нека тестваме хипотезата, че няма разлика при използването T-тест:

Но как в такива случаи да се оцени статистически наличието на ефекта от експозицията? Като цяло критерият на студента може да бъде представен като

/ -Критерият на студента се отнася до параметричен, следователно използването му е възможно само когато резултатите от експеримента са представени под формата на измервания по последните две скали - интервал и съотношения. Нека илюстрираме възможностите на студентския критерий с конкретен пример.

Да предположим, че трябва да разберете ефективността на обучението по стрелба по определен метод. За тази цел се провежда сравнителен педагогически експеримент, при който едната група (експериментална), състояща се от 8 души, се занимава с предложения експериментален метод, а другата (контролна) - според традиционния, общоприет. Работната хипотеза е, че новата техника, която предлагате, ще бъде по -ефективна. Резултатът от експеримента е контролна стрелба от пет изстрела, според резултатите от които (Таблица 6) е необходимо да се изчисли надеждността на разликите и да се провери правилността на изложената хипотеза.

Таблица 6

Какво трябва да се направи, за да се изчисли надеждността на разликите според t-критерия на Студента?

1. Изчислете средните аритметични стойности X за всяка група поотделно, като използвате следната формула:

където Xt -стойността на отделно измерение; i е общият брой измервания в групата.

След като въведете във формулата действителните стойности от таблицата. 6, получаваме:

Сравнението на средните аритметични стойности доказва, че в експерименталната група тази стойност (X, = 35) е по -висока, отколкото в контролната група. (Xk= 27). Въпреки това, за крайното твърдение, че участниците в експерименталната група са се научили да стрелят по -добре, трябва да се уверите, че разликите (/) между изчислените средни аритметични стойности са статистически значими.

2. И в двете групи изчислете стандартното отклонение (5), като използвате следната формула:

: de Ximax- най -високият процент; Ximm- най -малкият индикатор; ДА СЕ- табличен коефициент. Процедурата за изчисляване на стандартното отклонение (5): - определя Xitraxи в двете групи; - определете Ксимияв тези групи; - определят броя на измерванията във всяка група (l); - намерете стойността на коефициента съгласно специална таблица (Приложение 12) ДА СЕ,което съответства на броя на измерванията в група (8). За да направите това, в най -лявата колона под индекса (и) намираме числото 0, тъй като броят на измерванията в нашия пример е по -малък от 10, а в горния ред - числото 8; в пресечната точка на тези линии - 2,85, което съответства на стойността на коефициента. AG при 8 тест --- заменете получените стойности във формулата и направете необходимите изчисления:

3. Изчислете стандартната грешка на средната аритметична стойност (t) по формулата:

За нашия пример първата формула е подходяща, тъй като NS< 30. Вычислим для каждой группы значения:

4. Изчислете средната грешка на разликата, като използвате формулата:

5. Определете значимостта на разликите, като използвате специална таблица (Приложение 13). За това получената стойност (T)в сравнение с границата на ниво на значимост 5% (t0fi5)ЗА броя на степента на свобода / = pe + pc- 2, където опаковане на компютър ~общият брой на отделните резултати съответно в експерименталната и контролната групи. Ако се окаже, че експериментът е получен Tпо -голяма от граничната стойност (/ 0) o5)> m0 се вземат предвид разликите между средните аритметични от двете групи достоверенпри 50% ниво на значимост и обратно, в случай, че полученото t по -малкогранична стойност t0<05, се смята, че разликите ненадеждена разликата в средните аритметични на групите е случайна. Граничната стойност при 5% ниво на значимост (G0> 05) се определя, както следва:

изчислете броя на степента на свобода / = 8 + 8 - 2 = 14;

намерете от таблицата (Приложение 13) граничната стойност tofi5при / = 14.

В нашия пример стойността на таблицата tQ<05 = 2.15, сравнете го с изчисленото G,което е 1.7, т.е. по -малко от граничната стойност (2.15). Следователно се вземат предвид разликите между средните аритметични стойности, получени в експеримента ненадежденкоето означава, че няма достатъчно основание да се каже, че единият метод на обучение по стрелба се оказа по -ефективен от другия. В този случай можем да напишем: / = 1.7 за / »> 0.05, което означава, че в случай на 100 подобни експеримента, вероятността (R)получаване на подобни резултати, когато средните аритметични стойности на експерименталните групи се окажат по -високи от контролните, повече от 5% ниво на значимост или по -малко от 95 случая от 100. Окончателният дизайн на таблицата, като се вземе предвид получените изчисления и със съответните параметри, могат да изглеждат както следва.

При относително голям брой измервания се приема, че ако разликата между средната аритметична стойност е равна или по -голяма от три от нейните грешки, разликите се считат за надеждни. В този случай значимостта на разликите се определя от следното уравнение:

Както бе споменато в началото на този раздел, t-тестът на Студент може да се приложи само когато измерванията се извършват по скала на интервали и съотношения. Въпреки това, в педагогическите изследвания често се налага да се определи надеждността на разликите между получените резултати според Скалата на имената или реда. В такива случаи използвайте непараметриченкритерии. За разлика от параметричните критерии, непараметричните критерии не изискват изчисляване на определени параметри на получените резултати (средна аритметична стойност, стандартно отклонение и т.н.), което основно е причината за техните имена. Нека сега разгледаме два непараметрични критерия за определяне на надеждността на разликите между независими резултати, получени по скалата на реда и имената.

Еквивалентен подход за интерпретиране на резултатите от тестовете е следният: Ако приемем, че нулевата хипотеза е вярна, можем да изчислим колко голяма вероятностполучавам T- критерий, равен или по -голям от реалната стойност, която сме изчислили от наличните примерни данни. Ако тази вероятност се окаже по -малка от приетото по -рано ниво на значимост (например P< 0.05), мы вправе отклонить проверяемую нулевую гипотезу. Именно такой подход сегодня используется чаще всего: исследователи приводят в своих работах P-значение, которое легко рассчитывается при помощи статистических программ. Рассмотрим, как это можно сделать в системе R.

Да предположим, че имаме данни за дневния прием на енергия от храната (kJ / ден) за 11 жени (пример заимстван от книгата Altman D. G. (1981) Практическа статистика за медицински изследвания, Chapman & Hall, Лондон):


Средната стойност за тези 11 наблюдения е:


Въпрос: Различава ли се тази проба от установената норма от 7725 kJ / ден? Разликата между нашата пробна стойност и този стандарт е доста прилична: 7725 - 6753.6 = 971.4. Но колко голяма е тази разлика статистически? Една проба T-тест. Както и другите опции T-test, тестът на Student с една проба се извършва в R, използвайки функцията t.test ():


Въпросът е: тези средни стойности статистически различни ли са? Нека тестваме хипотезата, че няма разлика при използването T-тест:

Но как в такива случаи да се оцени статистически наличието на ефекта от експозицията? Като цяло критерият на студента може да бъде представен като

Един от най -известните статистически инструменти е t тестът на Студент. Използва се за измерване на статистическата значимост на различни сдвоени величини. Microsoft Excel има специална функция за изчисляване на този показател. Нека да разберем как да изчислим t теста на Student в Excel.

Но за начало нека все пак разберем какъв е критерият на Студента като цяло. Този индикатор се използва за проверка на равенството на средствата на две проби. Тоест, той определя надеждността на разликите между двете групи данни. В същото време се използва цял набор от методи за определяне на този критерий. Индикаторът може да се изчисли, като се вземе предвид едностранното или двустранното разпределение.

Изчисляване на индикатора в Excel

Сега нека преминем директно към въпроса как да изчислим този показател в Excel. Тя може да бъде произведена чрез функцията СТУДЕНТСКИ ТЕСТ... Във версиите на Excel 2007 и по -ранни се наричаше ТЕСТ... Той обаче беше оставен в по -късни версии за целите на съвместимостта, но все пак се препоръчва да се използва по -модерната версия в тях - СТУДЕНТСКИ ТЕСТ... Тази функция може да се използва по три начина, които ще бъдат разгледани подробно по -долу.

Метод 1: Съветник за функции

Най -лесният начин за изчисляване на този индикатор е чрез съветника за функции.


Изчислението се извършва и резултатът се показва в предварително избрана клетка.

Метод 2: работа с раздела „Формули“

Функция СТУДЕНТСКИ ТЕСТможе да се извика и чрез преминаване към раздела "Формули"с помощта на специален бутон на лентата.


Метод 3: ръчно въвеждане

Формула СТУДЕНТСКИ ТЕСТможете също да въведете ръчно във всяка клетка на работен лист или в функционална лента. Синтаксичната му форма е следната:

STUDENT.TEST (Array1; Array2; Tails; Type)

Какво означава всеки от аргументите беше взето предвид при разбора на първия метод. Тези стойности трябва да бъдат заменени в тази функция.

След като въведете данните, натиснете бутона Въведетеза да се покаже резултатът на екрана.

Както можете да видите, изчисляването на критерия на студента в Excel е много просто и бързо. Основното е, че потребителят, който извършва изчисленията, трябва да разбере какво представлява и какви входни данни отговарят за какво. Програмата извършва самото директно изчисление.