Beschreibung Student's t-Test für unabhängige Stichproben. Bestimmung der Signifikanz von Unterschieden nach t - Student-Kriterium

Mit der Methode können Sie die Hypothese testen, dass die Durchschnittswerte der beiden Grundgesamtheiten, aus denen die verglichen werden, bestehen abhängig Proben unterscheiden sich voneinander. Die Abhängigkeitsannahme bedeutet meistens, dass das Merkmal zweimal in derselben Stichprobe gemessen wird, beispielsweise vor und nach der Exposition. Im allgemeinen Fall wird jedem Repräsentanten einer Stichprobe ein Repräsentant einer anderen Stichprobe zugeordnet (sie werden paarweise kombiniert), so dass die beiden Datenreihen positiv miteinander korreliert sind. Schwächere Arten der Abhängigkeit von Stichproben: Stichprobe 1 - Ehemänner, Stichprobe 2 - ihre Ehefrauen; Stichprobe 1 - einjährige Kinder, Stichprobe 2 besteht aus Zwillingen von Kindern aus Stichprobe 1 usw.

Eine überprüfbare statistische Hypothese, wie im vorigen Fall, H 0: M1 = M2(Mittelwerte in den Proben 1 und 2 sind gleich.) Wenn es abgelehnt wird, wird eine alternative Hypothese akzeptiert M 1 mehr weniger) M2.

Anfängliche Annahmen zur statistischen Überprüfung:

□ jedem Repräsentanten einer Stichprobe (aus einer Allgemeinbevölkerung) wird ein Repräsentant einer anderen Stichprobe (aus einer anderen Allgemeinbevölkerung) zugeordnet;

□ die Daten der beiden Proben sind positiv korreliert (gepaart);

□ die Verteilung des untersuchten Merkmals in beiden Stichproben entspricht dem Normalgesetz.

Anfangsdatenstruktur: Es gibt zwei Werte des untersuchten Merkmals für jedes Objekt (für jedes Paar).

Beschränkungen: die Verteilung des Merkmals in beiden Stichproben sollte sich nicht wesentlich von der normalen unterscheiden; die Daten der beiden Messungen, die der einen und der anderen Probe entsprechen, sind positiv korreliert.

Alternativen: der T-Wilcoxon-Test, wenn die Verteilung für mindestens eine Stichprobe signifikant von der normalen abweicht; t-Student-Test für unabhängige Stichproben - wenn die Daten für zwei Stichproben nicht positiv korrelieren.

Formel denn der empirische Wert des Student's t-Test spiegelt die Tatsache wider, dass die Einheit der Differenzanalyse ist Unterschied (Verschiebung) Merkmalswerte für jedes Beobachtungspaar. Dementsprechend wird für jedes der N Paare von Merkmalswerten zuerst die Differenz berechnet d ich \u003d x 1 ich - x 2 ich.

(3) wobei M d die durchschnittliche Differenz der Werte ist; σ d ist die Standardabweichung der Differenzen.

Rechenbeispiel:

Nehmen wir an, dass im Zuge der Überprüfung der Wirksamkeit des Trainings jedem der 8 Mitglieder der Gruppe die Frage gestellt wurde: "Wie oft stimmen Ihre Meinungen mit der Meinung der Gruppe überein?" - zweimal, vor und nach dem Training. Für die Antworten wurde eine 10-Punkte-Skala verwendet: 1 – nie, 5 – in der Hälfte der Fälle, 10 – immer. Es wurde die Hypothese getestet, dass sich durch das Training die Selbsteinschätzung der Konformität (der Wunsch, wie andere in der Gruppe zu sein) der Teilnehmer erhöht (α = 0,05). Lassen Sie uns eine Tabelle für Zwischenberechnungen erstellen (Tabelle 3).

Tisch 3

Das arithmetische Mittel für die Differenz M d = (-6)/8= -0,75. Subtrahieren Sie diesen Wert von jedem d (der vorletzten Spalte der Tabelle).

Formel für Standardabweichung unterscheidet sich nur darin, dass anstelle von X darin d erscheint.Wir ersetzen alle notwendigen Werte, die wir erhalten

σd = 0,886.

Schritt 1. Berechnen Sie den empirischen Wert des Kriteriums mit Formel (3): die durchschnittliche Differenz M d= -0,75; Standardabweichung σ d = 0,886; t e = 2,39; df = 7.

Schritt 2. Wir bestimmen das p-Signifikanzniveau aus der Tabelle der kritischen Werte des Student-t-Tests. Für df = 7 liegt der Erfahrungswert zwischen den kritischen für p = 0,05 und p - 0,01. Daher p< 0,05.

df R
0,05 0,01 0,001
2,365 3,499 5,408

Schritt 3. Wir treffen eine statistische Entscheidung und formulieren eine Schlussfolgerung. Die statistische Hypothese, dass die Mittelwerte gleich sind, wird verworfen. Fazit: Der Indikator der Selbsteinschätzung der Konformität der Teilnehmer nach dem Training stieg statistisch signifikant an (auf dem Signifikanzniveau p< 0,05).

Parametrische Methoden umfassen Vergleich der Varianzen zweier Stichproben nach dem Kriterium F-Fischer. Manchmal führt diese Methode zu wertvollen aussagekräftigen Schlussfolgerungen, und im Fall des Vergleichs von Mittelwerten für unabhängige Stichproben ist der Vergleich der Varianzen der Fall verpflichtend Verfahren.

Berechnen F emp Sie müssen das Verhältnis der Varianzen der beiden Stichproben finden, und zwar so, dass die größere Varianz im Zähler und der kleinere Nenner ist.

Vergleich der Abweichungen. Mit der Methode können Sie die Hypothese testen, dass sich die Varianzen der beiden Grundgesamtheiten, aus denen die verglichenen Stichproben extrahiert werden, voneinander unterscheiden. Getestete statistische Hypothese H 0: σ 1 2 = σ 2 2 (Varianz in Stichprobe 1 ist gleich der Varianz in Stichprobe 2). Wenn es abgelehnt wird, wird eine alternative Hypothese akzeptiert, dass eine Varianz größer als die andere ist.

Anfängliche Annahmen: Zwei Stichproben werden zufällig aus verschiedenen Allgemeinpopulationen mit einer Normalverteilung des untersuchten Merkmals gezogen.

Anfangsdatenstruktur: Das untersuchte Merkmal wird in Objekten (Subjekten) gemessen, die jeweils zu einer der beiden verglichenen Stichproben gehören.

Beschränkungen: Die Verteilungen des Merkmals in beiden Stichproben unterscheiden sich nicht signifikant von der normalen.

Methodenalternative: der Levene "sTest-Test", dessen Anwendung keine Überprüfung der Normalitätsannahme erfordert (wird im SPSS-Programm verwendet).

Formel für den Erfahrungswert des F-Fisher-Tests:

(4)

wo σ 1 2 - große Streuung und σ 2 2 - kleinere Streuung. Da im Voraus nicht bekannt ist, welche Varianz größer ist, wird zur Bestimmung des p-Levels Tabelle der kritischen Werte für ungerichtete Alternativen. Wenn F e > F Kp für die entsprechende Anzahl von Freiheitsgraden dann R < 0,05 и статистическую гипотезу о равенстве дисперсий можно отклонить (для α = 0,05).

Rechenbeispiel:

Den Kindern wurden die üblichen Rechenaufgaben gestellt, wonach einer zufällig ausgewählten Hälfte der Schüler mitgeteilt wurde, dass sie den Test nicht bestanden hatten, und dem Rest - das Gegenteil. Dann wurde jedes Kind gefragt, wie viele Sekunden es brauchen würde, um ein ähnliches Problem zu lösen. Der Experimentator berechnete die Differenz zwischen der vom Kind aufgerufenen Zeit und dem Ergebnis der abgeschlossenen Aufgabe (in Sekunden). Es wurde erwartet, dass das Melden von Misserfolgen zu einer gewissen Unzulänglichkeit des Selbstwertgefühls des Kindes führen würde. Die getestete Hypothese (auf dem Niveau von α = 0,005) war, dass die Varianz der Grundgesamtheit der Selbsteinschätzungen nicht von Erfolgs- oder Misserfolgsmeldungen abhängt (Н 0: σ 1 2=σ 2 2).

Folgende Daten wurden empfangen:


Schritt 1. Berechnen Sie den empirischen Wert des Kriteriums und die Anzahl der Freiheitsgrade mit den Formeln (4):

Schritt 2. Gemäß der Tabelle der kritischen Werte des f-Fisher-Kriteriums für Nichtrichtungs Alternativen, für die wir den kritischen Wert finden df-Nummer = 11; df-Zeichen= 11. Einen kritischen Wert gibt es jedoch nur für df-Nummer= 10 und df-Zeichen = 12. Eine größere Anzahl von Freiheitsgraden kann nicht genommen werden, daher nehmen wir den kritischen Wert für df-Nummer= 10: Für R = 0,05 F Kp = 3,526; Pro R = 0,01 F Kp = 5,418.

Schritt 3. Akzeptanz Statistische Lösung und aussagekräftige Ausgabe. Da der Erfahrungswert den kritischen Wert für überschreitet R= 0,01 (und noch mehr für p = 0,05), dann in diesem Fall p< 0,01 и принимается альтернативная гипо­теза: дисперсия в группе 1 превышает дисперсию в группе 2 (R< 0,01). Folglich ist die Unzulänglichkeit des Selbstwertgefühls nach der Meldung von Misserfolgen höher als nach der Meldung von Erfolgen.

/ praktische Statistik / Referenzmaterialien / studentische t-Testwerte

BedeutungT - Student's Test auf einem Signifikanzniveau von 0,10, 0,05 und 0,01

ν – Variationsfreiheitsgrade

Standardwerte des Student's t-Test

Anzahl der Freiheitsgrade

Signifikanzniveaus

Anzahl der Freiheitsgrade

Signifikanzniveaus

Tabelle XI

Standardwerte des Fisher-Tests zur Beurteilung der Signifikanz von Unterschieden zwischen zwei Proben

Freiheitsgrade

Signifikanzniveau

Freiheitsgrade

Signifikanzniveau

Student's t-Test

Student's t-Test- der allgemeine Name für eine Klasse von Methoden zum statistischen Testen von Hypothesen (statistische Tests) basierend auf der Student-Verteilung. Die häufigsten Fälle der Anwendung des t-Tests beziehen sich auf die Überprüfung der Gleichheit der Mittelwerte in zwei Stichproben.

T-Statistiken werden normalerweise wie folgt erstellt allgemeines Prinzip: im Zähler ist eine Zufallsvariable mit null mathematischer Erwartung (wenn die Nullhypothese erfüllt ist), und im Nenner - die Stichprobenstandardabweichung davon zufällige Variable, erhalten als Quadratwurzel aus der ungemischten Schätzung der Varianz.

Geschichte

Dieses Kriterium wurde von William Gosset entwickelt, um die Qualität von Bier bei Guinness zu bewerten. Im Zusammenhang mit Verpflichtungen gegenüber dem Unternehmen zur Geheimhaltung Geschäftsgeheimnis(die Guinness-Führung betrachtete die Verwendung des statistischen Apparats in ihrer Arbeit als solche), Gossets Artikel wurde 1908 in der Zeitschrift Biometrics unter dem Pseudonym „Student“ (Student) veröffentlicht.

Datenanforderungen

Um dieses Kriterium anwenden zu können, müssen die Originaldaten normalverteilt sein. Bei der Anwendung eines Zweistichprobentests für unabhängige Stichproben ist zusätzlich die Bedingung der Varianzgleichheit einzuhalten. Es gibt jedoch Alternativen zum Student-t-Test für Situationen mit ungleichen Varianzen.

Die Anforderung, dass die Datenverteilung normal ist, ist für den exakten t (\displaystyle t)-Test notwendig. Aber auch bei anderen Datenverteilungen ist es möglich, die t (\displaystyle t) -Statistik zu verwenden. In vielen Fällen haben diese Statistiken asymptotisch eine Standardnormalverteilung - N (0 , 1) (\displaystyle N(0,1)) , sodass Quantile dieser Verteilung verwendet werden können. Allerdings werden auch hier oft die Quantile nicht aus der Standardnormalverteilung, sondern aus der entsprechenden Student-Verteilung verwendet, wie beim exakten t (\displaystyle t)-Test. Sie sind asymptotisch äquivalent, aber auf kleinen Stichproben Vertrauensintervalle Student-Verteilungen sind breiter und zuverlässiger.

t-Test bei einer Stichprobe

Es wird verwendet, um die Nullhypothese H 0: E (X) = m (\displaystyle H_(0):E(X)=m) über die Gleichheit der Erwartung E (X) (\displaystyle E(X)) zu testen. für manchen bekannter Wert m (\displaystyle m) .

Offensichtlich gilt unter der Nullhypothese E (X ¯) = m (\displaystyle E((\overline (X)))=m) . Angesichts der angenommenen Unabhängigkeit der Beobachtungen ist V (X ¯) = σ 2 / n (\displaystyle V((\overline (X)))=\sigma ^(2)/n) . Unter Verwendung der unverzerrten Varianzschätzung s X 2 = ∑ t = 1 n (X t − X ¯) 2 / (n − 1) (\displaystyle s_(X)^(2)=\sum _(t=1)^( n )(X_(t)-(\overline (X)))^(2)/(n-1)) erhalten wir die folgende t-Statistik:

t = X ¯ - - m s X / n (\displaystyle t=(\frac ((\overline (X))-m)(s_(X)/(\sqrt (n)))))

Unter der Nullhypothese ist die Verteilung dieser Statistik t (n − 1) (\displaystyle t(n-1)) . Daher, wenn der Wert der Statistik im absoluten Wert den kritischen Wert überschreitet gegebene Verteilung(bei gegebenem Signifikanzniveau) wird die Nullhypothese verworfen.

t-Test bei zwei Stichproben für unabhängige Stichproben

Seien zwei unabhängige Stichproben der Größen n 1 , n 2 (\displaystyle n_(1)~,~n_(2)) von normalverteilten Zufallsvariablen X 1 , X 2 (\displaystyle X_(1),~X_(2 )) . Es ist notwendig, die Nullhypothese der Gleichheit anhand von Beispieldaten zu testen mathematische Erwartungen diese Zufallsvariablen H 0: M 1 = M 2 (\displaystyle H_(0):~M_(1)=M_(2)) .

Betrachten Sie die Differenz der Stichprobenmittelwerte Δ = X ¯ 1 − X ¯ 2 (\displaystyle \Delta =(\overline (X))_(1)-(\overline (X))_(2)) . Wenn die Nullhypothese erfüllt ist, ist offensichtlich E (Δ) = M 1 − M 2 = 0 (\displaystyle E(\Delta)=M_(1)-M_(2)=0) . Die Varianz dieser Differenz ist gleich, basierend auf der Unabhängigkeit der Stichproben: V (Δ) = σ 1 2 n 1 + σ 2 2 n 2 (\displaystyle V(\Delta)=(\frac (\sigma _(1 )^(2))( n_(1)))+(\frac (\sigma _(2)^(2))(n_(2)))) . Verwenden Sie dann die unverzerrte Varianzschätzung s 2 = ∑ t = 1 n (X t − X ¯) 2 n − 1 (\displaystyle s^(2)=(\frac (\sum _(t=1)^(n) ( X_(t)-(\overline (X)))^(2))(n-1))) erhalten wir eine unverzerrte Schätzung der Varianz der Differenz zwischen den Mittelwerten der Stichprobe: s Δ 2 = s 1 2 n 1 + s 2 2 n 2 (\ displaystyle s_(\Delta )^(2)=(\frac (s_(1)^(2))(n_(1)))+(\frac (s_(2)^ (2))(n_(2) ))) . Daher ist die t-Statistik zum Testen der Nullhypothese

T = X ¯ 1 − X ¯ 2 s 1 2 n 1 + s 2 2 n 2 (\displaystyle t=(\frac ((\overline (X))_(1)-(\overline (X))_( 2))(\sqrt ((\frac (s_(1)^(2))(n_(1)))+(\frac (s_(2)^(2))(n_(2))))) ))

Diese Statistik hat unter der Nullhypothese eine Verteilung t (df) (\displaystyle t(df)) , wobei df = (s 1 2 / n 1 + s 2 2 / n 2) 2 (s 1 2 / n 1 ) 2 / (n 1 − 1) + (s 2 2 / n 2) 2 / (n 2 − 1) (\displaystyle df=(\frac ((s_(1)^(2)/n_(1)+ s_(2 )^(2)/n_(2))^(2))((s_(1)^(2)/n_(1))^(2)/(n_(1)-1)+( s_(2 )^(2)/n_(2))^(2)/(n_(2)-1))))

Gleicher Abweichungsfall

Wenn angenommen wird, dass die Stichprobenvarianzen gleich sind, dann

V (Δ) = σ 2 (1 n 1 + 1 n 2) (\displaystyle V(\Delta)=\sigma ^(2)\left((\frac (1)(n_(1)))+(\ frac (1)(n_(2)))\right))

Dann lautet die t-Statistik:

T = X ¯ 1 − X ¯ 2 s X 1 n 1 + 1 n 2 , s X = (n 1 − 1) s 1 2 + (n 2 − 1) s 2 2 n 1 + n 2 − 2 (\ Anzeigestil t=(\frac ((\overline (X))_(1)-(\overline (X))_(2))(s_(X)(\sqrt ((\frac (1)(n_(1 )))+(\frac (1)(n_(2))))))~,~~s_(X)=(\sqrt (\frac ((n_(1)-1)s_(1)^ (2)+(n_(2)-1)s_(2)^(2))(n_(1)+n_(2)-2))))

Diese Statistik hat eine Verteilung t (n 1 + n 2 − 2) (\displaystyle t(n_(1)+n_(2)-2))

t-Test bei zwei Stichproben für abhängige Stichproben

Um den empirischen Wert des t (\displaystyle t) -Kriteriums in einer Situation zu berechnen, in der eine Hypothese über die Unterschiede zwischen zwei abhängigen Stichproben (z. B. zwei Stichproben desselben Tests mit einem Zeitintervall) getestet wird, wird die folgende Formel verwendet :

T = M d s d / n (\displaystyle t=(\frac (M_(d))(s_(d)/(\sqrt (n)))))

wobei M d (\displaystyle M_(d)) die mittlere Differenz der Werte, s d (\displaystyle s_(d)) die Standardabweichung der Differenzen und n die Anzahl der Beobachtungen ist

Diese Statistik hat eine Verteilung von t (n − 1) (\displaystyle t(n-1)) .

Testen einer linearen Beschränkung auf lineare Regressionsparameter

Unter Verwendung des t-Tests kann man auch eine beliebige (einzelne) lineare Beschränkung auf die Parameter der geschätzten linearen Regression testen konventionelle Methode kleinsten Quadrate. Es sei notwendig, die Hypothese H 0 zu testen: c T b = a (\displaystyle H_(0):c^(T)b=a) . Offensichtlich gilt unter der Nullhypothese E (c T b ^ − a) = c TE (b ^) − a = 0 (\displaystyle E(c^(T)(\hat (b))-a)=c^( T)E((\hat (b)))-a=0) . Hier verwenden wir die Eigenschaft unverzerrter Schätzungen der kleinsten Quadrate von Modellparametern E (b ^) = b (\displaystyle E((\hat (b)))=b) . Außerdem ist V (c T b ^ − a) = c TV (b ^) c = σ 2 c T (XTX) − 1 c (\displaystyle V(c^(T)(\hat (b))-a )=c^(T)V((\hat (b)))c=\sigma ^(2)c^(T)(X^(T)X)^(-1)c) . Unter Verwendung der unverzerrten Schätzung s 2 = E S S / (n − k) (\displaystyle s^(2)=ESS/(n-k)) anstelle der unbekannten Varianz erhalten wir die folgende t-Statistik:

T = c T b ^ − asc T (XTX) − 1 c (\displaystyle t=(\frac (c^(T)(\hat (b))-a)(s(\sqrt (c^(T) (X^(T)X)^(-1)c)))))

Diese Statistik hat unter der Nullhypothese eine Verteilung von t (n − k) (\displaystyle t(nk)) , wenn also der Wert der Statistik größer als der kritische Wert ist, dann ist die Nullhypothese einer linearen Beschränkung abgelehnt.

Testen von Hypothesen über den Koeffizienten der linearen Regression

Ein Spezialfall einer linearen Einschränkung besteht darin, die Hypothese zu testen, dass der Regressionskoeffizient b j (\displaystyle b_(j)) gleich einem Wert a (\displaystyle a) ist. In diesem Fall lautet die entsprechende t-Statistik:

T = b ^ j − ein s b ^ j (\displaystyle t=(\frac ((\hat (b))_(j)-a)(s_((\hat (b))_(j)))))

wobei s b ^ j (\displaystyle s_((\hat (b))_(j))) der Standardfehler der Koeffizientenschätzung ist – die Quadratwurzel des entsprechenden Diagonalelements der Kovarianzmatrix der Koeffizientenschätzungen.

Unter der Nullhypothese ist die Verteilung dieser Statistik t (n − k) (\displaystyle t(n-k)) . Wenn der Absolutwert der Statistik höher als der kritische Wert ist, dann ist die Differenz des Koeffizienten von a (\displaystyle a) statistisch signifikant (nicht zufällig), andernfalls ist sie unbedeutend (zufällig, d. h. der wahre Koeffizient ist wahrscheinlich gleich oder sehr nahe am erwarteten Wert von a (\ display style a))

Kommentar

Der Ein-Stichproben-Test für mathematische Erwartungen kann auf das Testen einer linearen Beschränkung der linearen Regressionsparameter reduziert werden. In einem Test mit einer Stichprobe ist dies eine "Regression" auf eine Konstante. Daher ist s 2 (\displaystyle s^(2)) der Regression eine Stichprobenschätzung der Varianz der untersuchten Zufallsvariablen, die Matrix XTX (\displaystyle X^(T)X) ist n (\displaystyle n) , und die Schätzung des „Koeffizienten“ des Modells ist der Stichprobenmittelwert. Daraus erhalten wir den oben für den allgemeinen Fall angegebenen Ausdruck für die t-Statistik.

In ähnlicher Weise kann gezeigt werden, dass ein Zwei-Stichproben-Test mit gleichen Stichprobenvarianzen ebenfalls auf das Testen linearer Nebenbedingungen reduziert wird. In einem Test mit zwei Stichproben ist dies eine „Regression“ auf eine Konstante und eine Dummy-Variable, die abhängig vom Wert (0 oder 1) eine Unterstichprobe identifiziert: y = a + b D (\displaystyle y=a+bD) . Die Hypothese über die Gleichheit der mathematischen Erwartungen der Stichproben kann als Hypothese über die Gleichheit des Koeffizienten b dieses Modells zu Null formuliert werden. Es kann gezeigt werden, dass die entsprechende t-Statistik zum Testen dieser Hypothese gleich der t-Statistik für den Zwei-Stichproben-Test ist.

Sie kann auch auf die Überprüfung der linearen Nebenbedingung bei unterschiedlichen Varianzen reduziert werden. In diesem Fall nimmt die Varianz der Modellfehler zwei Werte an. Daraus kann man auch eine ähnliche t-Statistik wie für den Zwei-Stichproben-Test erhalten.

Nichtparametrische Analoga

Ein Analogon des Zwei-Stichproben-Tests für unabhängige Stichproben ist der Mann-Whitney-U-Test. Für die Situation mit abhängigen Stichproben sind die Analoga der Vorzeichentest und der Wilcoxon-T-Test

Literatur

Schüler. Der wahrscheinliche Fehler eines Mittelwerts. // Biometrika. 1908. Nr. 6 (1). S. 1-25.

Verknüpfungen

Über die Kriterien zum Testen von Hypothesen über die Homogenität der Mittel auf der Website der Staatlichen Technischen Universität Nowosibirsk

Ein äquivalenter Ansatz zur Interpretation von Testergebnissen lautet wie folgt: Unter der Annahme, dass die Nullhypothese wahr ist, können wir berechnen, wie groß sie ist Wahrscheinlichkeit erhalten T-Kriterium gleich oder größer als der reale Wert, den wir aus den verfügbaren Beispieldaten berechnet haben. Wenn sich herausstellt, dass diese Wahrscheinlichkeit kleiner als ein vorgegebenes Signifikanzniveau ist (z. B. P< 0.05), мы вправе отклонить проверяемую нулевую гипотезу. Именно такой подход сегодня используется чаще всего: исследователи приводят в своих работах P-значение, которое легко рассчитывается при помощи статистических программ. Рассмотрим, как это можно сделать в системе R.

Angenommen, wir haben Daten zur täglichen Nahrungsenergieaufnahme (kJ/Tag) für 11 Frauen (Beispiel aus dem Buch Altman D. G. (1981) Praktische Statistik für die medizinische Forschung, Chapman & Hall, London):


Der Mittelwert für diese 11 Beobachtungen ist:


Frage: weicht dieser Beispielmittelwert von der etablierten Norm von 7725 kJ / Tag ab? Der Unterschied zwischen unserem Beispielwert und diesem Standard ist recht ordentlich: 7725 - 6753,6 = 971,4. Aber wie groß ist dieser Unterschied statistisch gesehen? Eine Stichprobe hilft bei der Beantwortung dieser Frage. T-Prüfung. Wie andere Optionen T-test wird in R mit der Funktion t.test() ein Student-Test bei einer Stichprobe durchgeführt:


Frage: Sind diese Mittelwerte statistisch unterschiedlich? Lassen Sie uns die Hypothese von keinem Unterschied mit testen T-Prüfung:

Aber wie kann man in solchen Fällen die Wirkung der Exposition statistisch auswerten? v Gesamtansicht Das Schülerkriterium kann dargestellt werden als

/-Schülerkriterium bezieht sich auf Parameter, daher ist seine Verwendung nur möglich, wenn die Ergebnisse des Experiments in Form von Messungen auf den letzten beiden Skalen - Intervall und Verhältnisse - präsentiert werden. Lassen Sie uns die Möglichkeiten des Student-Kriteriums an einem konkreten Beispiel veranschaulichen.

Angenommen, Sie müssen die Wirksamkeit des Schießtrainings in einer bestimmten Technik herausfinden. Zu diesem Zweck wird ein vergleichendes pädagogisches Experiment durchgeführt, bei dem sich eine Gruppe (Experimental), bestehend aus 8 Personen, mit der vorgeschlagenen experimentellen Methodik und die andere (Kontrolle) - gemäß der traditionellen, allgemein anerkannten - beschäftigt. Die Arbeitshypothese lautet, dass die von Ihnen vorgeschlagene neue Methode effektiver sein wird. Das Ergebnis des Experiments ist ein Kontrollschuss von fünf Schüssen, nach dessen Ergebnissen (Tabelle 6) die Zuverlässigkeit der Unterschiede berechnet und die Richtigkeit der aufgestellten Hypothese überprüft werden muss.

Tabelle 6

Was ist zu tun, um die Signifikanz von Unterschieden nach Student's /-Test zu berechnen?

1. Berechnen Sie die arithmetischen Mittelwerte von X für jede Gruppe separat nach folgender Formel:

wo xt- der Wert einer einzelnen Messung; Ich bin -- Gesamtzahl Gruppenmessungen.

Geben Sie die tatsächlichen Werte aus der Tabelle in die Formel ein. 6 erhalten wir:

Der Vergleich der arithmetischen Mittelwerte belegt, dass in der Experimentalgruppe dieser Wert (X, = 35) höher ist als in der Kontrollgruppe. (Hk= 27). Für die abschließende Aussage, dass die Beteiligten der Versuchsgruppe besser schießen gelernt haben, sollte man sich jedoch von der statistischen Signifikanz der Differenzen (/) zwischen den errechneten arithmetischen Mittelwerten überzeugen.

2. Berechnen Sie in beiden Gruppen die Standardabweichung (5) mit der folgenden Formel:

:de Ximax-- der höchste Indikator; xmm-- der kleinste Indikator; ZU- tabellarischer Koeffizient. Die Reihenfolge, in der die Standardabweichung (5) berechnet wird, ist: -- define Xitrax in beiden Gruppen; -- definieren Ximia in diesen Gruppen; -- Bestimmung der Anzahl der Messungen in jeder Gruppe (l); -- finden Sie in einer speziellen Tabelle (Anhang 12) den Wert des Koeffizienten ZU, was der Anzahl der Messungen in der Gruppe (8) entspricht. Dazu finden wir in der Spalte ganz links unter dem Index (i) die Zahl 0, da die Anzahl der Messungen in unserem Beispiel weniger als 10 beträgt, und in der obersten Zeile die Zahl 8; am Schnittpunkt dieser Linien - 2,85, was dem Wert des Koeffizienten entspricht.

3. Berechnen Standart Fehler arithmetischer Mittelwert (t) nach der Formel:

Für unser Beispiel ist die erste Formel geeignet, da P< 30. Вычислим для каждой группы значения:

4. Berechnen Sie den durchschnittlichen Fehler der Differenz mit der Formel:

5. Bestimmen Sie anhand einer speziellen Tabelle (Anlage 13) die Signifikanz von Unterschieden. Dazu der resultierende Wert (T) verglichen mit dem Grenzwert bei 5 % Signifikanzniveau (t0fi5) FOR die Anzahl der Freiheitsgrade/= pe + pc- 2, wo pc packen~ die Gesamtzahl der Einzelergebnisse in den Versuchs- und Kontrollgruppen. Wenn sich herausstellt, dass die experimentelle T größer als der Grenzwert (/0)o5)> m0 werden die Differenzen zwischen den arithmetischen Mittelwerten der beiden Gruppen berücksichtigt glaubwürdig auf einem Signifikanzniveau von 50 % und umgekehrt, falls dies der Fall ist nicht weniger Grenzwert t0<05, Es wird angenommen, dass die Unterschiede unzuverlässig und die Differenz im arithmetischen Mittel der Gruppen ist zufällig. Der Grenzwert auf dem 5%-Signifikanzniveau (Г0>05) wird wie folgt bestimmt:

berechne die Anzahl der Freiheitsgrade/= 8 + 8 - 2 = 14;

Finden Sie den Grenzwert der Tabelle (Anhang 13). tofi5 um /= 14.

In unserem Beispiel der Tabellenwert tQ<05 = 2.15, vergleiche es mit dem berechneten G, was gleich 1,7 ist, d.h. kleiner als der Grenzwert (2.15). Daher werden die Unterschiede zwischen den im Experiment erhaltenen arithmetischen Mittelwerten berücksichtigt unzuverlässig, Das bedeutet, dass es nicht genügend Gründe gibt zu sagen, dass sich eine Methode des Schießunterrichts als effektiver erwiesen hat als eine andere. In diesem Fall können wir schreiben: / = 1,7 bei /> 0,05, was bedeutet, dass bei 100 ähnlichen Experimenten die Wahrscheinlichkeit (R) Erhalten ähnlicher Ergebnisse, wenn die arithmetischen Mittelwerte der Versuchsgruppen höher sind als die der Kontrollgruppen, mehr als 5% Signifikanzniveau oder weniger als 95 Fälle von 100. Das endgültige Design der Tabelle unter Berücksichtigung der erhaltenen Berechnungen und mit den entsprechenden Parametern so aussehen kann.

Mit vergleichsweise große Zahlen Messungen wird bedingt davon ausgegangen, dass, wenn die Differenz zwischen den arithmetischen Mittelwerten gleich oder größer als drei ihrer Fehler ist, die Differenzen als signifikant angesehen werden. In diesem Fall wird die Zuverlässigkeit von Differenzen durch die folgende Gleichung bestimmt:

Wie zu Beginn dieses Abschnitts erwähnt, kann der Student's /-Test nur angewendet werden, wenn Messungen auf einer Skala von Intervallen und Verhältnissen durchgeführt werden. Allerdings hinein Pädagogische Forschung Häufig besteht die Notwendigkeit, die Zuverlässigkeit von Unterschieden zwischen den auf der Namens- oder Ordnungsskala erhaltenen Ergebnissen zu bestimmen. Verwenden Sie in solchen Fällen nichtparametrisch Kriterien. Im Gegensatz zu parametrischen Kriterien erfordern nichtparametrische Kriterien keine Berechnung bestimmter Parameter der erhaltenen Ergebnisse (arithmetisches Mittel, Standardabweichung usw.), was der Hauptgrund für ihre Namen ist. Betrachten Sie jetzt zwei nichtparametrische Kriterien um die Signifikanz von Unterschieden zwischen unabhängigen Ergebnissen zu bestimmen, die auf einer Ordnungs- und Namensskala erhalten wurden.

Ein äquivalenter Ansatz zur Interpretation von Testergebnissen lautet wie folgt: Unter der Annahme, dass die Nullhypothese wahr ist, können wir berechnen, wie groß sie ist Wahrscheinlichkeit erhalten T-Kriterium gleich oder größer als der reale Wert, den wir aus den verfügbaren Beispieldaten berechnet haben. Wenn sich herausstellt, dass diese Wahrscheinlichkeit kleiner als ein vorgegebenes Signifikanzniveau ist (z. B. P< 0.05), мы вправе отклонить проверяемую нулевую гипотезу. Именно такой подход сегодня используется чаще всего: исследователи приводят в своих работах P-значение, которое легко рассчитывается при помощи статистических программ. Рассмотрим, как это можно сделать в системе R.

Angenommen, wir haben Daten zur täglichen Nahrungsenergieaufnahme (kJ/Tag) für 11 Frauen (Beispiel aus dem Buch Altman D. G. (1981) Praktische Statistik für die medizinische Forschung, Chapman & Hall, London):


Der Mittelwert für diese 11 Beobachtungen ist:


Frage: weicht dieser Beispielmittelwert von der etablierten Norm von 7725 kJ / Tag ab? Der Unterschied zwischen unserem Beispielwert und diesem Standard ist recht ordentlich: 7725 - 6753,6 = 971,4. Aber wie groß ist dieser Unterschied statistisch gesehen? Eine Stichprobe hilft bei der Beantwortung dieser Frage. T-Prüfung. Wie andere Optionen T-test wird in R mit der Funktion t.test() ein Student-Test bei einer Stichprobe durchgeführt:


Frage: Sind diese Mittelwerte statistisch unterschiedlich? Lassen Sie uns die Hypothese von keinem Unterschied mit testen T-Prüfung:

Aber wie kann man in solchen Fällen die Wirkung der Exposition statistisch auswerten? Im Allgemeinen kann das Student-Kriterium dargestellt werden als

Eines der bekanntesten statistischen Tools ist der Student's t-Test. Es wird zum Messen verwendet statistische Signifikanz verschiedene Paare. Microsoft Excel verfügt über eine spezielle Funktion zur Berechnung dieses Indikators. Lassen Sie uns lernen, wie man den Student-t-Test in Excel berechnet.

Aber lassen Sie uns für den Anfang noch herausfinden, was das Student-Kriterium im Allgemeinen ist. Dieser Indikator wird verwendet, um die Gleichheit der Durchschnittswerte zweier Proben zu überprüfen. Das heißt, es bestimmt die Gültigkeit der Unterschiede zwischen zwei Datengruppen. Gleichzeitig, um dieses Kriterium zu bestimmen, das ganze Set Methoden. Der Indikator kann mit einer einseitigen oder zweiseitigen Verteilung berechnet werden.

Berechnung des Indikators in Excel

Kommen wir nun zur Frage, wie man diesen Indikator in Excel berechnet. Dies kann über die Funktion erfolgen SCHÜLERTEST. In Versionen von Excel 2007 und früher hieß es TTEST. Es wurde jedoch aus Kompatibilitätsgründen in späteren Versionen belassen, aber es wird immer noch empfohlen, ein moderneres in ihnen zu verwenden - SCHÜLERTEST. Diese Funktion kann auf drei Arten verwendet werden, auf die weiter unten näher eingegangen wird.

Methode 1: Funktionsassistent

Am einfachsten lässt sich dieser Indikator über den Funktionsassistenten berechnen.


Die Berechnung wird durchgeführt und das Ergebnis wird auf dem Bildschirm in einer vorausgewählten Zelle angezeigt.

Methode 2: Arbeiten mit der Registerkarte "Formeln".

Funktion SCHÜLERTEST kann auch über die Registerkarte aufgerufen werden "Formeln" mit einem speziellen Knopf auf dem Band.


Methode 3: manuelle Eingabe

Formel SCHÜLERTEST es kann auch manuell in eine beliebige Zelle auf dem Arbeitsblatt oder in die Funktionsleiste eingegeben werden. Seine Syntax sieht so aus:

STUDENT.TEST(Array1,Array2,Tails,Typ)

Was jedes der Argumente bedeutet, wurde bei der Analyse der ersten Methode berücksichtigt. Diese Werte sollten in diese Funktion eingesetzt werden.

Drücken Sie nach Eingabe der Daten die Taste Eingeben um das Ergebnis auf dem Bildschirm anzuzeigen.

Wie Sie sehen können, wird das Schülerkriterium in Excel sehr einfach und schnell berechnet. Die Hauptsache ist, dass der Benutzer, der die Berechnungen durchführt, verstehen muss, was er ist und welche Eingabedaten für was verantwortlich sind. Die direkte Berechnung führt das Programm selbst durch.