Vertrauensintervalle für Frequenzen und Aktien. Proben- und Konfidenzintervalle

Vertrauensintervalle.

Die Berechnung des Konfidenzintervalls basiert auf einem durchschnittlichen Fehler des entsprechenden Parameters. Vertrauensintervall Zeigt an, dass unter welchen Grenzen mit einer Wahrscheinlichkeit (1-A) der tatsächliche Wert des geschätzten Parameters ist. Hier ist ein Signifikanzniveau (1-A) wird auch als vertrauensvolle Wahrscheinlichkeit bezeichnet.

Im ersten Kapitel haben wir gezeigt, dass zum Beispiel für die durchschnittliche Arithmetik der wahre Durchschnitt eines Satzes etwa 95% der Fälle innerhalb von 2 mittleren Durchschnittsfehlern liegt. Somit werden die Grenzen von 95% des Konfidenzintervalls für den Durchschnitt von dem Probenmedium bis zum doppelten mittleren Fehler verteidigt, d. H. Wir multiplizieren den durchschnittlichen Fehler des Durchschnitts für einen bestimmten Koeffizienten in Abhängigkeit von der Vertrauenswahrscheinlichkeit. Für den Durchschnitt und den Unterschied zwischen dem Durchschnitt wird der Studentenkoeffizient (der kritische Wert des Studentenkriteriums) für den Anteil und den Unterschied des Bruchteils des kritischen Werts des Z-Kriteriums ergriffen. Das Produkt des Koeffizienten auf einem durchschnittlichen Fehler kann als Grenzfehler dieses Parameters bezeichnet werden, d. H. Maximum, was wir bekommen können, wenn es auswertet wird.

Vertrauensintervall für mittlere Arithmetik : .

Hier - selektiver Durchschnitt;

Der durchschnittliche Fehler der durchschnittlichen Arithmetik;

s -selektive durchschnittliche quadratische Abweichung;

n.

f \u003d n-1 (Studentenkoeffizient).

Vertrauensintervall für mittlere arithmetische Unterschiede :

Hier ist der Unterschied zwischen dem Mustermedium;

- Durchschnittlicher arithmetischer Differenzdifferenzfehler;

s 1, S 2 -selektive durchschnittliche quadratische Abweichungen;

n 1, n 2

Kritischer Wert des kritischen Kriteriums des Schülers auf einem bestimmten Signifikanzniveau A und der Anzahl der Freiheitsgrade f \u003d n 1 + n 2-2 (studierter Koeffizient).

Vertrauensintervall für solo. :

.

Hier ist d ein selektiver Teilen;

- Durchschnittlicher Anteilsfehler;

n. - das Volumen der Probe (Anzahl der Gruppe);

Vertrauensintervall für unterschiede :

Hier ist der Unterschied zwischen den Probenaktien;

- Durchschnittlicher arithmetischer Differenzdifferenzfehler;

n 1, n 2 - Mustervolumente (Gruppennummern);

Kritischer Wert des Kriteriums Z auf einem bestimmten Signifikanzniveau A (,,).

Berechnen der Konfidenzintervalle für den Unterschied in den Indikatoren, wir sehen zunächst die möglichen Auswirkungen des Effekts und nicht nur seine Punktschätzung. Zweitens können wir über die Annahme oder die Widerlegung der Nullhypothese abschließen, und drittens können wir über die Kapazität des Kriteriums abschließen.

Bei der Überprüfung von Hypothesen mit Trust-Intervallen müssen Sie der folgenden Regel folgen:

Wenn 100 (1-A) ein prozentiges Vertrauensintervall der durchschnittlichen Unterschied ist, enthält keine Null, dann sind die Unterschiede statistisch signifikant auf dem Signifikanzniveau A; Wenn im Gegenteil, wenn dieses Intervall Null enthält, sind die Unterschiede statistisch nicht signifikant.

Wenn dieses Intervall Null enthält, bedeutet dies, dass ein kompacabierbarer Indikator sowohl in einer der Gruppen mehr als auch weniger in einem der Gruppen erweisen kann, verglichen mit dem anderen, d. H. Beobachtete Unterschiede zufällig.

An dem Ort, an dem sich der Null in dem Vertrauensintervall befindet, kann man die Kapazität des Kriteriums beurteilen. Wenn Null nahe an der unteren oder oberen Grenze des Intervalls liegt, ist es mit einer größeren Anzahl von Vergütungsgruppen möglich, die Unterschiede würden eine statistische Signifikanz erreichen. Wenn Null in der Nähe der Mitte des Intervalls liegt, bedeutet dies, dass es gleichermaßen ist und die Anzeige in der experimentellen Gruppe gleichermaßen ist, und wahrscheinlich gibt es wirklich keine Unterschiede.

Beispiele:

Vergleichen Sie die Betriebssterblichkeit beim Anwenden von zwei verschiedenen Arten von Anästhesie: 61 Personen wurden mit der Verwendung der ersten Art von Anästhesie betrieben, es starb 8, mit der Verwendung der zweiten - 67 Personen starb 10.

d 1 \u003d 8/61 \u003d 0,131; d 2 \u003d 10/67 \u003d 0,149; D1-D2 \u003d - 0,018.

Der Unterschied der Tödlichkeiten der verglichenen Methoden liegt in dem Intervall (-0,018 - 0,122; -0,018 + 0,122) oder (-0,14; 0,104) mit einer Wahrscheinlichkeit von 100 (1-A) \u003d 95%. Das Intervall enthält Null, d. H. Die Hypothese derselben Mortalität bei zwei verschiedenen Anästhesie kann nicht abgelehnt werden.

Somit kann und werden die Mortalität auf 14% sinken und mit einer Wahrscheinlichkeit von 95% auf 10,4% steigen, d. H. Null liegt ungefähr um die Mitte des Intervalls, so dass es argumentiert werden kann, dass diese beiden Methoden höchstwahrscheinlich nicht in der Mortalität nicht unterscheiden.

In dem bereits überprüften Beispiel wurde die durchschnittliche Zeit des Pressens, wenn der Titel-Test in vier Studentengruppen in der Prüfungsbewertung unterscheidet. Wir berechnen die vertraulichen Intervalle der mittleren Zeitpunkt des Klicks von Studenten, die die Prüfung für 2 und 5 und das Vertrauensintervall für den Unterschied dieser Durchschnittswerte bestanden haben.

Studentenkoeffizienten Wir finden entlang der Verteiltabellen des Schülers (siehe Anhang): Für die erste Gruppe: \u003d t (0,05; 48) \u003d 2.011; Für die zweite Gruppe: \u003d t (0,05; 61) \u003d 2.000. Somit Konfidenzintervalle für die erste Gruppe: \u003d (162,19-2,011 * 2,18; 162,19 + 2.011 * 2,18; 162,19 + 2.011 * 2,18) \u003d (157,8; 166.6), für die zweite Gruppe (156.55 bis 2.000 * 1.88 156.55 + 2.000 * 1,88) \u003d (152,8; 160.3). Um die Prüfung um 2 zu bestehen, liegt die durchschnittliche Presszeit im Bereich von 157,8 ms auf 166,6 ms mit einer Wahrscheinlichkeit von 95%, für die Prüfung für 5 - von 152,8 ms auf 160,3 ms mit einer Wahrscheinlichkeit von 95%.

Sie können die Nullhypothese in den Vertrauensintervallen für Medium überprüfen, und nicht nur für den Unterschied zwischen dem Durchschnitt. Wie in unserem Fall, wenn vertrauliche Intervalle überlappt, ist es beispielsweise nicht möglich, die Nullhypothese abzulehnen. Um die Hypothese auf dem ausgewählten Signifikanzniveau abzulehnen, sollten sich die entsprechenden Konfidenzintervalle nicht überlappen.

Wir finden ein Vertrauensintervall für den Unterschied in der Durchschnittszeit des Anklickens in Gruppen der ergebenen Prüfung für 2 und 5. Der Unterschied im Durchschnitt: 162.19 - 156.55 \u003d 5.64. Studentenkoeffizient: \u003d t (0,05; 49 + 62-2) \u003d t (0,05; 109) \u003d 1,982. Konzerndurchschnittliche quadratische Abweichungen sind gleich :; . Berechnen Sie den durchschnittlichen Mediumdifferenzfehler :. Vertrauensintervall: \u003d (5,64-1.982 * 2,87; 5.64 + 1.982 * 2,87) \u003d (-0.044; 11.33).

Daher liegt der Unterschied zwischen der durchschnittlichen Zeit, um in Gruppen zu klicken, die die Prüfung für 2 und 5 aufgeben, im Bereich von -0,044 ms bis 11.33 ms. Dieses Intervall beinhaltet Null, d. H. Die durchschnittliche Zeit des Klicks von Perfekt bestanden die Prüfung kann im Vergleich zu unbefriedigendem Kapitulation steigen und abnehmen, d. H. Nullhypothese kann nicht ablehnen. Aber Null ist sehr nahe an der unteren Grenze, die Zeit des Pressens ist viel wahrscheinlicher von perfekt erteilt. Somit kann der Schluss gezogen werden, dass die Unterschiede in der mittleren Zeit des Pressens zwischen den von den 2 und 5 übergebenen Zeiten immer noch da sind, sondern sie einfach nicht mit einer Änderung der Durchschnittszeit, der Variation der Durchschnittszeit und der Probenvolumina erkennen konnten.



Die Kapazität des Kriteriums ist die Wahrscheinlichkeit, die falsche Nullhypothese abzulehnen, d. H. Finden Sie die Unterschiede, wo sie wirklich sind.

Die Kapazität des Kriteriums wird auf der Grundlage des Signifikanzniveaus, der Größe der Unterschiede zwischen den Gruppen, der Ausbreitung von Werten in Gruppen und dem Volumen der Proben bestimmt.

Für das Kriterium der Studenten- und Dispersionsanalyse können Sie Sensitivitätsdiagramme verwenden.

Die Kriteriumsleistung kann in der vorläufigen Definition der erforderlichen Gruppe verwendet werden.

Das Vertrauensintervall zeigt, unter welchen Grenzen mit einer bestimmten Wahrscheinlichkeit der wahre Wert des geschätzten Parameters ist.

Mit Hilfe von Vertrauensintervallen können statistische Hypothesen überprüft und Schlussfolgerungen über die Sensibilität der Kriterien ziehen.

LITERATUR.

Glanz S. - Kapitel 6.7.

Rebbur o.yu. - S.112-114, S.171-173, S.234-238.

Sidorenko E. V. - S.32-33.

Fragen an Selbstteststudenten.

1. Was ist die Kapazität des Kriteriums?

2. In diesem Fall ist es notwendig, die Macht der Kriterien abzuschätzen?

3. Methoden zur Berechnung der Leistung.

6. Wie überprüfen Sie die statistische Hypothese mit einem Trust-Intervall?

7. Was kann bei der Berechnung des Konfidenzintervalls über die Kapazität des Kriteriums gesagt werden?

Aufgaben.

In der Statistik gibt es zwei Arten von Bewertungen: Spot und Intervall. Punktschätzung Es ist eine separate selektive Statistik, mit der der Parameter der allgemeinen Bevölkerung geschätzt wird. Selektiver Durchschnitt beispielsweise - Dies ist eine Punktschätzung der mathematischen Erwartung der allgemeinen Bevölkerung und der selektiven Dispersion S 2. - Punktauswertung der allgemeinen Bevölkerungsdispersion Σ 2.. Es wurde gezeigt, dass der selektive Durchschnitt eine unverzichtbare Bewertung der mathematischen Erwartung der allgemeinen Bevölkerung ist. Der selektive Durchschnitt heißt unglaublich, da der Durchschnittswert aller Probenmedien (auf der gleichen Größe der Probe) n.) Gleichermaßen mathematische Erwartung der allgemeinen Bevölkerung.

Für selektive Dispersion S 2. wurde zu einer unglaublichen Schätzung der Dispersion des allgemeinen Aggregats Σ 2.Der Nenner der selektiven Dispersion sollte gleich sein n. – 1 , und nicht n.. Mit anderen Worten, die Dispersion der allgemeinen Bevölkerung ist der Durchschnittswert aller möglichen selektiven Dispersionen.

Bei der Bewertung der Parameter der Allgemeinen Bevölkerung sollte dieser selektive Statistiken berücksichtigt werden, wie z , hängen von den bestimmten Proben ab. Diese Tatsache berücksichtigen, um zu erhalten intervallauswertung. Die mathematische Erwartung der allgemeinen Bevölkerung wird durch die Verteilung des Mustermediums analysiert (siehe mehr Details). Das aufgebaute Intervall zeichnet sich durch ein gewisses Konfidenzniveau aus, was die Wahrscheinlichkeit ist, dass der wahre Parameter der allgemeinen Bevölkerung ordnungsgemäß geschätzt wird. Ähnliche Vertrauensintervalle können verwendet werden, um den Teil des Merkmals zu bewerten r. und die hauptsächlich verteilte Masse der allgemeinen Bevölkerung.

Notiz im Format oder in Format herunterladen

Erstellen eines Vertrauensintervalls für die mathematische Erwartung der Allgemeinbevölkerung mit einer bekannten Standardabweichung

Konstruieren eines Vertrauensintervalls für einen Keulen eines Merkmals in der allgemeinen Bevölkerung

In diesem Abschnitt wird das Konzept des Vertrauensintervalls auf Kategoriedaten verteilt. Dadurch können Sie den Anteil eines Merkmals in der allgemeinen Bevölkerung abschätzen r. Mit Hilfe des selektiven Lappens r. S. \u003d X /n.. Wie angegeben, wenn die Werte n.r. und n.(1 - p) Überschreiten Sie die Nummer 5, kann die Binomialverteilung normal angenähert werden. Folglich, um den Anteil des Merkmals in der allgemeinen Aggregation zu beurteilen r. Sie können ein Intervall aufbauen, dessen Vertrauensniveau gleich ist (1 - α) x100%.


wo p. S. - Selektiver Anteil eines Zeichens gleich X /n.. die Anzahl des Erfolgs geteilt durch das Probenvolumen, r. - der Anteil eines Anzeichens in der allgemeinen Bevölkerung, Z. - kritische Bedeutung der standardisierten Normalverteilung, n. - Probenahme.

Beispiel 3. Angenommen, eine Probe wird aus dem Informationssystem extrahiert, bestehend aus 100 Rechnungen, die im letzten Monat ausgefüllt werden. Angenommen, dass 10 dieser Rechnungen mit Fehlern besteht. Auf diese Weise, r. \u003d 10/100 \u003d 0,1. Das Vertrauensgrad von 95% entspricht dem kritischen Wert Z \u003d 1.96.

Somit beträgt die Wahrscheinlichkeit, dass von 4,12% auf 15,88% der Rechnungen Fehler enthalten, 95%.

Für ein gegebenes Abtastvolumen scheint das Vertrauensintervall, das den Anteil eines Merkmals in der allgemeinen Bevölkerung enthält, breiter als bei einer kontinuierlichen zufälligen Variablen. Dies wird dadurch erläutert, dass die Messungen der kontinuierlichen zufälligen Abweichung mehr Informationen enthalten als Messkategoriedaten. Mit anderen Worten, Kategoriedaten, die nur zwei Werte dauern dauert, enthält nicht genügend Informationen, um die Parameter ihrer Verteilung abzuschätzen.

BEIMwechselnde Schätzungen, die aus der letzten allgemeinen Bevölkerung extrahiert werden

Bewertung der mathematischen Erwartung.Korrekturkoeffizient für das letzte allgemeine Aggregat ( fPC.) Verwendet, um den Standardfehler manchmal zu reduzieren. Bei der Berechnung der Vertrauensintervalle, um die Parameter des allgemeinen Satzes zu schätzen, wird der Korrekturkoeffizient in Situationen angewendet, in denen die Proben ohne Rückgabe abgerufen werden. Somit das Konfidenzintervall für die mathematische Erwartung mit einem Vertrauensniveau gleich (1 - α) x100%, berechnet von der Formel:

Beispiel 4.Um die Verwendung eines Korrekturkoeffizienten für das endgültige allgemeine Set zu veranschaulichen, kehren wir zur Aufgabe, das Vertrauensintervall für die durchschnittliche Menge des oben diskutierten Overheads zu berechnen, angenommen, dass ein Monat in der Gesellschaft 5.000 Gemeinkosten erteilt wird , und X̅. \u003d 110,27 Puppe., S. \u003d 28,95 Dollar, N. = 5000, n. = 100, α \u003d 0,05, T 99 \u003d 1,9842. Mit der Formel (6) erhalten wir:

Beurteilung des Lappens des Zeichens.Bei der Wahl, ohne ein Vertrauensintervall für ein Merkmal zurückzugeben, ist ein Vertrauen gleich (1 - α) x100%, berechnet von der Formel:

Vertrauensintervalle und ethische Probleme

Mit einer selektiven Studie der allgemeinen Bevölkerung und der Formulierung statistischer Schlussfolgerungen ergeben sich ethische Probleme oft. Der Haupteinsatz - wie Vertrauensintervalle und Punktschätzungen der Beispielstatistiken konsistent sind. Veröffentlichung der Punktschätzungen ohne Angabe der jeweiligen Konfidenzintervalle (in der Regel mit einem Konfidenzniveau von 95%) und des Abtastvolumens, auf deren Grundlage sie erhalten werden, können Missverständnisse erzeugen. Dies kann den Benutzer mit dem Eindruck erstellen, dass eine Punktschätzung genau das ist, was er genau das ist, was er vorhersagen muss, um die Eigenschaften der gesamten allgemeinen Bevölkerung vorherzusagen. Somit ist es notwendig, zu verstehen, dass in beliebigen Studien am Kopf der Ecke nicht geliefert werden sollten, und ein Intervallschätzungen. Darüber hinaus sollte die korrekte Auswahl der Probenahme besonders aufmerksam gemacht werden.

Am häufigsten sind die Objekte der statistischen Manipulationen die Ergebnisse soziologischer Erhebungen der Bevölkerung für ein oder andere politische Fragen. Gleichzeitig werden die Ergebnisse der Umfrage auf den ersten Seiten der Zeitung durchgeführt, und der Musterstudienfehler und die Methodik der statistischen Analyse werden irgendwo in der Mitte gedruckt. Um die Gültigkeit der resultierenden Punktschätzungen zu beweisen, ist es notwendig, die Größe der Probe anzuzeigen, auf deren Grundlage sie erhalten werden, die Grenzen des Konfidenzintervalls und deren Bedeutung.

Next Note

Die Materialien des Buches Levin et al. Statistiken für Manager. - M.: Williams, 2004. - mit. 448-462.

Zentraler Grenzwertsatz. Es behauptet, dass mit einer ausreichend großen Probengröße die selektive Verteilung des Durchschnitts durch eine normale Verteilung angenähert werden kann. Diese Eigenschaft hängt nicht von der Art der Verteilung der allgemeinen Bevölkerung ab.

Vertrauensintervall - Die Grenzwerte des statistischen Werts, die mit einer bestimmten Konfidenzwahrscheinlichkeit von γ, in diesem Intervall in der Probe eines größeren Volumens liegen. Es ist als p (θ - ε. In der Praxis wird die Vertrauenswahrscheinlichkeit γ von ausreichend nahe an der Werteeinheit γ \u003d 0,9, γ \u003d 0,95, γ \u003d 0,99 ausgewählt.

Ernennung des Dienstes.. Mit diesem Dienst werden ermittelt von:

  • vertrauensintervall für den allgemeinen Durchschnitt, das Vertrauensintervall für die Dispersion;
  • vertrauensintervall für mittlere quadratische Abweichungen, Vertrauensintervall für den allgemeinen Anteil;
Die erhaltene Lösung wird in der Word-Datei gespeichert (siehe Beispiel). Nachfolgend finden Sie eine Videoanweisung, wie Sie die Quelldaten füllen.

Beispiel Nummer 1. In der kollektiven Farm von der Gesamtherde in 1000 Schafen wurden 100 Schafe selektiven Kontrollhaarschnitt ausgesetzt. Infolgedessen wurden mittlere Nastrigwolle 4,2 kg pro Schafe installiert. Bestimmen Sie mit einer Wahrscheinlichkeit von 0,999 durchschnittlicher quadratischer Abtastfehler bei der Bestimmung der durchschnittlichen Spitznusswolle pro Schafe und den Grenzen, in denen die Größe von Nastrig beigefügt ist, wenn die Dispersion 2,5 beträgt. Die Probenahme ist beleidigt.
Beispiel Nummer 2. Von der Charge der importierten Produkte als Moskauer North-Bräuche wurde in Ordnung ein zufälliger Nachprobe von 20 Proben des Produkts "A" genommen. Infolge der Inspektion ist die mittlere Luftfeuchtigkeit des Produkts "A" in der Probe, die sich als in Höhe von 6% mit einer durchschnittlichen quadratischen Abweichung von 1% betrug.
Bestimmen Sie mit einer Wahrscheinlichkeit von 0,683 Grenzen der durchschnittlichen Luftfeuchtigkeit des Produkts in der gesamten Charge importierter Produkte.
Beispielnummer 3. Survey 36-Studenten zeigten, dass sich die durchschnittliche Anzahl der von ihnen gelesenen Lehrbücher für das akademische Jahr als gleichwertig erwiesen hat. In Anbetracht dessen, dass die Anzahl der vom Schüler des Semesters gelesenen Lehrbücher ein normales Vertriebsgesetz mit einer durchschnittlichen quadratischen Abweichung hat 6, FINDE: A) Mit der Zuverlässigkeit 0, 99 Intervallbewertung für die mathematische Erwartung dieser Zufallsgröße; B) Mit welcher Wahrscheinlichkeit kann es argumentiert werden, dass die durchschnittliche Anzahl der von dem Studenten gelesenen Lehrbücher für das von dieser Muster berechnete Semester von der mathematischen Erwartung des absoluten Werts nicht mehr als 2 abweichen wird.

Klassifizierung der Vertrauensintervalle

Durch Arten des geschätzten Parameters:

Entsprechend dem Beispieltyp:

  1. Vertrauensintervall für unendliche Probe;
  2. Vertrauensintervall für die endgültige Probe;
Die Probe wird wiederholt genanntWenn das ausgewählte Objekt vor der Auswahl des nächsten Werts in die allgemeine Bevölkerung zurückgegeben wird. Die Probe heißt UnsinnWenn das ausgewählte Objekt im allgemeinen Set nicht erstattet wird. In der Praxis befassen sie sich normalerweise mit den Hauptproben.

Berechnung des durchschnittlichen Abtastfehlers während der Zufallsauswahl

Die Diskrepanz zwischen den Werten der durch die Probe erhaltenen Indikatoren und den entsprechenden Parametern der allgemeinen Bevölkerung repräsentativer Fehler.
Bezeichnungen der Hauptparameter des allgemeinen und selektiven Aggregats.
Mittlere Fehlerformeln-Probenahme
wiederholte Auswahlwahlauswahl
für Mittefür einen Anteilfür Mittefür einen Anteil
Das Verhältnis zwischen dem Fehlergrenze der Probenahme (Δ), garantiert mit einiger Wahrscheinlichkeit P (t), und der durchschnittliche Abtastfehler ist: oder Δ \u003d t · μ, wo t.- Der Vertrauenskoeffizient, der je nach Wahrscheinlichkeitsniveau p (t) auf der Tabelle der integrierten Funktion des Laplace bestimmt wird.

Formeln zur Berechnung der Größe der Probe mit einer erschwinglichen Auswahlmethode

Vertrauensintervall (DI; In der in der Studie während der Studie während der Probe erhaltenen Englisch, die in der Studie während der Probe erhalten wird, ergibt das Maß der Genauigkeit (oder der Unsicherheit) der Forschungsergebnisse, um Schlussfolgerungen über die Bevölkerung aller derartigen Patienten (der allgemeinen Bevölkerung) zu ziehen . Die korrekte Definition von 95% di kann wie folgt formuliert werden: 95% der solchen Intervalle enthalten eine echte Größe in der Bevölkerung. Diese Interpretation ist etwas weniger genau: DI - der Wertebereich, in dem es möglich ist, 95% sicher zu sein, dass es eine echte Größe enthält. Bei der Verwendung von DI erfolgt der Schwerpunkt bei der Bestimmung des quantitativen Effekts, im Gegensatz zu dem Wert von P, der als Ergebnis der statistischen Prüfung erhalten wird. Die Menge von P bewertet keine Anzahl der Menge und eher ein Maß für die Zeugniskraft gegen die Nullhypothese "Noect". Der Wert des Pings selbst erzählt uns nichts über die Größe des Unterschieds, noch sogar seine Richtung. Daher sind unabhängige Werte von P absolut nicht informativ in Artikeln oder Abstracts. Im Gegensatz zu ihnen gibt Di die Anzahl der Effekte an, die Direktinteresse, beispielsweise für die Nützlichkeit der Behandlung, und für Beweise ist. Daher betrifft di direkt auf die Praxis von DM.

Der von DD veranschaulichte Bewertungsansatz zur statistischen Analyse ist darauf abzielen, die Anzahl der Auswirkungen von Interesse zu messen (Sensibilität des Diagnosetests, der Häufigkeit von projizierten Fällen, der Reduzierung des relativen Risikos in der Behandlung usw.) sowie die Messung der Unsicherheit in diesem Effekt. Meistens di - der Wertebereich auf beiden Seiten der Beurteilung, in der er wahrscheinlich echter Wert liegt und daraus um 95% zuversichtlich sein kann. Vereinbarung Verwenden Sie 95% wahrscheinlich willkürlich sowie die Menge an P<0,05 для оценки статистической значимости, и авторы иногда используют 90% или 99% ДИ. Заметим, что слово «интервал» означает диапазон величин и поэтому стоит в единственном числе. Две величины, которые ограничивают интервал, называются «доверительными пределами».

DI basiert auf der Idee, dass dieselbe Studie, die an anderen Patientenproben ausgeführt wird, nicht zu identischen Ergebnissen führen würde, sondern dass ihre Ergebnisse um den wahren, aber unbekannten Wert verteilt werden. Mit anderen Worten, DI beschreibt es als "Variabilität in Abhängigkeit von der Probe". DI spiegelt aufgrund von anderen Gründen nicht zusätzliche Unsicherheit wider; Insbesondere umfasst es nicht die Auswirkungen des selektiven Verlusts von Patienten beim Nachverfolgung, schlechte Komplette oder ungenaue Messung des Ergebnisses, das Mangel an "Blendung" usw. DI unterschätzt somit immer den Gesamtbetrag der Unsicherheit.

Berechnen des Konfidenzintervalls

Tabelle A1.1. Standardfehler und Vertrauensintervalle für einige klinische Dimensionen

Normalerweise wird dI aus der beobachteten Schätzung des quantitativen Indikators berechnet, beispielsweise der Differenz (D) zwischen den beiden Proportionen und dem Standardfehler (SE) bei der Bewertung dieser Differenz. Das auf diese Weise erhaltene 95% ige Di ist d ± 1,96 se. Die Formel variiert je nach Art des Maßes des Ergebnisses des Ergebnisses und der Abdeckung von DI. In einem randomisierten Placebo-kontrollierten Testen eines zellfreien Hustenimpfstoffs erhielt beispielsweise die Pertussis, die sich in 72 von 1670 (4,3%) in Säuglingen entwickelte, einen Impfstoff und in der Kontrollgruppe in 240 von 1665 (14,4%) in der Kontrollgruppe. Der Unterschied in Prozent, bekannt als die absolute Risikominderung, beträgt 10,1%. SE Diese Differenz beträgt 0,99%. Dementsprechend beträgt 95% di 10,1% + 1,96 x 0,99%, d. H. von 8.2 bis 12.0.

Trotz unterschiedlicher philosophischer Ansätze sind DI und Tests auf statistischer Signifikanz eng mit mathematisch verbunden.

Somit der Wert von p "sinnvoll", d. H. R.<0,05 соответствует 95% ДИ, который исключает величину эффекта, указывающую на отсутствие различия. Например, для различия между двумя средними пропорциями это ноль, а для относительного риска или отношения шансов - единица. При некоторых обстоятельствах эти два подхода могут быть не совсем эквивалентны. Преобладающая точка зрения: оценка с помощью ДИ - предпочтительный подход к суммированию результатов исследования, но ДИ и величина Р взаимодополняющи, и во многих статьях используются оба способа представления результатов.

Unsicherheit (Ungenauigkeit) Schätzungen, die in Di ausgedrückt werden, ist weitgehend auf Quadratwurzel aus der Probengröße zurückzuführen. Kleine Proben bieten weniger Informationen als groß und di, jeweils breiter in einer kleineren Probe. Beispielsweise berichtete ein Artikel, der die Eigenschaften von drei Tests vergleicht, die zur Diagnose der Helicobacter-Pylori-Infektion verwendet werden, die Sensitivität des Atemwegs mit dem Harnstoff 95,8% (95% di 75-100). Während die Anzahl von 95,8% beeindruckend aussieht, ist eine kleine Probe von 24 erwachsenen Patienten mit YA. Pylori bedeutet, dass in dieser Bewertung eine erhebliche Unsicherheit in dieser Bewertung gibt, wie die weiten Di-Shows. In der Tat beträgt die Untergrenze 75% viel niedriger als die Schätzung von 95,8%. Wenn in der Probe von 240 Personen dieselbe Sensibilität beobachtet wurde, wären 95% di 92.5-98.0, wann mehr Garantien garantiert, dass der Test sehr empfindlich ist.

In randomisierten kontrollierten Tests (RCI) sind unbedeutende Ergebnisse (dh solche, in denen P\u003e 0,05) anfällig für eine falsche Interpretation anfällt. Dee ist hier besonders nützlich, da er zeigt, wie kompatible Ergebnisse mit einem klinisch nützlichen Effekt ergeben. Beispielsweise hat sich in RCI mit dem Vergleichen der Auferlegung von Anastomose mit Naht und Clips an dem Dickdarm in 10,9% bzw. 13,5% der Patienten (P \u003d 0,30) verglichen. 95% di für diesen Unterschied beträgt 2,6% (von -2 bis +8). Selbst in dieser Studie, in der 652 Patienten enthalten waren, bleibt die Wahrscheinlichkeit, dass in der Häufigkeit von Infektionen, die sich aus diesen beiden Verfahren ergeben, einen moderaten Unterschied in der Häufigkeit von Infektionen bestehen. Je kleiner die Studie, desto mehr Unsicherheit. Sung et al. RCCS wurden durchgeführt, um eine OctReater-Infusion mit dringender Sklerotherapie bei akuten Blutungen von krampfartigen Venen pro 100 Patienten zu vergleichen. In der Octreotid-Gruppe betrug die Häufigkeit der Blutung 84%; In der Sklerotherapiegruppe - 90%, was p \u003d 0,56 gibt. Beachten Sie, dass die Indikatoren für fortgesetzte Blutungen denjenigen in der Wundinfektion in der genannten Studie ähneln. In diesem Fall beträgt jedoch 95% DI für Unterschiede in Interventionen 6% (von -7 bis +19). Dieses Intervall ist sehr breit im Vergleich zu 5% der Differenz, was ein klinisches Interesse darstellt. Es ist klar, dass das Studium einen erheblichen Effizienzunterschied nicht ausschließt. Daher ist der Abschluss der Autoren der "Octreotidinfusion und Sklerotherapie gleichermaßen in der Behandlung von Blutungen aus krampfartigen Venen gleichermaßen wirksam" definitiv unvorstellbar. In solchen Fällen, in denen, wie hier, 95% di zur absoluten Risikominderung (ASR; absolute Risikominderung - Arr, englisch) inklusive Null, DI für CHPLP (NNT-Nummer, die zur Behandlung, Englisch erforderlich ist, ist für die Interpretation ziemlich schwierig. CHPLP und sein Di werden von Werten, inversen ASRS erhalten (multiplizieren sie mit 100, wenn diese Mengen als Prozent angegeben sind). Hier erhalten wir CHPLP \u003d 100: 6 \u003d 16,6 mit 95% di von -14,3 bis 5,3. Wie aus der Fußnote "D" in Tabelle ersichtlich ist. A1.1, dieser DI umfasst CHPLP-Werte von 5.3 bis Unendlich und CHPLV von 14.3 bis Infinity.

Di kann für die meisten häufigsten statistischen Schätzungen oder Vergleiche gebaut werden. Für RKK umfasst es einen Unterschied zwischen durchschnittlichen Anteilen, relativen Risiken, Quoten und CHPLP-Beziehungen. In ähnlicher Weise kann Di für alle wichtigen Schätzungen in der Untersuchung der Genauigkeit von Diagnosetests ermittelt werden - Empfindlichkeit, Spezifität, prognostische Bedeutung eines positiven Ergebnisses (alle sind einfache Anteile) und die Haltung der Wahrscheinlichkeit - Ermittelte Schätzungen In Meta-Analyzas und Studien der Art des Vergleichstyps mit Steuerung. Computerprogramm für Personalcomputer, das viele dieser Methoden der Verwendung von DI abdeckt, ist mit der zweiten Ausgabe von Statistiken mit Vertrauen erhältlich. Makros zur Berechnung von DI für Proportionen sind kostenlos für Excel- und Statistikprogramme SPSS und Minitab unter http://www.uwcm.ac.uk/study/medicine/epidemiology_ Statistiken / Forschung / Statistiken / Proportionen, HTM.

Mehrere Bewertungen des Behandlungseffekts

Während des Gebäudes ist es für primäre Forschungsergebnisse wünschenswert, sind sie nicht für alle Ergebnisse erforderlich. DI betrifft klinisch wichtige Vergleiche. Zum Beispiel, wenn Sie zwei Gruppen vergleichen, ist, dass dI korrekt ist, der für die Differenz zwischen Gruppen aufgebaut ist, wie oben in den Beispielen gezeigt, und nicht dI, die in jeder Gruppe auswerten kann. Es ist nicht nur nutzlos, um in jeder Gruppe einzelne DI für Schätzungen zu geben, diese Ansicht kann irreführend sein. Auf dieselbe Weise ist der korrekte Ansatz beim Vergleich der Wirksamkeit der Behandlung in verschiedenen Untergruppen ein Vergleich von zwei (oder mehreren) Untergruppen direkt. Es ist falsch, anzunehmen, dass die Behandlung nur in einer Untergruppe wirksam ist, wenn sein Di den Wert beseitigt, der dem Fehlen des Effekts entspricht, und andere nicht. DI ist auch nützlich, wenn er die Ergebnisse in mehreren Untergruppen vergleicht. In FIG. Ein 1.1 zeigt das relative Risiko von Eklampsien bei Frauen mit Präeklampsie in Untergruppen von Frauen aus einem Placebo-kontrollierten RCC-Magnesiumsulfat.

Feige. A1.2. Waldgraph zeigt die Ergebnisse von 11 randomisierten klinischen Studien eines ROVINE-Rotavirus-Impfstoffs zur Verhinderung von Durchfall im Vergleich zu Placebo. Bei der Bewertung des relativen Durchfallrisikos wurden 95% des vertraulichen Intervalls verwendet. Die Größe des schwarzen Quadrats ist proportional zum Informationsvolumen. Darüber hinaus ist die Gesamtbewertung der Wirksamkeit der Behandlung und 95% des vertraulichen Intervalls dargestellt (die Raute ist angegeben). In der Metaanalyse verwendet das Modell der zufälligen Effekte einige vorinstallierte; Beispielsweise kann es die Größe sein, die beim Berechnen des Abtastwerts verwendet wird. In Übereinstimmung mit dem strengeren Kriterium sollte der gesamte Sortiment von Di zeigen, dass der Nutzen das vorinstallierte Minimum überschreitet.

Wir haben bereits einen Fehler diskutiert, wenn das Mangel an statistischer Bedeutung als Hinweis angenommen wird, dass zwei Behandlungsmethoden gleichermaßen wirksam sind. Es ist ebenso wichtig, statistische Signifikanz mit klinischer Bedeutung nicht auszugleichen. Klinische Bedeutung kann angenommen werden, wenn das Ergebnis statistisch signifikant ist, und der Wert der Bewertung der Wirksamkeit der Behandlung

Studien können zeigen, ob die Ergebnisse statistisch signifikant sind und welche von ihnen klinisch wichtig sind und welche - nein. In FIG. A1.2 zeigt die Ergebnisse von vier Tests, für die das gesamte DI<1, т.е. их результаты статистически значимы при Р <0,05 , . После высказанного предположения о том, что клинически важным различием было бы сокращение риска диареи на 20% (ОР = 0,8), все эти испытания показали клинически значимую оценку сокращения риска, и лишь в исследовании Treanor весь 95% ДИ меньше этой величины. Два других РКИ показали клинически важные результаты, которые не были статистически значимыми. Обратите внимание, что в трёх испытаниях точечные оценки эффективности лечения были почти идентичны, но ширина ДИ различалась (отражает размер выборки). Таким образом, по отдельности доказательная сила этих РКИ различна.

Vertrauensintervalle für Frequenzen und Aktien

© 2008.

Nationales Institut für öffentliche Gesundheit, Oslo, Norwegen

Der Artikel beschreibt und diskutiert die Berechnung von Vertrauensintervallen für Frequenzen und Anteile an Wald Methoden, Wilson, Klopper - Pearson, mit Hilfe einer Winkeltransformation und entsprechend der Wald-Methode mit der Korrektur der Aggregation - Colela. Das angegebene Material ergibt allgemeine Informationen zu den Methoden zur Berechnung von Vertrauensintervallen für Frequenzen und Anteil und soll das Interesse der Journalleser nicht nur dazu bringen, Vertrauensintervalle in der Darstellung der Ergebnisse ihrer eigenen Studien, sondern auch zum Lesen spezialisierter zu verwenden Literatur vor Beginn der Arbeit an zukünftigen Publikationen.

Stichworte: Vertrauensintervall, Häufigkeit, Anteil

In einem der vorherigen Publikationen wurde eine Beschreibung kurz eine Beschreibung hochwertiger Daten erwähnt, und es wurde berichtet, dass ihre Intervallschätzung vorzuziehen ist, um die Häufigkeit des Auftretens des untersuchten Charakteristiks in der allgemeinen Bevölkerung zu beschreiben. Da in der Tat, da Studien mit selektiven Daten durchgeführt werden, sollte die Projektion der Ergebnisse auf dem allgemeinen Satz ein Element der Ungenauigkeit der Probenbewertung enthalten. Das Vertrauensintervall ist ein Maß für die Genauigkeit des geschätzten Parameters. Interessanterweise wird in einigen Büchern über die Grundlagen der Statistiken für Ärzte das Thema Vertrauensintervalle für Frequenzen vollständig ignoriert. In diesem Artikel werden wir mehrere Wege zur Berechnung von Vertrauensintervallen für Frequenzen berücksichtigen, was solche Eigenschaften der Probe als Störung und Repräsentativität sowie Unabhängigkeit von Beobachtungen voneinander impliziert. Unter der Häufigkeit in diesem Artikel wird es nicht eine absolute Zahl verstanden, die zeigt, wie oft sie im Aggregat gefunden wird, und der relative Wert, der den Anteil der Teilnehmer an der Studie ermittelt, die ein untersuchtes Zeichen gefunden haben.

In biomedizinischen Studien werden 95% der vertraulichen Intervalle meistens verwendet. Dieses Vertrauensintervall ist ein Bereich, in dem der wahre Wert des Anteils von 95% der Fälle fällt. Mit anderen Worten, es ist möglich, mit 95% Zuverlässigkeit zu sagen, dass der wahre Wert des Auftretens des Anzeichens in der allgemeinen Bevölkerung innerhalb von 95% des vertraulichen Intervalls betragen wird.

In den meisten statistischen Vorteilen für Forscher aus der Medizin wird berichtet, dass der Frequenzfehler mit der Formel berechnet wird

wobei p die Häufigkeit des Auftretens des Zeichens in der Probe (der Wert von 0 bis 1) ist. In den meisten inländischen wissenschaftlichen Artikel ist der Wert des Auftretens des Anzeichens in der Probe (P) sowie deren Fehler (en) in Form von p ± s angezeigt. Zweckmäßiger ist jedoch ein 95% -Konfidenzintervall für die Häufigkeit des Anzeichens in der allgemeinen Bevölkerung, die Werte von enthalten

Vor.

In einigen Zertifikaten wird empfohlen, den Wert von 1,96 an kleinen Proben auf t für N-1-Freiheitsgrade zu ersetzen, wobei n die Anzahl der Beobachtungen in der Probe ist. Der Wert von t befindet sich auf Tabellen für die in fast allen Statistiken vorhandene T-Distribution. Die Verwendung der Verteilung t für die Waldmethode erteilt im Vergleich zu anderen unten diskutierten Methoden nicht sichtbare Vorteile, und daher sind einige Autoren nicht willkommen.

Das obige Verfahren zur Berechnung der Vertrauensintervalle für Frequenzen oder Fraktionen ist der Name des Walds zu Ehren von Abraham Walda (Abraham Wald, 1902-1950), da es 1939 nach der Veröffentlichung von Wald und Wolfovitsa weit verbreitet war. Das Verfahren selbst wurde jedoch 1812 von Pierre Simon Laplas (1749-1827) vorgeschlagen.

Wald Methode ist sehr beliebt, aber der Antrag ist mit erheblichen Problemen verbunden. Das Verfahren wird nicht für kleine Probenmengen empfohlen, sowie in Fällen, in denen die Zeichenfrequenz des Merkmals bis 0 oder 1 (0% oder 100%) neigt und einfach für Frequenzen 0 und 1. zusätzlich die Annäherung von Die Normalverteilung, die beim Berechnen des Fehlers verwendet wird, "funktioniert nicht in den Fällen, wenn n · p< 5 или n · (1 – p) < 5 . Более консервативные статистики считают, что n · p и n · (1 – p) должны быть не менее 10 . Более детальное рассмотрение метода Вальда показало, что полученные с его помощью доверительные интервалы в большинстве случаев слишком узки, то есть их применение ошибочно создает слишком оптимистичную картину, особенно при удалении частоты встречаемости признака от 0,5, или 50 % . К тому же при приближении частоты к 0 или 1 доверительный интревал может принимать отрицательные значения или превышать 1, что выглядит абсурдно для частот. Многие авторы совершенно справедливо не рекомендуют применять данный метод не только в уже упомянутых случаях, но и тогда, когда частота встречаемости признака менее 25 % или более 75 % . Таким образом, несмотря на простоту расчетов, метод Вальда может применяться лишь в очень ограниченном числе случаев. Зарубежные исследователи более категоричны в своих выводах и однозначно рекомендуют не применять этот метод для небольших выборок , а ведь именно с такими выборками часто приходится иметь дело исследователям-медикам.

Da die neue Variable eine normale Verteilung aufweist, sind die unteren und oberen Grenzen von 95% des Konfidenzintervalls für die Variable φ gleich φ - 1,96 und φ + 1,96LEFT "\u003e

Anstelle von 1,96 für kleine Proben wird empfohlen, den T-Wert für N-1-Freiheitsgrade zu ersetzen. Diese Methode ergibt keine negativen Werte und ermöglicht es Ihnen, die Konfidenzintervalle für Frequenzen genauer zu bewerten als die Wald-Methode. Darüber hinaus ist es in vielen inländischen Verzeichnissen für medizinische Statistiken beschrieben, die jedoch nicht zu seiner weit verbreiteten Verwendung in der medizinischen Forschung geführt hat. Die Berechnung von Vertrauensintervallen mit der Winkelumwandlung wird bei Frequenzen nicht empfohlen, die sich auf 0 oder 1 nähern.

Dies beschreibt die Methoden der Beurteilung von Vertrauensintervallen in den meisten Büchern auf den Grundlagen der Statistiken der Arztforscher endet normalerweise, und dieses Problem ist nicht nur für Inland, sondern auch für die Fremdliteratur charakteristisch. Beide Methoden basieren auf dem zentralen Grenzwertsatz, der das Vorhandensein einer großen Probe impliziert.

Unter Berücksichtigung der Nachteile der Beurteilung von Vertrauensintervallen mit den vorgenannten Methoden wurden 1934 Klopper (Clopper) und Pearson (Pearson) ein Verfahren zur Berechnung des sogenannten genau genannten Konfidenzintervalls angeboten, wobei die Binomialverteilung des untersuchten Zeichens berücksichtigt wurde. Diese Methode ist in vielen Online-Rechner verfügbar, aber die auf diese Weise erhaltenen Konfidenzintervalle sind in den meisten Fällen zu breit. Gleichzeitig wird dieses Verfahren empfohlen, in den Fällen angewendet zu werden, in denen eine konservative Schätzung erforderlich ist. Der Grad des Konservatismus des Verfahrens steigt zunimmt, wenn die Probengröße abnimmt, insbesondere mit n< 15 . описывает применение функции биномиального распределения для анализа качественных данных с использованием MS Excel, в том числе и для определения доверительных интервалов, однако расчет последних для частот в электронных таблицах не «затабулирован» в удобном для пользователя виде, а потому, вероятно, и не используется большинством исследователей.

Nach vielen Statistiken erfolgt die optimalste Bewertung der Vertrauensintervalle für die Häufigkeit von Wilson (Wilson), die 1927 vorgeschlagen wurde, jedoch praktisch nicht in inländischen Biomedizinischen Studien verwendet wird. Mit dieser Methode können Sie nicht nur die Konfidenzintervalle für sehr kleine und sehr große Frequenzen abschätzen, sondern auch für eine kleine Anzahl von Beobachtungen gelten. Im Allgemeinen hat das Vertrauensintervall nach Wilsons Formel den Blick von



wenn es den Wert von 1,96 bei der Berechnung von 95% des Konfidenzintervalls benötigt, ist n die Anzahl der Beobachtungen, und P ist die Häufigkeit des Auftretens des Merkmals in der Probe. Diese Methode ist in Online-Rechner verfügbar, sodass der Antrag nicht problematisch ist. und empfehlen Sie nicht mit dieser Methode bei N · P< 4 или n · (1 – p) < 4 по причине слишком грубого приближения распределения р к нормальному в такой ситуации, однако зарубежные статистики считают метод Уилсона применимым и для малых выборок .

Es wird angenommen, dass neben der Wilson-Methode die Waldmethode mit einer Korrektur der Aggregation - Colela auch eine optimale Bewertung des Konfidenzintervalls für Frequenzen bietet. Korrektur der Landwirtschaft - Colelu ist eine Substitution in der Waldformel der charakteristischen Frequenz des Anzeichens in der Probe (P) auf p`, wenn berechnet wird, wenn der Nenner zugesetzt wird, und 4 wird dem Nenner hinzugefügt, dh p` \u003d (x + 2) / (n + 4), wobei x die Anzahl der Teilnehmer an der Studie ist, die ein untersuchtes Merkmal aufweist, und n ist die Größe der Probe. Eine solche Modifikation führt zu Ergebnissen, sehr ähnlich der Verwendung der Verwendung der Formel Wilson, außer wenn die Ereignisfrequenz 0% oder 100% nähert, und die Probe ist klein. Zusätzlich zu den obigen Verfahren zur Berechnung der Vertrauensintervalle für Frequenzen wurden sowohl für die Wald-Methode als auch für die Wilson-Methode für kleine Proben korrigiert, jedoch haben Studien gezeigt, dass ihre Verwendung unangemessen ist.

Berücksichtigen Sie die Verwendung der oben beschriebenen Methoden zur Berechnung von Vertrauensintervallen auf zwei Beispielen. Im ersten Fall studieren wir eine große Probe, die aus 1.000 zufällig ausgewählten Forschungsanteilnehmern besteht, von denen 450 ein untersuchtes Zeichen aufweisen (es kann ein Risikofaktor, ein Ergebnis oder ein anderes Merkmal sein), das eine Frequenz von 0,45 oder 45 ist %. Im zweiten Fall erfolgt die Studie mit einer kleinen Probe, beispielsweise nur 20 Personen, und das studierte Zeichen ist nur ein Teilnehmer an der Studie (5%). Vertrauensintervalle gemäß der Wald-Methode, gemäß der Wald-Methode mit der Korrektur der Aggregation - Colel, gemäß der Wilson-Methode, wurde mit einem von Jeff Sauro entwickelten Online-Rechner berechnet (http: // www / wald. HTM). Konfidenzintervalle der Wilson-Methode mit Korrekturabdichter wurden mit dem von Wassar-Statistiken vorgeschlagenen Rechner berechnet: Website für statistische Berechnung (http: // Fakultät. Vassar. Edu / linkry / prop1.html). Berechnungen mit der Eckfisher-Transformation waren mit einem kritischen Wert T für 19 bzw. 999-Freiheitsgrade "manuell". Die Berechnungsergebnisse werden für beide Beispiele in der Tabelle dargestellt.

Vertrauensintervalle, die von sechs verschiedenen Wegen für zwei im Text beschriebene Beispiele berechnet werden

Die Methode zur Berechnung des Konfidenzintervalls

P \u003d 0,0500 oder 5%

95% di für x \u003d 450, n \u003d 1000, p \u003d 0,4500 oder 45%

–0,0455–0,2541

Wald mit Korrektur für Freizügigkeit - Colela

<,0001–0,2541

Wilson mit Kontinuitätskorrektur

"Genaue Methode" Klopper - Pearson

Ecktransformation

<0,0001–0,1967

Wie aus dem Tisch ersichtlich ist, wird das auf die "allgemein anerkannte Methode von Wald berechnete Vertrauensintervall für das erste Beispiel in den negativen Bereich eindringt, der nicht für Frequenzen sein kann. Leider sind solche Durchschnitte in der inländischen Literatur nicht ungewöhnlich. Die traditionelle Art, Daten in Form von Frequenz zu repräsentieren, und sein Fehler maskiert dieses Problem teilweise. Wenn beispielsweise die Häufigkeit des Auftretens des Merkmals (in Prozent) als 2,1 ± 1,4 dargestellt ist, dann wird dies nicht "das Auge", als 2,1% (95% DI: -0,7; 4,9), nicht "geschnitten" Und bezeichnet das gleiche. Die Waldmethode mit der Korrektur für Aggregat - Colel und der Berechnung mit der Winkeltransformation ergibt die untere Grenze, die auf Null strebt. Wilson-Methode mit Änderungsantrag für Kontinuität und "genaue Methode" ergibt breitere Intervalle als Wilson-Methode. Für das zweite Beispiel ergeben alle Methoden ungefähr die gleichen Konfidenzintervalle (Unterschiede erscheinen nur von Tausendstel), was nicht überraschend ist, da die Häufigkeit des Auftretens des Ereignisses in diesem Beispiel nicht sehr unterschiedlich von 50% ist und die Probengröße ist groß genug.

Für Leser, die an diesem Problem interessiert sind, ist es möglich, das Arbeiten von R. G. Newcombe und Braun, CAI und Dasgupta zu empfehlen, in denen die Vor- und Nachteile der Verwendung von 7 und 10 verschiedenen Methoden zur Berechnung von Vertrauensintervallen gegeben werden. Aus inländischen Vorteilen, einem Buch und, in dem neben einer detaillierten Beschreibung der Theorie die Methoden von Wald, Wilson, sowie ein Verfahren zur Berechnung von Konfidenzintervallen, unter Berücksichtigung der Binomialfrequenzverteilung präsentiert werden. Zusätzlich zu den kostenlosen Online-Rechner (http: // www. / Wald. HTM und HTTP: // Fakultät. Vassar. Edu / lowry / prop1.html) Vertrauensintervalle für Frequenzen (und nicht nur!) Sie können mit der CIA zählen Programm (Konfidenzintervalle-Analyse), das von http: // www heruntergeladen werden kann. Medizinschule. Soton. AC. UK / CIA /.

Im nächsten Artikel werden eindimensionale Arten des Vergleichs von Qualitätsdaten in Betracht gezogen.

Referenzliste

Banger A. Medizinische Statistiken sind verständlich: Einführungskurs / A. Banger. - M.: Praktische Medizin, 2007. - 287 p. Medizinische Statistik. - M.: Agentur für medizinische Information, 2007. - 475 p. Glanz S.Medizinische und biologische Statistiken / S. Glanz. - M.: Praxis, 1998. Datentypen, Verteilerprüfung und beschreibende Statistiken / / Humanökologie - 2008. - Nr. 1. - S. 52-58. Zhinzhin K. S.. Medizinische Statistik: Tutorial /. - Rostow N / D: Phoenix, 2007. - 160 p. Angewandte medizinische Statistiken / ,. - St. Petersburg. : Foliant, 2003. - 428 p. Lakin G. F.. Biometrie. - M.: Höhere Schule, 1990. - 350 s. Medik V. A.. Mathematische Statistiken in der Medizin / ,. - M.: Finanzen und Statistik, 2007. - 798 p. Mathematische Statistiken in klinischen Studien / ,. - M.: Gootar-Honey, 2001. - 256 p. Junkers B.. UND. Medizinische und statistische Verarbeitung von medizinischen Forschungsdaten / ,. - St. Petersburg. : Nameda, 2002. - 266 p. Agreti A. Annäherung ist besser als genau für die Intervallschätzung von binomialem Proportins / A. Agresti, B. Cull // Amerikanischer Statistiker. - 1998. - N 52. - S. 119-126. Altman D. Statistiken mit Vertrauen // D. Altman, D. Machin, T. Bryant, M. J. Gardner. - London: BMJ Bücher, 2000. - 240 p. Brown L. D. Intervallschätzung für einen Binomialanteil / L. D. Braun, T. T. Cai, A. Dasgupta // Statistische Wissenschaft. - 2001. - N 2. - S. 101-133. Clopper C. J. Die Verwendung von Vertrauen oder Treffergrenzen, dargestellt im Fall des Binomial / C. J. Clopper, E. S. Pearson // Biometrika. - 1934. - N 26. - S. 404-413. Garcia-Perez M. A. Auf dem Vertrauensintervall für den binomialen Parameter / M. A. Garcia-Perez // Qualität und Quantität. - 2005. - N 39. - S. 467-481. Motulsky H. Intuitive Biostatistik // H. motulsky. - Oxford: Oxford University Press, 1995. - 386 p. Newcombe R. G. Zweiseitige Konfidenzintervalle für den einzelnen Anteil: Vergleich von sieben Methoden / R. G. Newcombe // Statistiken in der Medizin. - 1998. - N. 17. - P. 857-872. Sauro J. Abschätzung der Fertigstellungsraten aus kleinen Smlen mit binomialer Konfidenzintervalle: Vergleiche und Empfehlungen / J. Sauro, J. R. Lewis // Verfahren der ordentlichen Treffen der menschlichen Faktoren und der Ergonomie-Gesellschaft. - Orlando, FL, 2005. Wald A. Vertrauensgrenzen für kontinuierliche Verteilungsfunktionen // A. Wald, J. Wolfovitz / / Annalen der mathematischen Statistiken. - 1939. - N 10. - S. 105-118. Wilson E. B.. Wahrscheinliche Inferenz, das Gesetz der Superation und des statistischen Inferenz / E. B. Wilson // Journal of American Statistical Association. - 1927. - N 22. - S. 209-212.

Vertrauensintervalle für Proportionen

EIN. M. GRJIBOVSKI.

Nationales Institut für öffentliche Gesundheit, Oslo, Norwegen

Der Artikel stellt mehrere Methoden für die Berechnungen von Vertrauensintervallen für Binomialkörpern, nämlich Wald, Wilson, Arcs-, Agresti-Cull und exakte Clopper-Pearson-Methoden vor. Das Papier gibt nur allgemeine Einführung in das Problem der Vertrauensintervallschätzung eines binomialen Anteils und dessen Ziel ist es nicht nur, die Leser nicht anzuregen, um Vertrauensintervalle zu nutzen, wenn er die Ergebnisse der eigenen empirischen Forschung, sondern auch dazu ermutigt, Statistikbücher vor zu ermutigen Analysierende eigene Daten und Vorbereitung von Manuskripten.

Schlüsselwörter.: Vertrauensintervall, Anteil

Kontaktinformationen:

senior Advisor dem National Institute of Public Health, Oslo, Norwegen