Die Formel zur Berechnung der Standardabweichung. Standardabweichung

Anweisungen

Seien mehrere Zahlen, die -oder homogene Größen charakterisieren. Zum Beispiel die Ergebnisse von Messungen, Wägungen, statistischen Beobachtungen usw. Alle dargestellten Größen müssen mit der gleichen Messung gemessen werden. Gehen Sie folgendermaßen vor, um die Standardabweichung zu ermitteln.

Bestimmen Sie das arithmetische Mittel aller Zahlen: Addieren Sie alle Zahlen und dividieren Sie die Summe durch die Gesamtzahl der Zahlen.

Bestimmen Sie die Varianz (Spreizung) der Zahlen: Addieren Sie die Quadrate der zuvor gefundenen Abweichungen und dividieren Sie die resultierende Summe durch die Anzahl der Zahlen.

Auf der Station befinden sich sieben Patienten mit einer Temperatur von 34, 35, 36, 37, 38, 39 und 40 Grad Celsius.

Es ist erforderlich, die durchschnittliche Abweichung vom Mittelwert zu bestimmen.
Lösung:
"Auf der Station": (34 + 35 + 36 + 37 + 38 + 39 + 40) / 7 = 37 ºС;

Temperaturabweichungen vom Durchschnitt (in diesem Fall der Normalwert): 34-37, 35-37, 36-37, 37-37, 38-37, 39-37, 40-37, es stellt sich heraus: -3, -2, -1 , 0, 1, 2, 3 (ºС);

Dividiere die erhaltene frühe Summe der Zahlen durch ihre Zahl. Für die Genauigkeit der Berechnung ist es besser, einen Taschenrechner zu verwenden. Das Ergebnis der Division ist das arithmetische Mittel der Summanden von Zahlen.

Achten Sie auf alle Stufen der Berechnung, da ein Fehler in mindestens einer der Berechnungen zu einem falschen Endindikator führt. Überprüfen Sie die erhaltenen Berechnungen in jeder Phase. Das arithmetische Mittel hat das gleiche Maß wie die Additionen der Zahl, dh wenn Sie die durchschnittliche Anwesenheit bestimmen, werden alle Indikatoren, die Sie haben, "Personen" sein.

Diese Berechnungsmethode wird nur in mathematisch-statistischen Berechnungen verwendet. So hat beispielsweise das arithmetische Mittel in der Informatik einen anderen Berechnungsalgorithmus. Das arithmetische Mittel ist ein sehr willkürlicher Indikator. Es zeigt die Wahrscheinlichkeit eines bestimmten Ereignisses an, sofern es nur einen Faktor oder Indikator hat. Für die gründlichste Analyse müssen viele Faktoren berücksichtigt werden. Dazu wird die Berechnung von allgemeineren Werten verwendet.

Das arithmetische Mittel ist eines der Maße des zentralen Trends, das in Mathematik und statistischen Berechnungen weit verbreitet ist. Es ist sehr einfach, das arithmetische Mittel für mehrere Werte zu finden, aber jede Aufgabe hat ihre eigenen Nuancen, die man einfach kennen muss, um korrekte Berechnungen durchzuführen.

Quantitative Ergebnisse ähnlicher Experimente.

So finden Sie das arithmetische Mittel

Das Ermitteln des arithmetischen Mittels für ein Array von Zahlen sollte mit der Bestimmung der algebraischen Summe dieser Werte beginnen. Wenn das Array beispielsweise die Zahlen 23, 43, 10, 74 und 34 enthält, ist ihre algebraische Summe 184. Beim Schreiben wird das arithmetische Mittel durch den Buchstaben μ (mu) oder x (x mit einem Balken) bezeichnet. Als nächstes sollte die algebraische Summe durch die Anzahl der Zahlen im Array geteilt werden. In diesem Beispiel gab es fünf Zahlen, sodass das arithmetische Mittel 184/5 und 36,8 beträgt.

Funktionen beim Arbeiten mit negativen Zahlen

Wenn das Array negative Zahlen enthält, wird das arithmetische Mittel mit einem ähnlichen Algorithmus ermittelt. Der Unterschied besteht nur beim Rechnen in der Programmierumgebung oder wenn zusätzliche Bedingungen im Problem vorhanden sind. In diesen Fällen reduziert sich die Ermittlung des arithmetischen Mittels von Zahlen mit unterschiedlichen Vorzeichen auf drei Schritte:

1. Ermitteln des gesamten arithmetischen Mittels nach der Standardmethode;
2. Ermitteln des arithmetischen Mittels negativer Zahlen.
3. Berechnung des arithmetischen Mittels positiver Zahlen.

Die Antworten auf jede der Aktionen werden durch Kommas getrennt geschrieben.

Natürliche und dezimale Brüche

Wenn das Zahlenfeld durch Dezimalbrüche dargestellt wird, erfolgt die Lösung nach der Methode der Berechnung des arithmetischen Mittels ganzer Zahlen, das Ergebnis wird jedoch entsprechend den Anforderungen des Problems an die Genauigkeit der Antwort reduziert.

Bei der Arbeit mit natürlichen Brüchen sollten diese auf einen gemeinsamen Nenner reduziert werden, der mit der Anzahl der Zahlen im Array multipliziert wird. Der Zähler der Antwort ist die Summe der angegebenen Zähler der ursprünglichen Bruchelemente.

Root-Mean-Square-Abweichung(Synonyme: quadratische Abweichung, quadratische Abweichung, quadratische Abweichung; verwandte Begriffe: Standardabweichung, Standardaufstrich) - in der Wahrscheinlichkeitstheorie und Statistik der häufigste Indikator für die Streuung der Werte einer Zufallsvariablen im Verhältnis zu ihrer mathematischen Erwartung. Bei begrenzten Arrays von Stichproben von Werten wird anstelle der mathematischen Erwartung das arithmetische Mittel der Grundgesamtheit von Stichproben verwendet.

College-YouTube

1 / 5

Die Standardabweichung wird in den Einheiten der Zufallsvariablen selbst gemessen und zur Berechnung des Standardfehlers des arithmetischen Mittels verwendet, bei der Konstruktion von Konfidenzintervallen, beim statistischen Testen von Hypothesen, bei der Messung der linearen Beziehung zwischen Zufallsvariablen. Sie wird als Quadratwurzel der Varianz einer Zufallsvariablen definiert.

Standardabweichung:

s = n n - 1 2 = 1 n - 1 i = 1 n (xi - x ¯) 2; (\ displaystyle s = (\ sqrt ((\ frac (n) (n-1)) \ sigma ^ (2))) = (\ sqrt ((\ frac (1) (n-1)) \ sum _ ( i = 1) ^ (n) \ links (x_ (i) - (\ bar (x)) \ rechts) ^ (2)));)

Hinweis: Sehr oft weichen die Namen von RMSD (Standard Deviation) und SRT (Standard Deviation) mit ihren Formeln ab. Im Python-Modul numPy wird die Funktion std() beispielsweise als "Standardabweichung" bezeichnet, während die Formel die Standardabweichung (Division durch die Wurzel der Stichprobe) widerspiegelt. In Excel unterscheidet sich die Funktion STDEV() (Division durch die Wurzel von n-1).

Standardabweichung(Schätzung der Standardabweichung einer Zufallsvariablen x relativ zu seiner mathematischen Erwartung basierend auf einer unverzerrten Schätzung seiner Varianz) s (\ Anzeigestil s):

= 1 n ∑ i = 1 n (x i - x ¯) 2. (\ displaystyle \ sigma = (\ sqrt ((\ frac (1) (n)) \ sum _ (i = 1) ^ (n) \ left (x_ (i) - (\ bar (x)) \ right) ^ (2))).)

wo σ 2 (\ displaystyle \ sigma ^ (2))- Abweichung; x i (\ Anzeigestil x_ (i)) - ich Element der Probe; n (\ Anzeigestil n)- Stichprobengröße; - arithmetisches Mittel der Stichprobe:

x = 1 n ∑ i = 1 n x i = 1 n (x 1 +… + x n). (\ displaystyle (\ bar (x)) = (\ frac (1) (n)) \ sum _ (i = 1) ^ (n) x_ (i) = (\ frac (1) (n)) (x_ (1) + \ ldots + x_ (n)).)

Zu beachten ist, dass beide Schätzungen verzerrt sind. Im allgemeinen Fall ist es unmöglich, eine unverzerrte Schätzung zu erstellen. Die auf der Schätzung der unverzerrten Varianz basierende Schätzung ist jedoch konsistent.

Gemäß GOST R 8.736-2011 wird die Standardabweichung nach der zweiten Formel dieses Abschnitts berechnet. Bitte überprüfen Sie die Ergebnisse.

Die Drei-Sigma-Regel

Die Drei-Sigma-Regel (3 σ (\ displaystyle 3 \ sigma)) - fast alle Werte einer normalverteilten Zufallsvariablen liegen im Intervall (x ¯ - 3 σ; x ¯ + 3 σ) (\ displaystyle \ left ((\ bar (x)) - 3 \ sigma; (\ bar (x)) + 3 \ sigma \ right))... Genauer - mit ungefähr einer Wahrscheinlichkeit von 0,9973 liegt der Wert der normalverteilten Zufallsvariablen im angegebenen Intervall (vorausgesetzt der Wert x ¯ (\ displaystyle (\ bar (x))) wahr, nicht abgetastet).

Wenn der wahre Wert x ¯ (\ displaystyle (\ bar (x))) unbekannt, dann sollten Sie nicht verwenden σ (\ displaystyle \ sigma), ein S... Somit wird die Drei-Sigma-Regel in eine Drei-Regel umgewandelt S .

Interpretieren des Wertes der Standardabweichung

Ein größerer Wert der Standardabweichung zeigt eine größere Streuung der Werte im präsentierten Set mit dem Durchschnittswert des Sets; ein niedrigerer Wert zeigt an, dass die Werte im Satz um den Mittelwert gruppiert sind.

Zum Beispiel haben wir drei Zahlenmengen: (0, 0, 14, 14), (0, 6, 8, 14) und (6, 6, 8, 8). Für alle drei Sätze sind die Mittelwerte 7, und die Standardabweichungen sind 7, 5 bzw. 1. Der letzte Satz hat eine kleine Standardabweichung, da die Werte im Satz um den Mittelwert gruppiert sind; der erste Satz hat die größte Standardabweichung - die Werte innerhalb des Satzes weichen stark vom Mittelwert ab.

Im Allgemeinen kann die Standardabweichung als ein Maß für die Unsicherheit angesehen werden. In der Physik wird die Standardabweichung beispielsweise verwendet, um den Fehler einer Reihe aufeinanderfolgender Messungen einer Größe zu bestimmen. Dieser Wert ist sehr wichtig, um die Wahrscheinlichkeit des untersuchten Phänomens im Vergleich zum prognostizierten Wert der Theorie zu bestimmen: Wenn der Durchschnittswert der Messungen stark von den prognostizierten Werten der Theorie abweicht (großer Wert der Standardabweichung), dann sollten die erhaltenen Werte oder die Methode, sie zu erhalten, erneut überprüft werden. mit Portfoliorisiko identifiziert.

Klima

Angenommen, es gibt zwei Städte mit den gleichen durchschnittlichen Tageshöchsttemperaturen, aber eine liegt an der Küste und die andere in der Ebene. Küstenstädte sind dafür bekannt, dass sie viele verschiedene maximale Tagestemperaturen haben, die niedriger sind als in Binnenstädten. Daher wird die Standardabweichung der maximalen Tagestemperaturen in der Nähe der Küstenstadt geringer sein als die der zweiten Stadt, obwohl sie den gleichen Durchschnittswert dieses Wertes haben, was in der Praxis bedeutet, dass die Wahrscheinlichkeit, dass die maximale Lufttemperatur von jeder spezifische Tag des Jahres wird stärker vom Durchschnitt abweichen, höher für eine Stadt im Inneren des Kontinents.

Sport

Angenommen, es gibt mehrere Fußballmannschaften, die nach bestimmten Parametern bewertet werden, z. B. Anzahl der erzielten und kassierten Tore, Torchancen usw. Die beste Mannschaft in dieser Gruppe hat am ehesten die besten Werte in mehr Parametern. Je weniger das Team eine Standardabweichung für jeden der vorgestellten Parameter hat, desto vorhersehbarer ist das Ergebnis des Teams, solche Teams sind ausgewogen. Andererseits ist es bei einer Mannschaft mit einer großen Standardabweichung schwierig, das Ergebnis vorherzusagen, was wiederum auf Ungleichgewichte zurückzuführen ist, zum Beispiel starke Verteidigung, aber schwacher Angriff.

Die Verwendung der Standardabweichung der Teamparameter ermöglicht es in gewisser Weise, das Ergebnis eines Spiels zwischen zwei Teams vorherzusagen, indem die Stärken und Schwächen der Teams und damit die gewählten Kampfmethoden bewertet werden.

Aus Wikipedia, der freien Enzyklopädie

Grundinformation

Die Standardabweichung wird in Maßeinheiten der Zufallsvariablen selbst gemessen und dient zur Berechnung des Standardfehlers des arithmetischen Mittels, bei der Konstruktion von Konfidenzintervallen, beim statistischen Testen von Hypothesen, bei der Messung der linearen Beziehung zwischen Zufallsvariablen. Sie wird als Quadratwurzel der Varianz einer Zufallsvariablen definiert.

Standardabweichung:

$\ sigma = \ sqrt (\ frac (1) (n) \ sum_ (i = 1) ^ n \ left (x_i- \ bar (x) \ right) ^ 2).$

Standardabweichung(Schätzung der Standardabweichung einer Zufallsvariablen x relativ zu seiner mathematischen Erwartung basierend auf einer unverzerrten Schätzung seiner Varianz) $S$ :

$s = \ sqrt (\ frac (n) (n-1) \ sigma ^ 2) = \ sqrt (\ frac (1) (n-1) \ sum_ (i = 1) ^ n \ left (x_i- \ bar (x) \ rechts) ^ 2);$

Die Drei-Sigma-Regel

Die Drei-Sigma-Regel ( $3 \ sigma$ ) - fast alle Werte einer normalverteilten Zufallsvariablen liegen im Intervall $\ links (\ bar (x) -3 \ sigma; \ bar (x) +3 \ sigma \ rechts)$ ... Genauer - mit ungefähr einer Wahrscheinlichkeit von 0,9973 liegt der Wert der normalverteilten Zufallsvariablen innerhalb des angegebenen Intervalls (vorausgesetzt, der Wert $\ bar (x)$ wahr, nicht abgetastet).

Wenn der wahre Wert $\ bar (x)$ unbekannt, dann sollten Sie nicht verwenden $\ sigma$ , ein S... Somit wird die Drei-Sigma-Regel in eine Drei-Regel umgewandelt S .

Interpretieren des Wertes der Standardabweichung

Praktischer Nutzen

In der Praxis können Sie mit der Standardabweichung abschätzen, um wie viel Werte aus einem Satz vom Mittelwert abweichen können.

Wirtschaft und Finanzen

Standardabweichung der Portfoliorendite $\ sigma = \ sqrt (D [X])$ mit Portfoliorisiko identifiziert.

Klima

Sport

siehe auch

Schreiben Sie eine Rezension zum Artikel "Standardabweichung"

Literatur

Borowikow V. STATISTIK. Die Kunst der Datenanalyse am Computer: Für Profis / V. Borovikov. - SPb. : Peter, 2003 .-- 688 S. - ISBN 5-272-00078-1..

Statistische Indikatoren

Beschreibend
Statistiken

Statistisch
Fazit und
Untersuchung
Hypothesen







Gesamtpunktzahl

Korrelation und
Rückschritt

Grafik
Methoden

Ein Auszug zur Charakterisierung der Standardabweichung

Und er öffnete schnell die Tür und trat mit entschlossenen Schritten auf den Balkon. Das Gespräch verstummte plötzlich, Hüte und Mützen wurden abgenommen, und alle Augen richteten sich auf den Grafen, der herausgekommen war.
- Hallo Leute! - sagte der Graf schnell und laut. - Danke fürs Kommen. Ich gehe jetzt zu dir, aber zuerst müssen wir uns mit dem Bösewicht befassen. Wir müssen den Bösewicht bestrafen, der Moskau getötet hat. Warte auf mich! - Und ebenso schnell kehrte der Graf in seine Gemächer zurück und schlug die Tür fest zu.
Ein anerkennendes Gemurmel des Vergnügens ging durch die Menge. „Es bedeutet, dass die Schurken von den Useh regiert werden! Und du sagst französisch ... er wird dich die ganze Strecke losbinden!“ - sagten die Leute, als ob sie sich gegenseitig ihren Mangel an Glauben vorwarfen.
Ein paar Minuten später eilte ein Offizier aus der Haustür, befahl etwas, und die Dragoner streckten sich aus. Die Menge bewegte sich eifrig vom Balkon auf die Veranda. Rostopchin trat mit wütenden schnellen Schritten auf die Veranda und sah sich hastig um, als suche er nach jemandem.
- Wo ist er? - sagte der Graf, und im selben Augenblick, als er dies sagte, sah er um die Ecke des Hauses einen jungen Mann mit langem, dünnem Hals, mit halbrasiertem und zugewachsenem Kopf zwischen zwei Dragonern auftauchen. Dieser junge Mann trug einen einstigen Dandy, bedeckt mit einem blauen Tuch, einen schäbigen Fuchs-Lammfellmantel und eine schmutzige Nachtgefangenenhose, die in schmutzige, abgenutzte dünne Stiefel gesteckt war. An seinen dünnen, schwachen Beinen hingen schwere Fesseln, die es dem jungen Mann schwer machten, unentschlossen zu gehen.
- EIN! - sagte Rostopchin, wandte hastig den Blick von dem jungen Mann im Fuchspelzmantel ab und zeigte auf die untere Stufe der Veranda. - Stell es hierhin! - Der mit Fesseln klirrende junge Mann trat schwerfällig auf die angedeutete Stufe, hielt sich mit dem Finger am Kragen seines Schaffellmantels fest, drehte seinen langen Hals zweimal und faltete seufzend die dünnen, nicht arbeitenden Hände vor dem Bauch mit eine unterwürfige Geste.
Während sich der junge Mann auf der Stufe niederließ, herrschte für einige Sekunden Stille. Nur in den hinteren Reihen der Menschen, die sich an eine Stelle quetschten, war das Ächzen, Ächzen, Ruckeln und Klappern der neu arrangierten Beine zu hören.
Rostopchin erwartete, dass er an der angegebenen Stelle anhalten würde, und rieb sich stirnrunzelnd mit der Hand das Gesicht.
- Leute! - sagte Rostopchin mit metallischer Stimme, - dieser Mann, Wereschtschagin, ist derselbe Schurke, der Moskau getötet hat.
Ein junger Mann in einem Fuchs-Lammfellmantel stand unterwürfig da, die Hände vor dem Bauch gefaltet und leicht vorgebeugt. Sein abgemagertes junges Gesicht mit hoffnungslosem Ausdruck, entstellt von seinem rasierten Kopf, war gesenkt. Bei den ersten Worten des Grafen hob er langsam den Kopf und sah auf den Grafen hinab, als wollte er ihm etwas sagen oder zumindest seinem Blick begegnen. Aber Rostopchin sah ihn nicht an. Der lange, dünne Hals des jungen Mannes spannte sich wie ein Seil und wurde hinter dem Ohr blau, und plötzlich wurde sein Gesicht rot.
Alle Augen waren auf ihn gerichtet. Er schaute auf die Menge, und wie durch den Ausdruck, den er in den Gesichtern der Menschen las, beruhigt, lächelte er traurig und schüchtern und korrigierte sich, den Kopf wieder gesenkt, mit den Füßen auf der Stufe.
„Er hat seinen Zaren und sein Vaterland verraten, er ist an Bonaparte übergegangen, er war einer von allen Russen, die den Namen des Russen blamierten, und Moskau geht an ihm zugrunde“, sagte Rostopchin mit gleichmäßiger, rauer Stimme; aber plötzlich blickte er schnell auf Wereschtschagin herab, der weiterhin in derselben unterwürfigen Haltung stand. Als ob dieser Blick ihn in die Luft jagen würde, hob er die Hand und schrie fast, an die Leute gerichtet: - Nach deinem eigenen Ermessen, kümmere dich um ihn! Ich gebe es dir!
Die Leute schwiegen und drückten sich nur immer enger aneinander. Sich aneinander halten, diese angesteckte Muffe einatmen, keine Kraft mehr haben, sich zu bewegen und auf etwas Unbekanntes, Unverständliches und Schreckliches zu warten, wurde unerträglich. Die Leute, die in den ersten Reihen standen und alles sahen und hörten, was sich vor ihnen abspielte, alle mit erschrocken großen Augen und aufgerissenen Mündern, mit aller Kraft, hielten den Druck des Hecks auf dem Rücken.
- Schlagen Sie ihn! .. Lassen Sie den Verräter umkommen und den Namen des Russen nicht blamieren! - rief Rostopchin. - Schneide es! Ich bestelle! - Die Menge hörte keine Worte, sondern die wütenden Töne von Rostopchins Stimme, stöhnte und rückte vor, blieb aber wieder stehen.
- Graf! .. - sagte Wereschtschagins schüchterne und zugleich theatralische Stimme inmitten der momentanen Stille wieder. - Graf, ein Gott über uns ... - sagte Wereschtschagin und hob den Kopf, und wieder war die dicke Ader an seinem dünnen Hals mit Blut gefüllt, und die Farbe trat schnell aus und floh aus seinem Gesicht. Er beendete nicht, was er sagen wollte.
- Schneide es! Ich bestelle! .. - Rostopchin schrie und wurde plötzlich so blass wie Wereschtschagin.
- Säbel raus! Der Offizier rief den Dragonern zu und holte selbst seinen Säbel hervor.
Eine weitere, noch stärkste Welle schoss durch die Leute, und als sie die ersten Reihen erreicht hatte, bewegte diese Welle die vorderen, schwankend, bis zu den Stufen der Veranda. Neben Wereschtschagin stand ein hochgewachsener Bursche mit versteinertem Gesichtsausdruck und mit angehaltener erhobener Hand.
- Schneide es! Fast flüsterte der Offizier den Dragonern zu, und plötzlich schlug einer der Soldaten mit verzerrtem, boshaftem Gesicht Wereschtschagin mit einem stumpfen Schwert auf den Kopf.
"EIN!" - Wereschtschagin schrie kurz und überrascht auf, sah sich erschrocken um und verstand nicht, warum ihm das angetan wurde. Das gleiche Stöhnen der Überraschung und des Entsetzens ging durch die Menge.
"Oh mein Gott!" - jemandes trauriger Ausruf war zu hören.
Aber nach dem Ausruf der Überraschung, der Wereschtschagin entkam, schrie er kläglich vor Schmerzen auf, und dieser Schrei ruinierte ihn. Die bis zum höchsten Grade gespannte Barriere des menschlichen Gefühls, die noch immer die Menge hielt, durchbrach augenblicklich. Das Verbrechen war begonnen, es war notwendig, es zu vollenden. Das beklagenswerte Stöhnen des Vorwurfs wurde von dem drohenden und wütenden Gebrüll der Menge übertönt. Wie die letzte siebte Welle, die Schiffe zerschmetterte, schoss diese letzte unkontrollierbare Welle aus den hinteren Reihen empor, erreichte die Front, warf sie nieder und verschluckte alles. Der streikende Dragoner wollte seinen Schlag wiederholen. Wereschtschagin stürzte mit einem Schreckensschrei, sich mit den Händen schützend, auf das Volk zu. Der große Kerl, über den er stolperte, packte seine Hände in Wereschtschagins dünnen Hals und fiel mit einem wilden Schrei mit ihm unter die Füße der brüllenden Leute, die hämmerten.
Einige schlugen und zerrten an Wereschtschagin, andere den großen Kerl. Und die Schreie der Zerdrückten und derer, die versuchten, den Großen zu retten, erregten nur die Wut der Menge. Lange konnten die Dragoner den blutigen, halb geschlagenen Fabrikarbeiter nicht befreien. Und trotz aller fieberhaften Eile, mit der die Menge versuchte, das einst begonnene Geschäft zu vollenden, konnten die Leute, die Wereschtschagin schlugen, erwürgten und rissen, ihn lange Zeit nicht töten; aber die Menge drückte sie von allen Seiten, mit ihnen in der Mitte, wie eine Masse, schwankte von einer Seite zur anderen und gab ihnen keine Gelegenheit, ihn entweder zu erledigen oder zu werfen.

Standardabweichung

Das vollkommenste Merkmal der Variation ist die Standardabweichung, wird als Standard (oder Standardabweichung) bezeichnet. Standardabweichung() ist gleich der Quadratwurzel des mittleren Quadrats der Abweichungen der einzelnen Werte des Merkmals vom arithmetischen Mittel:

Die Standardabweichung ist einfach:

Für gruppierte Daten wird die gewichtete Standardabweichung verwendet:

Zwischen den Standard- und Linearabweichungen unter Normalverteilungsbedingungen ergibt sich folgender Zusammenhang: ~ 1,25.

Die Standardabweichung, die das wichtigste absolute Maß für die Variation ist, wird verwendet, um die Werte der Ordinaten der Normalverteilungskurve zu bestimmen, bei Berechnungen zur Organisation der Probenbeobachtung und zur Bestimmung der Genauigkeit der Probenmerkmale sowie bei der Bewertung der Grenzen der Variation eines Merkmals in einer homogenen Population.

18. Dispersion, ihre Typen, Standardabweichung.

Streuung einer Zufallsvariablen- ein Maß für die Streuung einer gegebenen Zufallsvariablen, d. h. ihre Abweichung von der mathematischen Erwartung. In der Statistik wird häufig die Bezeichnung oder verwendet. Die Quadratwurzel der Varianz heißt normalerweise quadratische Abweichung, Standardabweichung oder Standardstreuung.

Gesamtabweichung (2) misst die Variation eines Merkmals in der gesamten Population unter dem Einfluss aller Faktoren, die diese Variation verursacht haben. Gleichzeitig ist es dank der Gruppierungsmethode möglich, die Variation aufgrund des Gruppierungsmerkmals und die Variation, die unter dem Einfluss nicht berücksichtigter Faktoren entsteht, zu isolieren und zu messen.

Varianz zwischen Gruppen (σ 2 mg) charakterisiert systematische Variation, d. h. Unterschiede im Wert des untersuchten Merkmals, die unter dem Einfluss eines Merkmals entstehen - ein Faktor, der der Gruppierung zugrunde liegt.

Die Standardabweichung wird in den Einheiten der Zufallsvariablen selbst gemessen und dient zur Berechnung des Standardfehlers des arithmetischen Mittels, bei der Konstruktion von Konfidenzintervallen, beim statistischen Testen von Hypothesen und bei der Messung der linearen Beziehung zwischen Zufallsvariablen. Definiert als Quadratwurzel der Varianz der Zufallsvariablen.

Standardabweichung:

Standardabweichung(Schätzung der Standardabweichung einer Zufallsvariablen x relativ zu seiner mathematischen Erwartung basierend auf einer unverzerrten Schätzung seiner Varianz):

wo ist die Varianz; - ich Element der Probe; - Stichprobengröße; - arithmetisches Mittel der Stichprobe:

Zu beachten ist, dass beide Schätzungen verzerrt sind. Im allgemeinen Fall ist es unmöglich, eine unverzerrte Schätzung zu erstellen. Darüber hinaus ist die auf der Schätzung der unverzerrten Varianz basierende Schätzung konsistent.

19. Wesen, Umfang und Verfahren zur Bestimmung der Mode und des Medians.

Für die relativen Charakteristiken der Größe des variierenden Merkmals und der inneren Struktur der Verteilungsreihen werden neben Potenzgesetz-Mitteln in der Statistik auch Strukturmittelwerte verwendet, die hauptsächlich durch Mode und Median.

Mode- Dies ist die häufigste Variante der Reihe. Mode wird beispielsweise bei der Bestimmung der Größe von Kleidung und Schuhen verwendet, die bei den Kunden am meisten nachgefragt werden. Der Modus für die diskrete Serie ist die Option mit der höchsten Frequenz. Bei der Berechnung des Modus für eine Intervallvariationsserie ist es äußerst wichtig, zuerst das Modalintervall (entsprechend der maximalen Frequenz) und dann den Wert des Modalwerts des Merkmals gemäß der Formel zu bestimmen:

§ - die Bedeutung von Mode

§ - die untere Grenze des Modalintervalls

§ - der Wert des Intervalls

§ - die Häufigkeit des Modalintervalls

§ - Häufigkeit des Intervalls vor dem Modal

§ ist die Häufigkeit des Intervalls nach dem Modal

Median - dies ist der Wert des Merkmals, ĸᴏᴛᴏᴩᴏᴇ liegt in der Basis der Rangfolge und teilt die gegebene Reihe in zwei gleich große Teile.

Um den Median zu bestimmen in einer diskreten Reihe bei Vorhandensein von Frequenzen wird zuerst die Halbsumme der Frequenzen berechnet und dann bestimmt, welcher Wert der Variante darauf fällt. (Wenn die sortierte Reihe eine ungerade Anzahl von Merkmalen enthält, wird der Median nach folgender Formel berechnet:

M e = (n (Anzahl der Merkmale im Aggregat) + 1) / 2,

bei einer geraden Anzahl von Merkmalen entspricht der Median dem Durchschnitt der beiden Merkmale in der Mitte der Zeile).

Bei der Berechnung des Medians für Intervallvariationsserien Zuerst wird das Medianintervall bestimmt, innerhalb dessen sich der Median befindet, und dann wird der Medianwert durch die Formel bestimmt:

§ - der erforderliche Median

§ - die untere Grenze des Intervalls, das den Median enthält

§ - der Wert des Intervalls

§ - die Summe der Häufigkeiten oder die Anzahl der Mitglieder der Serie

§ - die Summe der akkumulierten Häufigkeiten der Intervalle vor dem Median

§ - Häufigkeit des Medianintervalls

Beispiel... Finden Sie Mode und Median.

Lösung: In diesem Beispiel liegt das modale Intervall innerhalb der Altersgruppe 25-30, da dieses Intervall die höchste Häufigkeit aufweist (1054).

Berechnen wir die Größe des Modus:

Das bedeutet, dass das modale Alter der Studierenden 27 Jahre beträgt.

Berechnen wir den Median. Das Medianintervall liegt in der Altersgruppe 25-30 Jahre, da es innerhalb dieses Intervalls eine Variante gibt, die die Bevölkerung in zwei gleiche Teile teilt (Σf i / 2 = 3462/2 = 1731). Als nächstes setzen wir die notwendigen numerischen Daten in die Formel ein und erhalten den Medianwert:

Das bedeutet, dass die eine Hälfte der Studierenden jünger als 27,4 Jahre und die andere über 27,4 Jahre alt ist.

Neben der Mode und dem Median werden solche Indikatoren als Quartile verwendet, die eine Rangreihe in 4 gleiche Teile teilen, Dezile -10 Teile und Perzentile - in 100 Teile.

20. Der Begriff der selektiven Beobachtung und sein Anwendungsbereich.

Selektive Beobachtung gilt, wenn die Anwendung der kontinuierlichen Überwachung physikalisch unmöglich aufgrund einer großen Datenmenge, oder wirtschaftlich unpraktisch... Physische Unmöglichkeit tritt beispielsweise bei der Untersuchung des Personenverkehrs, der Marktpreise, des Familienbudgets auf. Wirtschaftliche Unzweckmäßigkeit tritt auf, wenn die Qualität von Waren im Zusammenhang mit ihrer Zerstörung bewertet wird, z. B. Verkostung, Festigkeitsprüfung von Ziegeln usw.

Die für die Beobachtung ausgewählten statistischen Einheiten sind Stichprobenpopulation oder Probenahme, und ihr gesamtes Array ist Durchschnittsbevölkerung(HS). Dabei Anzahl der Einheiten in der Probe bezeichnen n, und im ganzen HS - n... Attitüde n / N es ist üblich anzurufen relative Größe oder Beispielrate.

Die Qualität der Ergebnisse der selektiven Beobachtung hängt ab von Repräsentativität der Stichprobe, das heißt, wie repräsentativ es im HS ist. Um sicherzustellen, dass die Stichprobe repräsentativ ist, ist es zwingend erforderlich, dass zufällige Auswahl der Einheiten, die davon ausgeht, dass die Einbeziehung einer HS-Einheit in die Stichprobe durch keinen anderen Faktor als den Fall beeinflusst werden kann.

Existiert 4 Möglichkeiten zur zufälligen Auswahl zum Muster:

Eigentlich zufällig Auswahl oder "Lotto-Methode", bei der statistischen Mengen Seriennummern zugewiesen werden, die auf bestimmten Artikeln (zB Fässern) eingetragen werden, die dann in einem Behälter (zB in einem Sack) gemischt und zufällig ausgewählt werden. In der Praxis wird dieses Verfahren mit einem Zufallszahlengenerator oder mathematischen Zufallszahlentabellen durchgeführt.
Mechanisch Auswahl, nach der jeder ( N / nein) -th Wert der allgemeinen Bevölkerung. Wenn es beispielsweise 100.000 Werte enthält und Sie 1.000 auswählen möchten, wird jeder 100.000 / 1.000 = 100. Wert in die Stichprobe aufgenommen. Wenn sie keine Rangfolge haben, wird die erste zufällig aus den ersten Hundert ausgewählt, und die Anzahl der anderen wird um 100 höher sein. Wenn zum Beispiel die erste Einheit Nr. 19 war, dann sollte die nächste Nr. 119 sein, dann Nr. 219, dann Nr. 319 usw. Wenn die Einheiten der allgemeinen Bevölkerung geordnet sind, wird zuerst Nr. 50 ausgewählt, dann Nr. 150, dann Nr. 250 usw.
Die Auswahl von Werten aus einem heterogenen Datensatz erfolgt geschichtet(stratifizierte) Methode, wenn die allgemeine Bevölkerung in homogene Gruppen unterteilt wird, auf die eine zufällige oder mechanische Auswahl angewendet wird.
Eine besondere Art der Probenahme ist seriell Selektion, bei der nicht einzelne Größen zufällig oder mechanisch ausgewählt werden, sondern deren Reihen (Folgen von einer Zahl zu einer Reihe), innerhalb derer eine kontinuierliche Beobachtung durchgeführt wird.

Die Qualität der Stichprobenbeobachtungen hängt auch von Beispielstyp: wiederholt oder nicht wiederholbar. Bei Neuauswahl Die statistischen Größen, die nach der Verwendung in die Stichprobe oder deren Reihen gelangt sind, werden an die allgemeine Bevölkerung zurückgegeben und haben die Möglichkeit, in eine neue Stichprobe zu gelangen. Darüber hinaus haben alle Werte der Allgemeinbevölkerung die gleiche Wahrscheinlichkeit, in die Stichprobe aufgenommen zu werden. Auswahl ohne Wiederholung bedeutet, dass die statistischen Mengen, die in der Stichprobe oder deren Reihen enthalten sind, nach der Verwendung nicht an die Allgemeinbevölkerung zurückgegeben werden und daher für die verbleibenden Mengen der letzteren die Wahrscheinlichkeit steigt, in die nächste Stichprobe zu fallen.

Die Auswahl ohne Wiederholung liefert genauere Ergebnisse und wird daher häufiger verwendet. Es gibt jedoch Situationen, in denen sie nicht angewendet werden kann (Studie zu Passagierströmen, Verbrauchernachfrage usw.) und dann eine Neuauswahl durchgeführt wird.

21. Grenzstichprobenfehler der Beobachtung, durchschnittlicher Stichprobenfehler, die Reihenfolge ihrer Berechnung.

Betrachten wir im Detail die oben aufgeführten Methoden zur Bildung des Stichprobensatzes und die dabei auftretenden Repräsentativitätsfehler. Eigentlich zufällig die Stichprobe basiert auf einer zufälligen Auswahl von Einheiten aus der Allgemeinbevölkerung ohne systematische Elemente. Technisch erfolgt die richtige Zufallsauswahl durch Losziehung (zB Lotterieziehungen) oder nach einer Zufallszahlentabelle.

Tatsächlich wird die Zufallsauswahl "in ihrer reinen Form" in der Praxis der selektiven Beobachtung selten verwendet, aber sie ist die erste unter anderen Arten der Auswahl, sie setzt die Grundprinzipien der selektiven Beobachtung um. Betrachten wir einige Fragen der Theorie des Stichprobenverfahrens und der Fehlerformel für eine einfache Zufallsstichprobe.

Beobachtungsfehler der Probe- ϶ᴛᴏ die Differenz zwischen dem Wert des Parameters in der Allgemeinbevölkerung und seinem aus den Ergebnissen der Stichprobenbeobachtung berechneten Wert. Es ist wichtig zu beachten, dass für das durchschnittliche quantitative Merkmal der Stichprobenfehler bestimmt wird

Der Indikator wird normalerweise als marginaler Stichprobenfehler bezeichnet. Der Stichprobenmittelwert ist eine Zufallsvariable, die unterschiedliche Werte annehmen kann, je nachdem, welche Einheiten in die Stichprobe aufgenommen wurden. Daher sind Stichprobenfehler auch Zufallswerte und können unterschiedliche Werte annehmen. Aus diesem Grund wird der Durchschnitt der möglichen Fehler bestimmt - mittlerer Stichprobenfehler was hängt davon ab:

· Stichprobenumfang: je größer die Zahl, desto kleiner der Wert des durchschnittlichen Fehlers;

· Der Grad der Veränderung des untersuchten Merkmals: Je kleiner die Varianz des Merkmals und folglich die Varianz, desto kleiner der durchschnittliche Stichprobenfehler.

Bei zufällige Neuauswahl der durchschnittliche Fehler wird berechnet. In der Praxis ist die allgemeine Varianz nicht genau bekannt, aber in der Wahrscheinlichkeitstheorie wird bewiesen, dass ... Da der Wert für hinreichend großes n nahe 1 liegt, können wir dies annehmen. Dann sollte der durchschnittliche Stichprobenfehler berechnet werden:. Aber in Fällen einer kleinen Stichprobe (für n<30) коэффициент крайне важно учитывать, и среднюю ошибку малой выборки рассчитывать по формуле .

Bei zufällige nicht-replizierende Stichprobe die angegebenen Formeln werden um den Wert korrigiert. Dann beträgt der mittlere nicht-repetitive Stichprobenfehler: und ... Weil immer kleiner ist, dann ist der Multiplikator () immer kleiner als 1. Dies bedeutet, dass der durchschnittliche Fehler bei einer sich nicht wiederholenden Auswahl immer kleiner ist als bei einer wiederholten Auswahl. Mechanische Probenahme es wird verwendet, wenn die allgemeine Bevölkerung in irgendeiner Weise geordnet ist (z. B. Wählerlisten in alphabetischer Reihenfolge, Telefonnummern, Nummern von Häusern, Wohnungen). Die Auswahl der Einheiten erfolgt in einem bestimmten Intervall, das dem Kehrwert des Prozentsatzes der Stichprobe entspricht. Bei einer 2%-Stichprobe werden also jeweils 50 Einheiten = 1 / 0,02 ausgewählt, bei jeweils 5% 1 / 0,05 = 20 Einheiten der Gesamtbevölkerung.

Der Referenzpunkt wird auf unterschiedliche Weise gewählt: zufällig, aus der Mitte des Intervalls, mit einer Änderung des Referenzpunktes. Hier gilt es vor allem, systematische Fehler zu vermeiden. Wenn beispielsweise bei einer Stichprobe von 5 % 13 als erste Einheit gewählt wird, dann werden die nächsten 33, 53, 73 usw.

In Bezug auf die Genauigkeit kommt die mechanische Auswahl der Zufallsstichprobe selbst nahe. Aus diesem Grund werden die Formeln der richtigen Zufallsauswahl verwendet, um den mittleren Fehler der mechanischen Probenahme zu bestimmen.

Bei typische Auswahl die befragte Bevölkerung wird zunächst in gleichartige homogene Gruppen eingeteilt. Bei der Befragung von Unternehmen sind dies beispielsweise Branchen, Teilsektoren, bei der Untersuchung einer Bevölkerung sind dies Regionen, soziale oder Altersgruppen. Weiterhin erfolgt eine unabhängige Auswahl aus jeder Gruppe mechanisch oder rein zufällig.

Eine typische Probenahme liefert genauere Ergebnisse als andere Methoden. Die Typisierung der Allgemeinbevölkerung stellt sicher, dass jede typologische Gruppe in der Stichprobe vertreten ist, wodurch der Einfluss der Intergruppenvarianz auf den mittleren Stichprobenfehler ausgeschlossen werden kann. Daher ist es bei der Ermittlung des Fehlers einer typischen Stichprobe gemäß der Regel zum Addieren von Varianzen () äußerst wichtig, nur den Durchschnitt der Gruppenvarianzen zu berücksichtigen. Dann der durchschnittliche Abtastfehler: bei wiederholter Abtastung, bei Nichtabtastung , wo Der Durchschnitt der gruppeninternen Varianzen in der Stichprobe.

Serielle (oder verschachtelte) Auswahl gilt für den Fall, dass die Allgemeinbevölkerung vor Beginn der Stichprobenerhebung in Reihen oder Gruppen eingeteilt wird. Diese Serien sind Verpackungen von Fertigprodukten, Studentengruppen, Brigaden. Die Reihen für die Erhebung werden maschinell oder rein zufällig ausgewählt und innerhalb der Reihe wird eine kontinuierliche Einheitenerhebung durchgeführt. Aus diesem Grund hängt der mittlere Stichprobenfehler nur von der Varianz zwischen den Gruppen (zwischen den Reihen) ab, die durch die Formel berechnet wird: wobei r die Anzahl der ausgewählten Serien ist; - Durchschnitt der i-ten Reihe. Der durchschnittliche Fehler der seriellen Probenahme wird berechnet: bei wiederholter Probenahme, bei Nicht-Probenahme , wobei R die Gesamtzahl der Reihen ist. Kombiniert Auswahl ist eine Kombination der betrachteten Auswahlmethoden.

Der durchschnittliche Stichprobenfehler für jede Auswahlmethode hängt hauptsächlich von der absoluten Größe der Stichprobe und in geringerem Maße vom Prozentsatz der Stichprobe ab. Angenommen, im ersten Fall werden 225 Beobachtungen bei einer Gesamtbevölkerung von 4500 Einheiten und im zweiten Fall bei 225000 Einheiten durchgeführt. Die Varianzen sind in beiden Fällen gleich 25. Dann beträgt der Stichprobenfehler im ersten Fall bei einer Stichprobe von 5 %: Im zweiten Fall, bei einer Auswahl von 0,1 %, ist es gleich:

Τᴀᴋᴎᴍ ᴏϬᴩᴀᴈᴏᴍ, mit einer Verringerung des Prozentsatzes der Stichprobe um das 50-fache, nahm der Stichprobenfehler unbedeutend zu, da sich die Größe der Stichprobe nicht änderte. Angenommen, die Stichprobengröße wird auf 625 Beobachtungen erhöht. In diesem Fall beträgt der Stichprobenfehler: Eine Vergrößerung der Stichprobe um den Faktor 2,8 bei gleicher Größe der Allgemeinbevölkerung reduziert den Stichprobenfehler um mehr als das 1,6-fache.

22. Methoden und Wege zur Bildung einer Probe.

In der Statistik werden verschiedene Methoden zur Bildung von Stichproben verwendet, die von den Forschungszielen bestimmt werden und von den Besonderheiten des Untersuchungsgegenstandes abhängen.

Die Hauptbedingung für die Durchführung einer Stichprobenerhebung besteht darin, das Auftreten systematischer Fehler aufgrund der Verletzung des Grundsatzes der Chancengleichheit für jede in die Stichprobe aufzunehmende Einheit der Gesamtbevölkerung zu verhindern. Die Vermeidung systematischer Fehler wird durch den Einsatz wissenschaftlich fundierter Methoden zur Bildung einer Stichprobenpopulation erreicht.

Es gibt folgende Möglichkeiten, Einheiten aus der allgemeinen Bevölkerung auszuwählen: 1) individuelle Auswahl - einzelne Einheiten werden in der Stichprobe ausgewählt; 2) Gruppenauswahl - in die Stichprobe fallen qualitativ homogene Gruppen oder Reihen der untersuchten Einheiten; 3) Kombinierte Auswahl ist eine Kombination aus Einzel- und Gruppenauswahl. Die Auswahlverfahren werden durch die Regeln für die Bildung der Stichprobenpopulation bestimmt.

Die Probe sollte sein:

richtiges zufälliges besteht darin, dass die Stichprobenpopulation durch eine zufällige (unbeabsichtigte) Auswahl einzelner Einheiten aus der Gesamtbevölkerung gebildet wird. In diesem Fall wird die Anzahl der für die Stichprobenpopulation ausgewählten Einheiten in der Regel auf der Grundlage des akzeptierten Anteils der Stichprobe bestimmt. Der Anteil der Stichprobe ist das Verhältnis der Anzahl der Einheiten in der Stichprobe n zur Anzahl der Einheiten in der Gesamtbevölkerung N, ᴛ.ᴇ.

mechanisch besteht darin, dass die Auswahl der Einheiten in der Stichprobenpopulation aus der allgemeinen Bevölkerung erfolgt, die in gleiche Intervalle (Gruppen) unterteilt ist. Darüber hinaus entspricht die Größe des Intervalls in der Allgemeinbevölkerung dem Kehrwert des Stichprobenanteils. Bei einer 2%-Probe wird also jede 50. Einheit (1: 0,02) ausgewählt, bei einer 5%-Probe jede 20. Einheit (1: 0,05) usw. Τᴀᴋᴎᴍ ᴏϬᴩᴀᴈᴏᴍ, entsprechend dem akzeptierten Selektionsanteil wird die Gesamtbevölkerung sozusagen mechanisch in gleiche Gruppen eingeteilt. Aus jeder Gruppe wird nur eine Einheit ausgewählt.
typisch - bei der die Allgemeinbevölkerung zunächst in homogene typische Gruppen eingeteilt wird. Ferner wird aus jeder typischen Gruppe durch geeignete zufällige oder mechanische Stichproben eine individuelle Auswahl von Einheiten für die Stichprobenpopulation getroffen. Ein wichtiges Merkmal der typischen Stichprobe besteht darin, dass sie im Vergleich zu anderen Methoden zur Auswahl von Einheiten in der Stichprobe genauere Ergebnisse liefert;
seriell- in denen die Allgemeinbevölkerung in gleich große Gruppen eingeteilt wird - Reihen. Serien werden für die Probe ausgewählt. Innerhalb der Serie erfolgt eine kontinuierliche Beobachtung der in der Serie enthaltenen Einheiten;
kombiniert- Die Probe sollte zweistufig sein. In diesem Fall wird die allgemeine Bevölkerung zunächst in Gruppen eingeteilt. Weiterhin erfolgt die Auswahl von Gruppen und innerhalb letzterer die Auswahl einzelner Einheiten.

In der Statistik werden folgende Methoden zur Auswahl von Einheiten für eine Stichprobe unterschieden:

einstufig Stichprobenziehung - jede ausgewählte Einheit wird sofort nach einem bestimmten Kriterium untersucht (richtige Stichproben- und Serienstichproben);
mehrstufig Stichprobenziehung - Die Auswahl erfolgt aus der allgemeinen Grundgesamtheit einzelner Gruppen, und einzelne Einheiten werden aus den Gruppen ausgewählt (typische Stichprobenziehung mit einer mechanischen Methode zur Auswahl von Einheiten in der Stichprobenpopulation).

Unterscheiden Sie außerdem:

Neuauswahl- nach dem Schema der zurückgegebenen Kugeln. Darüber hinaus kehrt jede Einheit oder Serie, die in die Stichprobe aufgenommen wurde, an die allgemeine Bevölkerung zurück und hat daher eine Chance, erneut in die Stichprobe zu gelangen;
Auswahl ohne Wiederholung- nach dem Schema einer nicht zurückgegebenen Kugel. Es hat genauere Ergebnisse für die gleiche Stichprobengröße.

23. Ermittlung des äußerst wichtigen Stichprobenumfangs (mit Hilfe der Student's-Tabelle).

Eines der wissenschaftlichen Prinzipien der Stichprobentheorie besteht darin, eine ausreichende Anzahl von Stichprobeneinheiten sicherzustellen. Theoretisch ist es äußerst wichtig, dieses Prinzip bei den Beweisen der Grenzwertsätze der Wahrscheinlichkeitstheorie zu beachten, die es ermöglichen festzustellen, welche Menge von Einheiten aus der Gesamtbevölkerung ausgewählt werden sollte, damit diese ausreichend ist und die Repräsentativität gewährleistet ist der Probe.

Eine Verringerung des Standardfehlers der Stichprobe und folglich eine Erhöhung der Genauigkeit der Schätzung ist immer mit einer Erhöhung der Stichprobengröße verbunden. Diesbezüglich ist es bereits in der Phase der Organisation einer Stichprobenbeobachtung notwendig die Frage zu entscheiden, wie groß die Stichprobenpopulation sein sollte, um die erforderliche Genauigkeit der Beobachtungsergebnisse zu gewährleisten ... Die Berechnung des äußerst wichtigen Stichprobenumfangs basiert auf Formeln, die aus den Formeln für die marginalen Stichprobenfehler (A) abgeleitet wurden, die einer bestimmten Art und Methode der Auswahl entsprechen. Für eine zufällig wiederholte Stichprobengröße (n) haben wir also:

Die Essenz dieser Formel besteht darin, dass es bei wiederholten Zufallsstichproben äußerst wichtig ist, dass die Größe der Stichprobe direkt proportional zum Quadrat des Konfidenzkoeffizienten ist (t2) und die Varianz des Variationsmerkmals (? 2) und ist umgekehrt proportional zum Quadrat des marginalen Stichprobenfehlers (? 2). Insbesondere bei einer Verdoppelung des Grenzfehlers sollte der erforderliche Stichprobenumfang um den Faktor vier reduziert werden. Von den drei Parametern werden zwei (t und?) vom Forscher eingestellt. In diesem Fall geht der Forscher vom Ziel aus

und die Aufgaben der Stichprobenerhebung sollten die Frage lösen: In welcher quantitativen Kombination ist es besser, diese Parameter einzubeziehen, um die optimale Option zu gewährleisten? Im einen Fall kann er mit der Verlässlichkeit der erhaltenen Ergebnisse (t) zufriedener sein als mit einem Maß an Genauigkeit (?), im anderen - umgekehrt. Es ist schwieriger, die Frage nach der Größe des marginalen Stichprobenfehlers zu lösen, da der Forscher diesen Indikator in der Phase des Entwurfs einer Stichprobenbeobachtung nicht hat; daher ist es in der Praxis üblich, den marginalen Stichprobenfehler festzulegen, da in der Regel innerhalb von bis zu 10 % des erwarteten durchschnittlichen Niveaus des Merkmals ... Die Ermittlung eines angenommenen Durchschnitts kann auf unterschiedliche Weise angegangen werden: unter Verwendung von Daten aus ähnlichen früheren Erhebungen oder unter Verwendung von Daten aus einem Stichprobenrahmen und Erstellen einer kleinen Probestichprobe.

Beim Entwerfen einer Stichprobenbeobachtung ist es am schwierigsten, den dritten Parameter in Formel (5.2) zu bestimmen – die Varianz der Stichprobenpopulation. In diesem Fall ist es äußerst wichtig, alle dem Forscher zur Verfügung stehenden Informationen zu verwenden, die er in früheren ähnlichen und Pilotumfragen erhalten hat.

Die Frage der Bestimmung des äußerst wichtigen Stichprobenumfangs wird komplizierter, wenn bei der Stichprobenerhebung mehrere Merkmale der Stichprobeneinheiten untersucht werden. In diesem Fall sind die durchschnittlichen Niveaus der einzelnen Zeichen und ihre Variation in der Regel unterschiedlich, und in dieser Hinsicht kann die Frage der Varianz, welchem der Zeichen der Vorzug gegeben werden soll, nur unter Berücksichtigung von den Zweck und die Ziele der Erhebung berücksichtigen.

Beim Entwerfen einer Stichprobenbeobachtung wird ein vorbestimmter Wert des zulässigen Stichprobenfehlers in Übereinstimmung mit den Aufgaben einer bestimmten Studie und der Wahrscheinlichkeit von Schlussfolgerungen basierend auf den Ergebnissen der Beobachtung angenommen.

Im Allgemeinen lässt sich mit der Formel für den Grenzfehler des Stichprobenmittelwerts Folgendes bestimmen:

‣‣‣ der Wert möglicher Abweichungen der Indikatoren der Gesamtbevölkerung von den Indikatoren der Stichprobenpopulation;

‣‣‣ die erforderliche Größe der Probe, die die erforderliche Genauigkeit liefert, bei der die Grenzen eines möglichen Fehlers einen bestimmten festgelegten Wert nicht überschreiten;

‣‣‣ die Wahrscheinlichkeit, dass der Fehler in der Stichprobe eine bestimmte Grenze hat.

Schülerverteilung in der Wahrscheinlichkeitstheorie handelt es sich um eine einparametrige Familie absolut stetiger Verteilungen.

24. Dynamikreihen (Intervall, Moment), die die Dynamikreihen schließen.

Reihen der Dynamik sind die Werte statistischer Indikatoren, die in einer bestimmten chronologischen Reihenfolge dargestellt werden.

Jede Zeitreihe enthält zwei Komponenten:

1) Zeitraumindikatoren(Jahre, Quartale, Monate, Tage oder Daten);

2) Indikatoren, die das Untersuchungsobjekt charakterisieren für Zeiträume oder für die entsprechenden Termine, die aufgerufen werden Ebenen von.

Die Niveaus der Reihe werden sowohl in absoluten als auch in durchschnittlichen oder relativen Werten ausgedrückt. Unter Berücksichtigung der Abhängigkeit von der Art der Indikatoren wird eine dynamische Reihe von absoluten, relativen und durchschnittlichen Werten gebildet. Dynamikreihen aus Relativ- und Durchschnittswerten werden auf der Grundlage abgeleiteter Absolutwertreihen aufgebaut. Unterscheiden Sie zwischen Intervall- und Momentreihen der Dynamik.

Dynamische Intervallserien enthält Werte von Indikatoren für bestimmte Zeiträume. In der Intervallreihe können die Pegel aufsummiert werden, wodurch das Volumen des Phänomens über einen längeren Zeitraum oder die sogenannten akkumulierten Summen erhalten werden.

Dynamische Drehmomentreihe spiegelt die Werte von Indikatoren zu einem bestimmten Zeitpunkt (Datum der Uhrzeit) wider. In der Momentenreihe kann sich der Forscher nur für die Differenz der Phänomene interessieren, die die Veränderung des Niveaus der Reihe zwischen bestimmten Daten widerspiegelt, da die Summe der Niveaus hier keinen wirklichen Inhalt hat. Kumulierte Summen werden hier nicht berechnet.

Die wichtigste Bedingung für die korrekte Konstruktion von Zeitreihen ist Vergleichbarkeit auf Zeilenebene in Bezug auf verschiedene Zeiträume. Die Niveaus sollten in homogenen Mengen dargestellt werden, und die verschiedenen Teile des Phänomens sollten gleich umfassend sein.

Um Verzerrungen der realen Dynamik zu vermeiden, werden in einer statistischen Studie Vorberechnungen (Abschluss der Dynamikreihen) durchgeführt, die der statistischen Analyse von Zeitreihen vorangehen. Unter durch Schließen der Dynamikreihen es ist üblich, die Vereinigung in einer Reihe von zwei oder mehr Reihen zu verstehen, deren Niveaus nach unterschiedlichen Methoden berechnet werden oder nicht territorialen Grenzen entsprechen usw. Die Konvergenz der Dynamikreihe kann auch bedeuten, dass die absoluten Ebenen der Dynamikreihe auf eine gemeinsame Basis gebracht werden, wodurch die Unvergleichbarkeit der Ebenen der Dynamikreihe aufgehoben wird.

25. Das Konzept der Vergleichbarkeit von Reihen von Dynamiken, Koeffizienten, Wachstums- und Gewinnraten.

Reihen der Dynamik sind eine Reihe statistischer Indikatoren, die die zeitliche Entwicklung natürlicher und sozialer Phänomene charakterisieren. Statistische Zusammenstellungen, die vom Goskomstat of Russia veröffentlicht wurden, enthalten eine große Anzahl von Dynamikreihen in tabellarischer Form. Die Reihe von Dynamiken ermöglicht es, die Entwicklungsmuster der untersuchten Phänomene aufzudecken.

Die Dynamikreihen enthalten zwei Arten von Indikatoren. Zeitindikatoren(Jahre, Quartale, Monate etc.) oder Zeitpunkte (am Jahresanfang, am Monatsanfang etc.). Anzeigen auf Zeilenebene... Indikatoren für das Niveau der Dynamikreihe werden in absoluten Werten (Produktion eines Produkts in Tonnen oder Rubel), relativen Werten (Anteil der Stadtbevölkerung in %) und Durchschnittswerten (Durchschnittsgehalt der Arbeitnehmer) ausgedrückt in der Branche nach Jahren usw.). In tabellarischer Form enthält eine dynamische Zeile zwei Spalten oder zwei Zeilen.

Der richtige Aufbau der Dynamikreihe setzt die Erfüllung einer Reihe von Anforderungen voraus:

alle Indikatoren für eine Reihe von Dynamiken sollten wissenschaftlich fundiert und zuverlässig sein;
Indikatoren einer Reihe von Dynamiken sollten zeitlich vergleichbar sein, ᴛ.ᴇ. müssen für die gleichen Zeiträume oder für die gleichen Daten berechnet werden;
Indikatoren für eine Reihe von Dynamiken sollten im gesamten Gebiet vergleichbar sein;
Indikatoren für eine Reihe von Dynamiken sollten inhaltlich vergleichbar sein, ᴛ.ᴇ. auf dieselbe Weise nach einer einheitlichen Methodik berechnet;
Indikatoren für eine Reihe von Dynamiken sollten über alle betrachteten landwirtschaftlichen Betriebe hinweg vergleichbar sein. Alle Indikatoren einer Reihe von Dynamiken sollten in den gleichen Maßeinheiten angegeben werden.

Statistische Indikatoren können entweder die Ergebnisse des untersuchten Prozesses über einen bestimmten Zeitraum oder den Zustand des untersuchten Phänomens zu einem bestimmten Zeitpunkt charakterisieren, .ᴇ. Indikatoren sind Intervall (periodisch) und momentan. Dementsprechend sind die Dynamikreihen zunächst entweder intervallartig oder momentan. Die momentanen Dynamikreihen haben ihrerseits gleiche und ungleiche Zeitintervalle.

Die ursprüngliche Dynamikreihe wird in eine Reihe von Durchschnittswerten und eine Reihe von relativen Werten (Kette und Basis) umgewandelt. Solche Dynamikreihen werden abgeleitete Dynamikreihen genannt.

Die Methodik zur Berechnung des Durchschnittspegels in der Dynamikreihe ist aufgrund der Art der Dynamikreihe unterschiedlich. Anhand von Beispielen werden die Arten von Dynamikreihen und Formeln zur Berechnung des Durchschnittspegels betrachtet.

Absolute Gewinne (y) zeigen, um wie viele Einheiten sich die nächste Stufe der Reihe im Vergleich zur vorherigen (Spalte 3. - absolute Ketteninkremente) oder im Vergleich zur Ausgangsstufe (Spalte 4. - absolute Grundinkremente) geändert hat. Berechnungsformeln können wie folgt geschrieben werden:

Bei einer Abnahme der absoluten Werte der Reihe wird es jeweils zu "Abnahme", "Abnahme" kommen.

Indikatoren für das absolute Wachstum weisen darauf hin, dass beispielsweise 1998 ᴦ. die Produktion von Produkt "A" ist gegenüber 1997 gestiegen. um 4 Tausend Tonnen und im Vergleich zu 1994 ᴦ. - um 34 Tausend Tonnen; für den Rest der Jahre siehe Tabelle. 11,5 g
Gepostet auf ref.rf
3 und 4.

Wachstumsrate zeigt an, wie oft sich das Niveau der Reihe im Vergleich zum vorherigen (Spalte 5 - Kettenwachstums- oder -rückgangskoeffizienten) oder im Vergleich zum Ausgangsniveau (Spalte 6 - Basiswachstums- oder -rückgangskoeffizienten) geändert hat. Berechnungsformeln können wie folgt geschrieben werden:

Wachstumsraten zeigen, wie viel Prozent die nächste Stufe der Reihe im Vergleich zur vorherigen (Spalte 7 - Kettenwachstumsraten) oder im Vergleich zur Ausgangsstufe (Spalte 8 - Basiswachstumsraten) beträgt. Berechnungsformeln können wie folgt geschrieben werden:

Also zum Beispiel 1997 ᴦ. der Produktionsumfang des Produkts "A" im Vergleich zu 1996 ᴦ. belief sich auf 105,5 % (

Wachstumsrate zeigen, um wie viel Prozent das Niveau des Berichtszeitraums im Vergleich zum vorherigen (Spalte 9 – Kettenwachstumsraten) oder im Vergleich zum Ausgangsniveau (Spalte 10 – Basiswachstumsraten) gestiegen ist. Berechnungsformeln können wie folgt geschrieben werden:

T pr = T p - 100 % oder T pr = absoluter Anstieg / Niveau der Vorperiode * 100 %

Also zum Beispiel 1996 ᴦ. im Vergleich zu 1995 ᴦ. Produkt "A" produzierte um 3,8% (103,8% - 100%) oder (8: 210) x 100% mehr, und im Vergleich zu 1994 ᴦ. - um 9% (109% - 100%).

Wenn die absoluten Niveaus in der Reihe sinken, liegt die Rate unter 100 % und dementsprechend sinkt die Rate (Wachstumsrate mit Minuszeichen).

Absoluter Wert von 1% Gewinn(Säule
Gepostet auf ref.rf
11) zeigt, wie viele Einheiten in einer bestimmten Periode produziert werden müssen, damit das Niveau der Vorperiode um 1 % steigt. In unserem Beispiel 1995 ᴦ. es war notwendig, 2,0 Tausend Tonnen zu produzieren, und im Jahr 1998 ᴦ. - 2,3 Tausend Tonnen, ᴛ.ᴇ. viel größer.

Es gibt zwei Möglichkeiten, die Höhe des Absolutwerts einer 1%igen Erhöhung zu bestimmen:

§ den Stand der Vorperiode durch 100 teilen;

§ die absoluten Kettenzuwächse werden durch die entsprechenden Kettenwachstumsraten dividiert.

Absolutwert von 1% Verstärkung =

In der Dynamik, insbesondere über einen langen Zeitraum, ist eine gemeinsame Analyse der Wachstumsraten mit dem Gehalt jedes Prozents an Zu- oder Abnahme wichtig.

Beachten Sie, dass die betrachtete Methode zur Analyse der Dynamikreihe sowohl für die Dynamikreihe, deren Niveaus in absoluten Werten (t, Tausend Rubel, die Anzahl der Mitarbeiter usw.) ausgedrückt werden, als auch für die Reihe anwendbar ist der Dynamik, deren Niveau durch relative Indikatoren (% Schrott ,% Aschegehalt der Kohle usw.) oder Durchschnittswerte (durchschnittlicher Ertrag in c / ha, durchschnittliches Gehalt usw.) ausgedrückt wird.

Neben den berücksichtigten analytischen Indikatoren, die für jedes Jahr im Vergleich zum vorherigen oder Anfangsniveau berechnet werden, ist es bei der Analyse der Dynamikreihe äußerst wichtig, die durchschnittlichen analytischen Indikatoren für den Zeitraum zu berechnen: das durchschnittliche Niveau der Reihe, der Durchschnitt jährliche absolute Zunahme (Abnahme) und die durchschnittliche jährliche Wachstumsrate und Wachstumsrate ...

Methoden zur Berechnung des Durchschnittspegels einer Reihe von Dynamiken wurden oben diskutiert. In der von uns betrachteten Intervallreihe der Dynamik wird das Durchschnittsniveau der Reihe mit der einfachen arithmetischen Mittelwertformel berechnet:

Durchschnittliches Jahresvolumen der Produktproduktion für 1994-1998. belief sich auf 218,4 Tausend Tonnen.

Das durchschnittliche jährliche absolute Wachstum wird ebenfalls mit der Formel des arithmetischen Mittels berechnet

Standardabweichung - Konzept und Typen. Klassifikation und Merkmale der Kategorie "Standardabweichung" 2017, 2018.

Eines der wichtigsten Werkzeuge der statistischen Analyse ist die Berechnung der Standardabweichung. Mit diesem Indikator können Sie die Standardabweichung für eine Stichprobe oder die Gesamtbevölkerung schätzen. Lassen Sie uns lernen, wie Sie die Standardabweichungsformel in Excel verwenden.

Lassen Sie uns sofort bestimmen, was die Standardabweichung ist und wie ihre Formel aussieht. Dieser Wert ist die Quadratwurzel des arithmetischen Mittels der Quadrate der Differenz aller Werte der Reihe und ihres arithmetischen Mittels. Es gibt einen identischen Namen für diesen Indikator - Standardabweichung. Beide Namen sind völlig gleichwertig.

Aber in Excel muss der Benutzer dies natürlich nicht berechnen, da das Programm alles für ihn erledigt. Lassen Sie uns herausfinden, wie Sie die Standardabweichung in Excel berechnen.

Berechnung in Excel

Sie können den angegebenen Wert in Excel mit zwei speziellen Funktionen berechnen STABW.B.(für die Probe) und STABW.G(für die allgemeine Bevölkerung). Das Funktionsprinzip ist absolut gleich, aber sie können auf drei Arten verursacht werden, über die wir im Folgenden sprechen werden.

Methode 1: Funktionsassistent

Methode 2: die Registerkarte "Formeln"

Methode 3: Manuelle Eingabe einer Formel

Es gibt auch eine Möglichkeit, das Argumentfenster überhaupt nicht aufzurufen. Dazu müssen Sie die Formel manuell eingeben.

Wie Sie sehen, ist der Mechanismus zur Berechnung der Standardabweichung in Excel sehr einfach. Der Benutzer muss nur Zahlen aus der Population oder Verweise auf die Zellen eingeben, die sie enthalten. Alle Berechnungen werden vom Programm selbst durchgeführt. Es ist viel schwieriger zu verstehen, was der berechnete Indikator ist und wie die Berechnungsergebnisse in der Praxis angewendet werden können. Dies zu begreifen gehört aber bereits mehr in den Bereich der Statistik als zum Erlernen des Umgangs mit Software.