Bestimmen Sie 1 Abweichung. Absolute Variationsraten

Streuung in der Statistik findet man als Einzelwerte des Merkmals im Quadrat von . Abhängig von den Ausgangsdaten wird sie durch die einfachen und gewichteten Varianzformeln bestimmt:

1. (für nicht gruppierte Daten) wird nach folgender Formel berechnet:

2. Gewichtete Varianz (für eine Variationsreihe):

wobei n die Frequenz ist (Wiederholbarkeitsfaktor X)

Ein Beispiel zum Finden der Varianz

Diese Seite beschreibt ein Standardbeispiel zum Finden der Abweichung, Sie können sich auch andere Aufgaben ansehen, um sie zu finden

Beispiel 1. Wir haben die folgenden Daten für eine Gruppe von 20 Studenten Korrespondenzabteilung. Bauen müssen Intervallserie Verteilung des Merkmals, berechnen Sie den Mittelwert des Merkmals und untersuchen Sie seine Varianz

Lassen Sie uns eine Intervallgruppierung erstellen. Lassen Sie uns den Bereich des Intervalls durch die Formel bestimmen:

wobei X max der Maximalwert des Gruppierungsmerkmals ist;
X min ist der Mindestwert des Gruppierungsmerkmals;
n ist die Anzahl der Intervalle:

Wir akzeptieren n=5. Der Schritt ist: h \u003d (192 - 159) / 5 \u003d 6,6

Machen wir eine Intervallgruppierung

Für weitere Berechnungen bauen wir eine Hilfstabelle auf:

X'i ist die Mitte des Intervalls. (zum Beispiel die Mitte des Intervalls 159 - 165,6 = 162,3)

Das durchschnittliche Wachstum der Schüler wird durch die Formel des arithmetisch gewichteten Durchschnitts bestimmt:

Wir bestimmen die Dispersion nach der Formel:

Die Varianzformel lässt sich wie folgt umrechnen:

Aus dieser Formel folgt das die Abweichung ist die Differenz zwischen dem Mittelwert der Quadrate der Optionen und dem Quadrat und dem Mittelwert.

Streuung ein Variationsreihe mit gleichen Intervallen nach der Momentenmethode kann auf folgende Weise unter Verwendung der zweiten Eigenschaft der Streuung (Teilung aller Optionen durch den Wert des Intervalls) berechnet werden. Definition von Varianz, berechnet nach der Momentenmethode, nach folgender Formel ist weniger zeitaufwändig:

wobei i der Wert des Intervalls ist;
A - bedingte Null, die praktisch ist, um die Mitte des Intervalls mit der höchsten Frequenz zu verwenden;
m1 ist das Momentenquadrat erster Ordnung;
m2 - Moment zweiter Ordnung

(Wenn sich in der statistischen Grundgesamtheit das Attribut so ändert, dass es nur zwei sich gegenseitig ausschließende Optionen gibt, dann wird diese Variabilität als Alternative bezeichnet) kann durch die Formel berechnet werden:

Einwechseln diese Formel Dispersion q \u003d 1- p, wir erhalten:

Arten der Dispersion

Totale Varianz misst die Variation eines Merkmals über die gesamte Population als Ganzes unter dem Einfluss aller Faktoren, die diese Variation verursachen. Sie ist gleich dem mittleren Quadrat der Abweichungen der Einzelwerte des Merkmals x vom Gesamtmittelwert x und kann als einfache Varianz oder gewichtete Varianz definiert werden.

charakterisiert zufällige Variation, d.h. Teil der Variation, der auf den Einfluss nicht berücksichtigter Faktoren zurückzuführen ist und nicht von dem der Gruppierung zugrunde liegenden Merkmalsfaktor abhängt. Eine solche Varianz ist gleich dem mittleren Quadrat der Abweichungen der Einzelwerte eines Merkmals innerhalb der Gruppe X vom arithmetischen Mittel der Gruppe und kann als einfache Varianz oder als gewichtete Varianz berechnet werden.

Auf diese Weise, Varianzmaße innerhalb der Gruppe Variation eines Merkmals innerhalb einer Gruppe und wird durch die Formel bestimmt:

wo xi - Gruppendurchschnitt;
ni ist die Anzahl der Einheiten in der Gruppe.

Beispielsweise zeigen gruppeninterne Varianzen, die bei der Aufgabe bestimmt werden müssen, den Einfluss der Qualifikationen der Arbeiter auf das Niveau der Arbeitsproduktivität im Betrieb zu untersuchen, Variationen im Output in jeder Gruppe, die von allen verursacht werden mögliche Faktoren (technischer Zustand Ausrüstung, Verfügbarkeit von Werkzeugen und Materialien, Alter der Arbeiter, Arbeitsintensität usw.), außer bei Unterschieden in der Qualifikationskategorie (innerhalb der Gruppe haben alle Arbeiter die gleiche Qualifikation).

Der Durchschnitt der gruppeninternen Varianzen spiegelt den Zufall wider, d. h. den Teil der Variation, der unter dem Einfluss aller anderen Faktoren mit Ausnahme des Gruppierungsfaktors aufgetreten ist. Es wird nach der Formel berechnet:

Es charakterisiert die systematische Variation des resultierenden Merkmals, die auf den Einfluss des der Gruppierung zugrunde liegenden Merkmalsfaktors zurückzuführen ist. Er ist gleich dem mittleren Quadrat der Abweichungen der Gruppenmittelwerte vom Gesamtmittelwert. Die Varianz zwischen den Gruppen wird nach folgender Formel berechnet:

Varianzadditionsregel in der Statistik

Entsprechend Varianzadditionsregel Gesamtvarianz ist gleich der Summe des Durchschnitts der gruppeninternen und gruppenübergreifenden Streuungen:

Die Bedeutung dieser Regel ist, dass die Gesamtvarianz, die sich unter dem Einfluss aller Faktoren ergibt, gleich der Summe der Varianzen ist, die sich unter dem Einfluss aller anderen Faktoren ergibt, und der Varianz, die sich aufgrund des Gruppierungsfaktors ergibt.

Mit der Formel zur Addition von Varianzen ist es möglich, aus zwei bekannten Varianzen die dritte Unbekannte zu ermitteln und auch die Stärke des Einflusses des Gruppierungsmerkmals zu beurteilen.

Dispersionseigenschaften

1. Wenn alle Werte des Attributs um denselben konstanten Wert verringert (erhöht) werden, ändert sich die Abweichung davon nicht.
2. Wenn alle Werte des Attributs um die gleiche Anzahl von n-mal verringert (erhöht) werden, dann wird die Varianz entsprechend um n^2-mal verringert (erhöht).

Streuungzufällige Variable- ein Maß für die Streuung einer gegebenen zufällige Variable, das ist sie Abweichungen von mathematische Erwartung. In der Statistik wird häufig die Notation (Sigma zum Quadrat) verwendet, um die Varianz zu bezeichnen. Die Quadratwurzel der Varianz wird aufgerufen Standardabweichung oder Standardaufstrich. Die Standardabweichung wird in denselben Einheiten gemessen wie die Zufallswert, und die Varianz wird in den Quadraten dieser Einheit gemessen.

Obwohl es sehr praktisch ist, nur einen Wert (z. B. Mittelwert oder Modus und Median) zu verwenden, um die gesamte Stichprobe zu schätzen, kann dieser Ansatz leicht zu falschen Schlussfolgerungen führen. Der Grund für diese Situation liegt nicht im Wert selbst, sondern darin, dass ein Wert in keiner Weise die Streuung von Datenwerten widerspiegelt.

Zum Beispiel im Beispiel:

der Durchschnitt liegt bei 5.

Es gibt jedoch kein Element in der Stichprobe selbst mit einem Wert von 5. Möglicherweise müssen Sie wissen, wie nahe jedes Element der Stichprobe an seinem Mittelwert liegt. Oder mit anderen Worten, Sie müssen die Varianz der Werte kennen. Wenn Sie wissen, inwieweit sich die Daten geändert haben, können Sie sie besser interpretieren mittlere Bedeutung, Median Und Mode. Der Grad der Änderung der Stichprobenwerte wird durch Berechnung ihrer Varianz und Standardabweichung bestimmt.



Streuung u Quadratwurzel der Varianz, genannt Standardabweichung, charakterisieren die mittlere Abweichung vom Mittelwert der Stichprobe. Unter diesen beiden Größen ist die wichtigste Standardabweichung . Dieser Wert kann als durchschnittlicher Abstand dargestellt werden, in dem sich die Elemente vom mittleren Element der Probe befinden.

Streuung ist schwer sinnvoll zu interpretieren. Die Quadratwurzel dieses Werts ist jedoch die Standardabweichung und eignet sich gut zur Interpretation.

Die Standardabweichung wird berechnet, indem zuerst die Varianz bestimmt und dann die Quadratwurzel der Varianz berechnet wird.

Für das in der Abbildung gezeigte Datenarray werden beispielsweise die folgenden Werte erhalten:

Bild 1

Hier beträgt der Mittelwert der quadrierten Differenzen 717,43. Um die Standardabweichung zu erhalten, muss nur noch die Quadratwurzel dieser Zahl gezogen werden.

Das Ergebnis wird etwa 26,78 sein.

Es sollte daran erinnert werden, dass die Standardabweichung als der durchschnittliche Abstand interpretiert wird, in dem die Elemente vom Stichprobenmittelwert entfernt sind.

Die Standardabweichung zeigt, wie gut der Mittelwert die gesamte Stichprobe beschreibt.

Angenommen, Sie sind der Manager Produktionsabteilung PC-Montage. Der Quartalsbericht sagt, dass der Output für das letzte Quartal 2500 PCs betrug. Ist es schlecht oder gut? Sie haben darum gebeten (oder es gibt diese Spalte bereits im Bericht), die Standardabweichung für diese Daten im Bericht anzuzeigen. Die Standardabweichungszahl ist beispielsweise 2000. Als Abteilungsleiter wird Ihnen klar, dass die Produktionslinie besser kontrolliert werden muss (zu große Abweichungen in der Anzahl der zu montierenden PCs).

Erinnern wir uns: wann große Größe Wenn die Standardabweichung zu niedrig ist, liegen die Daten weit um den Mittelwert herum gestreut, und wenn die Standardabweichung niedrig ist, werden sie in der Nähe des Mittelwerts geclustert.

Die vier statistischen Funktionen VARP(), VARP(), STDEV() und STDEV() wurden entwickelt, um die Varianz und Standardabweichung von Zahlen in einem Bereich von Zellen zu berechnen. Bevor Sie die Varianz und Standardabweichung eines Datensatzes berechnen können, müssen Sie bestimmen, ob die Daten die Grundgesamtheit oder eine Stichprobe der Grundgesamtheit darstellen. Im Falle einer Stichprobe aus der Allgemeinbevölkerung sollten die Funktionen VARP() und STABW() verwendet werden, und im Falle der Allgemeinbevölkerung sollten die Funktionen VARP() und STABW() verwendet werden:

Bevölkerung Funktion

VARP()

STDLONG()
Probe

VARI()

STABW()

Die Streuung (wie auch die Standardabweichung) gibt, wie wir angemerkt haben, an, inwieweit die im Datensatz enthaltenen Werte um das arithmetische Mittel gestreut sind.

Ein kleiner Wert der Varianz oder Standardabweichung zeigt an, dass alle Daten um das arithmetische Mittel zentriert sind, und sehr wichtig diese Werte - dass die Daten über einen weiten Wertebereich gestreut sind.

Die Varianz ist eher schwer sinnvoll zu interpretieren (was bedeutet ein kleiner Wert, ein großer Wert?). Leistung Aufgaben 3 ermöglicht es Ihnen, die Bedeutung der Varianz für einen Datensatz visuell in einem Diagramm darzustellen.

Aufgaben

· Übung 1.

· 2.1. Nennen Sie die Begriffe: Varianz und Standardabweichung; ihre symbolische Bezeichnung in der statistischen Datenverarbeitung.

· 2.2. Erstellen Sie ein Arbeitsblatt gemäß Abbildung 1 und führen Sie die erforderlichen Berechnungen durch.

· 2.3. Geben Sie die Grundformeln an, die in den Berechnungen verwendet werden

· 2.4. Erklären Sie alle Schreibweisen ( , , )

· 2.5. erklären praktischer Wert die Begriffe Varianz und Standardabweichung.

Aufgabe 2.

1.1. Nennen Sie die Begriffe: Allgemeinbevölkerung und Stichprobe; mathematischer Erwartungswert und arithmetisches Mittel ihrer symbolischen Bezeichnung in der statistischen Datenverarbeitung.

1.2. Erstellen Sie gemäß Abbildung 2 ein Arbeitsblatt und führen Sie Berechnungen durch.

1.3. Geben Sie die grundlegenden Formeln an, die in den Berechnungen verwendet wurden (für die allgemeine Bevölkerung und die Stichprobe).

Figur 2

1.4. Erklären Sie, warum es möglich ist, solche arithmetischen Mittelwerte in Beispielen wie 46,43 und 48,78 zu erhalten (siehe Dateianhang). Schlussfolgern.

Aufgabe 3.

Es gibt zwei Proben mit anderer Satz Daten, aber der Durchschnitt für sie wird derselbe sein:

Figur 3

3.1. Erstellen Sie ein Arbeitsblatt gemäß Abbildung 3 und führen Sie die erforderlichen Berechnungen durch.

3.2. Geben Sie die grundlegenden Berechnungsformeln an.

3.3. Erstellen Sie Diagramme gemäß den Abbildungen 4, 5.

3.4. Erklären Sie die daraus resultierenden Abhängigkeiten.

3.5. Führen Sie ähnliche Berechnungen für diese beiden Proben durch.

Erstmuster 11119999

Wählen Sie die Werte der zweiten Stichprobe so, dass das arithmetische Mittel für die zweite Stichprobe gleich ist, zum Beispiel:

Wählen Sie die Werte für die zweite Probe selbst aus. Ordnen Sie Berechnungen und Plots wie in den Abbildungen 3, 4, 5 an. Zeigen Sie die wichtigsten Formeln, die bei den Berechnungen verwendet wurden.

Ziehen Sie die entsprechenden Schlüsse.

Alle Aufgaben sollten in Form eines Berichts mit allen erforderlichen Zahlen, Grafiken, Formeln und kurzen Erläuterungen präsentiert werden.

Hinweis: Die Konstruktion von Graphen muss mit Abbildungen und kurzen Erläuterungen erläutert werden.

Unter den vielen Indikatoren, die in der Statistik verwendet werden, muss die Berechnung der Varianz hervorgehoben werden. Es sollte beachtet werden, dass die manuelle Durchführung dieser Berechnung eine ziemlich mühsame Aufgabe ist. Glücklicherweise gibt es in Excel Funktionen, mit denen Sie den Berechnungsvorgang automatisieren können. Lassen Sie uns den Algorithmus für die Arbeit mit diesen Tools herausfinden.

Die Streuung ist ein Variationsindikator, der das durchschnittliche Quadrat der Abweichungen von der mathematischen Erwartung darstellt. Er drückt also die Streuung von Zahlen um den Mittelwert aus. Die Berechnung der Streuung kann sowohl für die Grundgesamtheit als auch für die Stichprobe durchgeführt werden.

Methode 1: Berechnung auf die allgemeine Bevölkerung

Um diesen Indikator in Excel für die allgemeine Bevölkerung zu berechnen, wird die Funktion verwendet ANZEIGEG. Die Syntax für diesen Ausdruck lautet wie folgt:

ANZEIGEG(Nummer1;Nummer2;…)

Insgesamt können 1 bis 255 Argumente verwendet werden. Argumente können sowohl numerische Werte als auch Verweise auf die Zellen sein, in denen sie enthalten sind.

Sehen wir uns an, wie dieser Wert für eine Reihe numerischer Daten berechnet wird.


Methode 2: Beispielrechnung

Im Gegensatz zur Berechnung des Wertes für die Allgemeinbevölkerung ist bei der Berechnung für die Stichprobe der Nenner nicht die Gesamtzahl der Zahlen, sondern eine weniger. Dies geschieht, um den Fehler zu korrigieren. Excel berücksichtigt diese Nuance in einer speziellen Funktion, die für diese Art der Berechnung entwickelt wurde - DISP.V. Seine Syntax wird durch die folgende Formel dargestellt:

VAR.B(Zahl1;Zahl2;…)

Die Anzahl der Argumente kann wie in der vorherigen Funktion auch zwischen 1 und 255 liegen.


Wie Sie sehen können, ist das Excel-Programm in der Lage, die Berechnung der Varianz erheblich zu erleichtern. Diese Statistik kann von der Anwendung sowohl für die Grundgesamtheit als auch für die Stichprobe berechnet werden. In diesem Fall reduzieren sich alle Benutzeraktionen eigentlich nur auf die Angabe des zu verarbeitenden Zahlenbereichs, und Excel erledigt die Hauptarbeit selbst. Dies spart den Benutzern natürlich viel Zeit.

Streuung ist ein Streuungsmaß, das die relative Abweichung zwischen Datenwerten und dem Mittelwert beschreibt. Es ist das am häufigsten verwendete Streuungsmaß in der Statistik, berechnet durch Summieren, quadriert, die Abweichung jedes Datenwertes aus mittlere Größe. Die Formel zur Berechnung der Varianz ist unten dargestellt:

s 2 - Stichprobenvarianz;

x cf ist der Mittelwert der Stichprobe;

n Stichprobengröße (Anzahl der Datenwerte),

(x i – x cf) ist die Abweichung vom Mittelwert für jeden Wert des Datensatzes.

Um die Formel besser zu verstehen, schauen wir uns ein Beispiel an. Ich koche nicht wirklich gerne, also tue ich es selten. Um jedoch nicht vor Hunger zu sterben, muss ich ab und zu an den Herd, um den Plan umzusetzen, meinen Körper mit Proteinen, Fetten und Kohlenhydraten zu sättigen. Der folgende Datensatz zeigt, wie oft Renat jeden Monat Essen kocht:

Der erste Schritt bei der Berechnung der Varianz besteht darin, den Stichprobenmittelwert zu bestimmen, der in unserem Beispiel 7,8 Mal pro Monat beträgt. Die weiteren Berechnungen können mit Hilfe der folgenden Tabelle erleichtert werden.

Die letzte Phase der Varianzberechnung sieht wie folgt aus:

Für diejenigen, die alle Berechnungen auf einmal machen möchten, sieht die Gleichung so aus:

Verwendung der Raw-Count-Methode (Kochbeispiel)

Es gibt mehr effektive Methode Berechnung der Varianz, bekannt als "Raw Counting"-Methode. Obwohl die Gleichung auf den ersten Blick ziemlich umständlich erscheinen mag, ist sie tatsächlich nicht so beängstigend. Sie können dies überprüfen und dann entscheiden, welche Methode Ihnen am besten gefällt.

ist die Summe der einzelnen Datenwerte nach dem Quadrieren,

ist das Quadrat der Summe aller Datenwerte.

Verlieren Sie jetzt nicht den Verstand. Fassen wir das alles in Form einer Tabelle zusammen, dann werden Sie sehen, dass hier weniger Berechnungen anfallen als im vorigen Beispiel.

Wie Sie sehen können, ist das Ergebnis dasselbe wie bei der Verwendung der vorherigen Methode. Die Vorteile dieser Methode zeigen sich mit wachsendem Stichprobenumfang (n).

Varianzberechnung in Excel

Wie Sie wahrscheinlich bereits erraten haben, verfügt Excel über eine Formel, mit der Sie die Varianz berechnen können. Darüber hinaus finden Sie ab Excel 2010 4 Varianten der Dispersionsformel:

1) VAR.V – Gibt die Varianz des Samples zurück. Boolesche Werte und Text werden ignoriert.

2) VAR.G – Gibt die Populationsvarianz zurück. Boolesche Werte und Text werden ignoriert.

3) VASP – Gibt die Stichprobenvarianz zurück, wobei boolesche und Textwerte berücksichtigt werden.

4) VARP – Gibt die Varianz der Grundgesamtheit zurück, wobei logische und Textwerte berücksichtigt werden.

Sehen wir uns zunächst den Unterschied zwischen einer Stichprobe und einer Grundgesamtheit an. Der Zweck der deskriptiven Statistik besteht darin, Daten so zusammenzufassen oder darzustellen, dass man schnell ein großes Bild, sozusagen einen Überblick erhält. Mit der statistischen Inferenz können Sie Rückschlüsse auf eine Grundgesamtheit ziehen, die auf einer Stichprobe von Daten aus dieser Grundgesamtheit basieren. Die Grundgesamtheit stellt alle möglichen Ergebnisse oder Messungen dar, die für uns von Interesse sind. Eine Stichprobe ist eine Teilmenge einer Grundgesamtheit.

Uns interessiert beispielsweise die Gesamtheit einer Gruppe von Studierenden einer der Russische Universitäten und wir müssen die durchschnittliche Punktzahl der Gruppe bestimmen. Wir können die durchschnittliche Leistung der Schüler berechnen, und die resultierende Zahl ist dann ein Parameter, da die gesamte Bevölkerung in unsere Berechnungen einbezogen wird. Wenn wir jedoch den GPA aller Schüler in unserem Land berechnen möchten, dann ist diese Gruppe unsere Stichprobe.

Der Unterschied in der Formel zur Berechnung der Varianz zwischen Stichprobe und Grundgesamtheit liegt im Nenner. Wobei es für die Stichprobe gleich (n-1) ist und für die allgemeine Bevölkerung nur n.

Beschäftigen wir uns nun mit den Funktionen zur Berechnung der Varianz mit Endungen ABER, in deren Beschreibung gesagt wird, dass die Berechnung Text und logische Werte berücksichtigt. In diesem Fall interpretiert Excel bei der Berechnung der Varianz eines bestimmten Datensatzes, in dem nicht numerische Werte vorkommen, Text und falsche boolesche Werte als 0 und wahre boolesche Werte als 1.

Wenn Sie also über ein Array von Daten verfügen, ist es nicht schwierig, seine Varianz mit einer der oben aufgeführten Excel-Funktionen zu berechnen.

.

Umgekehrt, wenn ein nicht-negatives a.e. eine solche Funktion , dann gibt es ein absolut kontinuierliches Wahrscheinlichkeitsmaß für eine solche, nämlich ihre Dichte.

    Maßänderung im Lebesgue-Integral:

,

wobei jede Borel-Funktion bezüglich des Wahrscheinlichkeitsmaßes integrierbar ist.

Dispersion, Arten und Eigenschaften der Dispersion Das Konzept der Dispersion

Streuung in der Statistik ergibt sich als Standardabweichung der Einzelwerte des Merkmals zum Quadrat vom arithmetischen Mittel. Abhängig von den Ausgangsdaten wird sie durch die einfachen und gewichteten Varianzformeln bestimmt:

1. einfache Abweichung(für nicht gruppierte Daten) wird nach folgender Formel berechnet:

2. Gewichtete Varianz (für eine Variationsreihe):

wo n - Frequenz (Wiederholbarkeitsfaktor X)

Ein Beispiel zum Finden der Varianz

Diese Seite beschreibt ein Standardbeispiel zum Finden der Abweichung, Sie können sich auch andere Aufgaben ansehen, um sie zu finden

Beispiel 1. Bestimmung der Gruppe, des Gruppendurchschnitts, der Zwischengruppen- und der Gesamtvarianz

Beispiel 2. Finden der Varianz und des Variationskoeffizienten in einer Gruppierungstabelle

Beispiel 3. Finden der Varianz in einer diskreten Reihe

Beispiel 4. Wir haben die folgenden Daten für eine Gruppe von 20 Fernstudenten. Es ist notwendig, eine Intervallreihe der Merkmalsverteilung zu erstellen, den Mittelwert des Merkmals zu berechnen und seine Varianz zu untersuchen

Lassen Sie uns eine Intervallgruppierung erstellen. Lassen Sie uns den Bereich des Intervalls durch die Formel bestimmen:

wobei X max der Maximalwert des Gruppierungsmerkmals ist; X min ist der Mindestwert des Gruppierungsmerkmals; n ist die Anzahl der Intervalle:

Wir akzeptieren n=5. Der Schritt ist: h \u003d (192 - 159) / 5 \u003d 6,6

Machen wir eine Intervallgruppierung

Für weitere Berechnungen bauen wir eine Hilfstabelle auf:

X "i - die Mitte des Intervalls. (z. B. die Mitte des Intervalls 159 - 165,6 \u003d 162,3)

Das durchschnittliche Wachstum der Schüler wird durch die Formel des arithmetisch gewichteten Durchschnitts bestimmt:

Wir bestimmen die Dispersion nach der Formel:

Die Formel lässt sich wie folgt umrechnen:

Aus dieser Formel folgt das die Abweichung ist die Differenz zwischen dem Mittelwert der Quadrate der Optionen und dem Quadrat und dem Mittelwert.

Varianz in Variationsreihen mit gleichen Intervallen nach der Momentenmethode kann auf folgende Weise unter Verwendung der zweiten Eigenschaft der Streuung (Teilung aller Optionen durch den Wert des Intervalls) berechnet werden. Definition von Varianz, berechnet nach der Momentenmethode, nach folgender Formel ist weniger zeitaufwändig:

wobei i der Wert des Intervalls ist; A - bedingte Null, die praktisch ist, um die Mitte des Intervalls mit der höchsten Frequenz zu verwenden; m1 ist das Momentenquadrat erster Ordnung; m2 - Moment zweiter Ordnung

Feature-Varianz (Wenn sich in der statistischen Grundgesamtheit das Attribut so ändert, dass es nur zwei sich gegenseitig ausschließende Optionen gibt, dann wird diese Variabilität als Alternative bezeichnet) kann durch die Formel berechnet werden:

Setzen wir in diese Dispersionsformel q = 1- p ein, erhalten wir:

Arten der Dispersion

Totale Varianz misst die Variation eines Merkmals über die gesamte Population als Ganzes unter dem Einfluss aller Faktoren, die diese Variation verursachen. Sie ist gleich dem mittleren Quadrat der Abweichungen der Einzelwerte des Merkmals x vom Gesamtmittelwert x und kann als einfache Varianz oder gewichtete Varianz definiert werden.

Varianz innerhalb der Gruppe charakterisiert zufällige Variation, d.h. Teil der Variation, der auf den Einfluss nicht berücksichtigter Faktoren zurückzuführen ist und nicht von dem der Gruppierung zugrunde liegenden Merkmalsfaktor abhängt. Eine solche Varianz ist gleich dem mittleren Quadrat der Abweichungen der Einzelwerte eines Merkmals innerhalb der Gruppe X vom arithmetischen Mittel der Gruppe und kann als einfache Varianz oder als gewichtete Varianz berechnet werden.

Auf diese Weise, Varianzmaße innerhalb der Gruppe Variation eines Merkmals innerhalb einer Gruppe und wird durch die Formel bestimmt:

wo xi - Gruppendurchschnitt; ni ist die Anzahl der Einheiten in der Gruppe.

Zum Beispiel zeigen gruppeninterne Varianzen, die bei der Untersuchung des Einflusses der Qualifikation der Arbeitnehmer auf das Niveau der Arbeitsproduktivität in einem Geschäft bestimmt werden müssen, Schwankungen im Output in jeder Gruppe, die durch alle möglichen Faktoren verursacht werden (technischer Zustand der Ausrüstung, Verfügbarkeit von Werkzeugen und Materialien, Alter der Arbeiter, Arbeitsintensität usw.), bis auf Unterschiede in der Qualifikationskategorie (innerhalb der Gruppe haben alle Arbeiter die gleiche Qualifikation).

Der Durchschnitt der gruppeninternen Varianzen spiegelt die zufällige Variation wider, dh den Teil der Variation, der unter dem Einfluss aller anderen Faktoren mit Ausnahme des Gruppierungsfaktors aufgetreten ist. Es wird nach der Formel berechnet:

Intergruppenvarianz charakterisiert die systematische Variation des resultierenden Merkmals, die auf den Einfluss des der Gruppierung zugrunde liegenden Merkmalsfaktors zurückzuführen ist. Er ist gleich dem mittleren Quadrat der Abweichungen der Gruppenmittelwerte vom Gesamtmittelwert. Die Varianz zwischen den Gruppen wird nach folgender Formel berechnet: