Aufbau einer Verteilerreihe. Statistische Zusammenfassung und Gruppierung. Statistische Verteilungsreihen. Beispiele für Problemlösungen

2. Konzept der Distributionsserie. Diskrete und Intervallverteilungsreihen

Verteilerreihen Gruppierungen einer besonderen Art werden genannt, bei denen für jedes Merkmal, jede Merkmalsgruppe oder Merkmalsklasse die Anzahl der Einheiten in der Gruppe oder deren Anteil an der Gesamtheit bekannt ist. Jene. Vertriebsserien- eine geordnete Menge von Attributwerten, die in aufsteigender oder absteigender Reihenfolge mit den entsprechenden Gewichtungen angeordnet sind. Verteilungsreihen können entweder quantitativ oder nach Attributen erstellt werden.

Quantitativ aufgebaute Verteilungsreihen werden als Variationsreihen bezeichnet. Sie sind diskret und intervall... Eine Verteilungsreihe kann auf einem sich kontinuierlich ändernden Merkmal (wenn ein Merkmal innerhalb eines beliebigen Intervalls beliebige Werte annehmen kann) und auf einem diskret variierenden Merkmal (annimmt streng definierte ganzzahlige Werte) aufgebaut werden.

Diskret Die Variationsreihe der Verteilung ist eine Reihe von Optionen mit ihren entsprechenden Häufigkeiten oder Einzelheiten. Varianten einer diskreten Reihe sind diskrete sich diskontinuierlich ändernde Werte eines Merkmals, in der Regel ist dies das Ergebnis einer Zählung.

Diskret

Variationsreihen werden normalerweise erstellt, wenn die Werte des untersuchten Merkmals um mindestens einen endlichen Wert voneinander abweichen können. In diskreten Reihen werden Punktwerte des Merkmals angegeben. Beispiel : Verteilung der von Geschäften pro Monat verkauften Herrenanzüge nach Größe.

Intervall

Eine Variationsreihe ist ein geordneter Satz von Variationsintervallen der Werte einer Zufallsvariablen mit den entsprechenden Häufigkeiten oder Häufigkeiten des Auftretens von Werten der Menge in jedem von ihnen. Intervallreihen wurden entwickelt, um die Verteilung eines sich ständig ändernden Merkmals zu analysieren, dessen Wert meistens durch Messen oder Wägen erfasst wird. Varianten einer solchen Serie werden gruppiert.

Beispiel : Verteilung der Einkäufe im Lebensmittelgeschäft nach Betrag.

Bezieht sich bei diskreten Variationsreihen der Frequenzgang direkt auf eine Variante der Reihe, so bezieht er sich bei Intervallreihen auf eine Gruppe von Varianten.

Es ist zweckmäßig, Verteilungsreihen anhand ihrer grafischen Darstellung zu analysieren, die eine Beurteilung der Verteilungsform und Regelmäßigkeiten ermöglicht. Eine diskrete Reihe wird im Diagramm als gestrichelte Linie angezeigt - Verteilungspolygon... Um es in einem rechteckigen Koordinatensystem zu konstruieren, werden die geordneten (geordneten) Werte des variablen Merkmals entlang der Abszissenachse im gleichen Maßstab aufgetragen, und eine Skala zum Ausdrücken von Häufigkeiten wird entlang der Ordinatenachse aufgetragen.

Intervallreihen werden dargestellt als Verteilungshistogramme(also Balkendiagramme).

Beim Erstellen eines Histogramms werden die Werte der Intervalle auf der Abszissenachse aufgetragen und die Häufigkeiten werden durch Rechtecke dargestellt, die in den entsprechenden Intervallen gebildet werden. Die Höhe der Balken sollte bei gleichem Abstand proportional zu den Frequenzen sein.

Jedes Histogramm kann in ein Verteilungspolygon umgewandelt werden, dazu müssen die Eckpunkte seiner Rechtecke mit Geraden verbunden werden.

2. Indexmethode zur Analyse des Einflusses der durchschnittlichen Produktion und des durchschnittlichen Personalbestands auf Veränderungen des Produktionsvolumens

Indexmethode Es wird verwendet, um die Dynamik zu analysieren und verallgemeinerte Indikatoren sowie Faktoren zu vergleichen, die die Änderung der Niveaus dieser Indikatoren beeinflussen. Mit Hilfe von Indizes ist es möglich, den Einfluss der durchschnittlichen Produktion und des durchschnittlichen Personalbestands auf die Veränderungen des Produktionsvolumens zu ermitteln. Diese Aufgabe wird durch den Aufbau eines Systems analytischer Indizes gelöst.

Der Index des Produktionsvolumens mit dem Index der durchschnittlichen Beschäftigtenzahl und dem Index des durchschnittlichen Outputs hängt in der gleichen Weise zusammen wie das Produktionsvolumen (Q) mit dem Output ( w) und die Zahl ( R) .

Daraus kann geschlossen werden, dass das Produktionsvolumen dem Produkt aus durchschnittlicher Produktion und durchschnittlicher Mitarbeiterzahl entspricht:

Q = w r, wobei Q das Produktionsvolumen ist,

w - durchschnittliche Leistung,

r - durchschnittlicher Personalbestand.

Wie Sie sehen, sprechen wir über den Zusammenhang von Phänomenen in der Statik: Das Produkt zweier Faktoren ergibt das Gesamtvolumen des wirksamen Phänomens. Es ist auch offensichtlich, dass diese Verbindung funktional ist, daher wird die Dynamik dieser Verbindung anhand von Indizes untersucht. Für das gegebene Beispiel ist dies das folgende System:

Jw × Jr = Jwr.

Zum Beispiel kann der Index des Produktionsvolumens Jwr als Index des produktiven Phänomens in zwei Indexfaktoren zerlegt werden: den Index der durchschnittlichen Produktion (Jw) und den Index der durchschnittlichen Mitarbeiterzahl (Jr):

Index Index Index

das Volumen des Durchschnitts

Produktionsleistung

wo J w- Index der Arbeitsproduktivität, berechnet nach der Laspeyres-Formel;

J r- der Index der Beschäftigtenzahl, berechnet nach der Paasche-Formel.

Indexsysteme werden verwendet, um den Einfluss einzelner Faktoren auf die Bildung des Niveaus des effektiven Indikators zu bestimmen, sie ermöglichen es, den Wert des Unbekannten durch die 2 bekannten Werte der Indizes zu bestimmen.

Auf der Grundlage des gegebenen Indexsystems ist es möglich, die absolute Zunahme des Produktionsvolumens, zerlegt in den Einfluss von Faktoren, zu ermitteln.

1. Gesamtzunahme des Produktionsvolumens:

wr = w 1 r 1 - ∑w 0 r 0.

2. Wachstum aufgrund der Wirkung des Indikators des durchschnittlichen Outputs:

wr / w = ∑w 1 r 1 - ∑w 0 r 1.

3. Wachstum aufgrund der Wirkung des Indikators für den durchschnittlichen Personalbestand:

wr / r = ∑w 0 r 1 - ∑w 0 r 0

wr = wr / w + ∆wr / r.

Beispiel. Folgende Daten sind bekannt

Wir können feststellen, wie sich das Produktionsvolumen relativ und absolut verändert hat und wie einzelne Faktoren diese Veränderung beeinflusst haben.

Das Produktionsvolumen betrug:

im Basiszeitraum

w 0 * r 0 = 2000 * 90 = 180000,

und in der Berichterstattung

w 1 * r 1 = 2100 * 100 = 210.000.

Folglich stieg das Produktionsvolumen um 30.000 oder 1,16 %.

wr = ∑w 1 r 1 -∑w 0 r 0 = (210000-180000) = 30000

oder (210.000: 180.000) * 100 % = 1,16 %.

Diese Veränderung des Produktionsvolumens war zurückzuführen auf:

1) eine Erhöhung des durchschnittlichen Personalbestands um 10 Personen oder um 111,1 %

r 1 / r 0 = 100/90 = 1,11 oder 111,1%.

Absolut hat sich das Produktionsvolumen durch diesen Faktor um 20.000 erhöht:

w 0 r 1 – w 0 r 0 = w 0 (r 1 –r 0) = 2000 (100–90) = 20000.

2) eine Erhöhung der durchschnittlichen Leistung um 105% oder 10.000:

w 1 r 1 / w 0 r 1 = 2100 * 100/2000 * 100 = 1,05 oder 105 %.

In absoluten Zahlen beträgt der Anstieg:

w 1 r 1 - w 0 r 1 = (w 1 -w 0) r 1 = (2100-2000) * 100 = 10000.

Daher war der kombinierte Einfluss der Faktoren:

1. In absoluten Zahlen

10000 + 20000 = 30000

2. Relativ gesehen

1,11 * 1,05 = 1,16 (116%)

Folglich beträgt der Anstieg 1,16 %. Beide Ergebnisse wurden früher erhalten.

Das Wort "Index" bedeutet in der Übersetzung einen Index, einen Indikator. In der Statistik wird der Index als relativer Indikator interpretiert, der die Veränderung eines Phänomens in Zeit, Raum oder im Vergleich zum Plan charakterisiert. Da der Index ein relativer Wert ist, stimmen die Namen der Indizes mit den Namen der relativen Werte überein.

In den Fällen, in denen wir die zeitliche Veränderung verglichener Produkte analysieren, können wir die Frage aufwerfen, wie sich die Komponenten des Index (Preis, physisches Volumen, Produktionsstruktur oder Absatz bestimmter Produktarten) unter verschiedenen Bedingungen (bei unterschiedlichen Websites). In diesem Zusammenhang werden Indizes konstanter Zusammensetzung, variabler Zusammensetzung und struktureller Verschiebungen konstruiert.

Permanenter (fester) Zusammensetzungsindex - es ist ein Index, der die Dynamik des Durchschnitts für dieselbe feste Bevölkerungsstruktur charakterisiert.

Das Prinzip der Konstruktion eines Index mit konstanter Zusammensetzung besteht darin, den Einfluss von Änderungen der Gewichtungsstruktur auf den indexierten Wert zu eliminieren, indem der gewichtete Durchschnittsstand des indexierten Index mit denselben Gewichtungen berechnet wird.

Der konstante Zusammensetzungsindex ist in seiner Form identisch mit dem Gesamtindex. Die Aggregatform ist die gebräuchlichste.

Der Index der konstanten Zusammensetzung wird mit Gewichten berechnet, die auf der Ebene einer Periode festgelegt sind, und zeigt nur die Änderung des indizierten Wertes an. Der Constant Composition Index eliminiert den Einfluss von Änderungen der Gewichtungsstruktur auf den Indexwert, indem er den gewichteten Durchschnittsstand des Indexindex mit den gleichen Gewichtungen berechnet. Die Indizes der konstanten Zusammensetzung vergleichen Indikatoren, die auf der Grundlage einer konstanten Struktur von Phänomenen berechnet wurden.

Das Thema der mathematischen Statistik. Allgemeine und Stichprobenpopulation.

— Mathe-Statistik- eine Abteilung der Mathematik, die Methoden zur Auswahl, Gruppierung, Systematisierung und Analyse statistischer Daten untersucht, um wissenschaftlich fundierte Schlussfolgerungen zu erhalten.

— Statistische Daten- die numerischen Werte des betrachteten Attributs der untersuchten Objekte, die als Ergebnis eines Zufallsexperiments erhalten wurden.

Die mathematische Statistik ist eng mit der Wahrscheinlichkeitstheorie verwandt, aber im Gegensatz zur Wahrscheinlichkeitstheorie ist das mathematische Modell des Experiments unbekannt. In der mathematischen Statistik ist es aufgrund statistischer Daten erforderlich, eine unbekannte Wahrscheinlichkeitsverteilung zu ermitteln oder die Verteilungsparameter objektiv zu schätzen.

Methoden der mathematischen Statistik ermöglichen es Ihnen, optimale mathematische Modelle massiver, sich wiederholender Phänomene zu erstellen. Das Bindeglied zwischen Wahrscheinlichkeitstheorie und mathematischer Statistik sind die Grenzwertsätze der Wahrscheinlichkeitstheorie.

Derzeit werden statistische Methoden in fast allen Sektoren der Volkswirtschaft eingesetzt.

— Durchschnittsbevölkerung- statistische Daten aller untersuchten Objekte (manchmal - die Objekte selbst). Die allgemeine Bevölkerung wird oft als SV X angesehen.

— Stichprobe(Stichprobenpopulation) - statistische Daten von zufällig ausgewählten Objekten aus der allgemeinen Bevölkerung.

— Probengröße n(die Größe der allgemeinen Bevölkerung) n) - die Anzahl der zur Untersuchung ausgewählten Objekte aus der allgemeinen Bevölkerung (die Anzahl der Objekte in der allgemeinen Bevölkerung).

Beispiele von.

ein) Statistische Daten kann sein: das Wachstum der Schüler; die Anzahl der Verben (oder anderer Wortarten) in einem Textstück einer bestimmten Länge; die durchschnittliche Punktzahl des Zertifikats; Intelligenzniveau; die Anzahl der vom Disponenten gemachten Fehler usw.

B) Die allgemeine Bevölkerung vielleicht: das Wachstum aller Menschen, die Ränge aller Arbeiter des Werks, die Häufigkeit der Verwendung einer bestimmten Wortart in allen Werken des studierten Autors, die durchschnittliche Note des Zeugnisses aller Absolventen usw.



v) Probenahme können sein: - die Größe von 20 Schülern, die Anzahl der Verben in zufällig ausgewählten 50 homogenen Textpassagen mit einer Länge von 500 Token, die durchschnittliche Punktzahl eines Zertifikats von 100 Absolventen, die zufällig aus Schulen der Stadt ausgewählt wurden, usw.

Die Probe heißt Vertreter, wenn es das Eigentum der Allgemeinbevölkerung richtig widerspiegelt. Die Repräsentativität der Stichprobe wird durch eine Zufallsauswahl erreicht, wenn alle Objekte der Gesamtbevölkerung die gleiche Wahrscheinlichkeit haben, ausgewählt zu werden.

Damit die Stichprobe repräsentativ ist, werden verschiedene Methoden zur Auswahl von Studienobjekten verwendet.

Auswahlarten: einfach, mechanisch, seriell, typisch.

Einfach... Elemente werden zufällig aus der gesamten Population ausgewählt.

Mechanische Auswahl... Jedes 10 (25, 30 usw.) Objekt wird aus der allgemeinen Bevölkerung ausgewählt.

Seriennummer... In jeder Serie wird recherchiert (z. B. 10 Auszüge von 500 Token - 10 Serien werden aus dem Text ausgewählt).

Typisch... Die allgemeine Bevölkerung wird nach einem bestimmten Kriterium in typische Gruppen eingeteilt. Die Anzahl der aus jeder dieser Gruppen extrahierten Chargen wird durch das spezifische Gewicht dieser Gruppe in der Allgemeinbevölkerung bestimmt.

Statistische Verteilung der Stichprobe und deren grafische Darstellung.

Lassen Sie die SV X (allgemeine Bevölkerung) in Bezug auf ein Attribut untersuchen. Eine Reihe unabhängiger Tests sind in Arbeit. Als Ergebnis von Experimenten nimmt SV X einige Werte an. Der Satz der erhaltenen Werte ist ein Beispiel, und die Werte selbst sind statistische Daten.

Anfänglich wird die Stichprobe geordnet - die Position der statistischen Daten der Stichprobe in nicht absteigender Reihenfolge. Wir erhalten die Variationsreihe.

Variationsserie ist eine geordnete Stichprobe.

Diskrete statistische Reihen

Wenn die allgemeine Bevölkerung ein diskreter RV ist, wird eine diskrete statistische Reihe (statistische Verteilung) erstellt.

Lassen Sie den Wert einmal im Beispiel erscheinen,

Mal,…, - mal.

Ich-das Möglichkeit Probenahme; - Frequenz i-te Varianten Die Häufigkeit zeigt an, wie oft die angegebene Variante in der Stichprobe vorgekommen ist.

- relative Frequenz i-te Optionen

(zeigt an, um welchen Teil der Probe es sich handelt).

Die statistische Verteilung ist die Übereinstimmung zwischen den Stichprobenvarianten und ihren Häufigkeiten oder relativen Häufigkeiten.

Für DSV kann die statistische Verteilung in Form einer Tabelle dargestellt werden – eine statistische Reihe von Häufigkeiten oder eine statistische Reihe von relativen Häufigkeiten.

Statistische Frequenzreihe Statistische Reihe

relative Häufigkeiten

........
........
........
........

Zur Klarheit der Darstellung der statistischen Verteilung der Stichprobe werden "Graphen" der statistischen Verteilung erstellt: ein Polygon und ein Histogramm.

Frequenzpolygon(relative Häufigkeiten) – eine grafische Darstellung einer diskreten statistischen Reihe – eine gestrichelte Linie, die die Punkte in Reihe verbindet [für ein Polygon relativer Häufigkeiten].

Beispiel. Der Forscher interessiert sich für das Wissen der Bewerber in der Mathematik. Es werden 10 Bewerber ausgewählt und deren Noten in diesem Fach festgehalten. Die folgende Probe wurde erhalten: 5; 4; 4; 3; 2; 5; 4; 3; 4; 5.

a) Präsentieren Sie die Probe in Form einer Variationsserie;

b) Erstellen einer statistischen Reihe von Häufigkeiten und relativen Häufigkeiten;

c) Zeichnen Sie ein Polygon relativer Häufigkeiten für die resultierende Reihe.

a) Lassen Sie uns die Stichprobe ordnen, d.h. wir ordnen die Mitglieder der Stichprobe in nicht abnehmender Reihenfolge an. Wir erhalten die Variationsreihe: 2; 3; 3; 4; 4; 4; 4; 5; 5; 5.

b) Konstruieren wir eine statistische Reihe von Häufigkeiten (die Übereinstimmung zwischen den Stichprobenvarianten und ihren Häufigkeiten) und eine statistische Reihe von relativen Häufigkeiten (die Übereinstimmung zwischen den Stichprobenvarianten und ihren relativen Häufigkeiten).

0,1 0,2 0,4 0,3

Statistische Frequenzreihe Statistische Reihe rel. Frequenzen

1 + 2 + 4 + 3 = 10 = n 0,1 + 0,2 + 0,4 + 0,3 = 1.

Polygon der relativen Häufigkeiten.


Höhere Berufsausbildung

"RUSSISCHE AKADEMIE DER VOLKSWIRTSCHAFT UND

ÖFFENTLICHER DIENST UNTER DEM PRÄSIDENT

RUSSISCHE FÖDERATION"

(Niederlassung Kaluga)

Institut für Naturwissenschaften und mathematische Disziplinen

PRÜFUNG

Nach Disziplin "Statistik"

Studentin ___ Mayboroda Galina Jurjewna ______

Korrespondenzabteilung, Fakultät für Staats- und Gemeindeverwaltung, Gruppe G-12-V

Lehrer ____________________ Hamer G.V.

Ph.D., außerordentlicher Professor

Kaluga-2013

Ziel 1.

Aufgabe 1.1. 4

Aufgabe 1.2. 16

Aufgabe 1.3. 24

Aufgabe 1.4. 33

Ziel 2.

Aufgabe 2.1. 43

Aufgabe 2.2. 48

Aufgabe 2.3. 53

Aufgabe 2.4. 58

Ziel 3.

Aufgabe 3.1. 63

Aufgabe 3.2. 68

Aufgabe 3.3. 73

Aufgabe 3.4. 79

Aufgabe 4.

Aufgabe 4.1. 85

Aufgabe 4.2. 88

Aufgabe 4.3. 90

Aufgabe 4.4. 93

Liste der verwendeten Quellen. 96

Ziel 1.

Aufgabe 1.1.

Es gibt folgende Daten über die Produktion und die Höhe des Gewinns der Unternehmen der Region (Tabelle 1).

Tabelle 1

Daten zum Output und zur Höhe der Gewinne der Unternehmen

Firmennummer Produktionsleistung, Mio. Rub. Gewinn, Millionen Rubel Firmennummer Produktionsleistung, Mio. Rub. Gewinn, Millionen Rubel
63,0 6,7 56,0 7,2
48,0 6,2 81,0 9,6
39,0 6,5 55,0 6,3
28,0 3,0 76,0 9,1
72,0 8,2 54,0 6,0
61,0 7,6 53,0 6,4
47,0 5,9 68,0 8,5
37,0 4,2 52,0 6,5
25,0 2,8 44,0 5,0
60,0 7,9 51,0 6,4
46,0 5,5 50,0 5,8
34,0 3,8 65,0 6,7
21,0 2,1 49,0 6,1
58,0 8,0 42,0 4,8
45,0 5,7 32,0 4,6

Nach den Ausgangsdaten:

1. Erstellen Sie eine statistische Reihe zur Verteilung der Unternehmen nach Leistung, indem Sie in gleichen Abständen fünf Gruppen bilden.

Zeichnen Sie die Diagramme der Verteilungsreihen: Polygon, Histogramm, kumulativ. Bestimmen Sie den Wert der Mode und des Medians grafisch.

2. Berechnen Sie die Merkmale der Verteilung der Unternehmen nach Output: arithmetisches Mittel, Varianz, Standardabweichung, Variationskoeffizient.

Machen Sie eine Schlussfolgerung.

3. Stellen Sie mit der Methode der analytischen Gruppierung das Vorhandensein und die Art der Korrelation zwischen dem Wert der hergestellten Produkte und der Höhe des Gewinns pro Unternehmen fest.

4. Messen Sie die Enge der Korrelation zwischen den Kosten der produzierten Güter und der Höhe des Gewinns durch das empirische Korrelationsverhältnis.

Ziehen Sie allgemeine Schlussfolgerungen.

Lösung:

Lassen Sie uns eine statistische Verteilungsreihe konstruieren

Um eine Intervallvariationsreihe zu erstellen, die die Verteilung der Unternehmen in Bezug auf die Produktion charakterisiert, müssen der Wert und die Grenzen der Intervalle der Reihen berechnet werden.

Beim Konstruieren einer Reihe mit gleichen Intervallen ist der Wert des Intervalls h bestimmt durch die Formel:

x max und x min- die größten und kleinsten Werte des Attributs in der untersuchten Gruppe von Unternehmen;

k- die Anzahl der Gruppen in der Intervallserie.

Anzahl Gruppen k in der Aufgabenbedingung angegeben. k= 5.

x max= 81 Millionen Rubel, x min= 21 Millionen Rubel.

Berechnung der Intervallgröße:

Millionen Rubel

Durch sukzessives Addieren des Wertes des Intervalls h = 12 Millionen Rubel. bis zur unteren Grenze des Intervalls erhalten wir folgende Gruppen:

Gruppe 1: 21 - 33 Millionen Rubel.

Gruppe 2: 33 - 45 Millionen Rubel;

Gruppe 3: 45 - 57 Millionen Rubel.

Gruppe 4: 57 - 69 Millionen Rubel.

Gruppe 5: 69 - 81 Millionen Rubel.

Um eine Intervallreihe zu erstellen, muss die Anzahl der Unternehmen berechnet werden, die in jeder Gruppe enthalten sind ( Gruppenfrequenzen).

Das Verfahren zur Gruppierung von Unternehmen nach Produktionsvolumen ist in Hilfstabelle 2 dargestellt. Spalte 4 dieser Tabelle ist erforderlich, um eine analytische Gruppierung zu bilden (Punkt 3 der Aufgabe).

Tabelle 2

Tabelle zum Zeichnen einer Intervallverteilungsreihe und

analytische Gruppe

Unternehmensgruppen nach Produktionsvolumen, Mio. Rub. Firmennummer Produktionsleistung, Mio. Rub. Gewinn, Millionen Rubel
21-33 21,0 2,1
25,0 2,8
28,0 3,0
32,0 4,6
Gesamt 106,0 12,5
33-45 34,0 3,8
37,0 4,2
39,0 6,5
42,0 4,8
44,0 5,0
Gesamt 196,0 24,3
45-57 45,0 5,7
46,0 5,5
47,0 5,9
48,0 6,2
49,0 6,1
50,0 5,8
51,0 6,4
52,0 6,5
53,0 6,4
54,0 6,0
55,0 6,3
56,0 7,2
Gesamt 606,0 74,0
57-69 58,0 8,0
60,0 7,9
61,0 7,6
63,0 6,7
65,0 6,7
68,0 8,5
Gesamt 375,0 45,4
69-81 72,0 8,2
76,0 9,1
81,0 9,6
Gesamt 229,0 26,9
Gesamt 183,1

Auf der Grundlage der Gruppenzusammenfassungszeilen "Gesamt" der Tabelle 3 wird eine zusammenfassende Tabelle 3 gebildet, die die Intervallreihen der Verteilung der Unternehmen nach der Produktionsmenge darstellt.

Tisch 3

Eine Reihe von Unternehmensverteilungen nach Produktionsvolumen

Ausgabe. Die konstruierte Gruppierung zeigt, dass die Verteilung der Unternehmen in Bezug auf die Produktion nicht einheitlich ist. Am häufigsten sind Unternehmen mit einem Produktionsvolumen von 45 bis 57 Millionen Rubel. (12 Unternehmen). Am seltensten sind Unternehmen mit einem Produktionsvolumen von 69 bis 81 Millionen Rubel. (3 Unternehmen).

Lassen Sie uns die Graphen der Verteilungsreihe erstellen.

Polygon häufiger verwendet, um diskrete Reihen darzustellen. Um ein Polygon in einem rechteckigen Koordinatensystem zu konstruieren, werden die Werte des Arguments auf der Abszissenachse aufgetragen, dh die Optionen (bei Intervallvariationsserien wird die Mitte des Intervalls als Argument genommen) und die Häufigkeit Werte sind auf der Ordinatenachse. Weiterhin werden in diesem Koordinatensystem Punkte eingezeichnet, deren Koordinaten Paare der entsprechenden Zahlen aus der Variationsreihe sind. Die resultierenden Punkte werden sequentiell durch gerade Liniensegmente verbunden. Das Polygon ist in Abbildung 1 dargestellt.

Balkendiagramm - Balkendiagramm. Es ermöglicht Ihnen, die Symmetrie der Verteilung zu bewerten. Das Histogramm ist in Abbildung 2 dargestellt.

Abbildung 1 - Polygon der Unternehmensverteilung nach Volumen

Produktionsleistung

Mode

Abbildung 2 - Histogramm der Verteilung der Unternehmen nach Volumen

Produktionsleistung

Mode- der Wert eines Merkmals, das in der untersuchten Population am häufigsten vorkommt.

Für die Intervallserie kann der Modus grafisch durch das Histogramm bestimmt werden (Abbildung 2). Dazu wird das höchste Rechteck ausgewählt, das in diesem Fall modal ist (45 - 57 Millionen Rubel). Dann wird der rechte Scheitelpunkt des modalen Rechtecks ​​mit der oberen rechten Ecke des vorherigen Rechtecks ​​verbunden. Und der linke Scheitelpunkt des modalen Rechtecks ​​ist mit der oberen linken Ecke des nachfolgenden Rechtecks. Ferner wird von ihrem Schnittpunkt eine Senkrechte auf die Abszissenachse abgesenkt. Die Abszisse des Schnittpunktes dieser Geraden ist der Verteilungsmodus.

Mln. reiben.

Ausgabe. In der betrachteten Gruppe von Unternehmen sind am häufigsten Unternehmen mit einer Produktionsleistung von 52 Millionen Rubel anzutreffen.

Cumulata - gebrochene Kurve. Es wird nach den akkumulierten Frequenzen gebaut (berechnet in Tabelle 4). Die kumulative beginnt an der unteren Grenze des ersten Intervalls (21 Millionen Rubel), die kumulierte Häufigkeit wird an der oberen Grenze des Intervalls hinterlegt. Die Kumulation ist in Abbildung 3 dargestellt.

Median

Abbildung 3 - Kumulative Verteilung der Unternehmen nach Volumen

Produktionsleistung

Median Me- Dies ist der Wert des Merkmals, der in die Mitte der Rangfolge fällt. Auf beiden Seiten des Medians befindet sich die gleiche Anzahl von Bevölkerungseinheiten.

In einer Intervallserie kann der Median aus der Summenkurve grafisch ermittelt werden. Um den Median von einem Punkt auf der Skala der akkumulierten Häufigkeiten, der 50% entspricht (30: 2 = 15), zu bestimmen, wird eine Gerade parallel zur Abszissenachse gezogen, bis sie die Summe schneidet. Dann wird vom Schnittpunkt der angegebenen Geraden mit der Summe eine Senkrechte auf die Abszissenachse abgesenkt. Die Abszisse des Schnittpunktes ist der Median.

Mln. reiben.

Ausgabe. In der betrachteten Gruppe von Unternehmen hat die Hälfte der Unternehmen ein Produktionsvolumen von nicht mehr als 52 Millionen Rubel und die andere Hälfte - mindestens 52 Millionen Rubel.


Ähnliche Informationen.


Statistische Verteilungsreihen- Dies ist eine geordnete Verteilung von Bevölkerungseinheiten in Gruppen nach einem bestimmten unterschiedlichen Merkmal.
Je nach dem Merkmal, das der Bildung einer Verteilungsreihe zugrunde liegt, gibt es Attributive und Variationsreihen der Verteilung.

Das Vorhandensein eines gemeinsamen Merkmals ist die Grundlage für die Bildung einer statistischen Grundgesamtheit, die das Ergebnis der Beschreibung oder Messung von gemeinsamen Merkmalen der Forschungsgegenstände ist.

Das Studienfach Statistik sind wechselnde (wechselnde) Vorzeichen oder statistische Vorzeichen.

Arten von statistischen Zeichen.

Verteilungsreihen heißen attributiv nach Qualitätskriterien. Attributiv Ist ein Schild, das einen Namen hat (zB Beruf: Näherin, Lehrerin etc.).
Es ist üblich, mehrere Verteilungen in Form von Tabellen anzuordnen. Tisch 2.8 zeigt die attributive Verteilungsreihe.
Tabelle 2.8 - Verteilung der Arten der Rechtshilfe durch Rechtsanwälte für Bürger einer der Regionen der Russischen Föderation.

Variationsserie Sind die Werte des Merkmals (oder Werteintervalle) und deren Häufigkeiten.
Die Verteilungsreihen heißen Variationsreihen quantitativ aufgebaut. Jede Variationsserie besteht aus zwei Elementen: Optionen und Frequenzen.
Als Varianten gelten die einzelnen Werte des Merkmals, die es in der Variantenreihe einnimmt.
Häufigkeiten sind die Anzahl der einzelnen Varianten bzw. jeder Gruppe der Variantenreihen, d.h. das sind Zahlen, die zeigen, wie oft die eine oder andere Variante in einer Verteilungsreihe vorkommt. Die Summe aller Häufigkeiten bestimmt die Anzahl der Gesamtbevölkerung, ihr Volumen.
Häufigkeiten sind Häufigkeiten, die in Bruchteilen von eins oder als Prozentsatz der Gesamtzahl ausgedrückt werden. Dementsprechend beträgt die Summe der Häufigkeiten 1 oder 100 %. Die Variationsreihe ermöglicht es uns, die Form des Verteilungsgesetzes anhand von tatsächlichen Daten abzuschätzen.

Je nach Art der Variation des Merkmals werden sie unterschieden diskrete und intervallartige Variationsreihen.
Ein Beispiel für eine diskrete Variationsreihe ist in der Tabelle angegeben. 2.9.
Tabelle 2.9 - Verteilung der Familien nach der Anzahl der belegten Zimmer in einzelnen Wohnungen im Jahr 1989 in der Russischen Föderation.

Die erste Spalte der Tabelle zeigt die Varianten der diskreten Variationsreihe, die zweite - die Häufigkeiten der Variationsreihe, die dritte - die Häufigkeitsindikatoren.

Variationsserie

In der Allgemeinbevölkerung wird ein gewisses quantitatives Merkmal untersucht. Eine Volumenprobe wird zufällig daraus gezogen n, d. h. die Anzahl der Elemente in der Stichprobe ist n... In der ersten Phase der statistischen Verarbeitung, Reichweite Probenahme, d.h. Nummern Ordnen x 1, x 2, ..., x n Aufsteigend. Jeder beobachtete Wert x ich namens Variante... Frequenz ich bin Ist die Anzahl der Beobachtungen des Wertes x ich in der Probe. Relative Häufigkeit (Häufigkeit) ich bin Ist das Frequenzverhältnis ich bin zur Stichprobengröße n: .
Beim Studium der Variationsreihen werden auch die Konzepte der akkumulierten Häufigkeit und der akkumulierten Häufigkeit verwendet. Lassen x irgendeine Zahl. Dann die Anzahl der Optionen , deren Werte kleiner sind x, heißt akkumulierte Frequenz: für x i n heißt die akkumulierte Frequenz w i max.
Ein Merkmal heißt diskret variiert, wenn sich seine einzelnen Werte (Varianten) um einen endlichen Wert (meist eine ganze Zahl) voneinander unterscheiden. Die Variationsreihe eines solchen Merkmals wird als diskrete Variationsreihe bezeichnet.

Tabelle 1. Gesamtansicht der diskreten Variationsreihen von Frequenzen

Kennwertex ich x 1 x 2 x nein
Frequenzenich bin m 1 m2 m n

Ein Merkmal wird als kontinuierlich variierend bezeichnet, wenn seine Werte um einen beliebig kleinen Betrag voneinander abweichen, d.h. das Attribut kann in einem bestimmten Intervall beliebige Werte annehmen. Eine kontinuierliche Variationsreihe für ein solches Merkmal wird Intervall genannt.

Tabelle 2. Allgemeine Ansicht der Intervallvariationsreihe von Frequenzen

Tabelle 3. Grafische Darstellungen der Variantenserien

ReihePolygon oder HistogrammEmpirische Verteilungsfunktion
Diskret
Intervall
Betrachtet man die Ergebnisse der Beobachtungen, bestimmen sie, wie viele Werte der Optionen in jedes bestimmte Intervall fielen. Es wird davon ausgegangen, dass jedes Intervall zu einem seiner Enden gehört: entweder ist es in allen Fällen links (häufiger) oder in allen Fällen rechts, und die Häufigkeiten oder Häufigkeiten zeigen die Anzahl der Optionen an, die in den angegebenen Grenzen enthalten sind. Unterschiede ein ich - ein ich +1 werden Teilintervalle genannt. Um spätere Berechnungen zu vereinfachen, kann die Intervallvariationsreihe durch eine herkömmlich diskrete ersetzt werden. In diesem Fall ist der Medianwert ich-tes Intervall wird als Variante genommen x ich, und die entsprechende Intervallfrequenz ich bin- für die Häufigkeit dieses Intervalls.
Zur grafischen Darstellung von Variationsreihen werden am häufigsten Polygon, Histogramm, Summenkurve und empirische Verteilungsfunktion verwendet.

Tisch 2.3 (Gruppierung der Bevölkerung Russlands nach durchschnittlichem Pro-Kopf-Einkommen im April 1994) wird vorgestellt Intervallvariationsserie.
Es ist praktisch, Verteilungsreihen mit Hilfe einer grafischen Darstellung zu analysieren, die es ermöglicht, die Form der Verteilung zu beurteilen. Eine klare Vorstellung von der Art der Änderung der Frequenzen der Variationsreihe ist gegeben durch Polygon und Histogramm.
Das Polygon wird verwendet, wenn diskrete Variationsreihen angezeigt werden.
Stellen wir uns beispielsweise die Verteilung des Wohnungsbestandes nach Wohnungstypen grafisch dar (Tabelle 2.10).
Tabelle 2.10 - Verteilung des Wohnungsbestandes des Stadtgebiets nach Wohnungstypen (beliebige Nummern).


Reis. Wohnungsbestandsverteilungspolygon


Auf der Ordinatenachse können nicht nur die Werte von Frequenzen, sondern auch die Frequenzen der Variationsreihen aufgetragen werden.
Das Histogramm wird für das Bild der Intervallvariationsreihe erstellt... Beim Erstellen eines Histogramms werden die Werte der Intervalle auf der Abszissenachse aufgetragen und die Häufigkeiten werden durch Rechtecke dargestellt, die in den entsprechenden Intervallen gebildet werden. Die Höhe der Balken sollte bei gleichem Abstand proportional zu den Frequenzen sein. Ein Histogramm ist ein Diagramm, in dem eine Reihe in Form von nebeneinander liegenden Balken dargestellt wird.
Lassen Sie uns die in der Tabelle angegebenen Intervallverteilungsreihen grafisch darstellen. 2.11.
Tabelle 2.11 - Verteilung der Familien nach Wohnfläche pro Person (willkürliche Zahlen).
N p / p Familiengruppen nach Wohnfläche pro Person Die Anzahl der Familien mit einer bestimmten Wohnfläche Kumulierte Anzahl von Familien
1 3 – 5 10 10
2 5 – 7 20 30
3 7 – 9 40 70
4 9 – 11 30 100
5 11 – 13 15 115
GESAMT 115 ----


Reis. 2.2. Histogramm der Verteilung der Familien nach Wohnfläche pro Person


Mit den Daten der akkumulierten Reihe (Tabelle 2.11) konstruieren wir kumulative Verteilung.


Reis. 2.3. Kumulierte Verteilung der Familien nach Wohnfläche pro Person


Die Darstellung der Variationsreihen in Form von Kumulaten ist besonders effektiv für Variationsreihen, deren Häufigkeiten in Bruchteilen oder Prozentsätzen zur Summe der Häufigkeiten der Reihe ausgedrückt werden.
Wenn wir bei der grafischen Darstellung der Variationsreihen in Form von Kumulaten die Achsen ändern, erhalten wir spitz... In Abb. 2.4 zeigt die auf der Grundlage der Daten in Tabelle gebaute Ogive. 2.11.
Ein Histogramm kann in ein Verteilungspolygon umgewandelt werden, indem die Mittelpunkte der Seiten der Rechtecke ermittelt und diese Punkte dann mit geraden Linien verbunden werden. Das resultierende Verteilungspolygon ist in Abb. 2.2 mit gestrichelter Linie.
Beim Erstellen eines Histogramms der Verteilung der Variationsreihen mit ungleichen Intervallen auf der Ordinatenachse werden nicht die Häufigkeiten aufgetragen, sondern die Dichte der Merkmalsverteilung in den entsprechenden Intervallen.
Die Verteilungsdichte ist die pro Einheitsintervallbreite berechnete Häufigkeit, d.h. wie viele Einheiten sich in jeder Gruppe pro Einheit des Intervalls befinden. Ein Beispiel für die Berechnung der Verteilungsdichte ist in der Tabelle dargestellt. 2.12.
Tabelle 2.12 - Verteilung der Unternehmen nach Anzahl der Beschäftigten (bedingte Zahlen)
N p / p Unternehmensgruppen nach Anzahl der Beschäftigten, Personen Anzahl Unternehmen Intervallgröße, Personen Verteilungsdichte
EIN 1 2 3=1/2
1 Bis zu 20 15 20 0,75
2 20 – 80 27 60 0,25
3 80 – 150 35 70 0,5
4 150 – 300 60 150 0,4
5 300 – 500 10 200 0,05
GESAMT 147 ---- ----

Zur grafischen Darstellung der Variationsreihen auch verwendbar Summenkurve... Mit Hilfe von Kumulaten (Summenkurve) wird eine Reihe von akkumulierten Häufigkeiten angezeigt. Die akkumulierten Häufigkeiten werden durch sequentielles Aufsummieren der Häufigkeiten nach Gruppen bestimmt und zeigen, wie viele Einheiten der Grundgesamtheit einen charakteristischen Wert haben, der nicht größer als der betrachtete Wert ist.


Reis. 2.4. Verteilung der Familien nach Wohnfläche pro Person

Bei der Bildung der Kumulate der Intervallvariationsserie werden die Varianten der Serie entlang der Abszissenachse aufgetragen und die akkumulierten Frequenzen werden entlang der Ordinatenachse aufgetragen.

Laborarbeit Nr. 1. Primäre Verarbeitung statistischer Daten

Verteilungsreihen auftragen

Die geordnete Verteilung der Bevölkerungseinheiten in Gruppen nach einem beliebigen Merkmal heißt nahe Verteilung ... In diesem Fall kann das Merkmal sowohl quantitativ sein, dann heißt die Reihe Variationen , und hochwertig, dann heißt die Serie attributiv ... So kann beispielsweise die Bevölkerung einer Stadt nach Altersgruppen in einer Variationsreihe oder nach Berufsangehörigen einer attributiven Reihe verteilt werden (natürlich können noch viele weitere qualitative und quantitative Merkmale für die Konstruktion von Verteilungsreihen vorgeschlagen werden, die Auswahl von ein Merkmal wird durch die Aufgabe einer statistischen Studie bestimmt).

Jede Verteilungsreihe zeichnet sich durch zwei Elemente aus:

- Möglichkeit(x ich) - Dies sind die einzelnen Werte des Merkmals der Einheiten der Stichprobenpopulation. Bei der Variationsreihe nimmt die Variante Zahlenwerte an, bei der attributiven - qualitativen (zB x = "Beamter");

- Frequenz(n ich) Ist eine Zahl, die angibt, wie oft ein bestimmter Wert eines Merkmals auftritt. Wird die Häufigkeit als relative Zahl ausgedrückt (d. h. die Anteile der Elemente der Grundgesamtheit, die einem gegebenen Wert der Optionen entsprechen, am Gesamtvolumen der Grundgesamtheit), dann heißt sie relative Frequenz oder häufig.

Der Variationsbereich kann sein:

- diskret wenn das zu untersuchende Merkmal durch eine bestimmte Zahl (normalerweise eine ganze Zahl) gekennzeichnet ist.

- Intervall wenn die Grenzen "von" und "bis" für ein sich ständig änderndes Merkmal bestimmt werden. Die Intervallreihe wird auch gebildet, wenn die Wertemenge des diskret variierten Merkmals groß ist.

Eine Intervallreihe kann sowohl mit Intervallen gleicher Länge (gleiche Intervallreihen) als auch mit ungleichen Intervallen aufgebaut werden, wenn dies durch die Bedingungen einer statistischen Studie vorgegeben ist. Beispielsweise kann eine Reihe von Einkommensverteilungen der Bevölkerung mit folgenden Intervallen betrachtet werden:<5тыс р., 5-10 тыс р., 10-20 тыс.р., 20-50 тыс р., и т.д. Если цель исследования не определяет способ построения интервального ряда, то строится равноинтервальный ряд, число интервалов в котором определяется по формуле Стерджесса:



wobei k die Anzahl der Intervalle ist, n die Stichprobengröße. (Natürlich gibt die Formel normalerweise eine Bruchzahl an, und die der resultierenden Zahl am nächsten liegende ganze Zahl wird als Anzahl der Intervalle gewählt.) Die Länge des Intervalls wird in diesem Fall durch die Formel bestimmt

.

Variationsreihen können grafisch dargestellt werden als Histogramme(über jedem Intervall der Intervallreihe wird eine "Spalte" der Höhe gebaut, die der Häufigkeit in diesem Intervall entspricht), Verteilungspolygon(die unterbrochene Linie, die die Punkte verbindet ( x ich;n ich) oder kumuliert(er wird gemäß den akkumulierten Häufigkeiten gebildet, d. h. für jeden Wert eines Merkmals wird die Häufigkeit des Auftretens in einer Menge von Objekten mit einem Merkmalswert kleiner als ein bestimmter genommen).

Beim Arbeiten in Excel können die folgenden Funktionen zum Aufbau der Variationsreihe verwendet werden:

PRÜFEN( Daten-Array) - um den Stichprobenumfang zu bestimmen. Das Argument ist der Zellenbereich, in dem sich die abgetasteten Daten befinden.

ZÄHLENWENN ( Bereich; Kriterium) - kann verwendet werden, um eine attributive oder Variationsreihe zu konstruieren. Die Argumente sind der Bereich des Arrays der abgetasteten Werte des Merkmals und das Kriterium ist der Zahlen- oder Textwert des Merkmals oder die Nummer der Zelle, in der es sich befindet. Das Ergebnis ist die Häufigkeit des Auftretens dieses Wertes in der Stichprobe.

FREQUENZ( Daten-Array; Reihe von Intervallen) - um eine Variationsreihe zu erstellen. Die Argumente sind der Bereich des abgetasteten Arrays und die Intervallspalte. Wenn eine diskrete Reihe erstellt werden muss, werden hier die Werte der Optionen angezeigt, wenn Intervall - dann die oberen Grenzen der Intervalle (sie werden auch "Taschen" genannt). Da das Ergebnis eine Spalte mit Häufigkeiten ist, muss die Funktion durch Drücken von STRG + SHIFT + ENTER abgeschlossen werden. Beachten Sie, dass bei der Angabe eines Arrays von Intervallen bei der Einführung einer Funktion der letzte Wert darin nicht angegeben werden muss - alle Werte, die nicht in die vorherigen "Taschen" fielen, werden in die entsprechende "Tasche" gelegt. Manchmal hilft dies, den Fehler zu vermeiden, dass der größte Abtastwert nicht automatisch in die letzte "Tasche" passt.

Verwenden Sie außerdem für komplexe Gruppierungen (nach mehreren Kriterien) das Tool "Pivot-Tabellen". Sie können auch verwendet werden, um attributive und Variationsreihen zu konstruieren, aber dies verkompliziert die Aufgabe unnötig. Um eine Variationsreihe und ein Histogramm zu erstellen, gibt es außerdem ein „Histogramm“-Verfahren aus dem „Analysepaket“-Add-In (um die Add-Ins in Excel zu verwenden, müssen Sie sie zuerst herunterladen, sie sind nicht standardmäßig installiert).

Lassen Sie uns den Prozess der primären Datenverarbeitung anhand der folgenden Beispiele veranschaulichen.

Beispiel 1.1... es liegen Daten zur quantitativen Zusammensetzung von 60 Familien vor.

Variationsreihen und Verteilungspolygon konstruieren

Lösung.

Öffnen wir Excel-Tabellen. Geben wir das Datenarray in den Bereich A1: L5 ein. Wenn Sie ein Dokument in elektronischer Form (z. B. im Word-Format) studieren, reicht es aus, eine Tabelle mit Daten auszuwählen und in die Zwischenablage zu kopieren, dann Zelle A1 auszuwählen und die Daten einzufügen - sie belegen automatisch die entsprechende Reichweite. Berechnen wir die Stichprobengröße n - die Anzahl der Stichprobendaten, dafür geben wir die Formel = COUNT (A1: L5) in Zelle B7 ein. Beachten Sie, dass Sie zum Eingeben des erforderlichen Bereichs in die Formel die Bezeichnung nicht über die Tastatur eingeben müssen, sondern dass Sie ihn auswählen müssen. Bestimmen Sie die Mindest- und Höchstwerte in der Probe, indem Sie die Formel = MIN (A1: L5) in Zelle B8 und in Zelle B9: = MAX (A1: L5) eingeben.

Abb.1.1 Beispiel 1. Primärverarbeitung statistischer Daten in Excel-Tabellen

Als Nächstes bereiten wir eine Tabelle zum Erstellen einer Variationsreihe vor, indem wir Namen für die Spalte der Intervalle (Werte der Optionen) und die Spalte der Häufigkeiten eingeben. Geben Sie in der Spalte der Intervalle die Werte des Attributs vom Minimum (1) bis zum Maximum (6) ein und belegen Sie den Bereich B12: B17. Wählen Sie die Frequenzspalte, geben Sie die Formel = FREQUENZ (A1: L5; B12: B17) ein und drücken Sie die Tastenkombination STRG + SHIFT + ENTER

Abb.1.2 Beispiel 1. Konstruktion einer Variationsreihe

Zur Kontrolle berechnen wir die Summe der Häufigkeiten mit der SUM-Funktion (das Symbol der S-Funktion in der Gruppe „Bearbeiten“ auf der Registerkarte „Main“), die berechnete Summe muss mit der zuvor berechneten Stichprobengröße in Zelle B7 übereinstimmen.

Lassen Sie uns nun ein Polygon erstellen: Nachdem Sie den erhaltenen Frequenzbereich ausgewählt haben, wählen Sie den Befehl "Grafik" auf der Registerkarte "Einfügen". Standardmäßig sind die Werte auf der horizontalen Achse Ordnungszahlen - in unserem Fall von 1 bis 6, was mit den Werten der Optionen (Tarifbitnummern) übereinstimmt.

Der Zeilenname des Diagramms „Serie 1“ kann entweder mit der gleichen Option „Daten auswählen“ auf der Registerkarte „Design“ geändert oder einfach gelöscht werden.

Abbildung 1.3. Beispiel 1. Erstellen eines Frequenzpolygons

Beispiel 1.2... Es liegen Daten zu Schadstoffemissionen aus 50 Quellen vor:

10,4 18,6 10,3 26,0 45,0 18,2 17,3 19,2 25,8 18,7
28,2 25,2 18,4 17,5 41,8 14,6 10,0 37,8 10,5 16,0
18,1 16,8 38,5 37,7 17,9 29,0 10,1 28,0 12,0 14,0
14,2 20,8 13,5 42,4 15,5 17,9 19, 10,8 12,1 12,4
12,9 12,6 16,8 19,7 18,3 36,8 15,0 37,0 13,0 19,5

Erstellen Sie eine Reihe mit gleichen Intervallen, erstellen Sie ein Histogramm

Lösung

Geben wir ein Datenarray in ein Excel-Blatt ein, es wird den Bereich A1 einnehmen: J5 Wie in der vorherigen Aufgabe bestimmen wir die Stichprobengröße n, die minimalen und maximalen Werte in der Stichprobe. Da wir nun keine diskrete, sondern eine Intervallreihe benötigen und die Anzahl der Intervalle im Problem nicht spezifiziert ist, berechnen wir die Anzahl der Intervalle k mit der Sturgess-Formel. Geben Sie dazu in Zelle B10 die Formel = 1 + 3,322 * LOG10 (B7) ein.

Abbildung 1.4. Beispiel 2. Konstruktion einer Reihe mit gleichen Intervallen

Der resultierende Wert ist keine ganze Zahl, sondern ungefähr 6,64. Da für k = 7 die Länge der Intervalle als ganze Zahl ausgedrückt wird (im Gegensatz zu k = 6), wählen wir k = 7, indem wir diesen Wert in Zelle C10 eingeben. Wir berechnen die Länge des Intervalls d in Zelle B11, indem wir die Formel = (B9-B8) / C10 eingeben.

Legen wir ein Array von Intervallen fest, das eine Obergrenze für jedes der 7 Intervalle angibt. Dazu berechnen wir in Zelle E8 die Obergrenze des ersten Intervalls, indem wir die Formel eingeben = B8 + B11; in Zelle E9 die obere Grenze des zweiten Intervalls durch Eingabe der Formel = E8 + B11. Um die verbleibenden Werte der oberen Grenzen der Intervalle zu berechnen, fixieren Sie die Zellennummer B11 in der eingegebenen Formel mit dem $-Zeichen, sodass die Formel in Zelle E9 die Form = E8 + B $ 11 annimmt, und kopieren Sie die Inhalt der Zelle E9 in die Zellen E10-E14. Der letzte erhaltene Wert ist gleich dem Maximalwert in der zuvor in Zelle B9 berechneten Stichprobe.

Abbildung 1.5. Beispiel 2. Konstruktion einer Reihe mit gleichen Intervallen


Füllen wir nun das Array der "Taschen" mit der FREQUENCY-Funktion, wie es in Beispiel 1 gemacht wurde.

Abbildung 1.6. Beispiel 2. Konstruktion einer Reihe mit gleichen Intervallen

Lassen Sie uns ein Histogramm auf der Grundlage der erhaltenen Variationsreihe erstellen: Wählen Sie die Häufigkeitsspalte und wählen Sie „Histogramm“ auf der Registerkarte „Einfügen“. Nachdem wir das Histogramm erhalten haben, ändern wir die Beschriftungen der horizontalen Achse darin auf Werte im Intervallbereich. Dazu wählen wir die Option "Daten auswählen" auf der Registerkarte "Konstruktor". Wählen Sie im erscheinenden Fenster den Befehl "Modify" für den Abschnitt "Horizontal Axis Labels" und geben Sie den Wertebereich, Optionen, indem Sie ihn mit der "Maus" auswählen.

Abbildung 1.7. Beispiel 2. Erstellen eines Histogramms

Abbildung 1.8. Beispiel 2. Erstellen eines Histogramms