Статистикийн хураангуй ба бүлэглэл. Статистикийн тархалтын цуврал. Асуудлыг шийдвэрлэх жишээ. Өгөгдлийг бүлэглэх, түгээлтийн цувралыг зурах

Цуглуулсан статистикийн бүлгүүдийн үр дүнг ихэвчлэн тархалтын цуваа хэлбэрээр үзүүлдэг. Тархалтын цуврал гэдэг нь популяцийн нэгжийг судалж буй шинж чанарын дагуу бүлэгт хуваахыг хэлнэ.

Бүлэглэлийн үндсэн шинж чанараас хамааран тархалтын цувралыг атрибутив болон вариаци гэж хуваадаг. Хэрэв шинж чанар нь чанарын шинж чанартай бол тархалтын цувралыг атрибутив гэж нэрлэдэг. Атрибутив цувралын жишээ нь аж ахуйн нэгж, байгууллагуудыг өмчийн хэлбэрээр хуваарилах явдал юм (Хүснэгт 3.1-ийг үз).

Хэрэв тархалтын цувралыг бий болгосон шинж чанар нь тоон шинж чанартай бол цувралыг вариаци гэж нэрлэдэг.

Тархалтын вариацын цуврал нь үргэлж хоёр хэсгээс бүрдэнэ: хувилбар ба харгалзах давтамж (эсвэл давтамж). Хувилбар гэдэг нь тухайн шинж чанар нь популяцийн нэгжээр авч болох утга, давтамж нь өгөгдсөн шинж чанарын утгатай ажиглалтын нэгжийн тоо юм. Давтамжийн нийлбэр нь хүн амын эзлэхүүнтэй үргэлж тэнцүү байдаг. Заримдаа давтамжийн оронд давтамжийг тооцдог - эдгээр нь нэгийн фракцаар (дараа нь бүх давтамжийн нийлбэр нь 1) эсвэл нийт эзлэхүүний хувиар (давтамжийн нийлбэр 100% -тай тэнцүү) илэрхийлэгддэг давтамж юм. .

Вариацын цуваа нь дискрет ба интервал юм. Дискрет цувралын хувьд (Хүснэгт 3.7) сонголтуудыг тодорхой тоогоор, ихэвчлэн бүхэл тоогоор илэрхийлдэг.

Хүснэгт 3.8. Даатгалын компанид ажилчдыг ажлын цагаар хуваарилах
Компанид ажилласан хугацаа, бүтэн жил (сонголт) Ажиллагсдын тоо
Хүн (давтамж) нийт (давтамж)
нэг жил хүртэл 15 11,6
1 17 13,2
2 19 14,7
3 26 20,2
4 10 7,8
5 18 13,9
6 24 18,6
Нийт 129 100,0

Интервалын цувралд (Хүснэгт 3.2-ыг үзнэ үү) индикаторын утгыг интервалаар тогтооно. Интервалууд нь доод ба дээд гэсэн хоёр хил хязгаартай. Интервалууд нь нээлттэй эсвэл хаалттай байж болно. Нээлттэй хүмүүст хилийн аль нь ч байхгүй тул хүснэгтэд үзүүлэв. 3.2 Эхний интервал нь доод хүрээгүй, сүүлчийнх нь дээд хязгааргүй. Интервалын цуваа байгуулахдаа атрибутын утгуудын тархалтын шинж чанараас хамааран тэнцүү интервал ба тэгш бус интервалыг хоёуланг нь ашигладаг (Хүснэгт 3.2-т тэнцүү интервалтай вариацын цувааг харуулав).

Хэрэв функц нь ихэвчлэн 10-аас ихгүй хязгаарлагдмал тооны утгыг авдаг бол салангид түгээлтийн цувралуудыг бүтээдэг. Хэрэв сонголт илүү том бол салангид цуврал нь тодорхой байдлаа алддаг; энэ тохиолдолд вариацын цувралын интервал хэлбэрийг ашиглах нь зүйтэй. Онцлог шинж чанарыг тасралтгүй өөрчлөх замаар тодорхой хязгаар доторх утгууд нь бие биенээсээ дур мэдэн бага хэмжээгээр ялгаатай байх үед интервалын тархалтын цувралыг бас бий болгодог.

3.3.1. Дискрет вариацын цуваа байгуулах

Дискрет вариацын цуваа байгуулах аргыг жишээгээр авч үзье.

Жишээ 3.2. 60 гэр бүлийн тоон бүрэлдэхүүнд дараахь мэдээлэл байна.

Гэр бүлүүдийг гишүүдийн тоогоор нь хуваарилах талаар ойлголттой болохын тулд вариацын цувралыг бий болгох хэрэгтэй. Онцлог нь хязгаарлагдмал тооны бүхэл тоон утгыг авдаг тул бид салангид вариацын цуваа үүсгэдэг. Үүнийг хийхийн тулд эхлээд шинж чанарын бүх утгыг (гэр бүлийн гишүүдийн тоо) өсөх дарааллаар бичихийг зөвлөж байна (жишээлбэл, статистик мэдээллийг эрэмбэлэх).

Дараа нь ижил бүтэцтэй гэр бүлийн тоог тоолох шаардлагатай. Гэр бүлийн гишүүдийн тоо (хувьсагчийн шинж чанарын утга) нь сонголтууд (бид тэдгээрийг x-ээр тэмдэглэх болно), ижил найрлагатай гэр бүлийн тоо нь давтамж (бид тэдгээрийг f гэж тэмдэглэх болно). Бүлэглэх үр дүнг дараах салангид вариацын тархалтын цуврал хэлбэрээр үзүүлэв.

Хүснэгт 3.11.
Гэр бүлийн гишүүдийн тоо (x) Гэр бүлийн тоо (y)
1 8
2 14
3 20
4 9
5 5
6 4
Нийт 60

3.3.2. Интервалын вариацын цуваа байгуулах

Дараах жишээн дээр интервалын вариацын тархалтын цуваа байгуулах аргыг үзүүлье.

Жишээ 3.3. Статистикийн ажиглалтын үр дүнд арилжааны 50 банкны зээлийн дундаж хүү (%)-ийн талаарх дараах мэдээллийг гаргалаа.

Хүснэгт 3.12.
14,7 19,0 24,5 20,8 12,3 24,6 17,0 14,2 19,7 18,8
18,1 20,5 21,0 20,7 20,4 14,7 25,1 22,7 19,0 19,6
19,0 18,9 17,4 20,0 13,8 25,6 13,0 19,0 18,7 21,1
13,3 20,7 15,2 19,9 21,9 16,0 16,9 15,3 21,4 20,4
12,8 20,8 14,3 18,0 15,1 23,8 18,5 14,4 14,4 21,0

Таны харж байгаагаар ийм массив өгөгдлийг үзэх нь туйлын тохиромжгүй бөгөөд үүнээс гадна индикаторын өөрчлөлтөд ямар ч хэв маяг байхгүй байна. Интервалын тархалтын цуваа байгуулъя.

  1. Интервалуудын тоог тодорхойлъё.

    Практикт интервалын тоог ихэвчлэн ажиглалт бүрийн даалгавар дээр үндэслэн судлаач өөрөө тогтоодог. Үүний зэрэгцээ Sturgess-ийн томъёог ашиглан үүнийг математикийн аргаар тооцоолж болно

    n = 1 + 3.322lgN,

    энд n нь интервалын тоо;

    N - хүн амын эзлэхүүн (ажиглалтын нэгжийн тоо).

    Бидний жишээн дээр бид дараахь зүйлийг авна: n = 1 + 3.322lgN = 1 + 3.322lg50 = 6.6 "7.

  2. (i) интервалуудын хэмжээг томъёогоор тодорхойлъё

    Энд x max нь шинж чанарын хамгийн их утга;

    x min нь функцын хамгийн бага утга юм.

    Бидний жишээн дээр

    Хэрэв тэдгээрийн хил хязгаар нь "дугуй" утгатай бол вариацын цувралын интервалууд нь тодорхой байдаг тул бид интервалын утгыг 1.9-аас 2 хүртэл, функцийн хамгийн бага утгыг 12.3-аас 12.0 хүртэл дугуйруулна.

  3. Интервалуудын хил хязгаарыг тодорхойлъё.

    Интервалуудыг ихэвчлэн нэг интервалын дээд хязгаар нь дараагийн интервалын доод хязгаар байхаар тэмдэглэдэг. Тиймээс, бидний жишээнд бид: 12.0-14.0; 14.0-16.0; 16.0-18.0; 18.0-20.0; 20.0-22.0; 22.0-24.0; 24.0-26.0.

    Ийм бичлэг нь онцлог нь тасралтгүй гэсэн үг юм. Хэрэв шинж чанарын хувилбарууд нь хатуу тодорхойлогдсон утгуудыг авдаг, жишээлбэл, зөвхөн бүхэл тоо, гэхдээ тэдгээрийн тоо нь салангид цуваа үүсгэхэд хэтэрхий том байвал интервалын доод хил нь дээд хилтэй давхцахгүй байх интервалын цуваа үүсгэж болно. дараагийн интервалын (энэ нь онцлог нь салангид байна гэсэн үг юм). Жишээлбэл, аж ахуйн нэгжийн ажилчдыг насаар нь хуваарилахдаа та дараах насны бүлгүүдийг үүсгэж болно: 18-25, 26-33, 34-41, 42-49, 50-57, 58-65, 66 ба илүү.

    Мөн бидний жишээн дээр бид эхний болон сүүлчийн интервалуудыг нээх гэх мэтийг хийж болно. бичих: 14.0 хүртэл; 24.0 ба түүнээс дээш.

  4. Анхны өгөгдлүүд дээр үндэслэн бид хүрээтэй цувралыг бүтээх болно. Үүнийг хийхийн тулд атрибут авах утгуудыг өсөх дарааллаар бичнэ үү. Үр дүнг хүснэгтэд үзүүлэв. Хүснэгт 3.13. Арилжааны банкуудын хүүг эрэмбэлсэн цуврал
    Банкны хүү% (сонголт)
    12,3 17,0 19,9 23,8
    12,8 17,4 20,0 24,5
    13,0 18,0 20,0 24,6
    13,3 18,1 20,4 25,1
    13,8 18,5 20,4 25,6
    14,2 18,7 20,5
    14,3 18,8 20,7
    14,4 18,9 20,7
    14,7 19,0 20,8
    14,7 19,0 21,0
    15,1 19,0 21,0
    15,2 19,0 21,1
    15,3 19,0 21,4
    16,0 19,6 21,9
    16,9 19,7 22,7
  5. Давтамжуудыг тоолъё.

    Давтамжийг тооцоолохдоо шинж чанарын утга нь интервалын хил дээр унах үед нөхцөл байдал үүсч болно. Энэ тохиолдолд та дүрмийг удирдаж болно: энэ нэгж нь түүний утга дээд хязгаар болох интервалд хуваарилагдана. Тиймээс, бидний жишээн дэх 16.0 утга нь хоёр дахь интервалд хамаарах болно.

Бидний жишээн дээр олж авсан бүлгийн үр дүнг хүснэгтэд үзүүлнэ.

Хүснэгт 3.14. Зээлийн хүүгээр арилжааны банкуудын хуваарилалт
Богино хувь,% Банкны тоо, нэгж (давтамж) Хуримтлагдсан давтамжууд
12,0-14,0 5 5
14,0-16,0 9 14
16,0-18,0 4 18
18,0-20,0 15 33
20,0-22,0 11 44
22,0-24,0 2 46
24,0-26,0 4 50
Нийт 50 -

Хүснэгтийн сүүлчийн баганад эхнийхээс эхлэн давтамжийг дараалан нийлбэрлэх замаар олж авсан хуримтлагдсан давтамжийг харуулав (жишээлбэл, эхний интервалд - 5, хоёр дахь интервалд 5 + 9 = 14, гурав дахь интервалд 5) + 9 + 4 = 18 гэх мэт.). Хуримтлагдсан давтамж, жишээлбэл, 33 нь 33 банк 20% -иас хэтрэхгүй зээлийн хүүтэй байгааг харуулж байна (харгалзах интервалын дээд хязгаар).

Вариацын цуваа үүсгэх үед өгөгдлийг бүлэглэх явцад заримдаа тэгш бус интервалуудыг ашигладаг. Энэ нь атрибутын утгууд нь арифметик эсвэл геометрийн прогрессийн дүрэмд захирагдах, эсвэл Стергессийн томъёог хэрэглэснээр ажиглалтын нэг нэгж агуулаагүй "хоосон" интервалын бүлгүүд гарч ирэхэд хамаарна. Дараа нь интервалын хил хязгаарыг судлаач өөрөө дур зоргоороо, эрүүл ухаан, судалгааны зорилгод үндэслэн эсвэл томъёогоор тогтоодог. Тиймээс арифметик прогрессод өөрчлөлт орсон өгөгдлийн хувьд интервалын хэмжээг дараах байдлаар тооцоолно.

Салангид шинж чанаруудын хувьд салангид вариацын цувралыг бүтээдэг.

Дискрет вариацын цувралыг бий болгохын тулд та дараах алхмуудыг хийх хэрэгтэй: 1) ажиглалтын нэгжийг шинж чанарын судлагдсан утгын өсөх дарааллаар эрэмблэх,

2) x i шинж чанарын бүх боломжит утгыг тодорхойлж, өсөх дарааллаар эрэмбэлэх,

шинж чанарын үнэ цэнэ, би .

шинж чанарын давтамж болон тэмдэглэнэ е би . Цувралын бүх давтамжийн нийлбэр нь судлагдсан популяцийн элементийн тоотой тэнцүү байна.

Жишээ 1 .

Шалгалтанд оюутнуудын авсан онооны жагсаалт: 3; 4; 3; 5; 4; 2; 2; 4; 4; 3; 5; 2; 4; 5; 4; 3; 4; 3; 3; 4; 4; 2; 2; 5; 5; 4; 5; 2; 3; 4; 4; 3; 4; 5; 2; 5; 5; 4; 3; 3; 4; 2; 4; 4; 5; 4; 3; 5; 3; 5; 4; 4; 5; 4; 4; 5; 4; 5; 5; 5.

Энд тоо байна NS - зэрэгнь салангид санамсаргүй хэмжигдэхүүн бөгөөд тооцооллын үр дүнгийн жагсаалт ньстатистик (ажигласан) өгөгдөл .

    шинж чанарын судлагдсан утгын өсөх дарааллаар ажиглалтын нэгжүүдийг эрэмблэх:

2; 2; 2; 2; 2; 2; 2; 2; 3; 3; 3; 3; 3; 3; 3; 3; 3; 3; 3; 3; 4; 4; 4; 4; 4; 4; 4; 4; 4; 4; 4; 4; 4; 4; 4; 4; 4; 4; 4; 4; 4; 4; 4; 5; 5; 5; 5; 5; 5; 5; 5; 5; 5; 5; 5; 5; 5; 5; 5; 5.

2) x i шинж чанарын бүх боломжит утгыг тодорхойлж, тэдгээрийг өсөх дарааллаар эрэмбэл:

Энэ жишээнд бүх ангиудыг дараах утгуудаар дөрвөн бүлэгт хувааж болно: 2; 3; 4; 5.

Ажиглагдсан өгөгдлийн тусдаа бүлэгт харгалзах санамсаргүй хэмжигдэхүүний утгыг нэрлэнэ шинж чанарын үнэ цэнэ, хувилбар (хувилбар) ба x гэж тэмдэглэнэ би .

Олон тооны ажиглалтад атрибутын харгалзах утга хэдэн удаа тохиолдож байгааг харуулсан тоог нэрлэнэ шинж чанарын давтамж болон тэмдэглэнэ е би .

Бидний жишээн дээр

оноо 2 тохиолддог - 8 удаа,

3 оноо гардаг - 12 удаа,

оноо 4 тохиолддог - 23 удаа,

оноо 5 тохиолддог - 17 удаа.

Нийт 60 тооцоолол.

4) хүлээн авсан өгөгдлийг хоёр мөр (багана) хүснэгтэд бичнэ үү - x i ба f i.

Эдгээр өгөгдөл дээр үндэслэн салангид вариацын цуваа үүсгэх боломжтой

Дискрет вариацын цуврал - энэ бол судалж буй шинж чанарын олсон утгыг өсөх дарааллаар тусад нь утгууд болон тэдгээрийн давтамжийг харуулсан хүснэгт юм.

  1. Интервалын вариацын цувралыг бий болгох

Дискрет вариацын цувралаас гадна өгөгдлийг интервалын өөрчлөлтийн цуврал болгон бүлэглэх арга нь ихэвчлэн байдаг.

Дараах тохиолдолд интервалын цувралыг байгуулна.

    тэмдэг нь байнгын өөрчлөлтийн шинж чанартай байдаг;

    Маш олон салангид утгууд байдаг (10-аас дээш)

    салангид утгын давтамж нь маш бага (харьцангуй олон тооны ажиглалтын нэгжтэй 1-3-аас хэтрэхгүй);

    ижил давтамжтай шинж чанарын олон салангид утгууд.

Интервалын хэлбэлзлийн цуврал нь өгөгдлийг хоёр баганатай (атрибутын утгууд нь утгын интервал ба интервал бүрийн давтамж) хүснэгт хэлбэрээр бүлэглэх арга юм.

Дискрет цувралаас ялгаатай нь интервалын цувралын шинж чанарын утгыг бие даасан утгуудаар биш харин утгын интервалаар ("ээс - хүртэл") төлөөлдөг.

Сонгосон интервал бүрт хэдэн ажиглалтын нэгж унасныг харуулсан тоог дуудна шинж чанарын давтамж болон тэмдэглэнэ е би . Цувралын бүх давтамжийн нийлбэр нь судлагдсан популяцийн элементүүдийн тоо (ажиглалтын нэгж) -тэй тэнцүү байна.

Хэрэв нэгж нь интервалын дээд хилийн утгатай тэнцэх шинж чанарын утгатай бол түүнийг дараагийн интервалд шилжүүлэх шаардлагатай.

Жишээлбэл, 100 см-ийн өндөртэй хүүхэд эхнийх нь биш харин 2-р завсарт унах болно; мөн 130 см өндөртэй хүүхэд гурав дахь биш харин сүүлчийн завсарт унах болно.

Эдгээр өгөгдлүүд дээр үндэслэн интервалын вариацын цуваа байгуулах боломжтой.

Хогийн сав бүр доод хязгаар (x n), дээд хязгаар (x h), хогийн савны өргөн ( би).

Интервалын хил гэдэг нь хоёр интервалын хил дээр орших шинж чанарын утга юм.

хүүхдийн өндөр (см)

хүүхдийн өндөр (см)

хүүхдийн тоо

130 гаруй

Хэрэв интервал нь дээд ба доод хилтэй бол түүнийг дуудна хаалттай интервал... Хэрэв интервал нь зөвхөн доод эсвэл зөвхөн дээд хязгаартай бол энэ нь - нээлттэй интервал.Зөвхөн эхний эсвэл хамгийн сүүлийн интервал нээлттэй байж болно. Дээрх жишээнд сүүлийн интервал нээлттэй байна.

Интервалын өргөн (би) - дээд ба доод хязгаарын ялгаа.

би = x n - x in

Нээлттэй хогийн савны өргөн нь зэргэлдээх хаалттай савны өргөнтэй ижил байна гэж үзнэ.

хүүхдийн өндөр (см)

хүүхдийн тоо

Интервалын өргөн (i)

тооцооллын хувьд 130 + 20 = 150

20 (зэргэлдээх хаалттай интервалын өргөн нь 20 учраас)

Бүх интервалын цувааг тэнцүү интервалтай интервал цуваа, тэгш бус интервалтай интервал цуваа гэж хуваана ... Тэнцүү интервалтай интервалын эгнээнд бүх интервалын өргөн ижил байна. Тэгш бус интервалтай интервалын эгнээнд интервалын өргөн өөр байна.

Энэ жишээнд тэгш бус интервалтай интервалын цуваа.

Математикийн статистик- шинжлэх ухаан, практик дүгнэлтэнд статистикийн өгөгдлийг боловсруулах, системчлэх, ашиглах математик аргуудад зориулагдсан математикийн хэсэг.

3.1. МАТЕМАТИК СТАТИСТИКИЙН ҮНДСЭН ОЙЛГОЛТ

Биоанагаах ухааны асуудлын хувьд маш олон тооны хүмүүст тодорхой шинж чанарын тархалтыг судлах шаардлагатай байдаг. Өөр өөр хүмүүст энэ тэмдэг нь өөр өөр утгатай тул санамсаргүй хэмжигдэхүүн юм. Жишээлбэл, аливаа эмийг өөр өөр өвчтөнд хэрэглэхэд өөр өөр үр дүнтэй байдаг. Гэсэн хэдий ч энэ эмийн үр дүнтэй байдлын талаар ойлголттой болохын тулд үүнийг хэрэглэх шаардлагагүй бүгдэд ньөвчтэй. Харьцангуй цөөн тооны өвчтөнүүдэд эмийг хэрэглэх үр дүнг ажиглаж, олж авсан өгөгдлүүдийн үндсэн дээр эмчилгээний үйл явцын чухал шинж чанаруудыг (үр дүнтэй байдал, эсрэг заалтуудыг) тодорхойлох боломжтой.

Нийт хүн ам- ямар нэг онцлог шинжээр тодорхойлогддог, судлах нэгэн төрлийн элементүүдийн багц. Энэ онцлог нь Үргэлжилсэнтархалтын нягтралтай санамсаргүй хэмжигдэхүүн f (x).

Жишээлбэл, хэрэв бид тодорхой бүс нутагт өвчний тархалтыг сонирхож байгаа бол нийт хүн ам гэдэг нь тухайн бүс нутгийн нийт хүн ам юм. Хэрэв бид эрэгтэй, эмэгтэй хүмүүсийн энэ өвчинд мэдрэмтгий байдлыг тус тусад нь олж мэдэхийг хүсвэл хоёр ерөнхий популяцийг авч үзэх хэрэгтэй.

Нийт популяцийн шинж чанарыг судлахын тулд түүний зарим элементүүдийг сонгосон.

Дээж- шинжилгээнд (эмчилгээнд) сонгосон нийт хүн амын нэг хэсэг.

Хэрэв энэ нь төөрөгдөл үүсгэхгүй бол дээжийг гэж нэрлэдэг объектын багц,шалгалтанд сонгосон, мөн нэгтгэх

үнэт зүйлссудалгааны явцад олж авсан шинж чанар. Эдгээр утгыг хэд хэдэн аргаар илэрхийлж болно.

Энгийн статистик цуврал -судалж буй шинж чанарын утгыг олж авсан дарааллаар нь бүртгэнэ.

20 өвчтөнд духны арьсанд гадаргуугийн долгионы хурдыг (м / с) хэмжих замаар олж авсан энгийн статистик цувралын жишээг хүснэгтэд үзүүлэв. 3.1.

Хүснэгт 3.1.Энгийн статистик цуврал

Энгийн статистик цуврал нь судалгааны үр дүнг бүртгэх гол бөгөөд бүрэн гүйцэд арга юм. Энэ нь хэдэн зуун зүйлийг агуулж болно. Ийм хослолыг нэг дор харахад маш хэцүү байдаг. Тиймээс том дээжийг ихэвчлэн бүлэгт хуваадаг. Үүний тулд шинж чанарын өөрчлөлтийн талбайг хэд хэдэн (N) хуваана. интервалуудижил өргөнтэй байх ба эдгээр интервалд хүрэх онцлогийн харьцангуй давтамжийг (n / n) тооцоол. Интервал бүрийн өргөн нь:

Интервалуудын хил хязгаар нь дараахь утгатай байна.

Хэрэв түүврийн зарим элемент нь хоёр зэргэлдээх интервалын хоорондох хил бол түүнийг гэж нэрлэдэг зүүнинтервал. Ийм байдлаар бүлэглэсэн өгөгдлийг гэж нэрлэдэг интервалын статистик цуврал.

- Энэ бол атрибутын утгуудын интервалууд болон эдгээр интервал дахь атрибутыг цохих харьцангуй давтамжийг харуулсан хүснэгт юм.

Манай тохиолдолд жишээлбэл, ийм интервалын статистик цуврал (N = 5,) үүсгэх боломжтой. г= 4), таб. 3.2.

Хүснэгт 3.2.Интервалын статистик цуврал

Энд 28-тай тэнцэх хоёр утгыг 28-32 интервалд (Хүснэгт 3.1), 32-36 интервалд 32, 33, 34, 35 гэсэн утгыг онооно.

Интервалын статистик цувралыг графикаар харуулах боломжтой. Үүнийг хийхийн тулд атрибутын утгуудын интервалыг абсцисса тэнхлэгийн дагуу зурж, тэдгээрийн үндсэн дээр харьцангуй давтамжтай тэнцүү өндөртэй тэгш өнцөгтийг барьсан болно. Үүссэн баганан диаграмыг дуудна гистограм.

Цагаан будаа. 3.1.баганан график

Гистограмм дээр шинж чанарын тархалтын статистик зүй тогтол нэлээд тодорхой харагдаж байна.

Түүврийн хэмжээ их (хэдэн мянга), баганын өргөн багатай гистограмын хэлбэр нь графикийн хэлбэртэй ойролцоо байна. түгээлтийн нягтралтэмдэг.

Гистограм дахь баарны тоог дараах томъёогоор сонгож болно.

Гистограммыг гараар бүтээх нь урт процесс юм. Тиймээс тэдгээрийг автоматаар бүтээхэд зориулж компьютерийн программуудыг боловсруулсан.

3.2. СТАТИСТИКИЙН ЦУВРАЛЫН ТООН ОНЦЛОГ

Статистикийн олон процедур нь хүн амын дундаж ба дисперсийн (эсвэл RMS) түүврийн тооцоог ашигладаг.

Жишээ дундаж(X) нь энгийн статистик цувралын бүх элементийн арифметик дундаж юм.

Бидний жишээн дээр NS= 37.05 (м / с).

Жишээ дундаж ньХамгийн сайнерөнхий дундаж тооцооМ.

Түүврийн зөрүү s 2түүвэр дунджаас элементүүдийн квадрат хазайлтын нийлбэрийг хуваасантай тэнцүү n- 1:

Бидний жишээнд s 2 = 25.2 (м / с) 2.

Түүврийн дисперсийг тооцоолохдоо томъёоны хуваагч нь түүврийн хэмжээ n биш, харин n-1 гэдгийг анхаарна уу. Энэ нь (3.3) томъёоны хазайлтыг тооцоолохдоо үл мэдэгдэх математик хүлээлтийн оронд түүний тооцоог ашигладагтай холбоотой юм. жишээ дундаж.

Түүврийн зөрүү нь Хамгийн сайнерөнхий хэлбэлзлийн тооцоо (σ 2).

Стандарт хазайлтын жишээ(s) нь түүврийн дисперсийн квадрат язгуур:

Бидний жишээн дээр с= 5.02 (м / с).

Сонгодог язгуур дундаж квадратхазайлт нь ерөнхий стандарт хазайлтын (σ) хамгийн сайн үнэлгээ юм.

Түүврийн хэмжээ хязгааргүй нэмэгдэхийн хэрээр түүврийн бүх шинж чанар нь нийт хүн амын харгалзах шинж чанаруудад чиглэдэг.

Түүврийн шинж чанарыг тооцоолохын тулд компьютерийн томъёог ашигладаг. Excel-д эдгээр тооцоолол нь AVERAGE, VAR гэсэн статистик функцуудыг гүйцэтгэдэг. STDEV.

3.3. ИНТЕРВАЛИЙН ҮНЭЛГЭЭ

Бүх дээжийн шинж чанарууд байна санамсаргүй хэмжигдэхүүн.Энэ нь ижил хэмжээтэй өөр түүврийн хувьд түүврийн шинж чанарын утгууд өөр байх болно гэсэн үг юм. Тиймээс сонгомол

шинж чанарууд нь зөвхөн тооцоололнийт хүн амын холбогдох шинж чанарууд.

Түүврийн тооцооны сул талуудыг нөхдөг интервалын тооцоо,төлөөлж байна тоон интервал,дотор нь өгөгдсөн магадлалтай Р дүнэлж буй параметрийн жинхэнэ утгыг олно.

Байцгаая U r - ерөнхий популяцийн зарим параметр (ерөнхий дундаж, ерөнхий дисперс гэх мэт).

Интервалын үнэлгээ U r параметрийг интервал гэж нэрлэдэг (U 1, U 2),нөхцөлийг хангаж байна:

П (У < Ur < U2) = Рд. (3.5)

Магадлал Р ддуудсан нууц магадлал.

Итгэлийн магадлал Pг - тооцоолсон хэмжигдэхүүний жинхэнэ утга байх магадлал доторзаасан интервал.

Энэ тохиолдолд интервал (U 1, U 2)дуудсан итгэлийн интервалүнэлж буй параметрийн хувьд.

Ихэнхдээ итгэлийн магадлалын оронд α = 1 - P d гэсэн холбогдох утгыг ашигладаг. ач холбогдлын түвшин.

Ач холбогдолын түвшинТооцоолсон параметрийн үнэн утга нь байх магадлал юм гаднаитгэлийн интервал.

Заримдаа α ба P q-г хувиар илэрхийлдэг, жишээлбэл, 0.05-ын оронд 5%, 0.95-ын оронд 95%.

Интервалын тооцоололд эхлээд тохирохыг нь сонгоно итгэлийн түвшин(ихэвчлэн 0.95 эсвэл 0.99), дараа нь тооцоолж буй параметрийн утгын харгалзах мужийг олоорой.

Интервалын тооцооллын зарим ерөнхий шинж чанарыг тэмдэглэе.

1. Ач холбогдлын түвшин бага байх тусам (илүү их R e),интервалын тооцоо илүү өргөн байна. Тэгэхээр, хэрэв ач холбогдлын түвшинд 0.05 байвал ерөнхий дундажийн интервалын үнэлгээ нь 34.7 байна.< М< 39,4, то для уровня 0,01 она будет гораздо шире: 33,85 < М< 40,25.

2. Түүврийн хэмжээ их байх тусам n,сонгосон ач холбогдлын түвшинтэй интервалын тооцоо нь нарийсдаг. Жишээлбэл, 5-ыг 20 элементийн түүврээс авсан ерөнхий дундаж (β = 0.05) хувийн тооцоолол, дараа нь 34.7 гэж үзье.< М< 39,4.

Түүврийн хэмжээг 80 хүртэл нэмэгдүүлснээр бид ижил түвшний ач холбогдлын талаар илүү нарийвчлалтай тооцоолол хийх болно: 35.5< М< 38,6.

Ерөнхий тохиолдолд найдвартай итгэлцлийн тооцоог бий болгохын тулд тооцоолсон санамсаргүй шинж чанарыг нийт хүн амд хуваарилдаг хуулийн талаархи мэдлэгийг шаарддаг. Интервалын тооцоолол хэрхэн хийгдсэнийг анхаарч үзээрэй ерөнхий дундшинж чанар, энэ нь нийт хүн амын дунд тархсан хэвийнхууль.

3.4. Хэвийн ХУВААЛТЫН ХУУЛИЙН ЕРӨНХИЙ ДУНДЫН ИНТЕРВАЛИЙН ҮНЭЛГЭЭ

Хэвийн тархалттай нийт хүн амын ерөнхий дундаж М-ийн интервалын тооцоог байгуулахдаа дараах шинж чанарт үндэслэнэ. Дээжийн эзлэхүүний хувьд nхандлага

ν = эрх чөлөөний зэрэгтэй Оюутны хуваарилалтад захирагдана n- 1.

Энд NSтүүвэр дундаж, ба с- сонгомол стандарт хазайлт.

Оюутны хуваарилалтын хүснэгтүүд эсвэл тэдгээрийн компьютерийн аналогийг ашиглан өгөгдсөн итгэлийн түвшинд дараахь тэгш бус байдлыг хангах хилийн утгыг олж болно.

Энэ тэгш бус байдал нь M-ийн тэгш бус байдалтай тохирч байна:

хаана ε нь итгэлцлийн интервалын хагас өргөн юм.

Ийнхүү M-ийн итгэлцлийн интервалыг байгуулах ажлыг дараах дарааллаар гүйцэтгэнэ.

1. P d (ихэвчлэн 0.95 эсвэл 0.99) итгэх магадлалыг сонгоод Оюутны тархалтын хүснэгтийн дагуу t параметрийг олно.

2. Итгэлийн интервал ε-ийн хагас өргөнийг тооцоол.

3. Сонгосон итгэлийн түвшинтэй ерөнхий дундажийн интервалын үнэлгээг хүлээн авна уу:

Товчхондоо ингэж бичжээ.

Интервалын тооцоог олохын тулд компьютерийн процедурыг боловсруулсан.

Оюутны хуваарилалтын хүснэгтийг хэрхэн ашиглах талаар тайлбарлая. Энэ хүснэгтэд хоёр "оролт" байна: зүүн багана, эрх чөлөөний зэрэглэлийн тоо гэж нэрлэгддэг ν = n- 1, дээд шугам нь ач холбогдлын түвшин α байна. Харгалзах мөр, баганын огтлолцол дээр Оюутны коэффициентийг ол т.

Энэ аргыг дээж дээрээ хэрэгжүүлье. Оюутны хуваарилалтын хүснэгтийн хэсгийг доор үзүүлэв.

Хүснэгт 3.3. Оюутны хуваарилалтын хүснэгтийн фрагмент

20 хүний ​​түүвэрт зориулсан энгийн статистик цуврал (n= 20, ν = 19) хүснэгтэд үзүүлэв. 3.1. Энэ цувралын хувьд (3.1-3.3) томъёогоор тооцоолно: NS= 37,05; с= 5,02.

Сонгоцгооё α = 0.05 (P d = 0.95). "19" мөр ба "0.05" баганын огтлолцол дээр бид олдог т= 2,09.

Тооцооллын үнэн зөвийг (3.6) томъёогоор тооцоолъё: ε = 2.09? 5.02 / λ / 20 = 2.34.

Интервалын тооцоог байгуулъя: 95% -ийн магадлалаар үл мэдэгдэх ерөнхий дундаж нь тэгш бус байдлыг хангана.

37,05 - 2,34 < М< 37,05 + 2,34, или М= 37.05 ± 2.34 (м / с), P d = 0.95.

3.5. СТАТИСТИКИЙН ТААМАГЛАЛ БАТАЛГААХ АРГА

Статистикийн таамаглал

Статистикийн таамаглал гэж юу болохыг тодорхойлохын өмнө дараах жишээг авч үзье.

Тодорхой өвчнийг эмчлэх хоёр аргыг харьцуулахын тулд 20 хүнтэй хоёр бүлгийн өвчтөнүүдийг сонгосон бөгөөд эдгээр аргуудын дагуу эмчилгээг хийсэн. Өвчтөн бүрийн хувьд тэмдэглэсэн процедурын тоо,Үүний дараа эерэг үр дүнд хүрсэн. Эдгээр өгөгдлүүдийн дагуу бүлэг бүрийн хувьд түүврийн дундаж (X) түүврийн зөрүү олдсон (s 2)болон жишээ RMS (s).

Үр дүнг хүснэгтэд үзүүлэв. 3.4.

Хүснэгт 3.4

Эерэг нөлөө үзүүлэхэд шаардагдах процедурын тоо нь санамсаргүй хэмжигдэхүүн бөгөөд тэдгээрийн талаарх бүх мэдээлэл нь тухайн түүвэрт одоогоор агуулагдаж байна.

Хүснэгтээс. 3.4-т эхний бүлгийн түүврийн дундаж нь хоёр дахь бүлгийнхээс бага байгааг харуулж байна. Энэ нь ерөнхий дундаж үзүүлэлтүүдэд ижил харьцаа байна гэсэн үг үү: M 1< М 2 ? Достаточно ли статистических данных для такого вывода? Ответы на эти вопросы и дает статистик таамаглалыг шалгах.

Статистикийн таамаглал- Энэ нь популяцийн шинж чанарын талаархи таамаглал юм.

Бид шинж чанаруудын талаархи таамаглалуудыг авч үзэх болно хоёрерөнхий популяци.

Хэрэв хүн ам байгаа бол мэддэг, адилхантооцоолсон хэмжигдэхүүний хуваарилалт ба таамаглалууд нь хэмжигдэхүүнтэй холбоотой зарим параметрЭнэ тархалтын дараа таамаглалуудыг дуудна параметрийн.Жишээлбэл, популяциас дээж авдаг ердийн хуультархалт ба ижил хэлбэлзэл. Та олж мэдмээр байна адилхан байнаэдгээр популяцийн ерөнхий дундаж.

Хэрэв ерөнхий популяцийн тархалтын хуулиудын талаар юу ч мэдэгдээгүй бол тэдгээрийн шинж чанарын талаархи таамаглалыг нэрлэнэ параметрийн бус.Жишээлбэл, адилхан байнадээж авсан нийт популяцийн тархалтын хууль.

Үгүй ба альтернатив таамаглал.

Таамаглалыг шалгах асуудал. Ач холбогдолын түвшин

Таамаглалыг шалгахад ашигладаг нэр томъёотой танилцацгаая.

H 0 - тэг таамаглал (эргэлзэгчийн таамаглал) - энэ бол таамаглал юм ялгаагүйхарьцуулсан дээжүүдийн хооронд. Эргэлзэгч нь судалгааны үр дүнгээс олж авсан түүврийн тооцооллын зөрүү нь санамсаргүй гэж үздэг;

H 1- өөр таамаглал (өөдрөг таамаглал) нь харьцуулсан түүврийн хооронд ялгаа байгаа тухай таамаглал юм. Өөдрөг үзэлтэн түүврийн тооцооллын зөрүү нь объектив шалтгаанаас үүдэлтэй бөгөөд нийт хүн амын хоорондох зөрүүтэй тохирч байна гэж үздэг.

Статистикийн таамаглалыг турших нь зөвхөн заримыг нь зохиох боломжтой үед л боломжтой байдаг хэмжээ(шалгуур), шударга байдлын хувьд хуваарилалтын хууль H 0алдартай. Дараа нь энэ хэмжээг зааж өгч болно итгэлийн интервал,өгөгдсөн магадлалаар Р дүнэ цэнийг нь авдаг. Энэ интервал гэж нэрлэгддэг чухал бүс.Хэрэв шалгуур үзүүлэлтийн утга нь эгзэгтэй бүсэд орвол таамаглалыг хүлээн зөвшөөрнө H 0.Үгүй бол H 1 таамаглалыг хүлээн зөвшөөрнө.

Анагаах ухааны судалгаанд P d = 0.95 эсвэл P d = 0.99-ийг ашигладаг. Эдгээр утгууд нь тохирч байна ач холбогдлын түвшинα = 0.05 эсвэл α = 0.01.

Статистикийн таамаглалыг шалгахдааач холбогдлын түвшин(α) нь тэг таамаглал үнэн үед няцаагдах магадлал юм.

Таамаглалыг шалгах процедур нь үндсэндээ чиглэгдэж байгааг анхаарна уу ялгааг илрүүлэх,мөн тэдний байхгүйг батлахгүй байх. Шалгуурын үнэ цэнэ нь эгзэгтэй бүсээс давсан тохиолдолд бид "эргэлзэгч" -д цэвэр зүрх сэтгэлээр хэлж чадна - та өөр юу хүсч байна вэ ?! Хэрэв ялгаа байхгүй байсан бол 95% (эсвэл 99%) байх магадлалтай бол тооцоолсон утга нь тогтоосон хязгаарт багтах болно. Гэхдээ үгүй! ..

За, хэрэв шалгуур үзүүлэлтийн утга нь эгзэгтэй бүсэд орвол H 0 таамаглал зөв гэдэгт итгэх шалтгаан байхгүй. Энэ нь хоёр боломжит шалтгааны аль нэгийг илтгэнэ.

1. Түүврийн хэмжээ нь ялгааг илрүүлэх хангалттай том биш байна. Туршилтыг үргэлжлүүлэх нь амжилтанд хүрэх магадлалтай.

2. Ялгаатай байдаг. Гэхдээ тэдгээр нь маш жижиг тул практик ач холбогдолгүй байдаг. Энэ тохиолдолд туршилтыг үргэлжлүүлэх нь утгагүй юм.

Анагаах ухааны судалгаанд ашигладаг зарим статистик таамаглалыг авч үзье.

3.6. ТАРХАЛТЫН ТЭГШ БАЙДЛЫН ТААМАГЛАЛ, ФИШЕРИЙН F-ШААЛТЫН БАТАЛГАА

Зарим эмнэлзүйн судалгаагаар эерэг нөлөө нь тийм ч их нотлогддоггүй хэмжээсудлагдсан параметрийн, энэ нь хэр их байна тогтворжуулах,түүний хэлбэлзэл буурах. Энэ тохиолдолд түүвэр судалгааны үр дүнд үндэслэн хоёр ерөнхий хэлбэлзлийг харьцуулах асуулт гарч ирнэ. Энэ даалгаврыг ашиглан шийдэж болно Фишерийн шалгуур.

Асуудлын томъёолол

ердийн хуульхуваарилалт. Дээжийн хэмжээ -

n 1болон n 2,а түүврийн зөрүүтэнцүү байна s 1 ба s 2 2 ерөнхий зөрүү.

Турших боломжтой таамаглалууд:

H 0- ерөнхий зөрүү ижил байна;

H 1- ерөнхий зөрүү ялгаатай.

Нийт популяциас дээж авсан эсэхийг харуулна ердийн хуульхуваарилалт, хэрэв таамаглал үнэн бол H 0түүврийн хэлбэлзлийн харьцаа нь Фишерийн тархалтыг дагаж мөрддөг. Тиймээс хүчинтэй эсэхийг шалгах шалгуур болгон H 0утгыг авч байна F,томъёогоор тооцоолно:

хаана s 1 ба s 2 нь түүврийн хэлбэлзэл юм.

Энэ харьцаа нь ν 1 = тоологчийн эрх чөлөөний зэрэгтэй Фишерийн тархалтыг дагаж мөрддөг. n 1- 1 ба хуваагчийн эрх чөлөөний зэрэглэлийн тоо ν ​​2 = n 2 - 1. Критик мужийн хил хязгаарыг Фишерийн тархалтын хүснэгтүүдийн дагуу эсвэл BRASPOBR компьютерийн функцийг ашиглан олно.

Хүснэгтэнд үзүүлсэн жишээний хувьд. 3.4, бид дараахийг авна: ν 1 = ν 2 = 20 - 1 = 19; Ф= 2.16 / 4.05 = 0.53. α = 0.05 үед эгзэгтэй бүсийн хилүүд тэнцүү байна: = 0.40, = 2.53.

Шалгуурын утга нь эгзэгтэй бүсэд орсон тул таамаглалыг хүлээн зөвшөөрөв H 0:дээжийн ерөнхий хэлбэлзэл адилхан байна.

3.7. ДУНДЧ ТЭГШ БАЙДЛЫН ТААМАГЛАЛЫН ШАЛГАЛТ, ОЮУТНЫ t-ШААЛТ

Харьцуулах даалгавар дундпрактик ач холбогдолтой үед хоёр ерөнхий популяци үүсдэг хэмжээсудалж буй шинж чанар. Жишээлбэл, эмчилгээний нөхцлүүдийг хоёр өөр аргаар харьцуулах эсвэл тэдгээрийн ашиглалтаас үүсэх хүндрэлийн тоо. Энэ тохиолдолд та Оюутны t тестийг ашиглаж болно.

Асуудлын томъёолол

Нийт популяциас гаргаж авсан хоёр дээжийг (X 1) болон (X 2) авсан ердийн хуульхуваарилалт ба ижил зөрүү.Дээжийн хэмжээ - n 1 ба n 2, дээж гэсэн үгнь X 1 ба X 2-тэй тэнцүү бөгөөд түүврийн зөрүү- s 1 2 ба s 2 2тус тус. Өөр хоорондоо харьцуулах шаардлагатай ерөнхий дундаж.

Турших боломжтой таамаглалууд:

H 0- ерөнхий дундаж ижил байна;

H 1- ерөнхий дундаж ялгаатай.

Энэ нь таамаглал үнэн зөв байх тохиолдолд харуулж байна H 0 t-ийн утга, томъёогоор тооцоолно:

ν = ν 1 + + ν2 - 2 эрх чөлөөний зэрэгтэй Студентийн хуулийн дагуу хуваарилагдсан.

Энд ν 1 = байна n 1 - 1 - эхний дээжийн эрх чөлөөний зэрэглэлийн тоо; ν 2 = n 2 - 1 нь хоёр дахь түүврийн эрх чөлөөний градусын тоо юм.

Чухал бүсийн хил хязгаарыг t-тархалтын хүснэгтээс эсвэл TIDERINST компьютерийн функцийг ашиглан олж болно. Оюутны тархалт тэг орчим тэгш хэмтэй тул эгзэгтэй бүсийн зүүн ба баруун хил нь хэмжээнээрээ ижил, тэмдгээр эсрэг тэсрэг байна: -ба

Хүснэгтэнд үзүүлсэн жишээний хувьд. 3.4, бид дараахь зүйлийг авна.

ν 1 = ν 2 = 20 - 1 = 19; ν = 38, т= -2.51. α = 0.05 = 2.02 байна.

Шалгуурын утга нь эгзэгтэй бүсийн зүүн хилээс давсан тул бид таамаглалыг хүлээн зөвшөөрч байна H 1:ерөнхий дундаж ялгаатай.Тэгээд ч нийт хүн амын дундаж анхны дээжЖИЖИГ.

Оюутны t-тестийг хэрэглэх боломж

Оюутны t тест нь зөвхөн дээжид хамаарна хэвийн-тэй нэгтгэдэг ижил ерөнхий зөрүү.Хэрэв нөхцөлүүдийн дор хаяж нэг нь зөрчигдсөн бол шалгуурыг хэрэглэх эсэх нь эргэлзээтэй болно. Хүн амын хэвийн байдлын ерөнхий шаардлагыг ихэвчлэн үл тоомсорлодог төв хязгаарын теорем.Үнэн хэрэгтээ, (3.10)-ийн тоологч дахь түүврийн дундаж утгын зөрүүг ν> 30-ийн хувьд хэвийн тархсан гэж үзэж болно. Гэвч дисперсийн тэгш байдлын асуултыг баталгаажуулах боломжгүй бөгөөд Фишерийн тест ялгааг илрүүлээгүй гэсэн лавлагаа байж болохгүй. харгалзан үзсэн. Гэсэн хэдий ч t-тест нь ямар ч шалтгаангүйгээр популяцийн дундаж утгын ялгааг илрүүлэхэд өргөн хэрэглэгддэг.

Доор авч үзсэн параметрийн бус тест,ижил зорилгоор амжилттай ашиглаж байгаа бөгөөд ямар ч шаардлагагүй хэвийн байдал,бас хэлбэлзлийн тэгш байдал.

3.8. ХОЁР ДЭЭЖИЙН ПАРАМЕТРИЙН БУС ХАРЬЦУУЛГА: МАН-УИТНИЙ ШАЛГАРУУЛГА

Параметрийн бус тестүүд нь хоёр ерөнхий популяцийн тархалтын хуулийн ялгааг илрүүлэх зорилготой юм. Ерөнхийдөө ялгааг мэдэрдэг шалгуурууд дунд,шалгуур гэж нэрлэдэг ээлж.Ерөнхийдөө ялгааг мэдэрдэг шалгуурууд зөрүү,шалгуур гэж нэрлэдэг масштаб.Манн-Уитнигийн шалгуур нь шалгуур үзүүлэлтийг хэлнэ ээлжЭнэ нь дээжийг танилцуулсан хоёр ерөнхий популяцийн дундаж утгын зөрүүг илрүүлэхэд ашиглагддаг зэрэглэлийн хэмжүүр.Хэмжсэн шинж чанаруудыг энэ масштаб дээр өсөх дарааллаар байрлуулж, дараа нь 1, 2 бүхэл тоогоор дугаарлана ... Эдгээр тоонуудыг нэрлэдэг. зэрэглэл.Тэнцүү утгыг ижил зэрэглэлээр өгдөг. Энэ нь тухайн шинж чанарын хэмжээ биш, зөвхөн чухал юм энгийн газар,Энэ нь бусад хэмжигдэхүүнүүдийн дунд ордог.

Хүснэгт 3.5. Хүснэгт 3.4-ийн эхний бүлгийг эрэмбэлсэн (урсгал 2) өргөтгөсөн хэлбэрээр (мөр 1), дараа нь ижил утгын зэрэглэлийг арифметик дундаж утгуудаар солино. Жишээлбэл, эхний эгнээний 4, 4-р зүйлд 2, 3-р зэрэглэл өгсөн бөгөөд дараа нь ижил утгатай 2.5-аар солигдоно.

Хүснэгт 3.5

Асуудлын томъёолол

Бие даасан дээж (X 1)болон (X 2)тархалтын хууль тодорхойгүй популяциас гаргаж авсан. Дээжийн хэмжээ n 1болон n 2тус тус. Жишээ элементийн утгыг энд үзүүлэв зэрэглэлийн хэмжүүр.Та эдгээр популяци нь бие биенээсээ ялгаатай эсэхийг шалгахыг хүсч байна уу?

Турших боломжтой таамаглалууд:

H 0- дээж нь ижил нийтлэг популяцид хамаарах; H 1- дээж нь янз бүрийн ерөнхий популяцид хамаарна.

Ийм таамаглалыг шалгахын тулд (/ -mann-Whitney тест.

Нэгдүгээрт, элементүүдийг эрэмбэлсэн хоёр дээжээс хосолсон дээжийг (X) хийдэг. Дараа нь эхний түүврийн элементүүдэд тохирох зэрэглэлийн нийлбэр олдоно. Энэ хэмжээ нь таамаглалыг шалгах шалгуур юм.

У= Эхний түүврийн зэрэглэлийн нийлбэр. (3.11)

20-оос дээш эзэлхүүнтэй бие даасан дээжийн хувьд утга Уматематикийн хүлээлт ба стандарт хазайлт нь тэнцүү байх хэвийн тархалтыг дагаж мөрддөг.

Тиймээс эгзэгтэй бүсийн хил хязгаарыг хэвийн тархалтын хүснэгтээс олно.

Хүснэгтэнд үзүүлсэн жишээний хувьд. 3.4, бид дараахийг авна: ν 1 = ν 2 = 20 - 1 = 19, У= 339, μ = 410, σ = 37. α = 0.05-ийн хувьд бид дараахь зүйлийг авна: арслан = 338, баруун талд = 482.

Шалгуурын утга нь эгзэгтэй бүсийн зүүн хилээс давсан тул H 1 таамаглалыг хүлээн зөвшөөрч байна: ерөнхий популяци өөр өөр тархалтын хуультай байдаг. Тэгээд ч нийт хүн амын дундаж анхны дээжЖИЖИГ.

Нийгэм, эдийн засгийн үзэгдэл, үйл явцыг судлах хамгийн чухал үе шат бол анхдагч өгөгдлийг системчлэх, үүний үндсэн дээр ерөнхий статистикийн материалыг нэгтгэн бүлэглэх замаар олж авсан ерөнхий үзүүлэлтүүдийг ашиглан бүх объектын хураангуй шинж чанарыг олж авах явдал юм.

Статистикийн хураангуй Энэ нь цогцыг бүрдүүлдэг тодорхой бие даасан баримтуудыг нэгтгэн дүгнэх, судалж буй үзэгдлийн өвөрмөц шинж чанар, хэв маягийг бүхэлд нь тодорхойлох дараалсан үйлдлүүдийн цогц юм. Статистикийн дүгнэлт гаргах нь дараах алхмуудыг агуулна :

  • бүлэглэх шинж чанарыг сонгох;
  • бүлэг байгуулах дарааллыг тодорхойлох;
  • бүлгүүд болон объектыг бүхэлд нь тодорхойлох статистик үзүүлэлтүүдийн тогтолцоог боловсруулах;
  • хураангуй үр дүнг танилцуулах статистикийн хүснэгтийн схемийг боловсруулах.

Статистикийн бүлэглэл Судалгаанд хамрагдсан популяцийн нэгжийг тодорхой чухал шинж чанаруудын дагуу нэгэн төрлийн бүлэгт хуваах гэж нэрлэдэг. Бүлэглэх нь статистикийн мэдээллийг нэгтгэн дүгнэх хамгийн чухал статистик арга, статистик үзүүлэлтүүдийг зөв тооцоолох үндэс болдог.

Дараах төрлийн бүлэглэлүүд байдаг: типологийн, бүтцийн, аналитик. Эдгээр бүх бүлэглэлүүд нь объектын нэгжийг зарим шалгуурын дагуу бүлэгт хувааснаар нэгтгэгддэг.

Бүлэглэх тэмдэг Хүн амын нэгжийг тусдаа бүлэгт хуваах шинж чанар гэж нэрлэдэг. Статистикийн судалгааны дүгнэлт нь бүлэглэх шинж чанарыг зөв сонгохоос хамаарна. Бүлэглэх үндэс болгон чухал, онолын үндэслэлтэй шинж чанаруудыг (тоон эсвэл чанарын) ашиглах шаардлагатай.

Бүлэглэх тоон шинж тэмдэг тоон илэрхийлэлтэй байх (арилжааны хэмжээ, хүний ​​нас, гэр бүлийн орлого гэх мэт), мөн бүлэглэх чанарын шинж тэмдэг нэгдсэн нэгжийн төлөв байдлыг тусгана (хүйс, гэр бүлийн байдал, аж ахуйн нэгжийн салбарын харьяалал, өмчийн хэлбэр гэх мэт).

Бүлэглэх үндэслэлийг тодорхойлсны дараа судалж буй популяцийг хэдэн бүлэгт хуваах асуудлыг шийдэх хэрэгтэй. Бүлгүүдийн тоо нь судалгааны зорилго, бүлэглэлд хамаарах үзүүлэлтийн төрөл, хүн амын тоо, шинж чанарын өөрчлөлтийн зэргээс хамаарна.

Жишээлбэл, аж ахуйн нэгжүүдийг өмчийн төрлөөр нь бүлэглэхдээ холбооны субъектуудын хотын захиргаа, холбооны болон өмч хөрөнгийг харгалзан үздэг. Хэрэв бүлэглэх ажлыг тоон байдлаар хийж байгаа бол судалж буй объектын нэгжийн тоо, бүлэглэх шинж чанарын хувьсах зэрэгт онцгой анхаарал хандуулах шаардлагатай.

Бүлгүүдийн тоог тодорхойлсны дараа бүлэглэх интервалыг тодорхойлох шаардлагатай. Интервал - эдгээр нь тодорхой хил хязгаарт орших хувьсах шинж чанарын утгууд юм. Интервал бүр өөрийн гэсэн утгатай, дээд ба доод хил, эсвэл ядаж нэг нь байдаг.

Интервалын доод хил интервал дахь онцлогийн хамгийн бага утга гэж нэрлэдэг ба дээд хязгаар - интервал дахь шинж чанарын хамгийн том утга. Интервалын утга нь дээд ба доод хязгаарын зөрүү юм.

Хэмжээнээс хамааран бүлэглэх интервалууд нь: тэнцүү ба тэгш бус байна. Хэрэв шинж чанарын өөрчлөлт нь харьцангуй нарийн хил хязгаарт илэрч, тархалт нь жигд байвал ижил интервалтайгаар бүлэглэлийг байгуулна. Тэнцүү интервалын утгыг дараах томъёогоор тодорхойлно :

Энд Xmax, Xmin нь нийлбэр дэх шинж чанарын хамгийн их ба хамгийн бага утгууд юм; n нь бүлгийн тоо юм.

Сонгосон бүлэг бүр нэг үзүүлэлтээр тодорхойлогддог хамгийн энгийн бүлэг бол түгээлтийн цуврал юм.

Статистикийн тархалтын цуврал - Энэ бол хүн амын нэгжийг тодорхой шинж чанарын дагуу бүлэгт хуваарилах явдал юм. Тархалтын цуваа үүсэх үндсэн шинж чанараас хамааран атрибутив болон вариацын тархалтын цувааг ялгадаг.

Атрибутив чанарын шинж чанарын дагуу баригдсан хуваарилалтын цувралыг, өөрөөр хэлбэл тоон илэрхийлэлгүй шинж чанаруудыг (хөдөлмөрийн төрөл, хүйс, мэргэжлээр хуваарилах гэх мэт) гэж нэрлэнэ. Атрибутив тархалтын цувралууд нь нэг буюу өөр чухал шинж чанаруудын хувьд популяцийн бүтцийг тодорхойлдог. Хэд хэдэн хугацаанд авсан энэ өгөгдөл нь бүтцийн өөрчлөлтийг судлах боломжийг олгодог.

Вариацын цуврал тоон үзүүлэлтээр бүтээгдсэн түгээлтийн цуврал гэж нэрлэдэг. Аливаа вариацын цуврал нь сонголт ба давтамж гэсэн хоёр элементээс бүрдэнэ. Хувилбарууд Вариацын цувралд авдаг атрибутын бие даасан утгыг өөрөөр хэлбэл хувьсах шинж чанарын тодорхой утга гэж нэрлэдэг.

Давтамж бие даасан хувилбаруудын тоог эсвэл вариацын цувралын бүлэг бүрийг нэрлэдэг, өөрөөр хэлбэл эдгээр нь тархалтын цувралд тодорхой сонголтууд хэр олон удаа олддогийг харуулсан тоонууд юм. Бүх давтамжийн нийлбэр нь нийт хүн амын хэмжээ, түүний эзлэхүүнийг тодорхойлдог. Давтамж нэгжийн бутархай эсвэл нийт дүнгийн хувиар илэрхийлсэн давтамж гэж нэрлэдэг. Үүний дагуу давтамжийн нийлбэр нь 1 эсвэл 100% байна.

Шинж тэмдгийн өөрчлөлтийн шинж чанараас хамааран вариацын цувралын гурван хэлбэрийг ялгадаг: эрэмбэлэгдсэн цуврал, салангид цуврал, интервалын цуваа.

Эрэмбэлэгдсэн вариацын цуврал - Энэ нь судалж буй шинж тэмдгийн өсөх эсвэл буурах дарааллаар популяцийн бие даасан нэгжүүдийн хуваарилалт юм. Эрэмбэлэх нь тоон өгөгдлийг бүлэгт хялбархан хувааж, шинж чанарын хамгийн бага, хамгийн том утгыг нэн даруй олох, хамгийн их давтагддаг утгыг тодруулах боломжийг олгодог.

Дискрет вариацын цуврал зөвхөн бүхэл тоон утгыг авдаг салангид шинж чанарын дагуу популяцийн нэгжийн тархалтыг тодорхойлдог. Жишээлбэл, цалингийн ангилал, гэр бүлийн хүүхдийн тоо, аж ахуйн нэгжийн ажилчдын тоо гэх мэт.

Хэрэв онцлог шинж чанар нь тодорхой хязгаарт ямар ч утгыг ("ээс - хүртэл") авч болох тасралтгүй өөрчлөлттэй байвал энэ функцийг бүтээх хэрэгтэй. интервалын өөрчлөлтийн цуврал ... Жишээлбэл, орлогын хэмжээ, ажлын туршлага, аж ахуйн нэгжийн үндсэн хөрөнгийн өртөг гэх мэт.

"Статистикийн хураангуй ба бүлэглэл" сэдвээр асуудлыг шийдвэрлэх жишээ

Асуудал 1 ... Өнгөрсөн хичээлийн жилд оюутнуудын захиалгаар хэдэн ном авсан талаарх мэдээлэл бий.

Цувралын элементүүдийг тодорхойлж эрэмбэлэгдсэн ба салангид вариацын тархалтын цувралыг байгуул.

Шийдэл

Энэ багц нь оюутнуудын хүлээн авах номын тооны олон сонголтыг илэрхийлдэг. Ийм сонголтуудын тоог тоолж, вариацын муж болон вариацын дискрет тархалтын цуваа хэлбэрээр зохион байгуулъя.

Даалгавар 2 ... 50 аж ахуйн нэгжийн үндсэн хөрөнгийн өртөг, мянган рубльтэй холбоотой мэдээлэл байна.

Аж ахуйн нэгжийн 5 бүлгийг (тэнцүү интервалаар) онцлон тэмдэглэсэн цуврал хуваарилалтыг байгуул.

Шийдэл

Шийдлийн хувьд бид аж ахуйн нэгжүүдийн үндсэн хөрөнгийн өртгийн хамгийн том, хамгийн бага утгыг сонгох болно. Эдгээр нь 30.0 ба 10.2 мянган рубль юм.

Интервалын хэмжээг олъё: h = (30.0-10.2): 5 = 3.96 мянган рубль.

Дараа нь эхний бүлэгт 10.2 мянган рубльтэй тэнцэх хэмжээний үндсэн хөрөнгөтэй аж ахуйн нэгжүүд орно. 10.2 + 3.96 = 14.16 мянган рубль хүртэл. Ийм 9 аж ахуйн нэгж байх болно.Хоёр дахь бүлэгт үндсэн хөрөнгийн хэмжээ нь 14.16 мянган рубль болох аж ахуйн нэгжүүд орно. 14.16 + 3.96 = 18.12 мянган рубль хүртэл. Ийм 16 аж ахуйн нэгж байх болно.Үүний нэгэн адил бид гурав, дөрөв, тавдугаар бүлэгт багтсан аж ахуйн нэгжийн тоог олдог.

Үр дүнгийн хуваарилалтын цувралыг хүснэгтэд байрлуулна.

Асуудал 3 ... Хөнгөн үйлдвэрийн хэд хэдэн аж ахуйн нэгжийн хувьд дараахь мэдээллийг авсан болно.

Аж ахуйн нэгжүүдийг ажилчдын тоогоор нь бүлэглэж, тэнцүү зайтайгаар 6 бүлэг байгуулна. Бүлэг тус бүрийг тоолно уу:

1. аж ахуйн нэгжийн тоо
2. ажилчдын тоо
3.жилд үйлдвэрлэсэн бүтээгдэхүүний хэмжээ
4.нэг ажилчдын дундаж бодит бүтээгдэхүүн
5.үндсэн хөрөнгийн хэмжээ
6.нэг аж ахуйн нэгжийн үндсэн хөрөнгийн дундаж хэмжээ
7.нэг аж ахуйн нэгжийн үйлдвэрлэсэн бүтээгдэхүүний дундаж үнэ

Тооцооллын үр дүнг хүснэгтэд бөглөнө үү. Дүгнэлт гаргах.

Шийдэл

Шийдлийн хувьд бид аж ахуйн нэгжийн ажилчдын дундаж тооноос хамгийн том, хамгийн бага утгыг сонгох болно. Эдгээр нь 43 ба 256 юм.

Интервалын хэмжээг ол: h = (256-43): 6 = 35.5

Дараа нь эхний бүлэгт дундаж ажилчдын тоо 43-43 + 35.5 = 78.5 хүн байдаг аж ахуйн нэгжүүд орно. Ийм 5 аж ахуйн нэгж байх болно.Хоёр дахь бүлэгт ажилчдын дундаж тоо 78.5-аас 78.5 + 35.5 = 114 хүн байх аж ахуйн нэгжүүд орно. Ийм 12 аж ахуйн нэгж байх болно.Үүний нэгэн адил гурав, дөрөв, тав, зургаадугаар бүлэгт багтсан аж ахуйн нэгжийн тоог олно.

Бид үр дүнгийн тархалтын цувралыг хүснэгтэд байрлуулж, бүлэг тус бүрт шаардлагатай үзүүлэлтүүдийг тооцоолно.

Гаралт : Хүснэгтээс харахад хоёрдугаар бүлгийн аж ахуйн нэгжүүд хамгийн олон байдаг. Үүнд 12 аж ахуйн нэгж багтдаг. Хамгийн жижиг нь тав, зургаа дахь бүлэг (тус бүр хоёр аж ахуйн нэгж). Эдгээр нь хамгийн том аж ахуйн нэгжүүд (ажилчдын тоогоор) юм.

Хоёр дахь бүлэг нь хамгийн олон байдаг тул энэ бүлгийн аж ахуйн нэгжүүдийн жилд үйлдвэрлэсэн бүтээгдэхүүний хэмжээ, үндсэн хөрөнгийн хэмжээ бусадтай харьцуулахад хамаагүй өндөр байна. Үүний зэрэгцээ энэ бүлгийн аж ахуйн нэгжүүдийн нэг ажилтны дундаж бодит бүтээгдэхүүн хамгийн өндөр биш байна. Энд дөрөвдүгээр бүлгийн аж ахуйн нэгжүүд тэргүүлж байна. Энэ бүлэгт мөн нэлээд их хэмжээний үндсэн хөрөнгө багтдаг.

Дүгнэж хэлэхэд, үндсэн хөрөнгийн дундаж хэмжээ, нэг аж ахуйн нэгжийн үйлдвэрлэлийн дундаж үнэ нь тухайн аж ахуйн нэгжийн хэмжээтэй (ажилчдын тоогоор) шууд пропорциональ байгааг тэмдэглэж байна.

Лабораторийн ажил No1

Математик статистикийн дагуу

Сэдэв: Туршилтын өгөгдлийг анхан шатны боловсруулалт

3. Оноогоор оноо. 1

5. Хяналтын асуултууд .. 2

6. Лабораторийн ажил гүйцэтгэх арга зүй .. 3

ажлын зорилго

Математик статистикийн аргаар эмпирик өгөгдлийг анхан шатны боловсруулалт хийх ур чадвар эзэмших.

Туршилтын нийт мэдээлэлд үндэслэн дараахь ажлуудыг гүйцэтгэнэ.

Дасгал 1.Тархалтын интервалын вариацын цувааг байгуул.

Даалгавар 2.Интервалын вариацын цувааны давтамжийн гистограммыг байгуул.

Даалгавар 3.Эмпирик тархалтын функцийг зурж, график байгуул.

a) загвар ба медиан;

б) нөхцөлт эхний мөчүүд;

в) түүврийн дундаж;

г) түүврийн дисперс, ерөнхий олонлогийн зассан дисперс, залруулсан стандарт хазайлт;

e) хэлбэлзлийн коэффициент;

е) тэгш бус байдал;

ж) илүүдэл;

Даалгавар 5.Өгөгдсөн найдвартай байдлын дагуу судлагдсан санамсаргүй хэмжигдэхүүний тоон шинж чанарын жинхэнэ утгуудын хил хязгаарыг тодорхойлно.

Даалгавар 6.Асуудлын нөхцөл байдлын дагуу анхан шатны боловсруулалтын үр дүнг бодитойгоор тайлбарлах.

Оноо оноо

Даалгавар 1-56 оноо

Даалгавар 62 оноо

Лабораторийн ажлыг хамгаалах(хяналтын асуулт, лабораторийн ажлын талаар аман ярилцлага) - 2 оноо

Бүтээлийг А4 хуудсан дээр бичгээр өгөх ёстой бөгөөд үүнд:

1) Гарчиг хуудас (Хавсралт 1)

2) Анхны өгөгдөл.

3) Заасан дээжийн дагуу ажил ирүүлэх.

4) Тооцооллын үр дүн (гараар гүйцэтгэсэн ба / эсвэл MS Excel ашиглан) заасан дарааллаар.

5) Дүгнэлт - асуудлын нөхцөл байдлын дагуу анхан шатны боловсруулалтын үр дүнг утга учиртай тайлбарлах.

6) Ажлын болон тестийн асуултын талаар аман ярилцлага.



5. Хяналтын асуултууд


Лабораторийн ажлын техник

Даалгавар 1. Тархалтын интервалын вариацын цувааг байгуул

Статистикийн өгөгдлийг ижил зайтай сонголт бүхий вариацын цуврал хэлбэрээр үзүүлэхийн тулд дараахь зүйлийг хийх шаардлагатай.

1. Анхны өгөгдлийн хүснэгтээс хамгийн бага ба хамгийн том утгыг ол.

2. Тодорхойлох хэлбэлзлийн хүрээ :

3. Хэрэв түүвэрт 1000 хүртэлх өгөгдөл агуулагдаж байвал h интервалын уртыг тодорхойлно уу. , энд n нь түүврийн хэмжээ - түүвэр дэх өгөгдлийн хэмжээ; lgn нь тооцоололд ашиглагддаг).

Тооцоолсон харьцаа нь дугуйрсан байна тохиромжтой бүхэл тоо .

4. Тэгш тооны интервалын эхний интервалын эхлэлийг тодорхойлох.Утгыг авахыг зөвлөж байна; мөн сондгой тооны интервалын хувьд.

5. Бүлэглэх интервалуудыг бичиж, заагуудын өсөх дарааллаар байрлуул

, ,………., ,

эхний интервалын доод хил хаана байна. Тохиромжтой тоог авсан, илүү биш, сүүлчийн интервалын дээд хязгаар нь багагүй байх ёстой. Интервалууд нь санамсаргүй хэмжигдэхүүний анхны утгуудыг агуулж, үүнээс салахыг зөвлөж байна 5-аас 20 хүртэлинтервалууд.

6. Бүлэглэлтийн интервал дээр эхний өгөгдлийг бүртгэх, өөрөөр хэлбэл. Анхны хүснэгтийн дагуу заасан интервалд орох санамсаргүй хэмжигдэхүүний утгын тоог тооцоол. Хэрэв зарим утгууд интервалын хилтэй давхцаж байвал дараа нь тэдгээрийг зөвхөн өмнөх, эсвэл зөвхөн дараагийн интервалд шилжүүлнэ.

Тайлбар 1.Интервалуудын урт нь тэнцүү байх шаардлагагүй. Утга нь илүү нягтралтай байгаа газруудад жижиг, богино интервалуудыг авах нь илүү тохиромжтой, бага давтамжтай бол илүү том байх болно.

Тайлбар 2.Хэрэв зарим утгын хувьд "тэг" эсвэл давтамжийн жижиг утгыг олж авсан бол интервалыг нэмэгдүүлэх (алхамыг нэмэгдүүлэх) өгөгдлийг дахин бүлэглэх шаардлагатай.