خلاصه آماری و گروه بندی. سری توزیع آماری نمونه هایی از حل مسئله ترسیم یک سری توزیع بازه ای

درس عملی 1

سری تنوع توزیع

سری تغییراتیا نزدیک توزیعتوزیع مرتب واحدهای جمعیت را با افزایش (اغلب) یا کاهش (کمتر) مقادیر ویژگی و شمارش تعداد واحدها با یک یا مقدار دیگری از ویژگی نامیده می شود.

3 وجود دارد از نوعسری توزیع:

1) ردیف رتبه بندی شده- این لیستی از واحدهای فردی جمعیت به ترتیب صعودی صفت مورد مطالعه است. اگر تعداد واحدهای جمعیت به اندازه کافی زیاد باشد، سری رتبه بندی شده دست و پا گیر می شود و در چنین مواردی، سری توزیع با گروه بندی واحدهای جمعیت بر اساس مقادیر مشخصه مورد مطالعه ساخته می شود (اگر ویژگی تعداد کمی از ویژگی ها را بگیرد. مقادیر، سپس یک سری گسسته ساخته می شود، و در غیر این صورت - یک سری فاصله).

2) سری گسستهیک جدول متشکل از دو ستون (ردیف) - مقادیر خاص یک ویژگی متغیر است ایکس منو تعداد واحدهای جمعیت با مقدار مشخصی از ویژگی f من- فرکانس ها؛ تعداد گروه ها در یک ردیف گسسته با تعداد مقادیر واقعی موجود مشخصه متغیر تعیین می شود.

3) سری بازه ایجدولی است متشکل از دو ستون (ردیف) - فواصل یک ویژگی متغیر ایکس منو تعداد واحدهای جمعیتی که در یک بازه معین (فرکانس ها) قرار می گیرند، یا سهم این تعداد در تعداد کل جمعیت ها (فرکانس ها).

اعدادی که نشان می‌دهند چند بار گزینه‌های فردی در یک جمعیت معین رخ می‌دهند، فراخوانی می‌شوند فرکانس هایا ترازونوع و با حروف کوچک الفبای لاتین نشان داده می شود f. مجموع کل فرکانس های سری تغییرات برابر با حجم جمعیت داده شده است، یعنی.

جایی که ک- تعداد گروه ها n- تعداد کل مشاهدات یا حجم جمعیت.

فرکانس ها (وزن ها) نه تنها به صورت مطلق، بلکه در اعداد نسبی نیز بیان می شوند - در کسری از یک واحد یا به صورت درصدی از تعداد کل متغیرهایی که یک مجموعه معین را تشکیل می دهند. در چنین مواردی وزنه ها نامیده می شوند فرکانس های نسبییا زود زود.مجموع کل جزئیات برابر با یک است

یا
,

اگر فرکانس ها به صورت درصدی از تعداد کل مشاهدات بیان شوند پ.جایگزینی فرکانس‌ها با فرکانس‌ها ضروری نیست، اما گاهی اوقات در مواردی که لازم است سری‌های تغییراتی که از نظر حجم بسیار متفاوت هستند، با یکدیگر مقایسه شود مفید و حتی ضروری است.

بسته به اینکه ویژگی چگونه تغییر می کند - به طور گسسته یا پیوسته، در یک محدوده وسیع یا باریک - جامعه آماری در بدون فاصلهیا فاصلهسری تغییرات در حالت اول، فرکانس‌ها مستقیماً به مقادیر رتبه‌بندی صفت مربوط می‌شوند که موقعیت گروه‌ها یا کلاس‌های جداگانه سری تغییرات را به دست می‌آورند؛ در حالت دوم، فرکانس‌ها مربوط به فواصل یا فواصل فردی (از - به) که در آن کل تنوع صفت در محدوده از حداقل تا حداکثر گزینه برای یک جمعیت معین تقسیم می شود. این شکاف ها، یا دهانه های کلاس، ممکن است از نظر عرض برابر باشند یا نباشند. از اینجا تشخیص می دهند سری تغییرات بازه ای مساوی و نامساویدر سری‌های با فاصله نابرابر، ماهیت توزیع فرکانس با تغییر عرض فواصل کلاس تغییر می‌کند. گروه بندی فاصله نابرابر نسبتاً به ندرت در زیست شناسی استفاده می شود. به عنوان یک قاعده، داده های بیومتریک در سری های با فاصله مساوی توزیع می شوند، که نه تنها اجازه می دهد تا نظم تغییرات را آشکار کند، بلکه محاسبه خصوصیات عددی خلاصه سری تغییرات، مقایسه سری های توزیع با یکدیگر را نیز تسهیل می کند.

هنگام شروع به ساخت یک سری تغییرات با بازه مساوی، مهم است که به درستی عرض فاصله کلاس را مشخص کنید. واقعیت این است که گروه بندی خشن (زمانی که فواصل کلاسی بسیار گسترده ایجاد می شود) ویژگی های معمولی تنوع را تحریف می کند و منجر به کاهش دقت ویژگی های عددی سری می شود. هنگام انتخاب فواصل بسیار باریک، دقت ویژگی های عددی تعمیم دهنده افزایش می یابد، اما معلوم می شود که این سری بیش از حد کشیده است و تصویر واضحی از تغییرات ارائه نمی دهد.

برای به دست آوردن یک سری تغییرات به وضوح قابل مشاهده و برای اطمینان از دقت کافی مشخصه های عددی محاسبه شده بر روی آن، تنوع ویژگی (در محدوده حداقل تا حداکثر گزینه ها) باید به تعدادی گروه یا کلاس تقسیم شود که هر دو الزامات را برآورده کند. این مشکل با تقسیم دامنه تغییرات ویژگی بر تعداد گروه ها یا کلاس های مشخص شده در ساخت سری تغییرات حل می شود:

,

جایی که ساعت- اندازه فاصله؛ ایکس m a x و ایکسحداقل - حداکثر و حداقل مقادیر در مجموع؛ ک- تعداد گروه ها

هنگام ساخت یک سری توزیع بازه ای، لازم است تعداد بهینه گروه ها (فاصله های ویژگی) را انتخاب کرده و طول (محدوده) بازه را تعیین کنید. از آنجایی که تجزیه و تحلیل یک سری از توزیع ها، فرکانس ها را در بازه های مختلف مقایسه می کند، لازم است که طول بازه ها ثابت باشد. اگر باید با یک سری بازه‌ای از توزیع‌ها با فواصل نابرابر برخورد کنید، برای مقایسه باید فرکانس یا فرکانس را به واحد بازه کاهش دهید، مقدار حاصل نامیده می‌شود. تراکم ρ ، به این معنا که
.

تعداد بهینه گروه ها به گونه ای انتخاب می شود که تنوع مقادیر صفت در کل به اندازه کافی منعکس شود و در عین حال نظم توزیع، شکل آن توسط نوسانات تصادفی فرکانس ها تحریف نشود. اگر گروه ها خیلی کم باشند، الگوی تنوع ظاهر نمی شود. اگر تعداد گروه‌ها خیلی زیاد باشد، پرش فرکانس تصادفی شکل توزیع را مخدوش می‌کند.

اغلب، تعداد گروه ها در یک سری توزیع با فرمول استرجس تعیین می شود:

جایی که n- اندازه جمعیت

یک نمایش گرافیکی کمک اساسی در تجزیه و تحلیل تعدادی از توزیع ها و ویژگی های آنها می کند. سری بازه ها با یک نمودار میله ای نشان داده می شود که در آن پایه میله های واقع در محور آبسیسا فواصل مقادیر ویژگی متغیر است و ارتفاع میله ها فرکانس های مربوط به مقیاس در امتداد محور ترتیبی این نوع نمودار نامیده می شود هیستوگرام

اگر یک سری توزیع گسسته وجود داشته باشد یا از نقاط میانی فواصل استفاده شود، نمایش گرافیکی چنین سری نامیده می شود. چند ضلعی، که از اتصال نقاط مستقیم با مختصات به دست می آید ایکس منو f من .

اگر مقادیر کلاس ها را روی ابسیسا رسم کنید و فرکانس های انباشته شده را روی مختصات رسم کنید، سپس نقاط را با خطوط مستقیم به هم وصل کنید، نموداری به نام دریافت می کنید. انباشته.فرکانس های انباشته شده با جمع متوالی یا تجمعفرکانس ها در جهت از کلاس اول تا انتهای سری تغییرات.

مثال. داده هایی در مورد تولید تخم 50 مرغ تخمگذار برای 1 سال نگهداری شده در مرغداری وجود دارد (جدول 1.1).

جدول 1.1

تولید تخم مرغ در مرغ های تخمگذار

شماره مرغ تخمگذار

تولید تخم مرغ، عدد

شماره مرغ تخمگذار

تولید تخم مرغ، عدد

شماره مرغ تخمگذار

تولید تخم مرغ، عدد

شماره مرغ تخمگذار

تولید تخم مرغ، عدد

شماره مرغ تخمگذار

تولید تخم مرغ، عدد

ساخت یک سری توزیع بازه ای و نمایش گرافیکی آن در قالب هیستوگرام، چند ضلعی و انباشته ها الزامی است.

مشاهده می شود که این صفت از 212 تا 245 تخم مرغ در یک سال متفاوت است.

در مثال ما، با استفاده از فرمول استرجس، تعداد گروه ها را تعیین می کنیم:

ک = 1 + 3,322ال جی 50 = 6,643 ≈ 7.

بیایید طول (محدوده) بازه را با استفاده از فرمول محاسبه کنیم:

.

بیایید یک سری فاصله با 7 گروه و فاصله 5 قطعه بسازیم. تخم مرغ (جدول 1.2). برای ساخت نمودارها در جدول، وسط فواصل و فرکانس انباشته شده را محاسبه می کنیم.

جدول 1.2

سری فاصله توزیع تولید تخم مرغ

گروه مرغ های تخمگذار بر اساس ارزش تولید تخم

ایکس من

تعداد مرغ تخمگذار

f من

وسط فاصله

ایکسمن '

فرکانس انباشته شده

f من

بیایید یک هیستوگرام از توزیع تولید تخم بسازیم (شکل 1.1).

برنج. 1.1. هیستوگرام توزیع تولید تخم مرغ

این هیستوگرام ها شکل توزیع مشخصه بسیاری از ویژگی ها را نشان می دهند: مقادیر متوسط ​​فواصل ویژگی رایج تر است، کمتر - مقادیر شدید (کوچک و بزرگ) ویژگی. شکل این توزیع نزدیک به قانون توزیع نرمال است که در صورتی شکل می گیرد که متغیر متغیر تحت تأثیر تعداد زیادی از عوامل قرار گیرد که هیچ یک از آنها مقدار غالب ندارند.

چند ضلعی و توزیع تجمعی تولید تخم به شکل (شکل 1.2 و 1.3) است.

برنج. 1.2. چند ضلعی توزیع تخم مرغ

برنج. 1.3. کومولوم توزیع تولید تخم مرغ

تکنولوژی برای حل مشکل در پردازنده جدولی مایکروسافت برتری داشتن بعد.

1. داده های اولیه را مطابق شکل وارد کنید. 1.4.

2. ردیف را رتبه بندی کنید.

2.1. سلول های A2: A51 را انتخاب کنید.

2.2. روی نوار ابزار روی دکمه کلیک چپ کنید<Сортировка по возрастанию > .

3. اندازه فاصله را برای رسم سری توزیع بازه ای تعیین کنید.

3.1. سلول A2 را در سلول E53 کپی کنید.

3.2. سلول A51 را در سلول E54 کپی کنید.

3.3. دامنه تغییرات را محاسبه کنید. برای این کار فرمول را در سلول E55 وارد کنید = E54-E53.

3.4. تعداد گروه های تغییرات را محاسبه کنید. برای این کار فرمول را در سلول E56 وارد کنید = 1 + 3.322 * LOG10 (50).

3.5. تعداد گرد شده گروه ها را در سلول E57 وارد کنید.

3.6. طول بازه را محاسبه کنید. برای این کار فرمول را در سلول E58 وارد کنید = E55 / E57.

3.7. طول گرد شده فاصله را در سلول E59 وارد کنید.

4. یک سری فاصله بسازید.

4.1. سلول E53 را در سلول B64 کپی کنید.

4.2. فرمول را در سلول B65 وارد کنید = B64 + $ E $ 59.

4.3. سلول B65 را در سلول های B66: B70 کپی کنید.

4.4. فرمول را در سلول C64 وارد کنید = B65.

4.5. فرمول را در سلول C65 وارد کنید = C64 + $ E $ 59.

4.6. سلول C65 را در سلول های C66: C70 کپی کنید.

نتایج راه حل به شکل زیر بر روی صفحه نمایش نمایش داده می شود (شکل 1.5).

5. فرکانس بازه را محاسبه کنید.

5.1. دستور را اجرا کنید سرویس,تحلیل داده هابا کلیک متناوب با دکمه سمت چپ ماوس.

5.2. در کادر محاوره ای تحلیل داده هااز دکمه سمت چپ ماوس برای نصب استفاده کنید: ابزارهای تجزیه و تحلیل <Гистограмма>(شکل 1.6).

5.3. روی دکمه کلیک چپ کنید<ОК>.

5.4. در برگه نمودار میله ایپارامترها را مطابق شکل تنظیم کنید. 1.7.

5.5. روی دکمه کلیک چپ کنید<ОК>.

نتایج راه حل به شکل زیر بر روی صفحه نمایش نمایش داده می شود (شکل 1.8).

6. جدول "سری فاصله توزیع" را پر کنید.

6.1. سلول های B74: B80 را در سلول های D64: D70 کپی کنید.

6.2. مجموع فرکانس ها را محاسبه کنید. برای انجام این کار، سلول های D64: D70 را انتخاب کنید و روی نوار ابزار روی دکمه کلیک چپ کنید<Автосумма > .

6.3. نقطه میانی فواصل را محاسبه کنید. برای این کار فرمول را در سلول E64 وارد کنید = (B64 + C64) / 2و در سلول های E65: E70 کپی کنید.

6.4. فرکانس های انباشته شده را محاسبه کنید. برای این کار سلول D64 را در سلول F64 کپی کنید. در سلول F65 فرمول = F64 + D65 را وارد کرده و آن را در سلول های F66: F70 کپی کنید.

نتایج راه حل به شکل زیر بر روی صفحه نمایش نمایش داده می شود (شکل 1.9).

7. هیستوگرام را ویرایش کنید

7.1. روی نمودار روی نام "pocket" کلیک راست کرده و روی تب ظاهر شده، کلیک کنید<Очистить>.

7.2. بر روی نمودار کلیک راست کرده و روی تب ظاهر شده، روی دکمه کلیک کنید<Исходные данные>.

7.3. در کادر محاوره ای اطلاعات اولیهبرچسب های محور X را تغییر دهید برای این کار سلول های B64: C70 را انتخاب کنید (شکل 1.10).

7.5. کلید را فشار دهید .

نتایج به شکل زیر بر روی صفحه نمایش نمایش داده می شود (شکل 1.11).

8. یک چند ضلعی برای توزیع تولید تخم بسازید.

8.1. روی نوار ابزار روی دکمه کلیک چپ کنید<Мастер диаграмм > .

8.2. در کادر محاوره ای جادوگر نمودار (مرحله 1 از 4)از دکمه سمت چپ ماوس برای تنظیم: استاندارد  استفاده کنید<График>(شکل 1.12).

8.3. روی دکمه کلیک چپ کنید<Далее>.

8.4. در کادر محاوره ای جادوگر نمودار (مرحله 2 از 4)پارامترها را مطابق شکل تنظیم کنید. 1.13.

8.5. روی دکمه کلیک چپ کنید<Далее>.

8.6. در کادر محاوره ای جادوگر نمودار (مرحله 3 از 4)نام نمودار و محور y را وارد کنید (شکل 1.14).

8.7. روی دکمه کلیک چپ کنید<Далее>.

8.8. در کادر محاوره ای جادوگر نمودار (مرحله 4 از 4)پارامترها را مطابق شکل تنظیم کنید. 1.15.

8.9. روی دکمه کلیک چپ کنید<Готово>.

نتایج بر روی صفحه نمایش به شکل زیر نمایش داده می شود (شکل 1.16).

9. برچسب های داده را روی نمودار درج کنید.

9.1. بر روی نمودار کلیک راست کرده و روی تب ظاهر شده، روی دکمه کلیک کنید<Исходные данные>.

9.2. در کادر محاوره ای اطلاعات اولیهبرچسب های محور X را تغییر دهید برای این کار سلول های E64: E70 را انتخاب کنید (شکل 1.17).

9.3. کلید را فشار دهید .

نتایج به شکل زیر بر روی صفحه نمایش نمایش داده می شود (شکل 1.18).

توزیع تجمعی مشابه چند ضلعی توزیع بر اساس فرکانس های انباشته شده ساخته می شود.

آنها در قالب سری های توزیع ارائه شده و در قالب ساخته شده اند.

سری توزیع نوعی گروه بندی است.

سری توزیع- نشان دهنده توزیع منظم واحدهای جمعیت مورد مطالعه به گروه ها با توجه به یک ویژگی متفاوت است.

بسته به ویژگی زیربنایی تشکیل یک سری از توزیع ها، آنها متمایز می شوند اسنادی و متغیررتبه های توزیع:

  • اسنادی- سری توزیع را که با توجه به ویژگی های کیفی ساخته شده است، فراخوانی کنید.
  • سری های توزیع ساخته شده به ترتیب صعودی یا نزولی مقادیر یک مشخصه کمی نامیده می شوند. متغیر.
سری تغییرات توزیع شامل دو ستون است:

ستون اول حاوی مقادیر کمی ویژگی متغیر است که نامیده می شود گزینه هاو نشان داده شده اند. گزینه گسسته - به عنوان یک عدد صحیح بیان می شود. گزینه interval از و تا متغیر است. بسته به نوع انواع، می توانید یک سری تغییرات گسسته یا بازه ای بسازید.
ستون دوم شامل تعداد گزینه خاصبیان شده بر حسب فرکانس یا فرکانس:

فرکانس ها- اینها اعداد مطلقی هستند که نشان می‌دهند چند بار یک مقدار مشخص از یک ویژگی در مجموع اتفاق می‌افتد که نشان‌دهنده آن است. مجموع همه فرکانس ها باید برابر با تعداد واحدهای کل جمعیت باشد.

فرکانس ها() آیا فرکانس ها به صورت درصدی از کل بیان می شوند. مجموع تمام فرکانس ها که به صورت درصد بیان می شوند باید برابر با 100 درصد در کسری از یک باشد.

نمایش گرافیکی ردیف های توزیع

سری های توزیع با استفاده از نمایش های گرافیکی تجسم می شوند.

سری های توزیع به شرح زیر است:
  • چند ضلعی
  • هیستوگرام ها
  • تجمع می کند
  • می دهد

چند ضلعی

هنگام ساخت یک چند ضلعی بر روی محور افقی (محور آبسیسا)، مقادیر ویژگی متغیر ترسیم می شود و در محور عمودی (محور مختصات) - فرکانس ها یا فرکانس ها.

چند ضلعی در شکل 6.1 بر اساس سرشماری خرد جمعیت روسیه در سال 1994 ساخته شده است.

6.1. توزیع خانوارها بر اساس اندازه

وضعیت: داده ها در مورد توزیع 25 کارمند یکی از شرکت ها بر اساس دسته های تعرفه ارائه شده است:
4; 2; 4; 6; 5; 6; 4; 1; 3; 1; 2; 5; 2; 6; 3; 1; 2; 3; 4; 5; 4; 6; 2; 3; 4
وظیفه: یک سری تغییرات گسسته بسازید و آن را به صورت گرافیکی به صورت چند ضلعی توزیع نمایش دهید.
راه حل:
در این مثال، گزینه ها درجه دستمزد کارمند هستند. برای تعیین فرکانس ها، لازم است تعداد کارکنان با دسته دستمزد مربوطه محاسبه شود.

چند ضلعی برای سری تغییرات گسسته استفاده می شود.

برای ساختن یک چند ضلعی توزیع (شکل 1)، در امتداد محور آبسیسا (X)، مقادیر کمی ویژگی های مختلف - گزینه ها، و در امتداد مختصات - فرکانس ها یا فرکانس ها را به تعویق می اندازیم.

اگر مقادیر یک ویژگی به صورت فواصل بیان شود، چنین سری فاصله نامیده می شود.
ردیف های فاصلهتوزیع ها به صورت گرافیکی به صورت هیستوگرام، انباشته یا گیوه رسم می شوند.

جدول آماری

وضعیت: داده های مربوط به اندازه سپرده های 20 نفر در یک بانک (هزار روبل) 60؛ 25; 12; 10; 68; 35; 2 17; 51; 9; 3; 130; 24; 85; یکصد؛ 152; 6 هجده؛ 7; 42.
وظیفه: یک سری تغییرات بازه ای را در فواصل مساوی رسم کنید.
راه حل:

  1. جمعیت اصلی شامل 20 واحد (N = 20) است.
  2. با استفاده از فرمول استرجس، تعداد مورد نیاز گروه های مورد استفاده را تعیین می کنیم: n = 1 + 3.322 * lg20 = 5
  3. ما مقدار یک فاصله مساوی را محاسبه می کنیم: i = (152 - 2) / 5 = 30 هزار روبل
  4. بیایید جمعیت اولیه را به 5 گروه با فاصله 30 هزار روبل تقسیم کنیم.
  5. نتایج گروه بندی در جدول ارائه شده است:

با چنین ضبطی از یک ویژگی پیوسته، هنگامی که یک مقدار دو بار اتفاق می افتد (به عنوان حد بالای یک بازه و حد پایین یک بازه دیگر)، آنگاه این مقدار به گروهی اشاره دارد که این مقدار به عنوان حد بالایی عمل می کند.

نمودار میله ای

برای ساختن یک هیستوگرام در امتداد آبسیسا، مقادیر مرزهای فواصل مشخص شده و بر اساس آنها مستطیل هایی ساخته می شوند که ارتفاع آنها متناسب با فرکانس ها (یا قطعات) است.

در شکل 6.2. هیستوگرام توزیع جمعیت روسیه در سال 1997 بر اساس گروه های سنی را نشان می دهد.

برنج. 6.2. توزیع جمعیت روسیه بر اساس گروه های سنی

وضعیت: توزیع 30 نفر از کارکنان شرکت به اندازه حقوق ماهانه داده شده است

وظیفه: سری تغییرات بازه را به صورت گرافیکی به صورت هیستوگرام نمایش داده و انباشته می شود.
راه حل:

  1. مرز ناشناخته بازه باز (اول) با مقدار فاصله دوم تعیین می شود: 7000 - 5000 = 2000 روبل. با همان مقدار، حد پایین بازه اول را پیدا می کنیم: 5000 - 2000 = 3000 روبل.
  2. برای ساختن یک هیستوگرام در یک سیستم مختصات مستطیلی در امتداد محور ابسیسا، بخش هایی را کنار می گذاریم که مقادیر آنها با فواصل سری واریته مطابقت دارد.
    این بخش ها به عنوان پایه پایین تر و فرکانس مربوطه (فرکانس) - ارتفاع مستطیل های تشکیل شده است.
  3. بیایید یک هیستوگرام بسازیم:

برای ساخت انباشته ها باید فرکانس های انباشته شده (فرکانس ها) را محاسبه کرد. آنها با جمع متوالی فرکانس‌ها (فرکانس‌های) بازه‌های قبلی تعیین می‌شوند و با S نشان داده می‌شوند.

تجمعی

توزیع یک ویژگی در سری تغییرات با توجه به فرکانس‌های انباشته شده (قطعات) با استفاده از انباشته‌ها نشان داده می‌شود.

تجمعییا منحنی تجمعی، بر خلاف چند ضلعی، از فرکانس ها یا قطعات انباشته شده ساخته می شود. در این حالت، مقادیر مشخصه روی محور آبسیسا و فرکانس‌ها یا فرکانس‌های انباشته‌شده روی محور ارتین قرار می‌گیرند (شکل 6.3).

برنج. 6.3. توزیع تجمعی خانوارها بر اساس اندازه

4. بیایید فرکانس های انباشته شده را محاسبه کنیم:
فرکانس زانو فاصله اول به شرح زیر محاسبه می شود: 0 + 4 = 4، برای دوم: 4 + 12 = 16. برای سوم: 4 + 12 + 8 = 24 و غیره.

هنگام ساخت انباشته ها، فرکانس (فرکانس) انباشته بازه مربوطه به حد بالایی آن اختصاص می یابد:

اوگیوا

اوگیوامشابه انباشته ساخته می شود، با تنها تفاوتی که فرکانس های انباشته شده روی محور آبسیسا و مقادیر مشخصه ها روی محور ارتین قرار می گیرند.

انواع تجمعات منحنی غلظت یا نمودار لورنتس است. برای ترسیم منحنی غلظت، یک مقیاس مقیاس در درصد از 0 تا 100 بر روی هر دو محور یک سیستم مختصات مستطیلی اعمال می شود. حجم ویژگی روی دستور مشخص شده است.

توزیع یکنواخت ویژگی مطابق با مورب مربع روی نمودار است (شکل 6.4). با توزیع ناهموار، نمودار بسته به سطح غلظت صفت، یک منحنی مقعر است.

6.4. منحنی تمرکز

گروه‌بندی داده‌های آماری چیست و چگونه با سری‌های توزیع مرتبط است، در این سخنرانی مورد بحث قرار گرفت، جایی که می‌توانید با چیستی سری توزیع گسسته و متغیر آشنا شوید.

سری های توزیعی یکی از انواع سری های آماری هستند (جدا از آنها از سری های دینامیک در آمار استفاده می شود)، از آنها برای تجزیه و تحلیل داده های پدیده های زندگی اجتماعی استفاده می شود. ساخت مجموعه ای از تغییرات یک کار کاملا عملی برای همه است. با این حال، قوانینی وجود دارد که باید به خاطر بسپارید.

نحوه ترسیم یک سری توزیع متغیر گسسته

مثال 1. داده هایی در مورد تعداد فرزندان در 20 خانواده مورد بررسی وجود دارد. یک سری تغییرات گسسته بسازید توزیع خانواده هابا تعداد فرزندان.

0 1 2 3 1
2 1 2 1 0
4 3 2 1 1
1 0 1 0 2

راه حل:

  1. ما با یک طرح برای جدول شروع می کنیم، که سپس داده ها را در آن پر می کنیم. از آنجایی که سطرهای توزیع دارای دو عنصر هستند، جدول از دو ستون تشکیل شده است. ستون اول همیشه یک گزینه است - آنچه در حال مطالعه آن هستیم - نام آن را از تکلیف می گیریم (پایان جمله با تکلیف در شرایط) - با تعداد فرزندان- پس گزینه ما تعداد فرزندان است.

ستون دوم فرکانس است - هر چند وقت یکبار نوع ما در پدیده مورد مطالعه رخ می دهد - نام ستون را نیز از کار می گیریم - توزیع خانواده ها - بنابراین فراوانی ما تعداد خانواده هایی است که تعداد فرزندان مربوطه را دارند.

  1. اکنون، از داده های اولیه، مقادیری را که حداقل یک بار رخ می دهند، انتخاب کنید. در مورد ما اینطور است

و این داده ها را در ستون اول جدول به ترتیب منطقی ترتیب می دهیم، در این حالت از 0 به 4 افزایش می یابد.

و در پایان، بیایید شمارش کنیم که هر مقدار از گزینه ها چند بار رخ می دهد.

0 1 2 3 1

2 1 2 1 0

4 3 2 1 1

1 0 1 0 2

در نتیجه یک جدول کامل یا سری مورد نیاز از توزیع خانواده ها بر اساس تعداد فرزندان بدست می آوریم.

ورزش . داده هایی در مورد دسته های دستمزد 30 کارگر این شرکت وجود دارد. یک سری تغییرات گسسته برای توزیع کارگران بر اساس دسته دستمزد بسازید. 2 3 2 4 4 5 5 4 6 3

1 4 4 5 5 6 4 3 2 3

4 5 4 5 5 6 6 3 3 4

چگونه یک سری تغییرات بازه ای از یک توزیع را رسم کنیم

بیایید یک سری توزیع بازه ای بسازیم، و ببینیم که ساختار آن با یک سری گسسته چه تفاوتی دارد.

مثال 2. اطلاعاتی در مورد میزان سود دریافتی توسط 16 شرکت، میلیون روبل وجود دارد. - 23 48 57 12 118 9 16 22 27 48 56 87 45 98 88 63. یک سری تغییرات بازه ای از توزیع شرکت ها بر حسب سود ایجاد کنید و 3 گروه را در فواصل مساوی برجسته کنید.

اصل کلی ساخت سری البته حفظ خواهد شد، همان دو ستون، گزینه ها و فرکانس یکسان، اما در اینجا گزینه در بازه قرار می گیرد و فرکانس ها متفاوت شمارش می شود.

راه حل:

  1. بیایید به روشی مشابه کار قبلی با ساختن یک طرح برای یک جدول شروع کنیم، که سپس داده ها را در آن وارد می کنیم. از آنجایی که سطرهای توزیع دارای دو عنصر هستند، جدول از دو ستون تشکیل شده است. ستون اول همیشه گزینه است - آنچه در حال مطالعه هستیم - نام آن را از تکلیف (پایان جمله با تکلیف در شرایط) - به میزان سود - می گیریم که به این معنی است که گزینه ما مقدار سود است. ساخته شده است.

ستون دوم بسامد است - همانطور که نوع ما اغلب در پدیده مورد مطالعه رخ می دهد - نام ستون را نیز از واگذاری - توزیع بنگاه ها می گیریم - بنابراین بسامد ما تعداد شرکت هایی است که سود مربوطه را دارند، در این حالت سقوط می کند. به فاصله

در نتیجه، چیدمان جدول ما به صورت زیر خواهد بود:

جایی که i مقدار یا طول بازه است،

Xmax و Xmin - حداکثر و حداقل مقدار ویژگی،

n تعداد گروه های مورد نیاز با توجه به بیان مسئله است.

بیایید اندازه فاصله را برای مثال خود محاسبه کنیم. برای انجام این کار، در میان داده های اولیه، بزرگترین و کوچکترین را پیدا می کنیم

23 48 57 12 118 9 16 22 27 48 56 87 45 98 88 63 - حداکثر ارزش 118 میلیون روبل و حداقل 9 میلیون روبل است. بیایید با استفاده از فرمول محاسبه کنیم.

در محاسبات، عدد 36، (3) سه را در دوره دریافت کردیم، در چنین شرایطی مقدار بازه باید به یک بزرگتر گرد شود تا پس از محاسبات حداکثر داده از بین نرود، به همین دلیل است. در محاسبه ارزش فاصله 36.4 میلیون روبل است.

  1. حالا بیایید فواصل را بسازیم - گزینه های ما در این مشکل. بازه اول از حداقل مقدار شروع به ساختن می کند، مقدار بازه به آن اضافه می شود و حد بالایی بازه اول به دست می آید. سپس حد بالایی بازه اول به حد پایین بازه دوم تبدیل می شود، مقدار فاصله به آن اضافه می شود و فاصله دوم به دست می آید. و به همین ترتیب به تعداد دفعات مورد نیاز برای ترسیم فواصل بر اساس شرایط.

بیایید توجه کنیم اگر مقدار بازه را به 36.4 گرد نکرده بودیم، بلکه آن را روی 36.3 رها می کردیم، آخرین مقدار 117.9 بود. دقیقاً برای جلوگیری از از دست رفتن داده ها، لازم است مقدار بازه به مقدار بزرگتر گرد شود.

  1. بیایید تعداد شرکت هایی را که در هر بازه زمانی خاص قرار می گیرند محاسبه کنیم. هنگام پردازش داده ها، به یاد داشته باشید که مقدار بالای بازه در این بازه در نظر گرفته نمی شود (در این بازه گنجانده نمی شود)، اما در بازه بعدی در نظر گرفته می شود (حد پایین بازه در این بازه لحاظ می شود، و حد بالایی شامل نمی شود) به جز آخرین فاصله.

هنگام پردازش داده ها، بهتر است داده های انتخاب شده را با نمادها یا رنگ های معمولی علامت گذاری کنید تا پردازش ساده تر شود.

23 48 57 12 118 9 16 22

27 48 56 87 45 98 88 63

ما فاصله اول را با رنگ زرد نشان می دهیم - و تعیین می کنیم که چه مقدار داده در بازه 9 تا 45.4 قرار می گیرد، در حالی که این 45.4 در بازه دوم در نظر گرفته می شود (به شرطی که در داده باشد) - در نتیجه به دست می آوریم. 7 شرکت در بازه اول. و به همین ترتیب در تمام فواصل.

  1. (اقدام اضافی) بیایید کل سود دریافتی بنگاه ها را برای هر بازه زمانی و به طور کلی محاسبه کنیم. برای انجام این کار، داده های علامت گذاری شده در رنگ های مختلف را اضافه کنید و ارزش کل سود را دریافت کنید.

با فاصله اول - 23 + 12 + 9 + 16 + 22 + 27 + 45 = 154 میلیون روبل.

برای بازه دوم - 48 + 57 + 48 + 56 + 63 = 272 میلیون روبل.

برای بازه سوم - 118 + 87 + 98 + 88 = 391 میلیون روبل.

ورزش . داده هایی در مورد اندازه سپرده در بانک 30 سپرده گذار، هزار روبل وجود دارد. 150، 120، 300، 650، 1500، 900، 450، 500، 380، 440،

600, 80, 150, 180, 250, 350, 90, 470, 1100, 800,

500, 520, 480, 630, 650, 670, 220, 140, 680, 320

ساختن سری تغییرات بازه ایتوزیع سپرده گذاران، با توجه به اندازه سهم، برجسته کردن 4 گروه در فواصل مساوی. مبلغ کل سپرده ها را برای هر گروه محاسبه کنید.

ارسال کار خوب خود را در پایگاه دانش ساده است. از فرم زیر استفاده کنید

دانشجویان، دانشجویان تحصیلات تکمیلی، دانشمندان جوانی که از دانش پایه در تحصیل و کار خود استفاده می کنند از شما بسیار سپاسگزار خواهند بود.

نوشته شده در http://www.allbest.ru/

وظیفه1

داده های زیر در مورد دستمزد کارکنان در شرکت وجود دارد:

جدول 1.1

میزان دستمزد در تبدیل لانه واحدها

لازم است یک سری توزیع بازه ای بسازید که توسط آن پیدا شود.

1) میانگین دستمزد.

2) میانگین انحراف خطی.

4) انحراف معیار؛

5) دامنه تغییرات؛

6) ضریب نوسان.

7) ضریب تغییرات خطی.

8) ضریب تغییرات ساده.

10) میانه؛

11) ضریب عدم تقارن.

12) شاخص عدم تقارن پیرسون;

13) ضریب کشیدگی.

راه حل

همانطور که می دانید، گزینه ها (مقادیر شناسایی شده) به صورت صعودی مرتب شده اند سری تغییرات گسسته با تعداد زیاد نوع (بیش از 10)، حتی در مورد تغییرات گسسته، سری های بازه ای ساخته می شوند.

اگر یک سری بازه‌ای در فواصل زوج جمع‌آوری شود، دامنه تغییرات بر تعداد بازه‌های مشخص شده تقسیم می‌شود. علاوه بر این، اگر مقدار به دست آمده عدد صحیح و بدون ابهام باشد (که نادر است)، طول بازه برابر با این عدد در نظر گرفته می شود. در موارد دیگر تولید شده گرد کردن لزوما v سمت افزایش دادن، بنابراین به آخرین رقم باقی مانده زوج بود. بدیهی است که با افزایش طول بازه، محدوده تغییرات توسط مقداری برابر با حاصل ضرب تعداد فواصل: با تفاوت بین طول محاسبه شده و اولیه فاصله

آ) اگر بزرگی بسط دامنه تغییرات ناچیز باشد، آنگاه یا به بزرگترین اضافه می شود یا از کوچکترین مقدار ویژگی کم می شود.

ب) اگر بزرگی بسط دامنه تغییرات قابل لمس باشد، به طوری که مرکز دامنه با هم مخلوط نشود، با افزودن همزمان به بزرگترین و کم کردن از کوچکترین مقادیر ویژگی، تقریباً نصف می شود. .

اگر یک سری بازه ای با فواصل نامساوی کامپایل شود، فرآیند ساده می شود، اما مانند قبل، طول بازه ها باید به عنوان یک عدد با آخرین رقم زوج بیان شود، که محاسبات بعدی ویژگی های عددی را بسیار ساده می کند.

30 - حجم نمونه.

بیایید با استفاده از فرمول استرجز یک سری توزیع بازه ای بسازیم:

K = 1 + 3.32 * log n،

K تعداد گروه ها است.

K = 1 + 3.32 * log 30 = 5.91 = 6

ما محدوده صفت - دستمزد کارگران در شرکت - (x) را طبق فرمول پیدا می کنیم

R = xmax - xmin و تقسیم بر 6. R = 195-112 = 83

سپس طول فاصله خواهد بود لخط = 83: 6 = 13.83

شروع اولین بازه 112 خواهد بود. به 112 اضافه می شود ل races = 13.83، مقدار نهایی آن را 125.83 می گیریم که در همان زمان شروع بازه دوم و غیره است. پایان فاصله پنجم - 195.

هنگام یافتن فرکانس ها، باید با این قانون هدایت شد: "اگر مقدار یک ویژگی با مرز یک بازه داخلی منطبق باشد، باید به بازه قبلی ارجاع داده شود."

ما یک سری فاصله ای از فرکانس ها و فرکانس های ذخیره سازی را دریافت می کنیم.

جدول 1.2

در نتیجه 3 کارگر حقوق دارند. هزینه از 112 تا 125.83 واحد معمولی بزرگترین شارژ. پرداخت از 181.15 تا 195 واحد پولی معمولی فقط 6 کارمند

برای محاسبه ویژگی های عددی، سری بازه ها را به یک گسسته تبدیل می کنیم و وسط بازه ها را به عنوان یک متغیر در نظر می گیریم:

جدول 1.3

14131,83

با توجه به فرمول میانگین حسابی وزنی

واحدهای متراکم

میانگین انحراف خطی:

که در آن xi مقدار صفت مورد مطالعه در واحد iم جامعه است،

میانگین ارزش صفت مورد مطالعه.

نوشته شده در http://www.allbest.ru/

L ارسال شده در http://www.allbest.ru/

سرویس den.ed.

انحراف معیار:

پراکندگی:

نوسان نسبی (ضریب نوسان): c = R:،

انحراف خطی نسبی: q = L:

ضریب تغییرات: V = y:

ضریب نوسان نوسانات نسبی مقادیر شدید صفت را در اطراف میانگین حسابی نشان می دهد و ضریب تغییرات درجه و همگنی جمعیت را مشخص می کند.

c = R: = 83 / 159.485 * 100٪ = 52.043٪

بنابراین، تفاوت بین مقادیر شدید 5.16٪ (= 94.84٪ -100٪) کمتر از میانگین حقوق کارگران در شرکت است.

q = L: = 17.765 / 159.485 * 100٪ = 11.139٪

V = y: = 21.704 / 159.485 * 100٪ = 13.609٪

ضریب تغییرات کمتر از 33٪ است که نشان دهنده تغییرات ضعیف در دستمزد کارکنان در شرکت است. که مقدار متوسط ​​یک مشخصه معمولی دستمزد کارگران است (مجموعه همگن).

در سری های فاصله ای توزیع روشبا فرمول تعیین می شود -

فرکانس بازه مودال، یعنی بازه ای که بیشترین تعداد انواع را در خود دارد.

فرکانس فاصله قبل از مدال؛

فرکانس فاصله پس از مدال؛

طول بازه مودال؛

کران پایینی فاصله مودال.

برای تعیین میانه هادر سری فاصله، از فرمول استفاده می کنیم

فرکانس تجمعی (انباشته) بازه قبل از میانه کجاست.

مرز پایینی فاصله میانی؛

فرکانس بازه میانه؛

طول فاصله متوسط.

فاصله میانه- فاصله ای که فرکانس انباشته آن (= 3 + 3 + 5 + 7) بیش از نیمی از مجموع فرکانس ها است - (153.49؛ 167.32).

بیایید چولگی و کشیدگی را محاسبه کنیم که برای آن یک کاربرگ جدید ایجاد می کنیم:

جدول 1.4

داده های واقعی

داده های تخمینی

بیایید لحظه مرتبه سوم را محاسبه کنیم

بنابراین، عدم تقارن است

از آنجایی که 0.3553 0.25، عدم تقارن معنی دار در نظر گرفته می شود.

بیایید لحظه مرتبه چهارم را محاسبه کنیم

بنابراین، کشش است

زیرا< 0, то эксцесс является плосковершинным.

درجه چولگی را می توان با استفاده از ضریب چولگی پیرسون (As) تعیین کرد: گردش مقدار نمونه نوسان

میانگین حسابی سری توزیع کجاست. - روش؛ - انحراف معیار.

با توزیع متقارن (عادی) = Mo، بنابراین، ضریب چولگی صفر است. اگر Аs> 0 باشد، حالت بیشتری وجود دارد، بنابراین، عدم تقارن سمت راست وجود دارد.

اگر به عنوان< 0, то меньше моды, следовательно, имеется левосторонняя асимметрия. Коэффициент асимметрии может изменяться от -3 до +3.

توزیع متقارن نیست، اما دارای عدم تقارن سمت چپ است.

وظیفه 2

حجم نمونه چقدر باید باشد تا با احتمال 954/0 خطای نمونه گیری از 04/0 تجاوز نکند، اگر از نظرسنجی های قبلی معلوم شود که واریانس 24/0 است؟

راه حل

حجم نمونه برای نمونه برداری غیر تکراری با فرمول محاسبه می شود:

t ضریب اطمینان است (با احتمال 0.954 برابر با 2.0 است که توسط جداول انتگرال احتمال تعیین می شود)

y2 = 0.24 - انحراف استاندارد.

10000 نفر - اندازه نمونه؛

Dx = 0.04 خطای حاشیه ای میانگین نمونه است.

با احتمال 95.4 درصد، می توان استدلال کرد که حجم نمونه ارائه دهنده خطای نسبی بیش از 0.04 حداقل باید 566 خانواده باشد.

وظیفه3

داده های زیر در مورد درآمد حاصل از فعالیت اصلی شرکت، میلیون روبل وجود دارد.

برای تجزیه و تحلیل تعدادی از پویایی ها، شاخص های زیر را تعیین کنید:

1) زنجیره ای و اساسی:

سود مطلق؛

نرخ رشد؛

نرخ رشد؛

2) متوسط

سطح تعدادی از پویایی؛

سود مطلق؛

نرخ رشد؛

نرخ افزایش؛

3) قدر مطلق 1% افزایش.

راه حل

1. سود مطلق (دیy)تفاوت بین سطح بعدی سری و قبلی (یا پایه):

زنجیره: Du = yi - yi-1،

پایه: Ду = у - y0،

уi - سطح ردیف،

i - شماره سطح ردیف،

y0 سطح سال پایه است.

2. نرخ رشد (Tu)نسبت سطح بعدی سری و قبلی (یا سال پایه 2001) است:

زنجیره: Tu =;

پایه: Tu =

3. نرخ رشد (Tدی) نسبت رشد مطلق به سطح قبلی است که بر حسب درصد بیان می شود.

زنجیره: Tu =;

پایه: Tu =

4. مقدار مطلق افزایش 1% (A)نسبت رشد مطلق زنجیره ای به نرخ رشد است که بر حسب درصد بیان می شود.

آ =

سطح وسط ردیفبا فرمول میانگین حسابی محاسبه می شود.

میانگین سطح درآمد حاصل از فعالیت های اصلی برای 4 سال:

متوسط ​​رشد مطلقبا فرمول محاسبه می شود:

که در آن n تعداد سطوح در سری است.

به طور متوسط، درآمد حاصل از فعالیت های عملیاتی 3.333 میلیون روبل در طول سال افزایش یافته است.

میانگین نرخ رشد سالانهبا فرمول میانگین هندسی محاسبه می شود:

ун - سطح نهایی سری،

y0 سطح اولیه سطر است.

Tu = 100٪ = 102.174٪

میانگین نرخ رشد سالانهبا فرمول محاسبه می شود:

تی = Tu - 100٪ = 102.74٪ - 100٪ = 2.74٪.

بدین ترتیب درآمد حاصل از فعالیت های اصلی بنگاه به طور متوسط ​​در طول سال 2.74 درصد افزایش یافته است.

وظایفآ4

محاسبه:

1. شاخص های قیمت فردی;

2. شاخص کل گردش مالی;

3. شاخص قیمت کل.

4. شاخص کل حجم فیزیکی فروش کالا.

5. افزایش مطلق در ارزش گردش مالی و تجزیه بر اساس عوامل (به دلیل تغییر در قیمت ها و تعداد کالاهای فروخته شده).

6. نتیجه گیری مختصری در مورد تمام شاخص های به دست آمده انجام دهید.

راه حل

1. بر اساس شرط، شاخص های قیمت فردی برای اقلام A، B، C بودند -

IPA = 1.20; ipB = 1.15; ipB = 1.00.

2. شاخص کلی گردش مالی با فرمول محاسبه می شود:

من w = = 1470/1045 * 100٪ = 140.67٪

حجم معاملات 40.67 درصد (100-140.67 درصد) افزایش یافت.

به طور متوسط، قیمت کالاها 10.24 درصد افزایش یافت.

میزان هزینه های اضافی خریداران از افزایش قیمت:

w (p) =؟ p1q1 -؟ p0q1 = 1470 - 1333.478 = 136.522 میلیون روبل.

در نتیجه افزایش قیمت ها، خریداران مجبور شدند 136.522 میلیون روبل اضافی خرج کنند.

4. شاخص کلی حجم فیزیکی تجارت:

حجم فیزیکی گردش مالی 27.61 درصد افزایش یافت.

5. تغییر کلی گردش مالی در دوره دوم نسبت به دوره اول را تعیین کنید:

w = 1470-1045 = 425 میلیون روبل.

به دلیل تغییرات قیمت:

W (p) = 1470 - 1333.478 = 136.522 میلیون روبل.

به دلیل تغییر در حجم فیزیکی:

w (q) = 1333.478 - 1045 = 288.478 میلیون روبل.

حجم معاملات 40.67 درصد افزایش یافت. قیمت 3 کالا به طور متوسط ​​10.24 درصد افزایش یافته است. حجم فیزیکی تجارت 27.61 درصد افزایش یافت.

به طور کلی، حجم فروش 425 میلیون روبل افزایش یافت، از جمله به دلیل افزایش قیمت، 136.522 میلیون روبل افزایش یافت و با توجه به افزایش حجم فروش - 288.478 میلیون روبل.

وظیفه5

داده های زیر برای 10 کارخانه در همان صنعت موجود است.

کارخانه شماره

خروجی تولید، هزار واحد (ایکس)

بر اساس داده های ارائه شده:

I) برای تأیید مفاد تجزیه و تحلیل منطقی در مورد وجود یک همبستگی خطی بین ویژگی عامل (حجم خروجی) و ویژگی مؤثر (مصرف توان)، داده های اولیه را بر روی نمودار فیلد همبستگی رسم کنید و نتیجه گیری در مورد شکل اتصال، فرمول آن را نشان دهید.

2) پارامترهای معادله ارتباط را تعیین کنید و خط نظری بدست آمده را روی نمودار میدان همبستگی رسم کنید.

3) محاسبه ضریب همبستگی خطی،

4) مقادیر شاخص های بدست آمده در بندهای 2) و 3 را توضیح دهید.

5) با استفاده از مدل به دست آمده، پیش بینی مصرف احتمالی برق در یک کارخانه با حجم تولید 4.5 هزار واحد را انجام دهید.

راه حل

داده های ویژگی - حجم خروجی (ضریب) را با xi نشان می دهیم. علامت - مصرف برق (نتیجه) از طریق уi; نقاط با مختصات (x، y) به میدان همبستگی OXY اعمال می شود.

نقاط میدان همبستگی در امتداد یک خط مستقیم قرار دارند. بنابراین، اتصال خطی است، ما به دنبال معادله رگرسیون به صورت خط مستقیم Yx = ax + b خواهیم بود. برای یافتن آن از سیستم معادلات عادی استفاده می کنیم:

بیایید یک جدول محاسبه درست کنیم.

با استفاده از میانگین یافت شده، سیستم را ترکیب کرده و با توجه به پارامترهای a و b حل می کنیم:

بنابراین، معادله رگرسیون y را روی x بدست می آوریم: = 3.57692 x + 3.19231

ما یک خط رگرسیون در میدان همبستگی ایجاد می کنیم.

با جایگزینی مقادیر x از ستون 2 به معادله رگرسیون، محاسبه شده (ستون 7) را به دست می آوریم و آنها را با داده های y که در ستون 8 منعکس شده است مقایسه می کنیم. به هر حال، صحت محاسبات نیز با تایید می شود. همزمانی مقادیر میانگین y و.

ضریبهمبستگی خطینزدیکی رابطه بین علائم x و y را ارزیابی می کند و با فرمول محاسبه می شود

شیب خط رگرسیون a (در x) جهت آشکار شده را مشخص می کندوابستگی هاعلائم: برای a> 0 یکسان هستند، برای a<0- противоположны. مطلق آن است مقدار - اندازه گیری تغییر در ویژگی مؤثر هنگامی که عامل در هر واحد اندازه گیری تغییر می کند.

عبارت آزاد خط رگرسیون جهت را نشان می دهد و قدر مطلق آن معیار کمی تأثیر بر علامت مؤثر همه عوامل دیگر است.

اگر< 0، سپس منبع ویژگی عامل یک شی منفرد با یک کوچکتر استفاده می شود، و زمانی که>0 باراندمان بیشتر از میانگین برای کل مجموعه اشیاء.

بیایید یک تحلیل پس از رگرسیون انجام دهیم.

ضریب x خط رگرسیون 3.57692> 0 است، بنابراین با افزایش (کاهش) تولید، مصرف برق افزایش (کاهش) می یابد. افزایش 1 هزار دستگاهی تولید میانگین افزایش مصرف برق به میزان 3.57692 هزار کیلووات ساعت را نشان می دهد.

2. ترم آزاد رگرسیون مستقیم 3.19231 است، بنابراین، تأثیر عوامل دیگر، قدرت تأثیر خروجی بر مصرف برق را به میزان مطلق 3.19231 هزار کیلووات ساعت افزایش می دهد.

3. ضریب همبستگی 0.8235 وابستگی بسیار نزدیک مصرف برق به خروجی را نشان می دهد.

پیش بینی با استفاده از معادله مدل رگرسیون آسان است. برای انجام این کار، مقادیر x در معادله رگرسیون جایگزین می شوند - حجم تولید و مصرف برق پیش بینی می شود. در این مورد، مقادیر x را می توان نه تنها در محدوده مشخص شده، بلکه خارج از آن نیز گرفت.

بیایید در مورد مصرف احتمالی برق در یک کارخانه با حجم تولید 4.5 هزار واحد پیش بینی کنیم.

3.57692 * 4.5 + 3.19231 = 19.288 45 هزار کیلووات ساعت.

فهرست منابع مورد استفاده

1. زاخارنکوف اس.ن. آمار اجتماعی-اقتصادی: کتاب درسی-راهنمای عملی. -Mn.: BSEU، 2002.

2. Efimova M.R., Petrova E.V., Rumyantsev V.N. نظریه عمومی آمار. - M.: INFRA - M.، 2000.

3. Eliseeva I.I. آمار. - M.: چشم انداز، 2002.

4. نظریه عمومی آمار / زیر کل. ویرایش O.E. بشینا، ع.ا. اسپیرینا - M.: امور مالی و آمار، 2000.

5. آمار اجتماعی-اقتصادی: کتاب درسی-عملی. کمک هزینه / زاخارنکوف S.N. و همکاران - مینسک: YSU، 2004.

6. آمار اجتماعی-اقتصادی: کتاب درسی. کمک هزینه / اد. نسترویچ اس.آر. - مینسک: BSEU، 2003.

7. Teslyuk I.E.، Tarlovskaya V.A.، Terlizhenko N. Statistics.- Minsk، 2000.

8. Kharchenko L.P. آمار. - M.: INFRA - M، 2002.

9. Kharchenko L.P., Dolzhenkova V.G., Ionin V.G. آمار. - M.: INFRA - M، 1999.

10. آمار اقتصادی / ویرایش. Yu.N. ایوانووا - M.، 2000.

ارسال شده در Allbest.ru

...

اسناد مشابه

    محاسبه میانگین حسابی برای سری توزیع بازه ای. تعیین شاخص کلی حجم فیزیکی تجارت. تجزیه و تحلیل تغییر مطلق در بهای تمام شده محصولات به دلیل تغییر در حجم فیزیکی. محاسبه ضریب تغییرات.

    تست، اضافه شده در 2010/07/19

    جوهر عمده فروشی، خرده فروشی و گردش کالاهای عمومی. فرمول های محاسبه شاخص های مجموع گردش مالی. محاسبه ویژگی های سری توزیع بازه ای - میانگین حسابی، حالت و میانه، ضریب تغییرات.

    مقاله ترم اضافه شده در 05/10/2013

    محاسبه فروش برنامه ریزی شده و واقعی، درصد طرح، تغییر مطلق در گردش مالی. تعیین رشد مطلق، متوسط ​​نرخ رشد و رشد درآمد نقدی. محاسبه ابزارهای ساختاری: حالت ها، میانه ها، چارک ها.

    تست، اضافه شده در 2012/02/24

    سری فاصله ای توزیع بانک ها بر اساس حجم سود. یافتن حالت و میانه سری توزیع بازه ای بدست آمده با روش گرافیکی و با محاسبات. محاسبه ویژگی های سری توزیع بازه ای. محاسبه میانگین حسابی.

    تست، اضافه شده در 12/15/2010

    فرمول های تعیین مقادیر میانگین سری بازه ای - حالت، میانه، واریانس. محاسبه شاخص های تحلیلی سری پویایی ها با توجه به طرح های زنجیره ای و پایه، رشد و نرخ رشد. مفهوم شاخص تلفیقی هزینه اصلی، قیمت ها، هزینه ها و گردش مالی.

    مقاله ترم، اضافه شده در 2011/02/27

    مفهوم و هدف، نظم و قوانین ساخت یک سری تغییرات. تجزیه و تحلیل همگنی داده ها در گروه ها. شاخص های تنوع (تغییرپذیری) صفت. تعیین میانگین انحراف خطی و مربعی، ضریب نوسان و تغییرات.

    تست، اضافه شده در 2010/04/26

    مفهوم مد و میانه به عنوان ویژگی های معمولی، ترتیب و معیارهای تعیین آنها. یافتن حالت و میانه در یک سری تغییرات گسسته و بازه ای. چارک ها و دهک ها به عنوان ویژگی های اضافی سری تغییرات آماری.

    تست، اضافه شده در 09/11/2010

    ساخت یک سری توزیع بازه ای بر اساس معیار گروه بندی. مشخصه انحراف توزیع فرکانس از شکل متقارن، محاسبه کشش و شاخص های عدم تقارن. تجزیه و تحلیل شاخص های ترازنامه یا صورت سود و زیان.

    تست، اضافه شده در 1393/10/19

    سری های تجربی را به گسسته و بازه ای تبدیل کنید. تعیین مقدار متوسط ​​برای یک سری گسسته با استفاده از خواص آن. محاسبه برای یک سری گسسته از حالت، میانه، شاخص های تغییرات (واریانس، انحراف، ضریب نوسان).

    تست، اضافه شده در 1390/04/17

    ساخت یک سری آماری از توزیع سازمان ها. تعریف گرافیکی مقدار مد و میانه. تنگی همبستگی با استفاده از ضریب تعیین. تعیین خطای نمونه گیری میانگین تعداد کارکنان.

در بسیاری از موارد، جامعه آماری شامل تعداد زیادی یا حتی بی‌نهایت‌تر از گزینه‌ها است که اغلب با تغییرات مداوم مواجه می‌شود، تشکیل گروهی از واحدها برای هر گزینه تقریباً غیرممکن و غیرعملی است. در چنین مواردی، تجمیع واحدهای آماری در گروه‌ها تنها بر اساس یک فاصله زمانی امکان‌پذیر است. چنین گروهی که دارای محدودیت های مشخصی برای مقادیر ویژگی متغیر است. این محدودیت ها با دو عدد نشان داده می شود که حد بالایی و پایینی هر گروه را نشان می دهد. استفاده از فواصل منجر به تشکیل یک سری توزیع بازه ای می شود.

فاصله خوشحالمیک سری تغییرات است که انواع آن به صورت فواصل ارائه شده است.

سری های بازه ای را می توان با فواصل مساوی و نابرابر تشکیل داد، در حالی که انتخاب اصل ساخت این سری عمدتاً به میزان بازنمایی و راحتی جامعه آماری بستگی دارد. اگر جمعیت از نظر تعداد واحدها به اندازه کافی بزرگ (نماینده) باشد و در ترکیب آن کاملاً همگن باشد، توصیه می شود تساوی فواصل را به عنوان مبنایی برای تشکیل سری فاصله قرار دهید. معمولاً طبق این اصل، برای جمعیت هایی که دامنه تغییرات نسبتاً کم است، یک سری بازه ای تشکیل می شود. گزینه های حداکثر و حداقل معمولا چندین بار متفاوت است. در این حالت، مقدار فواصل مساوی با نسبت دامنه تغییرات ویژگی به تعداد مشخصی از فواصل تشکیل شده محاسبه می شود. برای تعیین مساوی ودر بازه، می توان از فرمول استرجس استفاده کرد (معمولاً با تنوع کمی از ویژگی های فاصله و تعداد زیادی واحد در جامعه آماری):

جایی که x i - مقدار فاصله مساوی؛ X max، X min- گزینه های حداکثر و حداقل در جامعه آماری. n . - تعداد واحدها در مجموع.

مثال. توصیه می شود اندازه یک فاصله مساوی را از نظر چگالی آلودگی رادیواکتیو با سزیم - 137 در 100 شهرک منطقه کراسنوپلسکی در منطقه موگیلف محاسبه کنید، اگر مشخص باشد که گزینه اولیه (حداقل) برابر با I است. کیلومتر / کیلومتر 2، نهایی (حداکثر) - 65 کیلو در کیلومتر 2. با استفاده از فرمول 5.1 ما گرفتیم:

در نتیجه، برای تشکیل یک سری فاصله با فواصل مساوی از نظر چگالی آلودگی سزیم - 137 شهرک منطقه کراسنوپلسک، اندازه یک فاصله مساوی می تواند 8 مس / کیلومتر مربع باشد.

در شرایط توزیع نابرابر، یعنی. هنگامی که متغیرهای حداکثر و حداقل صدها بار هستند، هنگام تشکیل یک سری بازه ای، می توان این اصل را اعمال کرد نابرابرفواصل فواصل نابرابر معمولاً با حرکت به سمت مقادیر مشخصه بزرگتر افزایش می یابد.

فواصل می توانند به شکل بسته یا باز باشند. بسته شدمرسوم است که بازه هایی را فراخوانی کنید که مرزهای پایین و بالایی برای آنها مشخص شده است. باز کنفواصل فقط یک مرز دارند: در فاصله اول - بالا، در آخرین - مرز پایین.

توصیه می‌شود سری‌های بازه‌ای، به‌ویژه با فواصل نامساوی، با در نظر گرفتن ارزیابی شوند چگالی توزیع, ساده ترین راه برای محاسبه نسبت فرکانس (یا فرکانس) محلی به اندازه فاصله است.

برای شکل‌گیری عملی سری بازه‌ای، می‌توانید از چیدمان جدول استفاده کنید. 5.3.

جدول 5.3. روش تشکیل مجموعه های فاصله ای از سکونتگاه ها در منطقه کراسنوپلسک با توجه به تراکم آلودگی رادیواکتیو با سزیم -137

مزیت اصلی سری فاصله شدید آن است فشردگیدر عین حال، در سری های بازه ای توزیع، انواع مختلف ویژگی در فواصل مربوطه پنهان می شوند.

هنگام ترسیم گرافیکی یک سری بازه ای در یک سیستم مختصات مستطیلی، مرزهای بالای بازه ها بر روی محور آبسیسا و فرکانس های محلی سری بر روی محور ارتین رسم می شوند. ساختار گرافیکی یک سری بازه ای با ساخت یک چند ضلعی توزیع متفاوت است، زیرا هر بازه دارای مرزهای پایین و بالایی است و دو ابسیسا با هر یک از مقادیر ارتین مطابقت دارند. بنابراین، در نمودار سری بازه، یک نقطه مانند یک چند ضلعی علامت گذاری نمی شود، بلکه خطی که دو نقطه را به هم متصل می کند، مشخص می شود. این خطوط افقی توسط خطوط عمودی به یکدیگر متصل شده و شکل چندضلعی پلکانی به دست می آید که معمولاً به آن می گویند. هیستوگرامتوزیع (شکل 5.3).

هنگام ترسیم گرافیکی یک سری بازه ای برای یک جامعه آماری به اندازه کافی بزرگ، هیستوگرام نزدیک می شود متقارنفرم توزیع در مواردی که جامعه آماری کوچک است، به عنوان یک قاعده، نامتقارننمودار میله ای.

در برخی موارد، توصیه می شود که تعدادی فرکانس انباشته تشکیل شود، به عنوان مثال. انباشتهردیف یک سری تجمعی را می توان بر اساس یک سری توزیع گسسته یا فاصله ای تشکیل داد. هنگام ترسیم گرافیکی یک سری تجمعی در یک سیستم مختصات مستطیلی، گزینه‌ها بر روی محور ابسیسا و فرکانس‌های انباشته شده (فرکانس‌ها) روی محور مختصات رسم می‌شوند. خط منحنی حاصل معمولا نامیده می شود انباشتهتوزیع (شکل 5.4).

شکل‌گیری و نمایش گرافیکی انواع مختلف سری‌های تغییرات به محاسبه ساده ویژگی‌های آماری کمک می‌کند، که به تفصیل در مبحث 6 مورد بحث قرار گرفته‌اند، به درک بهتر ماهیت قوانین توزیع جامعه آماری کمک می‌کند. تجزیه و تحلیل سری تغییرات در مواردی که نیاز به شناسایی و ردیابی رابطه بین گزینه ها و فرکانس ها (فرکانس ها) است از اهمیت ویژه ای برخوردار است. این وابستگی در این واقعیت آشکار می شود که تعداد مواردی که روی هر گزینه می افتد به طریق خاصی با بزرگی این گزینه مرتبط است، یعنی. با افزایش مقادیر ویژگی متغیر، فرکانس (فرکانس) این مقادیر دستخوش تغییرات سیستماتیک و مشخصی می شود. این بدان معنی است که اعداد در ستون فرکانس ها (فرکانس ها) در معرض نوسانات آشفته نیستند، بلکه در جهت خاصی، با ترتیب و ترتیب خاصی تغییر می کنند.

اگر فرکانس‌ها در تغییراتشان سیستماتیک خاصی را نشان دهند، این بدان معناست که ما در مسیر شناسایی الگوها هستیم. سیستم، ترتیب، توالی در تغییر فرکانس بازتابی از علل مشترک، شرایط عمومی مشخصه کل مجموعه است.

نباید تصور کرد که الگوی توزیع همیشه آماده داده می شود. چند سری تغییرات وجود دارد که در آنها فرکانس ها به طرز عجیبی جهش می کنند، گاهی افزایش می یابند و گاهی کاهش می یابند. در چنین مواردی، بهتر است بدانیم محقق با چه توزیعی سروکار دارد: یا این توزیع اصلاً ذاتی قاعده مندی ها نیست، پس ماهیت آن هنوز آشکار نشده است: مورد اول نادر است، مورد دوم، مورد دوم. یک پدیده نسبتاً مکرر و بسیار گسترده است.

بنابراین، هنگام تشکیل یک سری بازه ای، تعداد کل واحدهای آماری می تواند کم باشد و هر بازه شامل تعداد کمی از انواع (مثلاً 1-3 واحد) است. در چنین مواردی، لازم نیست روی تظاهر هیچ نظمی حساب کرد. برای اینکه یک نتیجه منطقی بر اساس مشاهدات تصادفی به دست آید، قانون اعداد بزرگ باید به اجرا درآید، یعنی. به طوری که برای هر بازه نه چند، بلکه ده ها و صدها واحد آماری وجود داشته باشد. برای این منظور باید تلاش کرد تا حد امکان تعداد مشاهدات را افزایش داد. این مطمئن ترین راه برای تشخیص الگوها در فرآیندهای انبوه است. اگر فرصت واقعی برای افزایش تعداد مشاهدات وجود نداشته باشد، می توان با کاهش تعداد فواصل در سری توزیع، به شناسایی یک الگو دست یافت. کاهش تعداد بازه‌ها در سری تغییرات و در نتیجه افزایش تعداد فرکانس‌ها در هر بازه. این بدان معنی است که نوسانات تصادفی هر واحد آماری بر روی یکدیگر قرار می گیرند، "هموار" می شوند و به یک نظم تبدیل می شوند.

تشکیل و ساخت سری های متغیر به شما امکان می دهد فقط یک تصویر کلی و تقریبی از توزیع جامعه آماری بدست آورید. به عنوان مثال، هیستوگرام فقط به صورت تقریبی، رابطه بین مقادیر یک ویژگی و فرکانس های آن (فرکانس) را بیان می کند، بنابراین، مجموعه ای از تغییرات اساساً تنها مبنایی برای مطالعه بیشتر و عمیق قوانین داخلی هستند. توزیع ایستا

سوالات کنترلی برای موضوع 5

1. تنوع چیست؟ چه چیزی باعث تغییر یک ویژگی در یک جامعه آماری می شود؟

2. چه نوع ویژگی های متفاوتی می تواند در آمار وجود داشته باشد؟

3. سری تغییرات چیست؟ چه نوع سری های واریاسیونی می تواند وجود داشته باشد؟

4-سریال رتبه بندی شده چیست؟ مزایا و معایب آن چیست؟

5. سری گسسته چیست و چه مزایا و معایبی دارد؟

6. ترتیب تشکیل سری های بازه ای چگونه است، مزایا و معایب آن چیست؟

7. نمایش گرافیکی یک سری توزیع بازه ای گسسته چیست؟

8. توزیع تجمعی چیست و چه چیزی را مشخص می کند؟