سطح اطمینان آماری. سطح معنی داری آماری

وظیفه 3.پنج کودک پیش دبستانی با یک آزمون ارائه می شوند. زمان حل هر کار ثبت می شود. آیا از نظر آماری تفاوت معناداری بین زمان تصمیم گیری وجود خواهد داشت؟ سه اولموارد تست؟

تعداد موضوعات

مواد مرجع

این کار بر اساس تئوری تحلیل واریانس است. به طور کلی، وظیفه تحلیل واریانس شناسایی عواملی است که تأثیر قابل توجهی بر نتیجه آزمایش دارند. اگر تعداد نمونه ها بیش از دو باشد، می توان از ANOVA برای مقایسه میانگین چند نمونه استفاده کرد. برای این منظور، تحلیل واریانس یک طرفه در خدمت است.

به منظور حل وظایف مجموعه موارد زیر اتخاذ شده است. اگر واریانس مقادیر بدست آمده از پارامتر بهینه سازی در مورد تأثیر عوامل با واریانس نتایج در غیاب تأثیر عوامل متفاوت باشد، چنین عاملی به عنوان مهم شناخته می شود.

همانطور که از فرمول مسئله مشاهده می شود، در اینجا از روش هایی برای آزمون فرضیه های آماری استفاده می شود، یعنی مسئله آزمون دو واریانس تجربی. در نتیجه، تحلیل واریانس بر اساس بررسی واریانس با آزمون فیشر است. در این کار باید بررسی شود که آیا تفاوت زمان حل سه تکلیف اول آزمون توسط هر یک از شش کودک پیش دبستانی از نظر آماری معنادار است یا خیر.

فرضیه صفر (پایه) فرضیه H در مورد نامیده می شود. ماهیت e به این فرض کاهش می یابد که تفاوت بین پارامترهای مقایسه شده برابر با صفر است (از این رو نام فرضیه - صفر است) و تفاوت های مشاهده شده ماهیت تصادفی دارند.

فرضیه رقیب (جایگزین) فرضیه H 1 نامیده می شود که با فرضیه صفر در تضاد است.

راه حل:

با استفاده از روش تحلیل واریانس در سطح معناداری 05/0 = α، فرضیه صفر (H о) را در مورد وجود تفاوت آماری معنی دار بین زمان حل سه تکلیف اول آزمون در شش کودک پیش دبستانی بررسی می کنیم.

جدولی از شرایط تکلیف را در نظر بگیرید که در آن میانگین زمان برای حل هر یک از سه تکلیف تست را پیدا می کنیم

تعداد موضوعات

سطوح عاملی

زمان حل تکلیف اول آزمون (در ثانیه).

زمان حل تکلیف دوم آزمون (در ثانیه).

زمان حل تکلیف سوم آزمون (بر حسب ثانیه).

میانگین گروه

میانگین کلی را بیابید:

برای در نظر گرفتن اهمیت تفاوت‌های زمانی هر آزمون، واریانس کل نمونه به دو بخش تقسیم می‌شود که بخش اول فاکتوریل و بخش دوم باقیمانده است.

بیایید مجموع مجذورات انحرافات متغیر را از میانگین کل طبق فرمول محاسبه کنیم

یا ، که در آن p تعداد اندازه گیری های زمان حل تکالیف تستی است، q تعداد آزمودنی ها است. برای انجام این کار، یک گزینه جدول مربع ایجاد کنید

تعداد موضوعات

سطوح عاملی

زمان حل تکلیف اول آزمون (در ثانیه).

زمان حل تکلیف دوم آزمون (در ثانیه).

زمان حل تکلیف سوم آزمون (بر حسب ثانیه).

آمار از دیرباز بخشی جدایی ناپذیر از زندگی بوده است. مردم همه جا با او روبرو می شوند. بر اساس آمار، نتیجه‌گیری در مورد اینکه کجا و چه بیماری‌هایی شایع است، چه چیزی در یک منطقه خاص یا در میان بخش خاصی از جمعیت بیشتر مورد تقاضا است، به دست می‌آید. حتی ساخت برنامه های سیاسی نامزدهای نهادهای دولتی نیز بر این اساس است. آنها همچنین توسط زنجیره های خرده فروشی هنگام خرید کالا استفاده می شوند و تولید کنندگان در پیشنهادات خود بر اساس این داده ها هدایت می شوند.

آمار در حال پخش است نقش مهمدر زندگی جامعه تأثیر می گذارد و تک تک افراد آن را حتی در موارد کوچک تحت تأثیر قرار می دهد. برای مثال، اگر اکثر مردم رنگ‌های تیره را در لباس‌های شهر یا منطقه‌ای خاص ترجیح می‌دهند، پیدا کردن یک بارانی زرد روشن با چاپ گل در فروشگاه‌های خرده‌فروشی محلی بسیار دشوار خواهد بود. اما چه مقادیری این داده ها را جمع می کند که چنین تأثیری دارد؟ به عنوان مثال، "اهمیت آماری" چیست؟ منظور از این تعریف دقیقاً چیست؟

چیست؟

آمار به عنوان یک علم از ترکیبی از ارزش ها و مفاهیم مختلف تشکیل شده است. یکی از آنها مفهوم «اهمیت آماری» است. این نام مقدار متغیرها است که احتمال ظهور سایر شاخص ها در آنها ناچیز است.

به عنوان مثال، از هر 10 نفر 9 نفر هنگام ورود قارچ صبحگاهی خود کفش های لاستیکی می پوشند جنگل پاییزیبعد از یک شب بارانی احتمال اینکه در نقطه ای 8 عدد از آنها در مقرنس های بوم پیچیده شود ناچیز است. بنابراین، در این مثال خاصعدد 9 کمیتی است که به آن "معناداری آماری" می گویند.

بر این اساس، اگر ما داده شده را بیشتر توسعه دهیم مثال عملیکفش‌فروشی‌ها در اواخر فصل تابستان چکمه‌های لاستیکی را بیشتر از سایر فصل‌های سال خریداری می‌کنند. بنابراین، بزرگی ارزش آماری بر زندگی عادی تأثیر می گذارد.

البته، در محاسبات پیچیده، به عنوان مثال، هنگام پیش بینی شیوع ویروس ها، عدد بزرگمتغیرها اما ماهیت تعریف یک شاخص قابل توجه از داده های آماری، صرف نظر از پیچیدگی محاسبات و تعداد مقادیر متغیر، یکسان است.

چگونه محاسبه می شود؟

هنگام محاسبه مقدار شاخص "اهمیت آماری" یک معادله استفاده می شود. یعنی می توان استدلال کرد که در این مورد همه چیز توسط ریاضیات تعیین می شود. بیشترین گزینه سادهمحاسبات زنجیره ای از عملیات ریاضی است که در آن پارامترهای زیر دخیل هستند:

  • دو نوع نتیجه به دست آمده از نظرسنجی ها یا مطالعه داده های عینی، به عنوان مثال، مبالغی که برای آنها خرید انجام می شود، با علامت a و b مشخص می شود.
  • شاخص برای هر دو گروه - n؛
  • ارزش سهم نمونه ترکیبی - p.
  • مفهوم " خطای استاندارد"- SE.

مرحله بعدی تعیین شاخص آزمایش عمومی - t است، مقدار آن با عدد 1.96 مقایسه می شود. 1.96 مقدار متوسطی است که با توجه به تابع توزیع t Student، محدوده 95% را نشان می دهد.

اغلب این سوال مطرح می شود که تفاوت بین مقادیر n و p چیست. این تفاوت ظریف با یک مثال آسان است. فرض کنید در حال محاسبه اهمیت آماری وفاداری به محصول یا برند خاصی از مردان و زنان هستید.

در این صورت، موارد زیر در پشت حروف قرار می گیرند:

  • n تعداد پاسخ دهندگان است.
  • p تعداد افرادی است که از محصول راضی هستند.

تعداد زنانی که در این مورد مصاحبه می شوند، 1 نفر خواهد بود. بر این اساس، n2 مرد وجود دارد. همین معنی در نماد p دارای ارقام "1" و "2" خواهد بود.

مقایسه شاخص آزمون با مقادیر میانگین جداول محاسباتی دانش آموز به چیزی تبدیل می شود که به آن «معناداری آماری» می گویند.

راستی آزمایی چیست؟

نتایج هر محاسبه ریاضی همیشه قابل بررسی است، این در کلاس های ابتدایی به کودکان آموزش داده می شود. منطقی است که فرض کنیم از آنجایی که شاخص های آماری با استفاده از زنجیره ای از محاسبات تعیین می شوند، پس از آن بررسی می شوند.

با این حال، بررسی اهمیت آماری- نه تنها ریاضیات. آمار با مقدار زیادمتغیرها و احتمالات مختلف که همیشه قابل محاسبه نیستند. یعنی اگر به مثال کفش لاستیکی ارائه شده در ابتدای مقاله برگردیم، ساختار منطقی داده‌های آماری که خریداران کالا برای فروشگاه‌ها به آن تکیه خواهند کرد می‌تواند با هوای خشک و گرم مختل شود، که برای آن معمول نیست. فصل پاییز. در نتیجه این پدیده، تعداد افراد به دست آوردن چکمه های لاستیکی، کاهش خواهد یافت و خروجی هامتحمل ضرر و زیان شود فرمول ریاضی، البته، قادر به پیش بینی ناهنجاری آب و هوا نیست. این لحظه "خطا" نامیده می شود.

دقیقاً احتمال چنین خطاهایی است که بررسی سطح اهمیت محاسبه شده را در نظر می گیرد. هم شاخص‌های محاسبه‌شده و هم سطوح اهمیت پذیرفته‌شده و هم مقادیری را که معمولاً فرضیه نامیده می‌شوند، در نظر می‌گیرد.

سطح اهمیت چیست؟

مفهوم «سطح» در معیارهای اصلی معناداری آماری گنجانده شده است. در آمار کاربردی و کاربردی استفاده می شود. این یک نوع ارزش است که احتمال انحرافات یا خطاهای احتمالی را در نظر می گیرد.

این سطح بر اساس شناسایی تفاوت‌ها در نمونه‌های آماده است، به شما امکان می‌دهد اهمیت یا برعکس تصادفی بودن آنها را تعیین کنید. این مفهوم نه تنها معانی دیجیتالی، بلکه نوع رمزگشایی آنها را نیز دارد. آنها نحوه درک مقدار را توضیح می دهند و خود سطح با مقایسه نتیجه با شاخص میانگین تعیین می شود، این میزان قابلیت اطمینان تفاوت ها را نشان می دهد.

بنابراین، می توان مفهوم سطح را به سادگی ارائه کرد - این نشانگر خطا یا خطای مجاز، احتمالی در نتیجه گیری های حاصل از داده های آماری به دست آمده است.

چه سطوح معنی داری استفاده می شود؟

اهمیت آماری ضرایب احتمال اشتباه در عمل از سه سطح اساسی شروع می شود.

سطح اول آستانه ای است که در آن مقدار 5٪ است. یعنی احتمال خطا از سطح معناداری 5 درصد تجاوز نمی کند. این بدان معناست که 95% اطمینان به بی عیب و خطا بودن نتایج حاصل از داده های تحقیقات آماری وجود دارد.

سطح دوم آستانه 1 درصد است. بر این اساس، این رقم به این معنی است که می توان با داده های به دست آمده در محاسبات آماری با اطمینان 99 درصد هدایت شد.

سطح سوم 0.1٪ است. با این مقدار، احتمال خطا برابر با کسری از درصد است، یعنی خطاها عملاً حذف می شوند.

فرضیه در آمار چیست؟

خطاها به عنوان یک مفهوم به دو جهت در مورد پذیرش یا رد فرضیه صفر تقسیم می شوند. فرضیه مفهومی است که طبق تعریف خود مجموعه ای از داده ها یا گزاره های دیگر را پنهان می کند. یعنی توصیفی از توزیع احتمال چیزی مربوط به موضوع حسابداری آماری.

دو فرضیه برای محاسبات ساده وجود دارد - صفر و جایگزین. تفاوت بین آنها در این است که فرضیه صفر بر این ایده استوار است که بین نمونه های دخیل در تعیین اهمیت آماری تفاوت اساسی وجود ندارد و جایگزین کاملاً مخالف آن است. یعنی فرضیه جایگزین بر اساس وجود اختلاف معنی‌دار در داده‌های نمونه‌ها است.

اشتباهات چیست؟

خطاها به عنوان یک مفهوم در آمار با پذیرش این یا آن فرضیه به عنوان صحیح رابطه مستقیم دارد. آنها را می توان به دو جهت یا نوع تقسیم کرد:

  • نوع اول به دلیل پذیرش یک فرضیه صفر است که نادرست است.
  • دومی ناشی از پیروی از جایگزین است.

خطاهای نوع اول، مثبت کاذب نامیده می شود و اغلب در همه مناطقی که از آمار استفاده می شود، رخ می دهد. بر این اساس، خطای نوع دوم، منفی کاذب نامیده می شود.

رگرسیون در آمار برای چیست؟

اهمیت آماری رگرسیون این است که می توان از آن برای تعیین میزان واقعی بودن مدل وابستگی های مختلف محاسبه شده بر اساس داده ها با واقعیت استفاده کرد. به شما امکان می دهد کافی بودن یا نبود عوامل را برای حسابداری و نتیجه گیری شناسایی کنید.

مقدار رگرسیون با مقایسه نتایج با داده های فهرست شده در جداول فیشر تعیین می شود. یا با استفاده از تحلیل واریانس. شاخص های رگرسیون در مطالعات و محاسبات پیچیده آماری مهم هستند که در آن تعداد زیادی ازمتغیرها، داده های تصادفی و تغییرات احتمالی

آزمون فرضیه ها با استفاده از تجزیه و تحلیل آماری انجام می شود. اهمیت آماری با استفاده از مقدار P یافت می شود، که با احتمال یک رویداد معین با این فرض که برخی از گزاره ها (فرضیه صفر) درست است مطابقت دارد. اگر مقدار P کمتر از سطح معنی‌داری آماری مشخص شده باشد (معمولاً 05/0)، آزمایش‌گر می‌تواند با خیال راحت نتیجه‌گیری کند که فرضیه صفر نادرست است و به بررسی یک فرضیه جایگزین ادامه دهد. از آزمون t Student می توان برای محاسبه مقدار P و تعیین معنی داری برای دو مجموعه داده استفاده کرد.

مراحل

قسمت 1

راه اندازی یک آزمایش

    فرضیه خود را تعریف کنید.اولین قدم در ارزیابی اهمیت آماری این است که سؤالی را که می‌خواهید به آن پاسخ دهید انتخاب کنید و یک فرضیه را فرموله کنید. فرضیه بیانیه ای است در مورد داده های تجربی، توزیع و خواص آنها. برای هر آزمایشی، هم یک فرضیه صفر و هم فرضیه جایگزین وجود دارد. به طور کلی، شما باید دو مجموعه داده را با هم مقایسه کنید تا مشخص کنید که آنها مشابه یا متفاوت هستند.

    • فرضیه صفر (H 0) معمولاً بیان می کند که هیچ تفاوتی بین دو مجموعه داده وجود ندارد. به عنوان مثال: آن دسته از دانش آموزانی که مطالب را قبل از کلاس مطالعه می کنند، نمره بالاتری دریافت نمی کنند.
    • فرضیه جایگزین (H a) برعکس فرضیه صفر است و عبارتی است که باید با استفاده از داده های تجربی تأیید شود. به عنوان مثال: آن دسته از دانش آموزانی که مطالب را قبل از کلاس مطالعه می کنند، نمرات بالاتری دریافت می کنند.
  1. سطح اهمیت را برای تعیین میزان تفاوت توزیع داده ها با معمول تنظیم کنید تا به عنوان یک نتیجه معنادار در نظر گرفته شود. سطح اهمیت (همچنین نامیده می شود α (\ displaystyle \ alpha)-level) آستانه ای است که برای اهمیت آماری تعریف می کنید. اگر مقدار P کمتر یا مساوی با سطح معنی داری باشد، داده ها از نظر آماری معنی دار در نظر گرفته می شوند.

    • به عنوان یک قاعده، سطح اهمیت (ارزش α (\ displaystyle \ alpha)) 0.05 در نظر گرفته می شود و در این حالت احتمال تشخیص اختلاف تصادفی بین مجموعه داده های مختلف تنها 5 درصد است.
    • هر چه سطح معنی داری بالاتر باشد (و بر این اساس، مقدار P پایین تر باشد)، نتایج قابل اعتمادتر هستند.
    • اگر می خواهید بیشتر به دست آورید نتایج قابل اعتماد، مقدار P را به 0.01 کاهش دهید. به عنوان یک قاعده، زمانی که نیاز به شناسایی عیوب در محصولات باشد، از مقادیر P کمتر در تولید استفاده می شود. در این مورد، درجه بالایی از اطمینان لازم است تا اطمینان حاصل شود که تمام قطعات همانطور که انتظار می رود کار می کنند.
    • برای اکثر آزمایشات با فرضیه، سطح معناداری 0.05 کافی است.
  2. تصمیم بگیرید که از کدام معیار استفاده کنید:یک طرفه یا دو طرفه. یکی از مفروضات آزمون t دانشجو این است که داده ها به صورت عادی توزیع شده اند. توزیع نرمال یک منحنی زنگی شکل با حداکثر تعدادنتیجه در وسط منحنی است. آزمون تی دانشجویی است روش ریاضیاعتبارسنجی داده ها، که به شما امکان می دهد تعیین کنید که آیا داده ها خارج از توزیع نرمال قرار می گیرند (بیشتر، کمتر یا در "دم" منحنی).

    • اگر مطمئن نیستید که داده‌ها بالاتر یا پایین‌تر از گروه مرجع هستند، از آزمون دو طرفه استفاده کنید. این به شما امکان می دهد اهمیت را در هر دو جهت تعیین کنید.
    • اگر می‌دانید که داده‌ها در کدام جهت ممکن است خارج از توزیع نرمال باشند، از یک تست یک دنباله استفاده کنید. در مثال بالا انتظار داریم نمرات دانش آموزان بهبود یابد، بنابراین می توان از آزمون یک طرفه استفاده کرد.
  3. حجم نمونه را با استفاده از توان آماری تعیین کنید.قدرت آماری یک مطالعه احتمال این است که یک حجم نمونه معین نتیجه مورد انتظار را ایجاد کند. آستانه توان مشترک (یا β) 80٪ است. تجزیه و تحلیل توان بدون هیچ داده اولیه می تواند چالش برانگیز باشد زیرا برخی اطلاعات در مورد مقادیر میانگین مورد انتظار در هر مجموعه داده و انحرافات استاندارد آنها مورد نیاز است. برای تعیین اندازه نمونه بهینه برای داده های خود از یک ماشین حساب آنلاین برای تجزیه و تحلیل توان استفاده کنید.

    • دانشمندان معمولاً یک مطالعه آزمایشی کوچک انجام می دهند که داده هایی را برای تجزیه و تحلیل توان و اندازه نمونه مورد نیاز برای یک مطالعه گسترده تر و کامل تر ارائه می دهد.
    • اگر فرصت انجام یک مطالعه آزمایشی را ندارید، سعی کنید میانگین های ممکن را بر اساس ادبیات و نتایج افراد دیگر تخمین بزنید. این ممکن است به شما در تعیین حجم نمونه بهینه کمک کند.

    قسمت 2

    محاسبه انحراف معیار
    1. فرمول انحراف معیار را بنویسید.انحراف معیار میزان پراکندگی داده ها است. این به شما امکان می دهد نتیجه بگیرید که داده های به دست آمده در یک نمونه خاص چقدر نزدیک است. در نگاه اول، فرمول کاملاً پیچیده به نظر می رسد، اما توضیحات زیر به شما در درک آن کمک می کند. فرمول به شرح زیر است: s = √∑ ((x i - µ) 2 / (N - 1)).

      • s انحراف معیار است.
      • علامت ∑ نشان می دهد که تمام داده های به دست آمده در نمونه باید اضافه شوند.
      • x i مربوط به مقدار i است، یعنی یک نتیجه به دست آمده جداگانه.
      • μ میانگین این گروه است.
      • ن - تعداد کلداده ها در نمونه
    2. میانگین را در هر گروه بیابید.برای محاسبه انحراف معیار، ابتدا باید میانگین هر گروه مطالعه را بیابید. میانگین با حرف یونانی μ (mu) نشان داده می شود. برای یافتن میانگین، به سادگی تمام مقادیر به دست آمده را اضافه کرده و بر تعداد داده ها (اندازه نمونه) تقسیم کنید.

      • به عنوان مثال، یک مجموعه داده کوچک را برای یافتن میانگین نمره برای گروهی از دانش آموزان پیش کلاس در نظر بگیرید. برای سادگی، از مجموعه ای از پنج نقطه استفاده می کنیم: 90، 91، 85، 83، و 94.
      • بیایید همه مقادیر را با هم اضافه کنیم: 90 + 91 + 85 + 83 + 94 = 443.
      • مجموع را بر تعداد مقادیر تقسیم کنید، N = 5: 443/5 = 88.6.
      • بنابراین میانگین این گروه 88.6 است.
    3. هر مقداری که به دست می آورید از میانگین کم کنید. گام بعدیشامل محاسبه تفاوت (x i - μ) است. برای انجام این کار، هر مقدار به دست آمده را از مقدار متوسط ​​یافت شده کم کنید. در مثال ما، باید پنج تفاوت را پیدا کنیم:

      • (90 - 88.6)، (91 - 88.6)، (85 - 88.6)، (83 - 88.6) و (94 - 88.6).
      • در نتیجه، مقادیر زیر را دریافت می کنیم: 1.4، 2.4، -3.6، -5.6 و 5.4.
    4. هر مقداری را که به دست می آورید مربع کنید و آنها را با هم جمع کنید.هر یک از مقادیری که تازه پیدا شده است باید مجذور شود. در این مرحله تمام مقادیر منفی ناپدید خواهند شد. اگر بعد از این مرحله هنوز اعداد منفی دارید، فراموش کرده اید آنها را مربع کنید.

      • برای مثال ما، 1.96، 5.76، 12.96، 31.36 و 29.16 را دریافت می کنیم.
      • مقادیر به دست آمده را اضافه کنید: 1.96 + 5.76 + 12.96 + 31.36 + 29.16 = 81.2.
    5. بر حجم نمونه منهای 1 تقسیم کنید.در فرمول، به دلیل اینکه جمعیت عمومی را در نظر نمی گیریم، حاصل را بر N - 1 تقسیم می کنیم، اما از همه دانش آموزان برای ارزیابی نمونه برداری می کنیم.

      • تفریق: N - 1 = 5 - 1 = 4
      • تقسیم: 81.2 / 4 = 20.3
    6. استخراج کردن ریشه دوم. پس از تقسیم مجموع بر حجم نمونه منهای یک، جذر را از مقدار یافت شده استخراج کنید. این آخرین مرحله در محاسبه انحراف معیار است. برنامه های آماری وجود دارند که پس از وارد کردن داده های اولیه، تمامی محاسبات لازم را انجام می دهند.

      • در مثال ما، انحراف معیار نمرات آن دسته از دانش آموزانی که مطالب را قبل از کلاس می خوانند، s = √20.3 = 4.51 است.

      قسمت 3

      ارتباط را تعیین کنید
      1. واریانس بین دو گروه داده را محاسبه کنید.تا این مرحله فقط برای یک گروه داده مثالی در نظر گرفته ایم. اگر می خواهید دو گروه را با هم مقایسه کنید، بدیهی است که باید داده های هر دو گروه را بگیرید. انحراف معیار برای گروه دوم داده ها را محاسبه کنید و سپس واریانس بین دو گروه آزمایشی را بیابید. واریانس با استفاده از فرمول زیر محاسبه می شود: s d = √ ((s 1 / N 1) + (s 2 / N 2)).

اعتبار آماری برای عملکرد حسابداری FCC ضروری است. قبلاً ذکر شد که چندین نمونه را می توان از یک جامعه عمومی انتخاب کرد:

اگر آنها به درستی انتخاب شوند، با در نظر گرفتن قابلیت اطمینان پذیرفته شده، میانگین شاخص ها و شاخص های جمعیت عمومی آنها از نظر میزان خطای نمایندگی کمی با یکدیگر متفاوت است.

اگر آنها از جمعیت های مختلف انتخاب شوند، تفاوت بین آنها قابل توجه است. مقایسه نمونه ها به طور گسترده در آمار در نظر گرفته می شود.

اگر تفاوت ناچیز، نه اساسا، ناچیز، یعنی در واقع متعلق به یک جامعه عمومی باشند، تفاوت بین آنها از نظر آماری غیر قابل اعتماد نامیده می شود.

از نظر آماری قابل اعتماد تفاوت در نمونه ها نمونه ای است که به طور قابل توجهی و اساسی متفاوت است، یعنی متعلق به جمعیت های عمومی مختلف است.

امتیاز FCC اعتبار آماریتفاوت در نمونه ها به معنای حل بسیاری از مسائل عملی است. به عنوان مثال، معرفی روش های جدید تدریس، برنامه ها، مجموعه تمرین ها، تست ها، تمرینات کنترلیمرتبط با تأیید تجربی آنها، که باید نشان دهد که گروه آزمایش اساساً با گروه کنترل متفاوت است. بنابراین، ویژه روش های آماری، معیارهای پایایی آماری نامیده می شود که امکان تشخیص وجود یا عدم وجود تفاوت آماری معنی دار بین نمونه ها را فراهم می کند.

همه معیارها به دو گروه پارامتری و ناپارامتریک تقسیم می شوند. معیارهای پارامتری مستلزم وجود یک قانون توزیع نرمال است، به عنوان مثال. منظور من تعریف اجباری شاخص های اصلی قانون عادی است - میانگین حسابی و انحراف معیار s. معیارهای پارامتریک دقیق ترین و صحیح ترین هستند. آزمون های ناپارامتریک بر اساس تفاوت های رتبه ای (ترتیبی) بین آیتم های نمونه است.

در اینجا معیارهای اصلی پایایی آماری مورد استفاده در عمل FCC آمده است: آزمون دانشجویی و آزمون فیشر.

ملاک دانشجوبه نام دانشمند انگلیسی K. Gosset (Student یک نام مستعار است) که این روش را کشف کرد. آزمون دانش آموز پارامتریک است که برای مقایسه استفاده می شود شاخص های مطلقنمونه ها. اندازه نمونه ها ممکن است متفاوت باشد.

ملاک دانشجو به صورت زیر تعریف می شود.

1. آزمون t Student را با فرمول زیر بیابید:


میانگین های حسابی نمونه های مقایسه شده کجا هستند. t 1، t 2 - خطاهای نمایندگی، شناسایی شده بر اساس شاخص های نمونه های مقایسه شده.

2. تمرین در FCC نشان داده است که برای کارهای ورزشی کافی است که قابلیت اطمینان نمره 0.95 = P را بپذیرید.

برای قابلیت اطمینان شمارش: 0.95 = P (a = 0.05)، با تعداد درجه آزادی

k = n 1 + n 2 - 2 مطابق جدول ضمیمه 4، مقدار مرزی معیار را پیدا می کنیم ( تی گرم).

3. بر اساس ویژگی های قانون توزیع نرمال در معیار Student، مقایسه t و t gr انجام می شود.

ما نتیجه گیری می کنیم:

اگر t t gr، تفاوت بین نمونه های مقایسه شده از نظر آماری معنی دار است.

اگر t t gr باشد، این تفاوت از نظر آماری ناچیز است.

برای محققان در زمینه FCC، ارزیابی پایایی آماری اولین گام در حل یک مشکل خاص است: نمونه‌های مقایسه شده اساساً یا نه اساساً متفاوت هستند. مرحله بعدی ارزیابی این تفاوت از دیدگاه آموزشی است که با توجه به شرایط مشکل تعیین می شود.

بیایید کاربرد معیار Student را در یک مثال خاص در نظر بگیریم.

مثال 2.14. گروهی از افراد به تعداد 18 نفر از نظر ضربان قلب (bpm) قبل از x i و بعد از آن بررسی شدند. y مندست گرمی بازی کردن.

اثربخشی گرم کردن را از نظر ضربان قلب ارزیابی کنید. داده های اولیه و محاسبات در جدول ارائه شده است. 2.30 و 2.31.

جدول 2.30

پردازش نشانگرهای ضربان قلب قبل از گرم کردن


خطاها در هر دو گروه همزمان بود، زیرا حجم نمونه برابر است (با همان گروه مورد مطالعه قرار می‌گیرد شرایط مختلف) و میانگین انحرافات مربعی s x = s y = 3 ضربه در دقیقه بود. ما به تعریف معیار دانشجو می پردازیم:

ما قابلیت اطمینان حساب را تنظیم می کنیم: P = 0.95.

تعداد درجات آزادی k 1 = n 1 + n 2 - 2 = 18 + 18 - 2 = 34. با توجه به جدول ضمیمه 4 می یابیم تی گرم= 2,02.

استنباط آماری. از آنجایی که t = 11.62، و مرز t gr = 2.02، پس 11.62> 2.02، یعنی. t> t gr، بنابراین تفاوت بین نمونه ها از نظر آماری معنی دار است.

نتیجه گیری آموزشی. مشخص شد که از نظر ضربان قلب، تفاوت بین وضعیت گروه قبل و بعد از گرم کردن از نظر آماری معنی‌دار است، یعنی. مهم، اساسی بنابراین، با توجه به نشانگر ضربان قلب، می توان نتیجه گرفت که گرم کردن موثر است.

معیار فیشرپارامتریک است هنگام مقایسه نرخ پراکندگی نمونه ها استفاده می شود. این به عنوان یک قاعده به معنای مقایسه از نظر پایداری کار ورزشی یا ثبات شاخص های عملکردی و فنی در تمرین فرهنگ بدنی و ورزش است. نمونه ها می توانند در اندازه های مختلف باشند.

معیار فیشر در ترتیب زیر تعریف شده است.

1. معیار فیشر F را با فرمول پیدا کنید


که در آن، واریانس نمونه های مقایسه شده است.

شرایط معیار فیشر فراهم می کند که در صورت شمار فرمول اف یک واریانس بزرگ پیدا می شود، یعنی. عدد F همیشه بزرگتر از یک است.

ما قابلیت اطمینان شمارش را تنظیم می کنیم: P = 0.95 - و تعداد درجه آزادی را برای هر دو نمونه تعیین می کنیم: k 1 = n 1 - 1، k 2 = n 2 - 1.

با توجه به جدول ضمیمه 4، مقدار مرزی معیار F را پیدا می کنیم گرم.

مقایسه معیارهای F و F گرمبه شما امکان می دهد نتیجه گیری کنید:

اگر F> F gr، آنگاه تفاوت بین نمونه ها از نظر آماری معنی دار است.

اگر اف< F гр, то различие между выборками статически недо­стоверно.

بیایید یک مثال عینی بیاوریم.

مثال 2.15. بیایید دو گروه از بازیکنان هندبال را تجزیه و تحلیل کنیم: x i (n 1= 16 نفر) و y i (n 2 = 18 نفر). این گروه از ورزشکاران برای زمان برخاستن (های) هنگام پرتاب توپ به داخل دروازه مورد مطالعه قرار گرفتند.

آیا میزان دفع یکسان است؟

داده های اولیه و محاسبات اولیه در جدول ارائه شده است. 2.32 و 2.33.

جدول 2.32

پردازش شاخص های دافعه هندبالیست های دسته اول


بیایید معیار فیشر را تعریف کنیم:





با توجه به داده های ارائه شده در جدول پیوست 6، Fgr را پیدا می کنیم: Fgr = 2.4

توجه داشته باشید که جدول ضمیمه 6 تعداد درجات آزادی هر دو واریانس بیشتر و کمتر را هنگام نزدیک شدن فهرست می کند. اعداد بزرگخشن تر شدن بنابراین، تعداد درجات آزادی یک واریانس بزرگتر به ترتیب زیر است: 8، 9، 10، 11، 12، 14، 16، 20، 24، و غیره، و یک کوچکتر - 28، 29، 30، 40 ، 50 و غیره و غیره

این به این دلیل است که با افزایش حجم نمونه، تفاوت در آزمون F کاهش می یابد و می توانید از مقادیر جدولی نزدیک به داده های اصلی استفاده کنید. بنابراین، در مثال 2.15 = 17 وجود ندارد و ما می توانیم نزدیکترین مقدار را به آن k = 16 بگیریم، از آنجا Fgr = 2.4 به دست می آید.

استنباط آماری. از آنجایی که آزمون فیشر F = 2.5> F = 2.4، نمونه ها از نظر آماری قابل تشخیص هستند.

نتیجه گیری آموزشی. مقادیر زمان برخاست (های) هنگام پرتاب توپ به درون دروازه برای بازیکنان هندبال هر دو گروه به طور قابل توجهی متفاوت است. این گروه ها را باید متمایز دانست.

تحقیقات بیشتر باید نشان دهد که دلیل این تفاوت چیست.

مثال 2.20.(بر پایایی آماری نمونه ). اگر زمان (زمان‌ها) از علامت زدن تا ضربه زدن به توپ در ابتدای تمرین x i و در پایان در i باشد، شرایط بازیکن بهبود یافته است؟

داده های اولیه و محاسبات اولیه در جدول آورده شده است. 2.40 و 2.41.

جدول 2.40

پردازش شاخص های زمان از سیگنال دادن تا ضربه زدن به توپ در ابتدای تمرین


اجازه دهید تفاوت بین گروه های شاخص را با توجه به معیار دانش آموز تعیین کنیم:

با قابلیت اطمینان 0.95 = P و درجه آزادی k = n 1 + n 2 - 2 = 22 + 22 - 2 = 42 مطابق جدول ضمیمه 4، متوجه می شویم تی گرم= 2.02. از آنجایی که t = 8.3> تی گرم= 2.02 - تفاوت از نظر آماری معنی دار است.

اجازه دهید تفاوت بین گروه های شاخص را با توجه به معیار فیشر تعیین کنیم:


مطابق جدول ضمیمه 2، با قابلیت اطمینان 0.95 = P و درجه آزادی k = 22 - 1 = 21، مقدار F gr = 21. از آنجایی که F = 1.53< F гр = = 2,1, различие в рассеивании исходных данных статистически недостоверно.

استنباط آماری. با توجه به میانگین حسابی، تفاوت بین گروه های شاخص از نظر آماری معنی دار است. از نظر پراکندگی (پراکندگی)، تفاوت بین گروه های شاخص از نظر آماری ناچیز است.

نتیجه گیری آموزشی.صلاحیت های این فوتبالیست به میزان قابل توجهی افزایش یافته است، اما باید به پایداری شهادت او توجه شود.

آمادگی برای کار

قبل از انجام این کار کار آزمایشگاهیدر رشته "مترولوژی ورزشی" همه دانش آموزان گروه مطالعه باید تیم های کاری 3-4 دانش آموز را در هر یک تشکیل دهند، برای انجام مشترک وظایف کاری کلیه کارهای آزمایشگاهی.

در آماده سازی برای کار خود را با بخش های مربوطه ادبیات توصیه شده آشنا کنید (به بخش 6 داده ها مراجعه کنید دستورالعمل ها) و یادداشت های سخنرانی. بخش 1 و 2 را برای این کار آزمایشگاهی و همچنین تکلیف کاری برای آن (بخش 4) مطالعه کنید.

فرم گزارش تهیه کنیدبر ورق های استانداردکاغذ تحریر A4 و مواد لازم برای کار را در آن وارد کنید.

گزارش باید حاوی :

صفحه عنوانبا ذکر دپارتمان (بریتانیا و TR)، گروه تحصیلی، نام خانوادگی، نام، نام خانوادگی دانشجو، شماره و عنوان کار آزمایشگاهی، تاریخ اتمام آن و همچنین نام خانوادگی، مدرک تحصیلی، رتبه علمی و سمت معلم پذیرنده کار؛

هدف کار؛

فرمول هایی با مقادیر عددی که نتایج میانی و نهایی محاسبات را توضیح می دهد.

جداول مقادیر اندازه گیری و محاسبه شده؛

مواد گرافیکی مورد نیاز برای تکلیف؛

نتیجه گیری مختصر در مورد نتایج هر مرحله از تکلیف کاری و به طور کلی در مورد کار انجام شده.

تمام نمودارها و جداول با استفاده از ابزارهای ترسیم به طور منظم ترسیم می شوند. نمادهای گرافیکی و حروف مشروط باید با GOST مطابقت داشته باشند. تهیه گزارش با استفاده از تجهیزات محاسباتی (کامپیوتری) مجاز است.

تکلیف کاری

قبل از انجام تمام اندازه گیری ها، هر یک از اعضای تیم باید قوانین استفاده از ورزش را مطالعه کند بازی های دارتارائه شده در ضمیمه 7، که برای انجام مراحل زیر تحقیق ضروری است.

I - مرحله تحقیق«بررسی نتایج اصابت به هدف بازی ورزشیدارت توسط هر یک از اعضای تیپ برای رعایت قانون توزیع عادی طبق ضوابط χ 2پیرسون و معیار سه سیگما

1. برای اندازه گیری (آزمایش) سرعت (شخصی) و هماهنگی اقدامات، با پرتاب دارت 30-40 بار به سمت هدف دایره ای بازی ورزشی دارت.

2. نتایج اندازه گیری ها (آزمون ها) x i(با لیوان) به ترتیب در فرم سری تغییراتو در جدول 4.1 وارد کنید (ستون‌ها، همه را انجام دهید محاسبات لازم، جداول لازم را پر کنید و نتایج مناسب را در مورد مطابقت توزیع تجربی به دست آمده با قانون توزیع نرمال، با قیاس با محاسبات، جداول و نتایج مشابه مثال 2.12، که در بخش 2 این دستورالعمل ها در صفحات 7-10 آورده شده است، استخراج کنید. .

جدول 4.1

رعایت سرعت و هماهنگی اقدامات آزمودنی ها با قانون توزیع عادی

P / P شماره به صورت گرد
جمع

مرحله دوم تحقیق

"ارزیابی میانگین شاخص های جمعیت عمومی ضربات به هدف بازی ورزشی دارت کلیه دانش آموزان گروه مورد مطالعه بر اساس نتایج اندازه گیری اعضای یک تیپ"

ارزیابی میانگین شاخص‌های سرعت و هماهنگی اقدامات همه دانش‌آموزان گروه مطالعه (طبق فهرست گروه مطالعاتی مجله کلاسی) با توجه به نتایج ضربه زدن به هدف بازی ورزشی دارت همه اعضا. تیپ، در مرحله اول تحقیق این کار آزمایشگاهی به دست آمد.

1. برای صدور نتایج اندازه گیری سرعت و هماهنگی اقدامات هنگام پرتاب دارت به سمت هدف دایره ای بازی ورزشی دارت تمام اعضای تیم شما (2 تا 4 نفر) که نمونه ای از نتایج اندازه گیری از جمعیت عمومی را نشان می دهد (نتایج اندازه گیری همه دانش آموزان گروه آموزشی - به عنوان مثال، 15 نفر)، وارد کردن آنها در ستون دوم و سوم جدول 4.2.

جدول 4.2

پردازش شاخص های سرعت و هماهنگی اقدامات

اعضای تیپ

P / P شماره
جمع

در جدول 4.2 زیر باید درک شود , میانگین امتیاز منطبق (نتایج محاسبات را مطابق جدول 4.1 ببینید) اعضای تیم شما ( , در مرحله اول تحقیق به دست آمد. لازم به ذکر است که، معمولا، در جدول 4.2 یک مقدار متوسط ​​محاسبه شده از نتایج اندازه گیری به دست آمده توسط یکی از اعضای تیم در مرحله اول تحقیق وجود دارد. ، از آنجایی که احتمال همزمانی نتایج اندازه گیری توسط اعضای مختلف تیم بسیار کم است. سپس، معمولا ارزش دارد در ستون جدول 4.2 برای هر یک از ردیف ها - برابر با 1، آ در خط "کل "ستون ها" "، نوشته شده است تعداد اعضای تیم شما

2. کلیه محاسبات لازم برای پر کردن جدول 4.2 و همچنین سایر محاسبات و نتیجه گیری ها را مشابه محاسبات و نتیجه گیری های مثال 2.13 در بخش دوم این مقاله انجام دهید. توسعه روش شناختیدر صفحات 13-14. هنگام محاسبه خطای نمایندگی باید در نظر داشت "M" استفاده از فرمول 2.4 که در صفحه 13 این توسعه روش‌شناختی آورده شده است ضروری است، زیرا نمونه کوچک است (n و تعداد عناصر جمعیت عمومی N مشخص است و برابر با تعداد دانش‌آموزان گروه مورد مطالعه است. ، طبق لیست مجله گروه مطالعه.

مرحله سوم تحقیق

ارزیابی اثربخشی گرم کردن با شاخص "سرعت و هماهنگی اقدامات" توسط هر یک از اعضای تیم با استفاده از آزمون t Student

ارزیابی اثربخشی گرم کردن با پرتاب دارت به سمت هدف بازی ورزشی "دارت" که در مرحله اول تحقیق این کار آزمایشگاهی توسط هر یک از اعضای تیم با توجه به شاخص "سرعت و هماهنگی اقدامات» با استفاده از معیار دانشجویی - معیار پارامتریک پایایی آماری قانون توزیع تجربی قانون توزیع نرمال ...

… جمع

2. واریانس و RMS ، نتایج اندازه گیری شاخص "سرعت و هماهنگی اقدامات" با توجه به نتایج گرم کردن، ارائه شده در جدول 4.3، (محاسبات مشابه بلافاصله پس از جدول 2.30 از مثال 2.14 در صفحه 16 این توسعه روش شناختی ارائه شده را ببینید).

3. هر یک از اعضای تیم کاری برای اندازه گیری (آزمایش) سرعت (شخصی) و هماهنگی اقدامات خود پس از گرم کردن،

… جمع

5. میانگین را محاسبه کنید واریانس و RMS ,نتایج اندازه گیری شاخص "سرعت و هماهنگی اقدامات" پس از گرم کردن، ارائه شده در جدول 4.4، کل نتیجه اندازه گیری را بر اساس نتایج گرم کردن یادداشت کنید (محاسبات مشابه بلافاصله پس از جدول 2.31 از مثال 2.14 در صفحه 17 این توسعه روش شناختی ارائه شده را ببینید).

6. تمام محاسبات و نتیجه گیری های لازم را، مشابه محاسبات و نتیجه گیری های مثال 2.14، که در بخش دوم این توسعه روش شناختی در صفحات 16-17 آورده شده است، انجام دهید. هنگام محاسبه خطای نمایندگی باید در نظر داشت "M" لازم است از فرمول 2.1، ارائه شده در صفحه 12 این توسعه روش شناختی استفاده شود، زیرا نمونه n است و تعداد عناصر در جمعیت عمومی N (ناشناخته است.

IV - مرحله چهارم تحقیق

ارزیابی یکنواختی (پایداری) شاخص های "سرعت و هماهنگی اقدامات" دو عضو تیم با استفاده از معیار فیشر

با توجه به نتایج اندازه گیری های به دست آمده در مرحله سوم تحقیق در این کار آزمایشگاهی، یکنواختی (پایداری) شاخص های "سرعت و هماهنگی اقدامات" دو عضو تیم را با استفاده از معیار فیشر ارزیابی کنید.

برای این کار باید موارد زیر را انجام دهید.

با استفاده از داده های جداول 4.3 و 4.4، نتایج محاسبه واریانس بر اساس این جداول که در مرحله سوم تحقیق به دست آمده و همچنین روش محاسبه و به کارگیری معیار فیشر برای ارزیابی یکنواختی (پایداری) ورزش ها می باشد. شاخص‌هایی که در مثال 2.15 در صفحات 18-19 این توسعه روش‌شناختی آورده شده‌اند، نتایج آماری و آموزشی مرتبط را به دست می‌آورند.

مرحله پنجم تحقیق

ارزیابی گروه های شاخص "سرعت و هماهنگی اقدامات" یکی از اعضای تیم قبل و بعد از گرم کردن

اهمیت آماری یک نتیجه (p-value) معیار تخمینی اعتماد به "حقیقت" آن (به معنای "نمایندگی نمونه") است. از نظر فنی تر، مقدار p معیاری برای کاهش وابستگی به قابلیت اطمینان یک نتیجه است. مقدار p بالاتر مربوط به سطح پایین تری از اطمینان در وابستگی بین متغیرهای موجود در نمونه است. یعنی p-value احتمال خطای مرتبط با گسترش نتیجه مشاهده شده به کل جمعیت است. به عنوان مثال، مقدار p 0.05 (یعنی 1/20) نشان می دهد که احتمال 5٪ وجود دارد که رابطه یافت شده در نمونه بین متغیرها فقط یک ویژگی تصادفی نمونه باشد. به عبارت دیگر، اگر این وابستگی در جمعیت وجود نداشته باشد، و شما آزمایش‌های مشابه را بارها انجام دهید، در هر بیست تکرار آزمایش، انتظار وابستگی یکسان یا قوی‌تر بین متغیرها را دارید.

در بسیاری از مطالعات، مقدار p 0.05 "مرز قابل قبول" سطح خطا در نظر گرفته می شود.

هیچ راهی برای اجتناب از خودسری در تصمیم گیری اینکه چه سطحی از اهمیت باید واقعاً «مهم» در نظر گرفته شود، وجود ندارد. انتخاب سطح معینی از اهمیت که بالاتر از آن نتایج به‌عنوان نادرست رد می‌شوند، کاملاً دلخواه است. در عمل، تصمیم نهایی معمولاً به این بستگی دارد که آیا نتیجه پیشینی پیش‌بینی شده است (یعنی قبل از آزمایش) یا به‌طور پسینی در نتیجه تحلیل‌ها و مقایسه‌های زیادی که بر روی تعداد زیادی از داده‌ها انجام شده است و همچنین به سنت در زمینه تحقیق داده شده به طور کلی، در بسیاری از مناطق، p 0.05 یک برش قابل قبول برای اهمیت آماری است، اما باید به خاطر داشت که این سطح هنوز هم احتمال خطا نسبتاً بالایی را شامل می شود (5٪). نتایج معنی دار در سطح p 0.01 عموماً از نظر آماری معنی دار در نظر گرفته می شوند و نتایج با سطح p 0.005 یا p 0.001 بسیار معنی دار هستند. با این حال، باید درک کرد که این طبقه‌بندی سطوح اهمیت کاملاً دلخواه است و فقط یک توافق غیررسمی است که بر اساس تجربه عملی در یک زمینه تحقیقاتی خاص اتخاذ شده است.

همانطور که قبلا ذکر شد، میزان وابستگی و قابلیت اطمینان دو است ویژگی های مختلفوابستگی بین متغیرها با این حال نمی توان گفت که آنها کاملا مستقل هستند. به طور کلی، هر چه مقدار رابطه (رابطه) بین متغیرها در یک نمونه با اندازه معمولی بیشتر باشد، قابل اعتمادتر است.

اگر فرض کنیم که بین متغیرهای متناظر در جامعه رابطه وجود ندارد، به احتمال زیاد انتظار می رود که در نمونه مورد مطالعه هیچ رابطه ای بین این متغیرها وجود نداشته باشد. بنابراین، هرچه این رابطه در نمونه قوی‌تر باشد، احتمال اینکه این رابطه در جامعه‌ای که از آن استخراج شده وجود نداشته باشد، کمتر می‌شود.


حجم نمونه بر اهمیت رابطه تأثیر می گذارد. اگر مشاهدات کمی وجود داشته باشد، بر این اساس ترکیبات احتمالی کمی از مقادیر این متغیرها وجود دارد، و بنابراین احتمال یافتن تصادفی ترکیبی از مقادیری که وابستگی شدید را نشان می‌دهند، نسبتاً زیاد است.

نحوه محاسبه سطح معناداری آماری فرض کنید شما قبلاً میزان رابطه بین دو متغیر را محاسبه کرده اید (همانطور که در بالا توضیح داده شد). سوال بعدی پیش روی شما این است که "این اعتیاد چقدر مهم است؟" به عنوان مثال، آیا 40 درصد واریانس توضیح داده شده بین دو متغیر برای معنادار شدن رابطه کافی است؟ پاسخ: «در حد مقتضی». یعنی، اهمیت به طور عمده به حجم نمونه بستگی دارد. همانطور که قبلا توضیح داده شد، در نمونه های بسیار بزرگ، حتی روابط بسیار ضعیف بین متغیرها معنادار خواهد بود، در حالی که در نمونه های کوچک، حتی روابط بسیار قوی قابل اعتماد نیستند. بنابراین، برای تعیین سطح معنی‌داری آماری، به تابعی نیاز دارید که نشان‌دهنده رابطه بین «مقدار» و «معنی‌داری» رابطه بین متغیرها برای هر حجم نمونه باشد. این تابع دقیقاً به شما می‌گوید: «چقدر احتمال دارد که وابستگی یک مقدار معین (یا بیشتر) را در نمونه‌ای با اندازه معین به دست آوریم، با این فرض که چنین وابستگی در جامعه وجود ندارد». به عبارت دیگر، این تابع سطح معنی داری (p-value) را نشان می دهد و بنابراین احتمال رد اشتباه این فرض را دارد که این رابطه در جامعه وجود ندارد. این فرضیه «جایگزین» (که هیچ وابستگی در جمعیت وجود ندارد) معمولاً فرضیه صفر نامیده می شود. اگر تابع محاسبه‌کننده احتمال خطا خطی باشد و فقط برای اندازه‌های نمونه مختلف شیب‌های متفاوتی داشته باشد، ایده‌آل خواهد بود. متأسفانه، این عملکرد بسیار پیچیده تر است و همیشه دقیقاً یکسان نیست. با این حال، در بیشتر موارد، شکل آن شناخته شده است و می توان از آن برای تعیین سطوح اهمیت در هنگام بررسی نمونه هایی با اندازه معین استفاده کرد. بیشتر این ویژگی ها با یک بسیار مرتبط هستند کلاس مهمتوزیع هایی که نرمال نامیده می شود.