فرض کنید میخواهیم نتیجهی یک انتخابات را پیشبینی کنیم. از افرادی مختلف که ارتباطی به هم ندارند، نظر سنجی میکنیم و تعداد رایهای به نفع هر کاندیدا را در این نمونه می شماریم و از روی آن نتایج را تخمین میزنیم. اما از کجا معلوم که نتیجهای که از این نمونه میگیریم به نتیجهی واقعی نزدیک است؟
پیش از پاسخ به این سوال، یادآوری می کنیم که قانون اعداد بزرگ میگوید که اگر یک مجموعه نمونهی مستقل (بی ارتباط به هم) از یک کمیت را با هم جمع کنیم، و حاصل را بر تعداد نمونهها تقسیم کنیم، عدد حاصل به میانگین نمونهها نزدیک است. به این شکل اگر در یک نمونهی ۷۰۰ نفری، ۷۰ نفر به یک کاندیدای خاص رای دهند، درصد آرای آن کاندیدا ۱۰٪ تخمین زده میشود.
قضیهی حد مرکزی تا حدی به این سوال جواب میدهد. طبق قانون اعداد بزرگ، اگر یک مجموعه نمونهی مستقل (بی ارتباط به هم) از یک کمیت را با هم جمع کنیم، سپس آن را بر تعداد نمونه تقسیم کنیم، حاصل تقریبا میانگین میشود. اما قضیهی حد مرکزی میگوید، تخمین حاصل همان قدر از میانگین دور است که توزیع نرمال با میانگین صفر و واریانس متناسب با واریانس نمونه تقسیم بر تعداد نمونه (
)، از صفر.
)، از صفر.به عبارت دیگر، اگر دو نامزد انتخاباتی داشته باشیم و نمونهی ما ۷۰۰ نفری باشد که ۷۰ نفر از آن به کاندیدای یک رای داده اند، احتمال این که یک درصد خطا داشته باشیم، یعنی درصد واقعی یک درصد از تخمین ۱۰٪ی ما فاصله داشته باشد، تقریبا برابر صفر (دو به توان منفی بیست) است!
پ.ن.: لازم به تاکید است که تمام این محاسبات بر مبنای یک نمونهی مستقل انجام شده است. اگر در نمونهگیری خطاهای بزرگی مرتکب شویم. تمام این نتایجی که به دست میآوریم از اساس غلط است. نمونههای تاریخی این نوع اشتباهات هم رخ داده است. یک نمونهی این اشتباه نمونهگیری با استفاده از تلفن یا نمونهگیری در خیابان است. دقت در نمونهگیری شاید پرهزینهترین بخش یک کار آماری است، هم به لحاظ عملیاتی و هم به لحاظ بررسیهای بعدی برای تایید نتایج.
هیچ نظری موجود نیست:
ارسال یک نظر