kolmogorov smirnov test

پیشنهاد کاربران

آزمون کولموگروف - اسمیرنوف ( Kolmogorov - Smirnov test ) که اغلب به اختصار آزمون K - S نامیده می شود، یک آزمون ناپارامتری است که برای موارد زیر کاربرد دارد:
**1. آزمون برازش ( Goodness - of - Fit Test ) :**
...
[مشاهده متن کامل]

* **هدف:** بررسی می کند که آیا نمونه ای از داده ها از یک توزیع احتمال مشخص پیروی می کند یا خیر. به عبارت دیگر، می خواهد ببیند که داده های مشاهده شده با توزیع مورد انتظار چقدر تطابق دارند.
* **نحوه کار:** تفاوت بین تابع توزیع تجمعی ( CDF ) داده های نمونه و CDF توزیع فرضی را محاسبه می کند. آماره آزمون، بزرگترین تفاوت ( از نظر قدر مطلق ) بین این دو CDF است.
* **مثال:** فرض کنید می خواهید بررسی کنید که آیا داده های قد دانش آموزان یک مدرسه از توزیع نرمال پیروی می کنند یا خیر. می توانید از آزمون K - S استفاده کنید و CDF داده های قد دانش آموزان را با CDF توزیع نرمال مقایسه کنید.
**2. آزمون دو نمونه ای ( Two - Sample Test ) :**
* **هدف:** بررسی می کند که آیا دو نمونه مستقل از یک توزیع احتمال یکسان آمده اند یا خیر. به عبارت دیگر، می خواهد ببیند که آیا دو نمونه دارای توزیع یکسانی هستند یا خیر.
* **نحوه کار:** تفاوت بین CDF دو نمونه را محاسبه می کند. آماره آزمون، بزرگترین تفاوت ( از نظر قدر مطلق ) بین این دو CDF است.
* **مثال:** فرض کنید می خواهید بررسی کنید که آیا نمرات امتحان ریاضی دانش آموزان دو کلاس مختلف دارای توزیع یکسانی هستند یا خیر. می توانید از آزمون K - S استفاده کنید و CDF نمرات امتحان در دو کلاس را با هم مقایسه کنید.
**مزایا:**
* **ناپارامتری:** نیازی به فرض توزیع خاصی برای داده ها ندارد. این ویژگی آن را برای داده هایی که توزیع آنها مشخص نیست یا نرمال نیستند، مناسب می کند.
* **کاربرد گسترده:** می تواند برای انواع مختلف داده ها، از جمله داده های پیوسته و گسسته، استفاده شود.
* **قابل درک:** مفهوم آن نسبتاً ساده است و تفسیر نتایج آن آسان است.
**معایب:**
* **کمتر قدرتمند:** در مقایسه با آزمون های پارامتری ( مانند آزمون t ) در مواردی که فرضیات پارامتری برقرار باشند، قدرت کمتری دارد. به عبارت دیگر، ممکن است در تشخیص تفاوت های واقعی بین توزیع ها ضعیف تر عمل کند.
* **حساسیت به مقادیر پرت:** مقادیر پرت می توانند تأثیر زیادی بر نتایج آزمون داشته باشند.
* **برای حجم نمونه های کوچک مناسب نیست:** در حجم نمونه های بسیار کوچک، ممکن است نتایج آزمون غیرقابل اعتماد باشند.
**نکات مهم:**
* **فرضیات:** برای آزمون دو نمونه ای، فرض اصلی این است که دو نمونه مستقل هستند.
* **تفسیر نتایج:** اگر مقدار p - value ( مقدار احتمال ) حاصل از آزمون کمتر از سطح معنی داری ( معمولاً 0. 05 ) باشد، فرضیه صفر ( null hypothesis ) رد می شود. این به معنی آن است که شواهد کافی برای رد این فرضیه وجود دارد که داده ها از توزیع مورد نظر پیروی می کنند ( در آزمون برازش ) یا دو نمونه از یک توزیع آمده اند ( در آزمون دو نمونه ای ) .
* **آزمون جایگزین:** اگر داده ها نرمال هستند و می خواهید قدرت بیشتری داشته باشید، می توانید از آزمون های پارامتری مانند آزمون t یا آزمون ANOVA استفاده کنید.
**به طور خلاصه:**
آزمون کولموگروف - اسمیرنوف ابزاری مفید برای بررسی برازش یک توزیع فرضی با داده های مشاهده شده و مقایسه توزیع دو نمونه مستقل است، به خصوص زمانی که فرضیات پارامتری قابل اطمینان نیستند. با این حال، در نظر داشته باشید که ممکن است قدرت کمتری نسبت به آزمون های پارامتری داشته باشد و به مقادیر پرت حساس باشد.

آزمون کولموگروف اسمیرنف

بپرس