نمودار ستونی، [ ۱] بافت نگاشت[ ۲] یا هیستوگرام نمایشی از توزیع داده های کمی پیوسته است که می تواند تخمینی از توزیع احتمال باشد و نخستین بار توسط کارل پیرسون به کار گرفته شد. [ ۳] بافت نگاشت یکی از ۷ ابزار کنترل کیفیت است. تفاوت بافت نگاشت ( نمودار ستونی ) با نمودار میله ای در آن است که نمودار میله ای مربوط به توزیع دو متغیر تصادفی است ولی بافت نگاشت مربوط به یک متغیر است.
برای رسم بافت نگاشت ابتدا باید داده ها را به بازه های کوچک افراز ( معمولاً طول بازه ها برابر در نظر گرفته می شود ) ، سپس تعداد داده های هر بازه را محاسبه کرد. [ ۴]
پس از آن اگر طول بازه ها برابر بود، روی هر بازه یک مستطیل با ارتفاع متناسب فراوانی آن بازه کشیده می شود.
اگر طول بازه ها برابر نبود، روی هر بازه یک مستطیل با مساحت متناسب فراوانی آن بازه کشیده می شود. در این حالت محور عمودی دیگر نشان دهنده فراوانی نیست، بلکه نشان دهنده چگالی فراوانی - تعداد پیشامدها بر واحد متغیر تصادفی روی محور افقی - است.
بافت نگاشت مجموعه ای از توابع f i است که تعداد پیشامدهای مشاهده شده از هر بازه را برمی گرداند؛ لذا نمودار بافت نگاشت فقط یک راه از نمایش بافت نگاشت است. اگر n تعداد کل پیشامدهای مشاهده شده و k تعداد بازه ها باشد، آنگاه معادلهٔ زیر برای بافت نگاشت های f i برقرار است:
n = ∑ i = 1 k f i
بافت نگاشت تجمعی مجموعه ای از توابع F i است که فراوانی تجمعی پیشامدهای مشاهده شده هر بازه را برمی گرداند پس بافت نگاشت تجمعیِ بافت نگاشت f i به صورت زیر تعریف می شود:
F i = ∑ j = 1 i f i
حالت های مختلفی برای تعیین بازه ها وجود دارد که هرکدام ویژگی های مختلفی از داده را آشکار می کنند لذا برهم برتری ندارند. هرچه طول بازه ها بیشتر باشد، تراکم نقاط کم تر می شود و نویز ناشی از نمونه گیری تصادفی را کاهش می دهد. از طرف دیگر هرچه طول بازه ها کمتر باشد، تخمین بهتری از توزیع می توان پیدا کرد. بعضی تلاش کرده اند تا مقداری بهینه برای تعداد بازه ها بیابند، ولی این روش ها معمولاً شامل فرضی قوی روی توزیع اند. با توجه به توزیع واقعی داده ها و اهداف تحلیل آن ها، مقدار متفاوتی برای طول بازه ها مناسب خواهدبود. [ ۵]
k = ⌈ n ⌉ [ ۶]
برای استفاده از فرمول استرجس داده ها باید توزیع تقریباً نرمال داشته باشند. معمولاً این فرمول در حالتی که n < 30 باشد یا توزیع داده ها نرمال نباشد، کاربردی ندارد. [ ۷]
این نوشته برگرفته از سایت ویکی پدیا می باشد، اگر نادرست یا توهین آمیز است، لطفا گزارش دهید: گزارش تخلفبرای رسم بافت نگاشت ابتدا باید داده ها را به بازه های کوچک افراز ( معمولاً طول بازه ها برابر در نظر گرفته می شود ) ، سپس تعداد داده های هر بازه را محاسبه کرد. [ ۴]
پس از آن اگر طول بازه ها برابر بود، روی هر بازه یک مستطیل با ارتفاع متناسب فراوانی آن بازه کشیده می شود.
اگر طول بازه ها برابر نبود، روی هر بازه یک مستطیل با مساحت متناسب فراوانی آن بازه کشیده می شود. در این حالت محور عمودی دیگر نشان دهنده فراوانی نیست، بلکه نشان دهنده چگالی فراوانی - تعداد پیشامدها بر واحد متغیر تصادفی روی محور افقی - است.
بافت نگاشت مجموعه ای از توابع f i است که تعداد پیشامدهای مشاهده شده از هر بازه را برمی گرداند؛ لذا نمودار بافت نگاشت فقط یک راه از نمایش بافت نگاشت است. اگر n تعداد کل پیشامدهای مشاهده شده و k تعداد بازه ها باشد، آنگاه معادلهٔ زیر برای بافت نگاشت های f i برقرار است:
n = ∑ i = 1 k f i
بافت نگاشت تجمعی مجموعه ای از توابع F i است که فراوانی تجمعی پیشامدهای مشاهده شده هر بازه را برمی گرداند پس بافت نگاشت تجمعیِ بافت نگاشت f i به صورت زیر تعریف می شود:
F i = ∑ j = 1 i f i
حالت های مختلفی برای تعیین بازه ها وجود دارد که هرکدام ویژگی های مختلفی از داده را آشکار می کنند لذا برهم برتری ندارند. هرچه طول بازه ها بیشتر باشد، تراکم نقاط کم تر می شود و نویز ناشی از نمونه گیری تصادفی را کاهش می دهد. از طرف دیگر هرچه طول بازه ها کمتر باشد، تخمین بهتری از توزیع می توان پیدا کرد. بعضی تلاش کرده اند تا مقداری بهینه برای تعداد بازه ها بیابند، ولی این روش ها معمولاً شامل فرضی قوی روی توزیع اند. با توجه به توزیع واقعی داده ها و اهداف تحلیل آن ها، مقدار متفاوتی برای طول بازه ها مناسب خواهدبود. [ ۵]
k = ⌈ n ⌉ [ ۶]
برای استفاده از فرمول استرجس داده ها باید توزیع تقریباً نرمال داشته باشند. معمولاً این فرمول در حالتی که n < 30 باشد یا توزیع داده ها نرمال نباشد، کاربردی ندارد. [ ۷]
wiki: هیستوگرام