نمودار ساقه وبرگ
فرهنگستان زبان و ادب
دانشنامه عمومی
نمودار ساقه وبرگ[ ۱] یکی از نمودارهای آماری و شبیه به هیستوگرام است که برای داده نمایی داده های کمی به کار می رود تا به تصویرسازی از شکل توزیع احتمال کمک کند. این نمودارها در تحلیل کاوشی داده ها[ و ۱] مفید هستند.
بر خلاف هیستوگرام ها، نمودارهای ساقه و برگ اصل داده ها را دست کم تا دو رقم حفظ می کنند.
یک نمودار ساقه و برگ ساده شامل دو ستون که با استفاده از یک خط عمومی جدا شده اند می شود. ستون سمت چپ ساقه ها و ستون سمت راست برگ ها را در بر می گیرد.
ابتدا داده های حاصل از مشاهده را از کم به زیاد مرتب می کنند. برای نمونه داده های زیر مرتب شده اند:
۴۴ ۴۶ ۴۷ ۴۹ ۶۳ ۶۴ ۶۶ ۶۸ ۶۸ ۷۲ ۷۲ ۷۵ ۷۶ ۸۱ ۸۴ ۸۸ ۱۰۶ سپس باید تصمیم گرفت که کدام بخش از اعداد را ساقه و کدام بخش را برگ در نظر بگیریم. معمولاً آخرین رقم هر عدد را برگ، و همهٔ رقم های باقی مانده را ساقه در نظر می گیرند. اگر داده ها عددهای خیلی بزرگی باشند ممکن است آن ها را تا حد معینی ( مثلاً تا صدگان ) گرد کنند. در نمونهٔ بالا برگ ها را رقم یکان و ساقه را رقم دهگان در نظر می گیرم. در هنگام رسم، ساقه ها را ( بدون پرش از روی عددها ) در ستونشان می نویسیم و سپس برگ ها را در برابر ساقهٔ خودشان و به ترتیب از کم به زیاد قرار می دهیم.
۴ | ۴ ۶ ۷ ۹ ۵ | ۶ | ۳ ۴ ۶ ۸ ۸ ۷ | ۲ ۲ ۵ ۶ ۸ | ۱ ۴ ۸ ۹ | ۱۰ | ۶ کلید: ۳|۶=۶۳ یکای برگ: ۱٫۰ یکای ساقه: ۱۰٫۰ تاریخچه نمودارهای ساقه و برگ حالت تکامل یافتهٔ اثر آرتور بولی در اوایل دههٔ ۱۹۰۰ هستند. استفاده از آن ها در دههٔ ۱۹۸۰ و پس از انتشار تحلیل کاوشی داده ها اثر جان توکی در سال ۱۹۷۷ عمومی شد. پرطرفدار بودن این شیوهٔ نمایش داده در آن زمان به سبب استفاده از سبک مونواسپیس در هنگام نگارش نسبت داده می شود زیرا امکان تولید سادهٔ این نگاره ها با فناوری رایانه ای آن زمان وجود داشت. با ظهور توانایی های گرافیکی برتر رایانه های نوین این روش کمتر استفاده می شود.
نمودارهای ساقه و برگ برای نمایش چگالی نسبی و شکل داده ها مفید هستند و به خواننده یک دید سریع از توزیع می دهند. این نمودارهای بیشتر داده های عددی خام را حفظ می کنند. همچنین برای نمایش دادن داده پرت و یافتن مد کاربرد دارند.
با این وجود نمودارهای ساقه و برگ تنها برای نمایش مجموعه داده هایی با اندازهٔ نه چندان زیاد یا کم مناسبند ( تقریباً ۱۵ تا ۱۵۰ نقطه ) . اگر مجموعه داده خیلی کوچک باشد، این نمودار کاربرد زیادی نخواهد داشت؛ چراکه به تعداد مناسبی نقطهٔ داده برای مشخص شدن خواص توزیع نیاز است. برای چنین داده هایی نمودار نقطه ای ممکن است مناسب تر باشد. اگر مجموعه داده خیلی بزرگ باشد، نمودار بسیار به هم ریخته خواهد شد زیرا نقاط داده باید به صورت عددی مشخص شوند. در این موارد استفاده از نمودار جعبه ای یا هیستوگرام ممکن است مناسب تر باشد.
این نوشته برگرفته از سایت ویکی پدیا می باشد، اگر نادرست یا توهین آمیز است، لطفا گزارش دهید: گزارش تخلفبر خلاف هیستوگرام ها، نمودارهای ساقه و برگ اصل داده ها را دست کم تا دو رقم حفظ می کنند.
یک نمودار ساقه و برگ ساده شامل دو ستون که با استفاده از یک خط عمومی جدا شده اند می شود. ستون سمت چپ ساقه ها و ستون سمت راست برگ ها را در بر می گیرد.
ابتدا داده های حاصل از مشاهده را از کم به زیاد مرتب می کنند. برای نمونه داده های زیر مرتب شده اند:
۴۴ ۴۶ ۴۷ ۴۹ ۶۳ ۶۴ ۶۶ ۶۸ ۶۸ ۷۲ ۷۲ ۷۵ ۷۶ ۸۱ ۸۴ ۸۸ ۱۰۶ سپس باید تصمیم گرفت که کدام بخش از اعداد را ساقه و کدام بخش را برگ در نظر بگیریم. معمولاً آخرین رقم هر عدد را برگ، و همهٔ رقم های باقی مانده را ساقه در نظر می گیرند. اگر داده ها عددهای خیلی بزرگی باشند ممکن است آن ها را تا حد معینی ( مثلاً تا صدگان ) گرد کنند. در نمونهٔ بالا برگ ها را رقم یکان و ساقه را رقم دهگان در نظر می گیرم. در هنگام رسم، ساقه ها را ( بدون پرش از روی عددها ) در ستونشان می نویسیم و سپس برگ ها را در برابر ساقهٔ خودشان و به ترتیب از کم به زیاد قرار می دهیم.
۴ | ۴ ۶ ۷ ۹ ۵ | ۶ | ۳ ۴ ۶ ۸ ۸ ۷ | ۲ ۲ ۵ ۶ ۸ | ۱ ۴ ۸ ۹ | ۱۰ | ۶ کلید: ۳|۶=۶۳ یکای برگ: ۱٫۰ یکای ساقه: ۱۰٫۰ تاریخچه نمودارهای ساقه و برگ حالت تکامل یافتهٔ اثر آرتور بولی در اوایل دههٔ ۱۹۰۰ هستند. استفاده از آن ها در دههٔ ۱۹۸۰ و پس از انتشار تحلیل کاوشی داده ها اثر جان توکی در سال ۱۹۷۷ عمومی شد. پرطرفدار بودن این شیوهٔ نمایش داده در آن زمان به سبب استفاده از سبک مونواسپیس در هنگام نگارش نسبت داده می شود زیرا امکان تولید سادهٔ این نگاره ها با فناوری رایانه ای آن زمان وجود داشت. با ظهور توانایی های گرافیکی برتر رایانه های نوین این روش کمتر استفاده می شود.
نمودارهای ساقه و برگ برای نمایش چگالی نسبی و شکل داده ها مفید هستند و به خواننده یک دید سریع از توزیع می دهند. این نمودارهای بیشتر داده های عددی خام را حفظ می کنند. همچنین برای نمایش دادن داده پرت و یافتن مد کاربرد دارند.
با این وجود نمودارهای ساقه و برگ تنها برای نمایش مجموعه داده هایی با اندازهٔ نه چندان زیاد یا کم مناسبند ( تقریباً ۱۵ تا ۱۵۰ نقطه ) . اگر مجموعه داده خیلی کوچک باشد، این نمودار کاربرد زیادی نخواهد داشت؛ چراکه به تعداد مناسبی نقطهٔ داده برای مشخص شدن خواص توزیع نیاز است. برای چنین داده هایی نمودار نقطه ای ممکن است مناسب تر باشد. اگر مجموعه داده خیلی بزرگ باشد، نمودار بسیار به هم ریخته خواهد شد زیرا نقاط داده باید به صورت عددی مشخص شوند. در این موارد استفاده از نمودار جعبه ای یا هیستوگرام ممکن است مناسب تر باشد.
wiki: نمودار ساقه وبرگ
پیشنهاد کاربران
پیشنهادی ثبت نشده است. شما اولین نفر باشید