خوشه بندی سلسله مراتبی

دانشنامه عمومی

]
در داده کاوی و آمار، خوشه بندی سلسله مراتبی ( همچنین به نام تحلیل خوشه سلسله مراتبی ) یک روش خوشه بندی می باشد که هدف آن ساخت یک سلسله مراتب از خوشه ها می باشد. روش های خوشه بندی سلسله مراتبی به دو دسته تقسیم می شوند:[ ۱]
• تجمعی: رویکرد این دسته «پایین به بالا» می باشد: با شروع از پایین، در هر مرحله دو خوشه با یکدیگر تجمیع شده و یک خوشه جدید تشکیل می دهند. خوشه های جدید در سطح های بالاتر قرار گرفته و این روند تکرار می شود.
• تجزیه ای: رویکرد این دسته «بالا به پایین» می باشد: با شروع از بالا، در هر مرحله یک خوشه به خوشه های کوچکتری تجزیه می شود که در سطح پایین تر قرار می گیرند. [ ۲]
هر سطح از سلسله مراتب یک دسته بندی از داده ها را نمایش می دهد که می توان به آن به شکل یک درخت نگاه کرد. هر کدام از برگ های درخت نشان دهنده یک مشاهده اولیه می باشند و ریشه درخت مجموعهٔ تمام مشاهدات است. نتایج یک خوشه بندی سلسله مراتبی عموماً به شکل یک دندروگرام نمایش داده می شوند. [ ۳]
برای این که بفهمیم کدام خوشه ها باید با هم تجمیع بشوند یا از یکدیگر تقسیم بشوند باید معیاری از تفاوت بین خوشه ها تعریف شود. در اکثر روش ها، این معیار به کمک تعریف یک متریک و یک معیار پیوند حاصل می شود. متریک فاصلهٔ بین دو تک مشاهده را تعیین کرده و معیار پیوند فاصلهٔ بین دو مجموعه مشاهده را توسط تابعی از فاصله دو به دو بین مشاهدات هر مجموعه تعریف می کند. [ ۴]
انتخاب یک متریک مناسب شکل خوشه ها را تحت تأثیر قرار می دهد، زیرا به ازای یک متریک چند مشاهده می توانند به یکدیگر نزدیک باشند ولی به ازای متریک دیگری فاصلهٔ آن ها از هم افزایش یابد. به عنوان مثال در یک فضای دو بعدی فاصلهٔ بین نقاط ( ۰و۰ ) و ( ۱و۰ ) بنابر روش های معمول یک می باشد، اما فاصلهٔ بین دو نقطه ( ۰و۰ ) و ( ۱و۱ ) با در نظر گرفتن فاصله منهتن ۲ می باشد، با در نظر گرفتن فاصله اقلیدسی رادیکال ۲ می باشد، و با در نظر گرفتن فاصله بیشینه ۱ می باشد.
بعضی از متریک های رایج برای استفاده در خوشه بندی سلسله مراتبی:[ ۵]
برای متون و سایر داده های غیر عددی، متریک هایی مانند فاصله همینگ یا فاصله لون اشتاین استفاده می شوند.
یک مرور در خوشه بندی های استفاده شده در تحقیقات سلامت روان نشان می دهد که بیشترین معیار فاصله استفاده شده در مطالعات منتشر شده در آن حوزه از فاصله اقلیدسی یا مجذور آن استفاده می کند. [ نیازمند منبع]
عکس خوشه بندی سلسله مراتبیعکس خوشه بندی سلسله مراتبیعکس خوشه بندی سلسله مراتبی
این نوشته برگرفته از سایت ویکی پدیا می باشد، اگر نادرست یا توهین آمیز است، لطفا گزارش دهید: گزارش تخلف

پیشنهاد کاربران

بپرس