خوشه بندی تک پیوندی یکی از روش های خوشه بندی سلسله مراتبی است که با رویکرد از پایین به بالا یک سلسله مراتب از خوشه ها ایجاد می کند. خوشه بندی تجمعی که به نام تکنیک نزدیک ترین همسایه نیز شناخته می شود برای اولین بار در سال ۱۹۵۱ توسط فلورک مطرح شد. [ ۱] مبنای کار این روش آن است که در هر مرحله از اجرا، دو خوشه ای که کمترین فاصله از یک دیگر را دارند با هم ادغام می کند و فاصلهٔ یک خوشه از خوشه ای دیگر برابر با کمترین فاصله از هر یک از اعضای آن خوشه با هر یک از اعضای خوشه دیگر تعریف می شود.
یکی از معایب این روش نسبت به خوشه بندی کامل پیوند آن است که خوشه بندی کامل پیوند خوشه های منسجم تری به وجود می آورد درحالی که در روش خوشه بندی تک پیوندی تعداد کمی داده که با فاصله اندک از یک دیگر که به شکل یک پل بین دو خوشه قرار داشته باشند موجب ادغام شدن آن دو خوشه می شوند و این خاصیت «اثر زنجیره ای» نامیده می شود. اما یکی از مزایای این روش تطبیق پذیری بیشتر آن و حفظ کارایی خود روی مجموعه داده های مختلف است. [ ۲]
خوشه بندی های تجمعی احتمالاً یکی از پرمصرف ترین روش های خوشه بندی سلسله مراتبی هستند. در این نوع از خوشه بندی ها هر داده ای در ابتدا خود یک خوشه، سپس به صورت پیاپی در هر مرحله دو خوشه با یک دیگر ادغام شده و خوشه ای بزرگ تر تشکیل می دهند و این روند ادامه پیدا می کند تا تنها یک خوشه باقی بماند. نتیجهٔ چنین خوشه بندی ای معمولاً به صورت یک دندروگرام نمایش داده می شود و با برش دندروگرام در سطحی دلخواه از میزان شباهت یک خوشه بندی ایجاد می شود. [ ۲]
تفاوت روش های مختلف خوشه بندی تجمعی در نحوه انتخاب شدن آن دو خوشه ای است که در هر مرحله برای ادغام شدن انتخاب می شوند. در خوشه بندی تک پیوندی فاصلهٔ دو خوشه را نزدیک ترین جفت داده ( که هر کدام در یکی از خوشه ها باشد ) تعیین می کند.
به صورت ریاضی تابع فاصله خوشه ها به شکل D ( X , Y ) = min x ∈ X , y ∈ Y d ( x , y ) تعریف می شود که X و Y خوشه ها و d ( x , y ) فاصله دو داده x و y را نمایش می دهد. [ ۳]
در هر مرحله از این الگوریتم دو خوشه ای که کمترین فاصله را با یک دیگر دارند با هم ترکیب می شوند و فاصله خوشه حاصل از ادغام شدن X و Y و خوشه دیگر Z به صورت زیر محاسبه می شود:
D ( X ∪ Y , Z ) = m i n ( D ( X , Z ) , D ( Y , Z ) )
این نوشته برگرفته از سایت ویکی پدیا می باشد، اگر نادرست یا توهین آمیز است، لطفا گزارش دهید: گزارش تخلفیکی از معایب این روش نسبت به خوشه بندی کامل پیوند آن است که خوشه بندی کامل پیوند خوشه های منسجم تری به وجود می آورد درحالی که در روش خوشه بندی تک پیوندی تعداد کمی داده که با فاصله اندک از یک دیگر که به شکل یک پل بین دو خوشه قرار داشته باشند موجب ادغام شدن آن دو خوشه می شوند و این خاصیت «اثر زنجیره ای» نامیده می شود. اما یکی از مزایای این روش تطبیق پذیری بیشتر آن و حفظ کارایی خود روی مجموعه داده های مختلف است. [ ۲]
خوشه بندی های تجمعی احتمالاً یکی از پرمصرف ترین روش های خوشه بندی سلسله مراتبی هستند. در این نوع از خوشه بندی ها هر داده ای در ابتدا خود یک خوشه، سپس به صورت پیاپی در هر مرحله دو خوشه با یک دیگر ادغام شده و خوشه ای بزرگ تر تشکیل می دهند و این روند ادامه پیدا می کند تا تنها یک خوشه باقی بماند. نتیجهٔ چنین خوشه بندی ای معمولاً به صورت یک دندروگرام نمایش داده می شود و با برش دندروگرام در سطحی دلخواه از میزان شباهت یک خوشه بندی ایجاد می شود. [ ۲]
تفاوت روش های مختلف خوشه بندی تجمعی در نحوه انتخاب شدن آن دو خوشه ای است که در هر مرحله برای ادغام شدن انتخاب می شوند. در خوشه بندی تک پیوندی فاصلهٔ دو خوشه را نزدیک ترین جفت داده ( که هر کدام در یکی از خوشه ها باشد ) تعیین می کند.
به صورت ریاضی تابع فاصله خوشه ها به شکل D ( X , Y ) = min x ∈ X , y ∈ Y d ( x , y ) تعریف می شود که X و Y خوشه ها و d ( x , y ) فاصله دو داده x و y را نمایش می دهد. [ ۳]
در هر مرحله از این الگوریتم دو خوشه ای که کمترین فاصله را با یک دیگر دارند با هم ترکیب می شوند و فاصله خوشه حاصل از ادغام شدن X و Y و خوشه دیگر Z به صورت زیر محاسبه می شود:
D ( X ∪ Y , Z ) = m i n ( D ( X , Z ) , D ( Y , Z ) )

wiki: خوشه بندی تک پیوندی