مشقت بعدچندی

دانشنامه عمومی

نفرین ابعاد ( به انگلیسی: Curse of dimensionality ) به پدیده های گوناگونی گفته می شود که هنگام تحلیل و ساماندهی داده ها در فضاهای با ابعاد بسیار بالا ( اغلب با صدها یا هزاران بعد ) روی می دهند، ولی نه در محیط های با ابعاد بسیار پایین، مانند فضای فیزیکی سه بعدی، که در زندگی روزمره احساس می کنیم.
از چندین پدیده در حوزه هایی چون محاسبات عددی، نمونه برداری، ترکیبیات، یادگیری ماشینی، داده کاوی، و پایگاه داده ها با این نام یاد می شود. مضمون مشترک همهٔ این مشکلات آن است که با افزایش ابعاد، حجم فضا آنقدر سریع افزایش می یابد که داده های موجود پراکنده و تُنُک می شوند. این تنکی در هر روشی که مستلزم معنی داری آماری است مشکل ساز می شود. با افزایش ابعاد لازم است داده های مورد نیاز برای پشتیبانی از نتیجه هم اغلب به طور نمایی افزایش یابند تا نتیجهٔ حاصله از نظر آماری معقول و معتبر باشد. همچنین ساماندهی و جستجوی داده اغلب متکی بر شناسایی ناحیه هایی است که در آنجاها اشیاء گروه هایی با خواص مشابه تشکیل داده باشند؛ اما در داده های کثیرالابعاد همهٔ اشیاء از بسیاری جهات تُنُک و نامشابه به نظر می رسند که این امر از کارایی راهبردهای معمول و متعارف ساماندهی داده ها می کاهد.
اصطلاح مشقت بعدچندی را ریچارد بلمن هنگام کار کردن روی برنامه ریزی پویا وضع کرد و جا انداخت.
مشقت چندبعدی در یادگیری ماشینی زمانی به چشم می آید که در حال کار کردن با داده هایی باشیم که نسبت ویژگی ها به تعداد آن ها بالا باشد. مشکلی که خود را در هنگام کار با داده هایی با ویژگی های بسیار زیاد خود را نشان می دهد، سخت بودن پیدا کردن هرگونه الگوی معنی داری هنگام آنالیز و تجسم کردن داده است. این پدیده فرایندآموزش یک مدل یادگیری ماشین را مختل می کند و تأثیر منفی روی دقت و سرعت آموزش مدل می گذارد. افزایش تعداد بعد در داده ها احتمال رخداد چند خطی بودن را افزایش می دهد.
پدیدهٔ هیوز نشان می دهد که افزایش تعداد ویژگی های داده باعث بهبود عملکرد یک مدل طبقه بندی کننده می شود تا زمانی که به یک نقطهٔ آپتیمال برسیم. پس از آن اضافه کردن ویژگی های جدید با ثابت نگه داشتن تعداد داده باعث تنزل عملکرد مدل می شود.
کاهش ابعاد، به مجموعه روش هایی گفته می شود که با استفاده از آن ها داده ها را از فضای با ابعاد بالا به فضایی با بعد کمتر نگاشت می کنند به صورتی که داده های نگاشته شده دارای ویژگی های معنی داری از داده های اولیه ما باشند، به صورت ایده آل به نحوی که در داده های نهایی تنها دارای ویژگی های مستقل از هم باشیم به طوری که بتوان داده های اصلی را از آن ها بدست آورد.
عکس مشقت بعدچندی
این نوشته برگرفته از سایت ویکی پدیا می باشد، اگر نادرست یا توهین آمیز است، لطفا گزارش دهید: گزارش تخلف

پیشنهاد کاربران

بپرس