یادگیری با نظارت یا یادگیری تحت نظارت ( به انگلیسی: Supervised learning ) یکی از زیرمجموعه های یادگیری ماشینی است. در این روش مدل با دریافت اطلاعات برچسب زده شده آموزش می بیند و سعی می کند الگوی بین داده ها و برچسب هایشان را به صورت یک تابع یادگرفته و برچسب داده های جدید و دیده نشده را پیش بینی کند. از این روش هم در مسائل طبقه بندی و هم در مسائل رگرسیون استفاده می شود. [ ۱]
به طور کلی، الگوریتم های یادگیری با نظارت یک پروسهٔ آموزش ( training ) دارند که طی آن داده های برچسب گذاری شده به الگوریتم داده می شود و الگوریتم سعی می کند پارامترهای خودش را با استفاده از این داده ها بروزرسانی کند و بتواند برچسب داده های جدید را تشخیص دهد. روش کلی این کار به این صورت است که الگوریتم سعی می کند پارامترها را در جهتی تغییر دهد که خطای ایجاد شده در پیش بینی داده ها کمینه شود. این خطا با استفاده از تابعی که تابع هزینه نامیده می شود محاسبه می گردد. [ ۲] [ ۳]
یادگیری تحت نظارت نیازمند تعدادی داده ورودی به منظور آموزش سیستم است. با این حال رده ای از مسائل وجود دارند که خروجی مناسب که یک سیستم یادگیری تحت نظارت نیازمند آن است، برای آن ها موجود نیست. این نوع از مسائل چندان قابل جوابگویی با استفاده از یادگیری تحت نظارت نیستند. یادگیری تقویتی مدلی برای مسائلی از این قبیل فراهم می آورد. در یادگیری تقویتی، سیستم تلاش می کند تا تقابلات خود با یک محیط پویا را از طریق آزمون و خطا بهینه نماید. یادگیری تقویتی مسئله ای است که یک عامل که می بایست رفتار خود را از طریق تعاملات آزمون و خطا با یک محیط پویا فرا گیرد، با آن مواجه است. در یادگیری تقویتی هیچ نوع زوج ورودی - خروجی ارائه نمی شود. به جای آن، پس از اتخاذ یک عمل، حالت بعدی و پاداش بلافصل به عامل ارائه می شود. هدف اولیه برنامه ریزی عامل ها با استفاده از تنبیه و تشویق است بدون آنکه ذکری از چگونگی انجام وظیفه آن ها شود. [ ۴] [ ۵]
از الگوریتم های مهم یادگیری بانظارت می توان به موارد زیر اشاره کرد:
رگرسیون خطی ( Linear Regression ) نوعی تابع پیش بینی کننده خطی است که برای پیش بینی یک متغیر از روی یک یا چند متغیر دیگر آموزش داده می شود. به متغیرهایی که پیش بینی بر روی آن انجام می شود متغیر وابسته و به متغیرهایی که پیش بینی به کمک آن ها انجام می شود متغیرهای مستقل می گویند. متغیرهای وابسته را معمولاً با و متغیرهای مستقل را با نمایش می دهند. اگر تنها یک متغیر مستقل وجود داشته باشد مدل رگرسیون خطی را ساده و در غیر این صورت چندگانه می نامند. [ ۶]
این نوشته برگرفته از سایت ویکی پدیا می باشد، اگر نادرست یا توهین آمیز است، لطفا گزارش دهید: گزارش تخلفبه طور کلی، الگوریتم های یادگیری با نظارت یک پروسهٔ آموزش ( training ) دارند که طی آن داده های برچسب گذاری شده به الگوریتم داده می شود و الگوریتم سعی می کند پارامترهای خودش را با استفاده از این داده ها بروزرسانی کند و بتواند برچسب داده های جدید را تشخیص دهد. روش کلی این کار به این صورت است که الگوریتم سعی می کند پارامترها را در جهتی تغییر دهد که خطای ایجاد شده در پیش بینی داده ها کمینه شود. این خطا با استفاده از تابعی که تابع هزینه نامیده می شود محاسبه می گردد. [ ۲] [ ۳]
یادگیری تحت نظارت نیازمند تعدادی داده ورودی به منظور آموزش سیستم است. با این حال رده ای از مسائل وجود دارند که خروجی مناسب که یک سیستم یادگیری تحت نظارت نیازمند آن است، برای آن ها موجود نیست. این نوع از مسائل چندان قابل جوابگویی با استفاده از یادگیری تحت نظارت نیستند. یادگیری تقویتی مدلی برای مسائلی از این قبیل فراهم می آورد. در یادگیری تقویتی، سیستم تلاش می کند تا تقابلات خود با یک محیط پویا را از طریق آزمون و خطا بهینه نماید. یادگیری تقویتی مسئله ای است که یک عامل که می بایست رفتار خود را از طریق تعاملات آزمون و خطا با یک محیط پویا فرا گیرد، با آن مواجه است. در یادگیری تقویتی هیچ نوع زوج ورودی - خروجی ارائه نمی شود. به جای آن، پس از اتخاذ یک عمل، حالت بعدی و پاداش بلافصل به عامل ارائه می شود. هدف اولیه برنامه ریزی عامل ها با استفاده از تنبیه و تشویق است بدون آنکه ذکری از چگونگی انجام وظیفه آن ها شود. [ ۴] [ ۵]
از الگوریتم های مهم یادگیری بانظارت می توان به موارد زیر اشاره کرد:
رگرسیون خطی ( Linear Regression ) نوعی تابع پیش بینی کننده خطی است که برای پیش بینی یک متغیر از روی یک یا چند متغیر دیگر آموزش داده می شود. به متغیرهایی که پیش بینی بر روی آن انجام می شود متغیر وابسته و به متغیرهایی که پیش بینی به کمک آن ها انجام می شود متغیرهای مستقل می گویند. متغیرهای وابسته را معمولاً با و متغیرهای مستقل را با نمایش می دهند. اگر تنها یک متغیر مستقل وجود داشته باشد مدل رگرسیون خطی را ساده و در غیر این صورت چندگانه می نامند. [ ۶]
wiki: یادگیری با نظارت