approximate dynamic programming

پیشنهاد کاربران

یادگیری نیروافزوده یا یادگیری تقویتی یا یادگیری پاداش و تاوان یکی از گرایش های یادگیری ماشینی است که از روان شناسی رفتارگرایی الهام می گیرد. این روش بر رفتارهایی تمرکز دارد که ماشین باید برای بیشینه کردن
...
[مشاهده متن کامل]
پاداشش انجام دهد. این مسئله، با توجه به گستردگی اش، در زمینه های گوناگونی بررسی می شود. مانند: نظریه بازی ها، نظریه کنترل، تحقیق در عملیات، نظریه اطلاعات، سامانه چندعامله، هوش ازدحامی، آمار، الگوریتم ژنتیک، بهینه سازی بر مبنای شبیه سازی. در مبحث تحقیق در عملیات و در ادبیات کنترل، حوزه ای که در آن روش یادگیری نیروافزوده مطالعه می شود.

منابع• https://dl.acm.org/doi/10.1145/3005745.3005750

بپرس