markov decision process

تخصصی

[ریاضیات] فرایند تصمیم مارکوف
[آمار] فرایند تصمیم مارکوف

پیشنهاد کاربران

فرایندهای تصمیم گیری مارکوف ( به انگلیسی: Markov decision process ) ( به اختصار: MDPs ) یک چارچوب ریاضی است برای مدل سازی تصمیم گیری در شرایطی که نتایج تا حدودی تصادفی و تا حدودی تحت کنترل یک تصمیم گیر
...
[مشاهده متن کامل]
است. MDPs برای مطالعه طیف گسترده ای از مسائل بهینه سازی که از طریق برنامه نویسی پویا و تقویت یادگیری حل می شوند مفید است. حداقل از اوایل 1950 MDPs شناخته شده است ( cf. ( Bellman 1957 ) ) . هسته اصلی پژوهش در فرایندهای تصمیم گیری مارکوف حاصل کتاب رونالد هوارد است که در سال ۱۹۶۰ تحت عنوان �برنامه نویسی پویا و فرایندهای مارکف� منتشر شد. فرایندهای تصمیم گیری مارکوف در طیف گسترده ای از رشته ها از جمله رباتیک، اقتصاد تا حقوق تجارت و بازرگانی بین الملل مورد استفاده است.

منابع• https://www.sciencedirect.com/science/article/pii/S1665642316300700• https://www.ijbssnet.com/journal/index/374

بپرس