reinforcement learning from human feedback

پیشنهاد کاربران

کلمه اختصاری: RLHF
موضوع: یادگیری ماشینی
تقویت یادگیری با استفاده از بازخورد انسان
یادگیری تقویتی از بازخورد انسانی
یادگیری تقویتی با بازخورد انسانی

بپرس