یادگیری درخت تصمیم

دانشنامه عمومی

یادگیری درخت تصمیم ( به انگلیسی: Decision tree learning ) گروهی از الگوریتم های یادگیری ماشین هستند که در طبقه بندی آماری کاربرد دارند. [ ۱] درخت های تصمیم به گروه الگوریتم های یادگیری تحت نظارت تعلق دارند و بیشتر آنها بر اساس حداقل سازی کمیتی به نام آنتروپی ساخته می شوند. هرچند توابع دیگری هم برای یادگیری درخت تصمیم وجود دارند. [ ۲] [ ۳] نمونه های قدیمی درخت تصمیم تنها قادر به استفاده از متغیرهای گسسته بودند، اما الگوریتم های جدیدتر هردو نوع متغیر گسسته و پیوسته را در یادگیری به کار می برند. [ ۲] [ ۴] یکی از مزایای مهم الگوریتم درخت تصمیم قابلیت فهم و تفسیر آسان است که محبوبیت این الگوریتم را بالا برده است. [ ۲] [ ۵] [ ۴] از معایب آن عدم استواری و دقت ناکافی است. [ ۴]
یادگیری درخت تصمیم روشی است که به طور معمول در داده کاوی از آن استفاده می شود. هدف این مدل این است که بتواند مقدار یک متغیر هدف را براساس مقادیر متغیرهای ورودی پیش بینی کند.
یک نمایش ساده از درخت تصمیم در مثال دسته بندی در اینجا آورده شده است. در اینجا فرض کنید که مقادیر هر ویژگی ورودی ها، دارای دامنه گسسته و محدود باشد. و یک ویژگی هدف به نام «طبقه بند» وجود دارد. به هر عضو در دامنه طبقه بند یک کلاس گفته می شود. درخت تصمیم یا درخت طبقه بندی درختی است که به هر گره داخلی ( گره ای که برگ نیست ) یکی از ویژگی های ورودی ها برچسب زده شده است. یال های خارج شده از گره داخلی به یک گره برگ برای دسته بندی داده ها یا یک گره داخلی برای دسته بندی داده ها برحسب یک ویژگی دیگر هدایت می شوند. درنهایت، هر گره برگ برحسب یکی از مقادیر در دامنه طبقه بند برچسب زده می شوند و همه داده هایی که در آن گره قرار بگیرند، به عنوان عضو آن کلاس پیش بینی خواهند شد.
روند ایجاد درخت تصمیم از تقسیم کردن مجموعه تمام داده های در دسترس ( که در واقع ریشه درخت را تشکیل می دهند ) ، به زیر مجموعه هایی ( که به هر گره فرزند تبدیل می شوند ) است. شرایط تقسیم کردن داده های هر گره به گره های فرزند آن براساس یک شرط تقسیم بندی در هر گره داخلی خواهد بود. تقسیم کردن هر گره بدست آمده به گره های فرزند آن در یک روند بازگشتی انجام خواهد گرفت که به آن تقسیم بندی بازگشتی نیز گفته خواهد شد. این تقسیم بندی تا زمانی ادامه پیدا خواهد کرد که داده های در هر گره برگ متعلق به یک کلاس باشند یا زمانی که دیگر ویژگی ای برای تقسیم گردن داده های در یک گره وجود نداشته باشد. به این فرایند القای درخت تصمیم از بالا به پایین[ ۶] گفته می شود که یک مثال از الگوریتمی حریصانه است.
عکس یادگیری درخت تصمیمعکس یادگیری درخت تصمیم
این نوشته برگرفته از سایت ویکی پدیا می باشد، اگر نادرست یا توهین آمیز است، لطفا گزارش دهید: گزارش تخلف

پیشنهاد کاربران

بپرس