دقت و بازیابی

دانشنامه عمومی

دقت و بازیابی ( انگلیسی: Precision and recall ) یا دقت و بازیافت در بازشناخت الگو، بازیابی اطلاعات و طبقه بندی آماری کاربرد دارند. در حوزه یادگیری ماشینی، Precision به معنای درصدی از پیش بینی های مدل که مرتبط هستند ولی recall اشاره به درصدی از کل پیش بینی هایی که توسط مدل درست دسته بندی شده اند. به بیان ساده تر، «دقت» به این سؤال پاسخ می دهد که «چه مقدار از مواردی که شناسایی کردیم، درست بودند؟» و «بازیابی» به این سؤال پاسخ می دهد که «چه مقدار از مواردی که باید شناسایی می کردیم را شناسایی کردیم؟»[ ۱] .
Recall برابر است با تقسیم تعداد مواردی که توسط مدل درست تشخیص داده اند شده بر تعداد کل مواردی که توسط مدل ایجاد شده اند و Precision برابر است با تقسیم تعداد مواردی که توسط مدل درست تشخیص داده شده است بر تعداد مواردی که واقعاً درست هستند، درست تشخیص داده شده اند.
به عنوان مثال یک الگوریتم یادگیری ماشینی از میان ۱۲ تصویر سگ و گربه ۸ مورد سگ را تشخیص می دهد. از ۸ سگ ۵ مورد واقعاً سگ هستند ( مثبت درست یا true positives ) و ۳ مورد دیگر گربه هستند؛ که مثبت نادرست یا false positives هستند. مقدار precision برابر با ۵/۸ است و مقدار recall برابر با ۵/۱۲ هست.
وقتی موتور جستجو ۳۰ صفحه را بازمی گرداند و فقط ۲۰ موردش مرتبط هستند و به اشتباهاً ۴۰ مورد دیگر که مرتبط بودند را بازنمی گرداند. مقدار precision برابر با ۲۰/۳۰ = ۲/۳ و مقدار recall برابر با ۲۰/۶۰ = ۱/۳ است.
در نتیجه در این مورد precision نشان می دهد که چقدر موتور جستجو به درد بخور است و recall نشان می دهد که چه مقدار پاسخش کامل و جامع هست.
precision = | { relevant documents } ∩ { retrieved documents } | | { retrieved documents } | recall = | { relevant documents } ∩ { retrieved documents } | | { relevant documents } |
به عنوان مثال قصد داریم طی یک روند یادگیری نظارت شده مدلی برای پیش بینی بیماری سرطان ایجاد کنیم. برای آموزش مدل یک جامعه آماری تهیه می کنیم که تعدادی بیمار واقعاً سرطان درند و تعدادی هم ندارند و مدل را به کمک بخش آموزش، ایجاد می کنیم و بر روی بخش آزمون یا شاهد آن را اجرا می کنیم تا میزان خطا یا دقت مدل را بررسی کنیم.
specificity عبارت است از کسری از جواب های منفی که به درستی تشخیص داده شده است مثلاً درصد افرادی که طبق پیش بینی مدل سرطان ندارند و در دنیای واقعی هم سرطان ندارند.
• recall یا sensitivity یا بازیابی عبارتست از کسری از جوابهای مثبت که درست تشخیص داده شده اند مثلاً درصد افرادی که طبق پیش بینی مدل سرطان دارند و در دنیای واقعی هم سرطان دارند.
• accuracy یا صحت یعنی مقدار اندازه گیری شده چقدر به مقدار واقعی نزدیک است برای accuracy باید precision بالا باشد ولی برعکسش لزوماً برقرار نیست. بالا بودن بایاس و واریانس به معنای accuracy کم است.
• precision یا دقت برای اندازه گیری های متوالی از یک مقدار میزان نزدیک بودن مقدارهای اندازه گیری را نشان می دهد. مثلاً اگر یک ساعت هر روز فقط ۲ ساعت جلو رود مقدار accuracy یا صحتش پایین است ولی مقدار precision آن بالاست.
عکس دقت و بازیابی
این نوشته برگرفته از سایت ویکی پدیا می باشد، اگر نادرست یا توهین آمیز است، لطفا گزارش دهید: گزارش تخلف

پیشنهاد کاربران

بپرس