هیستوگرام گرادیان های گرا ( HOG ) یک توصیفگر ویژگی است که در بینایی کامپیوتری و پردازش تصویر به منظور تشخیص اشیا استفاده می شود. این تکنیک، جهت گیری گرادیان را در بخش های محلی یک تصویر شمارش می کند. این روش شبیه هیستوگرام های جهت گیری لبه، توصیف گرهای تبدیل ویژگی تغییرناپذیر مقیاس، و زمینه های شکل است، اما از این جهت متفاوت است که بر روی شبکه ای متراکم از سلول های با فاصله یکنواخت محاسبه می شود و از نرمال سازی کنتراست محلی همپوشانی برای بهبود دقت استفاده می کند.
رابرت کی مک کانل از شرکت تحقیقاتی Wayland اولین بار مفاهیم پشت HOG را بدون استفاده از اصطلاح HOG در یک درخواست ثبت اختراع در سال ۱۹۸۶ توصیف کرد. [ ۱] در سال ۱۹۹۴ این مفاهیم توسط آزمایشگاه تحقیقاتی میتسوبیشی الکتریک مورد استفاده قرار گرفت. [ ۲] با این حال، زمانی که ناونیت دالال و بیل تریگز، محققان مؤسسه ملی تحقیقات علوم کامپیوتر و اتوماسیون فرانسه ( INRIA ) ، کار تکمیلی خود را در مورد توصیفگرهای HOG در کنفرانس بینایی کامپیوتری و تشخیص الگو ( CVPR ) ارائه کردند، استفاده از آن در سال ۲۰۰۵ گسترده شد ) . در این کار آنها بر روی تشخیص عابر پیاده در تصاویر ایستا تمرکز کردند، اگرچه از آن زمان آزمایش های خود را گسترش دادند تا تشخیص انسان در فیلم ها و همچنین انواع حیوانات و وسایل نقلیه رایج در تصاویر ثابت را شامل شود.
تفکر اساسی پشت توصیفگر هیستوگرام گرادیان های جهت دار این است که ظاهر و شکل شی محلی در یک تصویر را می توان با توزیع گرادیان های شدت یا جهت های لبه توصیف کرد. تصویر به مناطق کوچک متصل به نام سلول تقسیم می شود و برای پیکسل های درون هر سلول، یک هیستوگرام از جهت های گرادیان کامپایل می شود. توصیفگر الحاق این هیستوگرام ها است. برای دقت بهتر، هیستوگرام های محلی را می توان با محاسبه اندازه گیری شدت در ناحیه بزرگ تری از تصویر، به نام بلوک، و سپس با استفاده از این مقدار برای عادی سازی تمام سلول های داخل بلوک، با کنتراست نرمال کرد. این عادی سازی منجر به تغییرناپذیری بهتری نسبت به تغییرات در روشنایی و سایه می شود.
توصیفگر HOG چند مزیت کلیدی نسبت به سایر توصیفگرها دارد. از آنجایی که بر روی سلول های محلی کار می کند، به جز برای شی گرایی، نسبت به تبدیل های هندسی و فتومتریک ثابت است. چنین تغییراتی فقط در مناطق فضایی بزرگتر ظاهر می شود. علاوه بر این، همان طور که دالال و تریگز کشف کردند، نمونه برداری فضایی درشت، نمونه گیری جهت گیری دقیق و نرمال سازی فتومتریک محلی قوی اجازه می دهد تا زمانی که عابران پیاده وضعیت تقریباً عمودی خود را حفظ کنند، حرکات بدن فردی نادیده گرفته شود؛ بنابراین توصیفگر HOG به ویژه برای تشخیص انسان در تصاویر مناسب است. [ ۳]
این نوشته برگرفته از سایت ویکی پدیا می باشد، اگر نادرست یا توهین آمیز است، لطفا گزارش دهید: گزارش تخلفرابرت کی مک کانل از شرکت تحقیقاتی Wayland اولین بار مفاهیم پشت HOG را بدون استفاده از اصطلاح HOG در یک درخواست ثبت اختراع در سال ۱۹۸۶ توصیف کرد. [ ۱] در سال ۱۹۹۴ این مفاهیم توسط آزمایشگاه تحقیقاتی میتسوبیشی الکتریک مورد استفاده قرار گرفت. [ ۲] با این حال، زمانی که ناونیت دالال و بیل تریگز، محققان مؤسسه ملی تحقیقات علوم کامپیوتر و اتوماسیون فرانسه ( INRIA ) ، کار تکمیلی خود را در مورد توصیفگرهای HOG در کنفرانس بینایی کامپیوتری و تشخیص الگو ( CVPR ) ارائه کردند، استفاده از آن در سال ۲۰۰۵ گسترده شد ) . در این کار آنها بر روی تشخیص عابر پیاده در تصاویر ایستا تمرکز کردند، اگرچه از آن زمان آزمایش های خود را گسترش دادند تا تشخیص انسان در فیلم ها و همچنین انواع حیوانات و وسایل نقلیه رایج در تصاویر ثابت را شامل شود.
تفکر اساسی پشت توصیفگر هیستوگرام گرادیان های جهت دار این است که ظاهر و شکل شی محلی در یک تصویر را می توان با توزیع گرادیان های شدت یا جهت های لبه توصیف کرد. تصویر به مناطق کوچک متصل به نام سلول تقسیم می شود و برای پیکسل های درون هر سلول، یک هیستوگرام از جهت های گرادیان کامپایل می شود. توصیفگر الحاق این هیستوگرام ها است. برای دقت بهتر، هیستوگرام های محلی را می توان با محاسبه اندازه گیری شدت در ناحیه بزرگ تری از تصویر، به نام بلوک، و سپس با استفاده از این مقدار برای عادی سازی تمام سلول های داخل بلوک، با کنتراست نرمال کرد. این عادی سازی منجر به تغییرناپذیری بهتری نسبت به تغییرات در روشنایی و سایه می شود.
توصیفگر HOG چند مزیت کلیدی نسبت به سایر توصیفگرها دارد. از آنجایی که بر روی سلول های محلی کار می کند، به جز برای شی گرایی، نسبت به تبدیل های هندسی و فتومتریک ثابت است. چنین تغییراتی فقط در مناطق فضایی بزرگتر ظاهر می شود. علاوه بر این، همان طور که دالال و تریگز کشف کردند، نمونه برداری فضایی درشت، نمونه گیری جهت گیری دقیق و نرمال سازی فتومتریک محلی قوی اجازه می دهد تا زمانی که عابران پیاده وضعیت تقریباً عمودی خود را حفظ کنند، حرکات بدن فردی نادیده گرفته شود؛ بنابراین توصیفگر HOG به ویژه برای تشخیص انسان در تصاویر مناسب است. [ ۳]