تشخیص اشیاء یک فناوری کامپیوتری مربوط به بینایی رایانه ای و پردازش تصویر است که با شناسایی نمونه هایی از اشیاء معنادار از یک کلاس خاص ( مانند انسان ها، ساختمان ها یا اتومبیل ها ) در تصاویر و ویدئوهای دیجیتال سروکار دارد. [ ۱] حوزه های به خوبی تحقیق شده تشخیص اشیا شامل تشخیص چهره و تشخیص عابر پیاده است. تشخیص اشیاء در بسیاری از زمینه های بینایی رایانه ای از جمله جستجوی تصویر و سامانه تصاویر مداربسته کاربرد دارد.
تشخیص اشیاء به طور گسترده در کارهای بینایی رایانه ای مانند حاشیه نویسی تصویر، [ ۲] شمارش وسیله نقلیه، [ ۳] شناسایی فعالیت، [ ۴] تشخیص چهره، سیستم تشخیص چهره، تقسیم بندی مشترک اشیاء ویدئویی استفاده می شود. همچنین در ردیابی اشیاء، به عنوان مثال ردیابی توپ در طول مسابقه فوتبال، ردیابی حرکت چوب کریکت، یا ردیابی یک شخص در یک ویدیو استفاده می شود.
اغلب، تصاویر آزمایشی از توزیع داده های متفاوتی نمونه برداری می شوند که کار تشخیص شی را به طور قابل توجهی دشوارتر می کند. [ ۵] برای رسیدگی به چالش های ناشی از شکاف دامنه بین آموزش و داده های آزمایشی، بسیاری از رویکردهای تطبیق دامنه بدون نظارت پیشنهاد شده اند. [ ۵] [ ۶] [ ۷] [ ۸] [ ۹] یک راه حل ساده و سرراست برای کاهش شکاف دامنه، اعمال رویکرد ترجمه تصویر به تصویر، مانند چرخه GAN است. [ ۱۰] در میان کاربردهای دیگر، تشخیص اشیاء متقابل دامنه در رانندگی خودکار اعمال می شود، جایی که مدل ها را می توان در تعداد زیادی از صحنه های بازی ویدیویی آموزش داد، زیرا برچسب ها می توانند بدون کار دستی تولید شوند.
هر کلاس شی دارای ویژگی های خاص خود است که به طبقه بندی کلاس کمک می کند - به عنوان مثال همه دایره ها گرد هستند. کلاس تشخیص اشیاء از این ویژگی های خاص استفاده می کند. به عنوان مثال، هنگام جستجوی دایره ها، اجسامی که در یک فاصله خاص از یک نقطه ( یعنی مرکز ) هستند جستجو می شوند. به همین ترتیب، هنگام جستجوی مربع، به اجسامی که در گوشه ها عمود هستند و طول ضلع آنها برابر است، نیاز است. روش مشابهی برای تشخیص چهره استفاده می شود که در آن چشم ها، بینی و لب ها را می توان یافت و همچنین ویژگی هایی مانند رنگ پوست و فاصله بین چشم ها را نیز می توان یافت.
روش های تشخیص اشیاء معمولاً در دو روش مبتنی بر شبکه عصبی یا غیر عصبی قرار می گیرند. برای روش های غیر عصبی، ابتدا لازم است ویژگی ها را با استفاده از یکی از روش های زیر تعریف کنیم، سپس با استفاده از تکنیکی مانند ماشین بردار پشتیبانی ( SVM ) طبقه بندی را انجام دهیم. از سوی دیگر، تکنیک های عصبی قادر به تشخیص سرتاسر یک شیء بدون تعریف مشخصی از ویژگی ها هستند و معمولاً مبتنی بر شبکه های عصبی پیچشی ( CNN ) هستند.
این نوشته برگرفته از سایت ویکی پدیا می باشد، اگر نادرست یا توهین آمیز است، لطفا گزارش دهید: گزارش تخلفتشخیص اشیاء به طور گسترده در کارهای بینایی رایانه ای مانند حاشیه نویسی تصویر، [ ۲] شمارش وسیله نقلیه، [ ۳] شناسایی فعالیت، [ ۴] تشخیص چهره، سیستم تشخیص چهره، تقسیم بندی مشترک اشیاء ویدئویی استفاده می شود. همچنین در ردیابی اشیاء، به عنوان مثال ردیابی توپ در طول مسابقه فوتبال، ردیابی حرکت چوب کریکت، یا ردیابی یک شخص در یک ویدیو استفاده می شود.
اغلب، تصاویر آزمایشی از توزیع داده های متفاوتی نمونه برداری می شوند که کار تشخیص شی را به طور قابل توجهی دشوارتر می کند. [ ۵] برای رسیدگی به چالش های ناشی از شکاف دامنه بین آموزش و داده های آزمایشی، بسیاری از رویکردهای تطبیق دامنه بدون نظارت پیشنهاد شده اند. [ ۵] [ ۶] [ ۷] [ ۸] [ ۹] یک راه حل ساده و سرراست برای کاهش شکاف دامنه، اعمال رویکرد ترجمه تصویر به تصویر، مانند چرخه GAN است. [ ۱۰] در میان کاربردهای دیگر، تشخیص اشیاء متقابل دامنه در رانندگی خودکار اعمال می شود، جایی که مدل ها را می توان در تعداد زیادی از صحنه های بازی ویدیویی آموزش داد، زیرا برچسب ها می توانند بدون کار دستی تولید شوند.
هر کلاس شی دارای ویژگی های خاص خود است که به طبقه بندی کلاس کمک می کند - به عنوان مثال همه دایره ها گرد هستند. کلاس تشخیص اشیاء از این ویژگی های خاص استفاده می کند. به عنوان مثال، هنگام جستجوی دایره ها، اجسامی که در یک فاصله خاص از یک نقطه ( یعنی مرکز ) هستند جستجو می شوند. به همین ترتیب، هنگام جستجوی مربع، به اجسامی که در گوشه ها عمود هستند و طول ضلع آنها برابر است، نیاز است. روش مشابهی برای تشخیص چهره استفاده می شود که در آن چشم ها، بینی و لب ها را می توان یافت و همچنین ویژگی هایی مانند رنگ پوست و فاصله بین چشم ها را نیز می توان یافت.
روش های تشخیص اشیاء معمولاً در دو روش مبتنی بر شبکه عصبی یا غیر عصبی قرار می گیرند. برای روش های غیر عصبی، ابتدا لازم است ویژگی ها را با استفاده از یکی از روش های زیر تعریف کنیم، سپس با استفاده از تکنیکی مانند ماشین بردار پشتیبانی ( SVM ) طبقه بندی را انجام دهیم. از سوی دیگر، تکنیک های عصبی قادر به تشخیص سرتاسر یک شیء بدون تعریف مشخصی از ویژگی ها هستند و معمولاً مبتنی بر شبکه های عصبی پیچشی ( CNN ) هستند.
wiki: تشخیص اشیاء