مهندسی ویژگی یا استخراج ویژگی یا کشف ویژگی، فرایند استفاده از دانش دامنه برای استخراج ویژگی ها ( مشخصات، خواص، صفت ها ) از داده های خام است. [ ۱] انگیزه استفاده از این ویژگی های اضافی برای بهبود کیفیت نتایج حاصل از فرایند یادگیری ماشین است، در مقایسه با ارائه تنها داده خام به فرایند یادگیری ماشین. این کار مهم است زیرا دانشمندان داده، با مهندسی ویژگی، می توانند انتخاب های پربارتری داشته باشند و فرایند را درک کنند. همچنین شفافیت بیشتر در مورد نتیجه و چشم اندازها به دست آید. [ ۲]
فرایند مهندسی ویژگی عبارت است از:[ ۳]
• ویژگی های طوفان فکری یا آزمایش[ ۴]
• تصمیم گیری برای ایجاد نوع ویژگی ها
• ایجاد ویژگی ها
• آزمایش تأثیر ویژگی های شناسایی شده بر روی کار
• در صورت نیاز ویژگی های خود را بهبود می بخشد
• تکرار
لیست زیر[ ۵] راه های متداول برای مهندسی کاربردی ویژگی ها را ارائه می کند
• تبدیل های عددی ( مانند گرفتن کسر یا مقیاس بندی )
• رمزگذار دسته مانند رمزگذار تک - نمود یا هدف ( برای داده های رسته ای ) [ ۶]
• خوشه بندی
• مقادیر تجمیع شده گروه
• تجزیه و تحلیل مولفه اصلی ( برای داده های عددی )
ویژگی ها از نظر مفهوم متفاوت هستند. [ ۷] حتی ویژگی های نسبتاً کوچک ممکن است به یک نمونه کمک کنند. انتخاب ویژگی می تواند تعداد ویژگی ها را کم کند تا از خاص شدن یک نمونه به مجموعه داده های آموزشی ( بیش از حد ) جلوگیری کند. [ ۸]
پُکش ویژگی زمانی اتفاق می افتد که تعداد ویژگی های شناسایی شده به شکل نامناسبی افزایش یابد. علت های متداول عبارتند از:
• قالب های ویژگی - پیاده سازی قالب های ویژگی به جای کدنویسی ویژگی های جدید
• ترکیبش های ویژگی - ترکیبش هایی ( به انگلیسی: combination ) که نمی توانند با یک سیستم خطی نمایش داده شوند
پکش ویژگی را می توان از طریق روش هایی مثل: منظم سازی، روش های هسته و انتخابش ویژگی کاهش داد. [ ۹]
خودکارسازی مهندسی ویژگی یک موضوع تحقیقاتی است که تاریخ آن، به دهه ۱۹۹۰ برمی گردد. نرم افزار یادگیری ماشین که مهندسی ویژگی های خودکار را شامل می شود از سال ۲۰۱۶ به صورت تجاری در دسترس بوده است. [ ۱۰] ادبیات علمی مرتبط حدوداً به دو شکل تقسیم می شود:
این نوشته برگرفته از سایت ویکی پدیا می باشد، اگر نادرست یا توهین آمیز است، لطفا گزارش دهید: گزارش تخلففرایند مهندسی ویژگی عبارت است از:[ ۳]
• ویژگی های طوفان فکری یا آزمایش[ ۴]
• تصمیم گیری برای ایجاد نوع ویژگی ها
• ایجاد ویژگی ها
• آزمایش تأثیر ویژگی های شناسایی شده بر روی کار
• در صورت نیاز ویژگی های خود را بهبود می بخشد
• تکرار
لیست زیر[ ۵] راه های متداول برای مهندسی کاربردی ویژگی ها را ارائه می کند
• تبدیل های عددی ( مانند گرفتن کسر یا مقیاس بندی )
• رمزگذار دسته مانند رمزگذار تک - نمود یا هدف ( برای داده های رسته ای ) [ ۶]
• خوشه بندی
• مقادیر تجمیع شده گروه
• تجزیه و تحلیل مولفه اصلی ( برای داده های عددی )
ویژگی ها از نظر مفهوم متفاوت هستند. [ ۷] حتی ویژگی های نسبتاً کوچک ممکن است به یک نمونه کمک کنند. انتخاب ویژگی می تواند تعداد ویژگی ها را کم کند تا از خاص شدن یک نمونه به مجموعه داده های آموزشی ( بیش از حد ) جلوگیری کند. [ ۸]
پُکش ویژگی زمانی اتفاق می افتد که تعداد ویژگی های شناسایی شده به شکل نامناسبی افزایش یابد. علت های متداول عبارتند از:
• قالب های ویژگی - پیاده سازی قالب های ویژگی به جای کدنویسی ویژگی های جدید
• ترکیبش های ویژگی - ترکیبش هایی ( به انگلیسی: combination ) که نمی توانند با یک سیستم خطی نمایش داده شوند
پکش ویژگی را می توان از طریق روش هایی مثل: منظم سازی، روش های هسته و انتخابش ویژگی کاهش داد. [ ۹]
خودکارسازی مهندسی ویژگی یک موضوع تحقیقاتی است که تاریخ آن، به دهه ۱۹۹۰ برمی گردد. نرم افزار یادگیری ماشین که مهندسی ویژگی های خودکار را شامل می شود از سال ۲۰۱۶ به صورت تجاری در دسترس بوده است. [ ۱۰] ادبیات علمی مرتبط حدوداً به دو شکل تقسیم می شود:
wiki: مهندسی ویژگی