در تکنیک تراش دادن داده ( به انگلیسی: Data scraping ) یک برنامه رایانه ای داده ها را از خروجی های انسان - خواندنی ( به انگلیسی: human - readable ) که از برنامهٔ دیگری آمده است، استخراج می کند. [ ۱]
• در تجزیه داده ( Data parsing ) انتقال داده بین برنامه های رایانه ای معمولاً با استفاده از ساختمان های داده ای که برای پردازش خودکار توسط رایانه، مناسب اند ( نه انسان ها ) انجام می شود. این فرمت های تبدیل و پروتکل ها معمولاً به صورت سختگیرانه ای ساخت یافته اند، به خوبی سند دهی شده اند، و به راحتی قابل تجزیه می باشند، و نیز ابهام را در حد حداقل قرار می دهند. این نوع انتقال داده، اصلاً انسان - خواندنی نیست. [ ۱]
• تراش داده برخلاف روش های تجزیه معمول، قصد دارد تراش را روی خروجی که برای نمایش به کاربر نهایی در نظر گرفته شده است، انجام دهد؛ بنابراین این خروجی ها به صورت مناسب ساختار دهی نشده نشده اند تا به صورت معمول تجزیه ( parse ) شوند. [ ۱]
عمل تراش دادن داده، معمولاً شامل نادیده گرفتن داده های دودویی ( معمولاً تصاویر یا دادهٔ چند رسانه ای ) ، نادیده گرفتن قالب دهی نمایشگر، نادیده گرفتن برچسب های تکراری، نادیده گرفتن توضیحات زاید، و نادیده گرفتن اطلاعات دیگری است که یا بی ربط اند یا مانع پردازش خودکار می شوند. [ ۱]
• تراش داده معمولاً برای ارتباط با سامانه های موروثی ( سیستم های قدیمی ) که هیچ سازوکار دیگری برای سازگاری با سخت افزار فعلی موجود ندارند، استفاده می شود.
• تراش داده ممکن است در سیستم های ثالثی که رابط برنامه نویسی کاربری ( API ) مناسبی ندارند، استفاده شود. در این حالت ممکن است کاربر سیستم ثالث، به دلیل ایجاد بار کاری بالا برای سیستم، یا نبود درآمدهای لازم برای ساخت رابط، یا از بین رفتن کنترل روی محتوای اطلاعات، از ساخت یک رابط کاربری مناسب خودداری کند. [ ۱]
تراش داده معمولاً، یک تکنیک موردی ناخوشایند است، و «آخرین پناهگاه فرار» می باشد، یعنی موقعی که هیچ سازوکار دیگری برای تبادل داده در دسترس نیست، از این روش باید استفاده کرد.
دلیل این موضوع، اول، سربار پردازشی و برنامه نویسی بالاتر، می باشد، دلیل بعدی آن است که خروجی های نمایشی که برای مصرف انسان ها درنظر گرفته شده اند، ساختارشان به صورت مکرر تغییر می کند. اگر چه انسان ها به سادگی با این موضوع کنار می آیند، اما برنامه های رایانه ای ممکن است این موضوع را غیر عقلانی بدانند، زیرا به آنها گفته شده است که داده را در یک قالب خاص، و در یک محل خاص، بخوانند. این سیستم ها اطلاعاتی در مورد نحوه بررسی نتایج برای تصدیق آنها ندارند. [ ۱]
این نوشته برگرفته از سایت ویکی پدیا می باشد، اگر نادرست یا توهین آمیز است، لطفا گزارش دهید: گزارش تخلف• در تجزیه داده ( Data parsing ) انتقال داده بین برنامه های رایانه ای معمولاً با استفاده از ساختمان های داده ای که برای پردازش خودکار توسط رایانه، مناسب اند ( نه انسان ها ) انجام می شود. این فرمت های تبدیل و پروتکل ها معمولاً به صورت سختگیرانه ای ساخت یافته اند، به خوبی سند دهی شده اند، و به راحتی قابل تجزیه می باشند، و نیز ابهام را در حد حداقل قرار می دهند. این نوع انتقال داده، اصلاً انسان - خواندنی نیست. [ ۱]
• تراش داده برخلاف روش های تجزیه معمول، قصد دارد تراش را روی خروجی که برای نمایش به کاربر نهایی در نظر گرفته شده است، انجام دهد؛ بنابراین این خروجی ها به صورت مناسب ساختار دهی نشده نشده اند تا به صورت معمول تجزیه ( parse ) شوند. [ ۱]
عمل تراش دادن داده، معمولاً شامل نادیده گرفتن داده های دودویی ( معمولاً تصاویر یا دادهٔ چند رسانه ای ) ، نادیده گرفتن قالب دهی نمایشگر، نادیده گرفتن برچسب های تکراری، نادیده گرفتن توضیحات زاید، و نادیده گرفتن اطلاعات دیگری است که یا بی ربط اند یا مانع پردازش خودکار می شوند. [ ۱]
• تراش داده معمولاً برای ارتباط با سامانه های موروثی ( سیستم های قدیمی ) که هیچ سازوکار دیگری برای سازگاری با سخت افزار فعلی موجود ندارند، استفاده می شود.
• تراش داده ممکن است در سیستم های ثالثی که رابط برنامه نویسی کاربری ( API ) مناسبی ندارند، استفاده شود. در این حالت ممکن است کاربر سیستم ثالث، به دلیل ایجاد بار کاری بالا برای سیستم، یا نبود درآمدهای لازم برای ساخت رابط، یا از بین رفتن کنترل روی محتوای اطلاعات، از ساخت یک رابط کاربری مناسب خودداری کند. [ ۱]
تراش داده معمولاً، یک تکنیک موردی ناخوشایند است، و «آخرین پناهگاه فرار» می باشد، یعنی موقعی که هیچ سازوکار دیگری برای تبادل داده در دسترس نیست، از این روش باید استفاده کرد.
دلیل این موضوع، اول، سربار پردازشی و برنامه نویسی بالاتر، می باشد، دلیل بعدی آن است که خروجی های نمایشی که برای مصرف انسان ها درنظر گرفته شده اند، ساختارشان به صورت مکرر تغییر می کند. اگر چه انسان ها به سادگی با این موضوع کنار می آیند، اما برنامه های رایانه ای ممکن است این موضوع را غیر عقلانی بدانند، زیرا به آنها گفته شده است که داده را در یک قالب خاص، و در یک محل خاص، بخوانند. این سیستم ها اطلاعاتی در مورد نحوه بررسی نتایج برای تصدیق آنها ندارند. [ ۱]
wiki: تراش دادن داده