مدل پنهان مارکف مشخصات

دانشنامه عمومی

مدل پنهان مارکف مشخصات ( یا Profile - HMM ) یکی از روش های حل مسائل هم تراز کردن توالی ( Sequence Alignment ) است که به کمک مدل پنهان مارکف به حل آن می پردازد. یکی از دسته مسئله های هم تراز کردن توالی که به کمک این روش حل می شود هم ترازسازی چند توالی ( Multiple Sequence Alignment ) یا به اختصار MSA است. [ ۱] این مدل به وسیله احتمال پرش، تطابق و عدم تطابق ایجاد می شود که این احتمال ها را می توان از جدول شاخصه رشته های توالی یافته ( Profile ) بدست آورد. در MSA هم ترازی بین چند توالی بیولوژیکی بررسی می شود به همین دلیل الگوریتم های استفاده شده در آن به مراتب پیچیده تر اند. یکی از مزیت های استفاده از مدل ها در حل این دسته از مسائل نسبت به دیگر الگوریتم ها استفاده از فاکتور احتمال است که در دیگر الگوریتم ها معمولاً نادیده گرفته می شود.
در گراف این مدل هر گره نشان دهنده یک تطبیق، حذف یا درج است همچنین در دو طرف گراف گره هایی برای نشان دادن شروع و پایان هم ترازی وجود دارد. تعداد و مقادیر موجود در گره ها بر اساس جدول مشخصه بدست می آید به اینگونه که برای گره های تطبیق در جدول ستون هایی که احتمال پرش در آنها از یک مقدار از قبل تعیین شده کمتر باشد در نظر گرفته می شوند. به ازای هر گره تطبیق دو گره درج و حذف نیز وجود دارد که گره حذف نشان دهنده این است که در هم ترازی به جای تطبیق حذف انجام شده و گره درج نشان دهنده درج در توالی در عملیات هم ترازی است که این درج ها بین دو تطبیق در گراف رخ می دهند و ممکن است بین دو تطبیق بیش از یک درج وجود داشته باشد.
در گراف برای گره تطابق انتقال به گره های تطبیق و حذف در لایه بعدی یا گره درج در همان لایه انجام می شود. در گره درج انتقال به خود گره یا گره تطابق لایه بعدی صورت می گیرد. همچنین برای گره های حذف انتقال به گره های تطبیق و حذف لایه بعدی انجام می شود. [ ۲]
برای هم تراز کردن یک توالی از گره شروع آغاز می کنیم و مسیری با بیشترین امتیاز را تا گره پایان می یابیم. برای اینکار به کمک الگوریتم ویتربی این مسیر را میابیم. در این الگوریتم اگر در مرحله i در حالت k باشیم مسیری از گره شروع تا این گره با بیشترین امتیاز از رابطه زیر پیدا می شود: s ( k , i ) = m a x l { s ( l , i − 1 ) × w l , k } که s ( k , i ) امتیاز آن گره می باشد و w l , k وزن یال بین گره مربوط به حالت l در مرحله i − 1 و گره حالت k در مرحله i است که احتمال انتقال را نشان می دهد. با توجه به اینکه مقادیر وزن های کمتر از یک است پس اگر اندازه گراف بزرگ باشد مقادیر امتیاز به تدریج کوچک تر می شود تا جایی که از لحاظ کامپیوتری قادر به انجام محاسبات نیستیم در این صورت به جای خود امتیاز از لگاریتم آن استفاده می شود. در صورت استفاده از لگاریتم رابطه به شکل زیر می شود:[ ۳] log ⁡ ( s ( k , i ) ) = m a x l { log ⁡ ( s ( l , i − 1 ) ) + log ⁡ ( w l , k ) } مقدار دهی پارامترها پس از ساخت گراف و مدل برای مقدار دهی به وزن یال ها و احتمالات از توالی های هم تراز شده موجود در جدول استفاده می کنیم. ابتدا مسیر توالی ها در گراف پیدا کردهه و از طریق این مسیرها مقدار احتمال انتقال ها را می یابیم. برای مثال اگر بخواهیم احتمال انتقال از حالت k به حالت l را بیابیم در هر مسیر تعداد دفعات انتقال از k به l را بر تعداد دفعات انتقال از حالت k به هر حالت دیگری تقسیم می کنیم. به این ترتیب می توان وزن یال ها را بدست آورد. همچنین مشابه همین روش می توان احتمال انتشار را در هر حالت بدست آورد. [ ۴] یک روش دیگر برای مقدار دهی استفاده از یادگیری ویتربی است. در این روش ابتدا پارامترها را به صورت رندم مقدار دهی می کنیم و بر اساس آن مسیر یک توالی را بدست می آوریم سپس به کمک مسیر بدست آمده و خود توالی مقادیر جدیدی برای پارامترها بدست می آوریم و به کمک این مقادیر و توالی دیگر مسیر جدیدی بدست آورده می شود. همین روند چندین بار تکرار می شود تا زمانی که پارامترها به یک مقدار همگرا شوند. [ ۵]
عکس مدل پنهان مارکف مشخصاتعکس مدل پنهان مارکف مشخصات
این نوشته برگرفته از سایت ویکی پدیا می باشد، اگر نادرست یا توهین آمیز است، لطفا گزارش دهید: گزارش تخلف

پیشنهاد کاربران

بپرس