در بیوانفورماتیک ، یک خطای خوانش دی ان ای هنگامی رخ می دهد که بازساز توالی یک پایه دی ان ای را برای یک پایه متفاوت تغییر دهد. سپس دنباله های خوانده شده از بازساز توالی برای ایجاد یک گراف دی براین استفاده می شود که به روش های مختلفی برای یافتن خطاهای خوانش استفاده می شود.
از طریق شکل گراف دی براین ، می توانیم ببینیم که احتمال 4 ^ k گره های مختلف برای ساختن یک ژنوم وجود دارد. با در نظر گرفتن تنها ک تایی موجود در رشته مورد نظر دی ان ای ، تعداد گره های مورد استفاده برای ایجاد نمودار را می توان کاهش داد. با توجه به توالی 1 ، می توان گره های اندازه ۷ یا ۷ تایی را تعیین کرد که در نمودار قرار دارند. سپس این ۷ تایی ها نمودار ایجاد شده در شکل 1 را ایجاد می کنند. قطعه تابع زیر را می توان به این صورت استفاده کرد که با دادن دنباله شکل یک و مشخص کردن اندازه ک تایی ها می توان گراف دی براین ساده شکل را ساخت.
def de_bruijn_graph ( seq, k ) : edges = nodes = set ( ) for i in range ( len ( seq ) - k + 1 ) : edges. append ( ( seq, seq ) ) nodes. add ( seq ) nodes. add ( seq ) return nodes, edges نمودار نشان داده شده در شکل 1 یک نسخه بسیار ساده است از آنچه که یک نمودار می تواند شبیه به ان باشد. [ ۱] . این نمودار با گرفتن 6 عنصر آخر ۷ تایی و پیوند دادن آن به گره ای که 6 عنصر اول آنها یکسان است تشکیل می شود. شکل 1 ساده ترین گراف دی براین است ، زیرا هر گره دقیقاً یک مسیر در آن وارد و یک مسیر از ان خارج می شود. در بیشتر مواقع ، شما به احتمال زیاد گرافیکی را مشاهده خواهید کرد که در آن بیش از یک لبه به سمت گره و یا بیش از یک لبه خروجی از یک گره وجود دارد. این امر به دلیل اتصال گره ها اتفاق می افتد. گره ها با لبه هایی که به گره ها اشاره می کنند متصل می شوند اگر و تنها اگر ، "k - 1" عنصر اخر ک تایی مورد نظر مطابق با "k - 1” عنصر اول گره دیگری باشد. این موضوع این اجازه را می دهد تا یک نمودار د دی براین چند لبه تشکیل شود. این نمودارهای پیچیده تر به دلیل خطاهای خواندن یا تغییر در رشته های دی ان ای اتفاق می افتد. این دو دلیل تعیین ساختار صحیح دی ان ای و تعیین عوامل ایجاد خطا را مشکل می کنند. از آنجایی که بیشتر رشته های دی ان ای احتمالاً شامل خطاها و تغییرات در خواندن هستند ، دانشمندان امیدوارند که از گره های نمودار هنگامی که به طور نامشخص به هم وصل شوند ، پس از تمیز کردن نمودار از راس و لبه های ایجاد شده توسط خطاها ، از فرایند بازسازی استفاده کنند که می تواند گره های نمودار را یکپارچه کند. [ ۲]





این نوشته برگرفته از سایت ویکی پدیا می باشد، اگر نادرست یا توهین آمیز است، لطفا گزارش دهید: گزارش تخلفاز طریق شکل گراف دی براین ، می توانیم ببینیم که احتمال 4 ^ k گره های مختلف برای ساختن یک ژنوم وجود دارد. با در نظر گرفتن تنها ک تایی موجود در رشته مورد نظر دی ان ای ، تعداد گره های مورد استفاده برای ایجاد نمودار را می توان کاهش داد. با توجه به توالی 1 ، می توان گره های اندازه ۷ یا ۷ تایی را تعیین کرد که در نمودار قرار دارند. سپس این ۷ تایی ها نمودار ایجاد شده در شکل 1 را ایجاد می کنند. قطعه تابع زیر را می توان به این صورت استفاده کرد که با دادن دنباله شکل یک و مشخص کردن اندازه ک تایی ها می توان گراف دی براین ساده شکل را ساخت.
def de_bruijn_graph ( seq, k ) : edges = nodes = set ( ) for i in range ( len ( seq ) - k + 1 ) : edges. append ( ( seq, seq ) ) nodes. add ( seq ) nodes. add ( seq ) return nodes, edges نمودار نشان داده شده در شکل 1 یک نسخه بسیار ساده است از آنچه که یک نمودار می تواند شبیه به ان باشد. [ ۱] . این نمودار با گرفتن 6 عنصر آخر ۷ تایی و پیوند دادن آن به گره ای که 6 عنصر اول آنها یکسان است تشکیل می شود. شکل 1 ساده ترین گراف دی براین است ، زیرا هر گره دقیقاً یک مسیر در آن وارد و یک مسیر از ان خارج می شود. در بیشتر مواقع ، شما به احتمال زیاد گرافیکی را مشاهده خواهید کرد که در آن بیش از یک لبه به سمت گره و یا بیش از یک لبه خروجی از یک گره وجود دارد. این امر به دلیل اتصال گره ها اتفاق می افتد. گره ها با لبه هایی که به گره ها اشاره می کنند متصل می شوند اگر و تنها اگر ، "k - 1" عنصر اخر ک تایی مورد نظر مطابق با "k - 1” عنصر اول گره دیگری باشد. این موضوع این اجازه را می دهد تا یک نمودار د دی براین چند لبه تشکیل شود. این نمودارهای پیچیده تر به دلیل خطاهای خواندن یا تغییر در رشته های دی ان ای اتفاق می افتد. این دو دلیل تعیین ساختار صحیح دی ان ای و تعیین عوامل ایجاد خطا را مشکل می کنند. از آنجایی که بیشتر رشته های دی ان ای احتمالاً شامل خطاها و تغییرات در خواندن هستند ، دانشمندان امیدوارند که از گره های نمودار هنگامی که به طور نامشخص به هم وصل شوند ، پس از تمیز کردن نمودار از راس و لبه های ایجاد شده توسط خطاها ، از فرایند بازسازی استفاده کنند که می تواند گره های نمودار را یکپارچه کند. [ ۲]






wiki: خطای خوانش دی ان ای