در علم ژنتیک، جزایر سی پی جی ( به انگلیسی: CpG islands ) ناحیه ای از ژنوم است که فرکانس بالایی از مکان های CG در آن وجود دارد. حرف p در CpG برمی گردد به پیوند فسفودی استر بین سیتوزین و گوانین که به این معنی است که در توالی، C و G به ترتیب در کنار هم قرار گرفته اند بدون در نظر گرفتن تک رشته یا دو رشته ای بودن. در یک ناحیه CpG هم C و هم G در یک رشته از DNA یا RNA یافت می شوند و به وسیله زنجیره فسفودیستر با هم پیوند کوالانسی دارند که بسیار قوی تر از پیوندی است که بین جفت پایه ها در پیوند نرمال بین مکمل ها وجود دارد. اگر C و G در رشته های مختلف از DNA باشند، سه پیوند هیدروژنی به اشتراک می گذارند.
با وجود این محدودیت هایی برای تعریف شهودی جزایر سی پی جی وجود دارد. یک تعریف فرمال معمول برای جزایز سی پی جی این است که منطقه ای است با حداقل ۲۰۰ جفت پایه ( base pair ) با بیشتر از ۵۰٪ GC با انتظار مشاهده CpG بالاتر از ۶۰٪.
«انتظار مشاهده CpG» از فرمول زیر محاسبه می شود:
تعداد کل نوکلئوتیدها در توالی × ( ( تعداد G × تعداد C ) / تعداد CpG )
در ژنوم پستانداران جزایز سی پی جی به طور معمول طولی برابر ۳۰۰ تا ۳۰۰۰ جفت پایه دارند و به طور تقریبی ۴۰٪ از پروموتورهای ژن پستانداران را تشکیل می دهند.
تقریبا ۷۰٪ از پروموتورهای ژن انسان دارای تراکم CpG بالایی می باشند. اگر فرکانس توالی دونوکلئوتیدی CG را داشته باشیم، تعداد CpG از حد انتظار خیلی پایین تر است.
مطالعات در سال ۲۰۰۲، قوانینی برای پیش بینی جزایز سی پی جی برای تمییز دادن از بقیه توالی های پر CG مثل عنصر Alu را نشان داد.
طبق مطالعات گسترده روی توالی کامل کروموزوم های ۲۱ و ۲۲ انسان، مناطق بزرگتر از ۵۰۰ جفت پایه مشاهده شد که جزایز سی پی جی در آن بودند که حاوی CG بیشتر از ۵۰٪ و انتظار مشاهده نرخ CpG بیشتر از ۶۵٪ بودند. جزایز سی پی جی معمولاً نزدیک به ناحیه شروع رونویسی ژن ها قرار دارند.
معمولا قرار گرفتن C و G کنار هم نادر است. به این دلیل که سیتوزین ها در یک چنین چیدمانی به متلیل شدن تمایل دارد. متلیل شدن سبب می شود که در رونویسی بین رشته اصلی و رشته تولید شده تفاوت ایجاد شود؛ بنابراین زمان فرگشت ( تکامل ) به دلیل خودبخودی بودن آمین زدایی تمایل دارند که تبدیل به T شوند.
آنزیم خاصی در انسان وجود دارد که به طور خاص جایگزین عدم انطباق T/G می شود. این تأثیر کافی برای جلوگیری از سرعت جهش این نوکلئوتید ندارد. نتیجه اینکه CpGها نادر هستند؛ بنابراین وجود جزیره های CpG معمولاً با وجود محتوای بالای CG در یک منطقه های ژن ها توصیف می شوند.
این نوشته برگرفته از سایت ویکی پدیا می باشد، اگر نادرست یا توهین آمیز است، لطفا گزارش دهید: گزارش تخلفبا وجود این محدودیت هایی برای تعریف شهودی جزایر سی پی جی وجود دارد. یک تعریف فرمال معمول برای جزایز سی پی جی این است که منطقه ای است با حداقل ۲۰۰ جفت پایه ( base pair ) با بیشتر از ۵۰٪ GC با انتظار مشاهده CpG بالاتر از ۶۰٪.
«انتظار مشاهده CpG» از فرمول زیر محاسبه می شود:
تعداد کل نوکلئوتیدها در توالی × ( ( تعداد G × تعداد C ) / تعداد CpG )
در ژنوم پستانداران جزایز سی پی جی به طور معمول طولی برابر ۳۰۰ تا ۳۰۰۰ جفت پایه دارند و به طور تقریبی ۴۰٪ از پروموتورهای ژن پستانداران را تشکیل می دهند.
تقریبا ۷۰٪ از پروموتورهای ژن انسان دارای تراکم CpG بالایی می باشند. اگر فرکانس توالی دونوکلئوتیدی CG را داشته باشیم، تعداد CpG از حد انتظار خیلی پایین تر است.
مطالعات در سال ۲۰۰۲، قوانینی برای پیش بینی جزایز سی پی جی برای تمییز دادن از بقیه توالی های پر CG مثل عنصر Alu را نشان داد.
طبق مطالعات گسترده روی توالی کامل کروموزوم های ۲۱ و ۲۲ انسان، مناطق بزرگتر از ۵۰۰ جفت پایه مشاهده شد که جزایز سی پی جی در آن بودند که حاوی CG بیشتر از ۵۰٪ و انتظار مشاهده نرخ CpG بیشتر از ۶۵٪ بودند. جزایز سی پی جی معمولاً نزدیک به ناحیه شروع رونویسی ژن ها قرار دارند.
معمولا قرار گرفتن C و G کنار هم نادر است. به این دلیل که سیتوزین ها در یک چنین چیدمانی به متلیل شدن تمایل دارد. متلیل شدن سبب می شود که در رونویسی بین رشته اصلی و رشته تولید شده تفاوت ایجاد شود؛ بنابراین زمان فرگشت ( تکامل ) به دلیل خودبخودی بودن آمین زدایی تمایل دارند که تبدیل به T شوند.
آنزیم خاصی در انسان وجود دارد که به طور خاص جایگزین عدم انطباق T/G می شود. این تأثیر کافی برای جلوگیری از سرعت جهش این نوکلئوتید ندارد. نتیجه اینکه CpGها نادر هستند؛ بنابراین وجود جزیره های CpG معمولاً با وجود محتوای بالای CG در یک منطقه های ژن ها توصیف می شوند.
wiki: جزایر سی پی جی