تعیین نواحی کدکننده پروتئین در توالی DNA با استفاده از الگوریتم های پردازش سیگنال
1394/06/22 12:35:00
مقطع : کارشناسی ارشد
دانشگاه : دانشگاه صنعتی سهند تبریز
تاریخ دفاع : 1392/02/04
اساتید راهنما : دکتر موسی شمسی و دکتر محمد حسین صداقی
اساتید مشاور :
اساتید داور :
مشاهده سایر پایان نامه های حمیدرضا صابرکاری
شناسایی نواحی کدکننده پروتئین در ژن¬ها با استفاده از ابزارهای پردازش سیگنال در سال¬های اخیر به چالشی در بیوانفورماتیک تبدیل شده است. اولین گام در تخمین نواحی ژنی، تعیین الگوهای تناوب-3 است. به¬دلیل ماهیت پیچیده این نواحی معمولا نیاز به یک ابزار قدرتمندی است که بتواند به طور موثر مشخصات نواحی کدکننده پروتئین را نمایش دهد. تکنیک¬های پردازش سیگنال به طور موفقیت¬آمیزی می¬توانند به حل این مساله کمک کنند. در این پژوهش، الگوریتم¬های بهینه¬ای جهت تعیین نواحی کدکننده پروتئین بر مبنای خاصیت تناوب-3 بازهای موجود در توالی DNA ارائه شده است. الگوریتم¬های مطرح شده، بر پایه تبدیل ویولت، فیلترینگ زمان- فرکانس بر مبنای تبدیل S، فیلترهای تطبیقی، مدل کدکننده پیشگویانه خطی و الگوریتم گورتزل ارائه می-شود. جهت سنجش عملکرد الگوریتم¬های پیشنهادی از معیارهای ارزیابی سطح نوکلئوتیدی استفاده شده است که شامل منحنی ROC، سطح زیر منحنی ROC، حساسیت بر حسب ویژگی، همبستگی تقریبی بر حسب سطح آستانه می¬باشد. پایگاه داده استفاده شده در این پژوهش، مجموعه ژن¬های موجود در دو پایگاه داده HMR195، Burset/Guigo1996 و همچنین ژن¬های موجود در پایگاه داده Genbank می¬باشد. همچنین در این پژوهش به بررسی الگوریتم¬های استخراج ژن¬های موثر در بروز سرطان در داده¬های ریزآرایه پرداخته و یک الگوریتم بهینه بر پایه الگوریتم انتخابی آنالیز مولفه¬های مستقل و الگوریتم بهبود یافته ماشین بردار پشتیبان ارائه می¬شود. پایگاه داده استفاده شده جهت ارزیابی الگوریتم پیشنهادی، داده¬های ریزآرایه مربوط به سه نوع از سرطان است و مقایسه نرخ درستی الگوریتم پیشنهادی با سایر روش¬های موجود نشان¬دهنده دقت بالای آن است.