نوع همکاری : مجری
کارفرما : دانشگاه آزاد اسلامي واحد زنجان
سال طرح : 1391
مشاهده سایر طرح های امیر نجفی
ظهور تکنولوژي داده‌ی آرايه کوچک (ماتریس‌های با رتبه پایین)، ما را قادر می‌سازد تا بر کل ژنوم (کل ژن انسان یا DNA)، در يک تراشه با استفاده از رويکرد سيستماتيک نظارت کنيم. استفاده از خوشه بندي به عنوان يک رويکرد داده کاوي که به طور گسترده براي کشف فنوتیپ‌ها (صفتی که بروز کرده، هر ژن مسئول یک صفت است. مثلاً ژن بینایی باعث دیدن می‌شود) از ميان داده هاي خام معمول است. با وجود اين الگوریتم‌های خوشه بندي سنتي داراي محدودیت‌هایی هستند مثلاً آن‌ها نمی‌توانند زیرساخت‌های نمونه‌ها و ویژگی‌های پنهان داده‌ها را تشخيص دهند. جداي از خوشه بندي، خوشه يابي دو طرفه (دو دويی) يک متد جديد براي کشف داده‌هایی است که به شدت با زيرمجموعه¬ی نمونه‌ها مرتبط هستند. چند متد خوشه بندي دودويي براي تشخیص‌های باليني تومور و تحقيقات آسيب شناسي استفاده شده است. در اين تحقيق، ما يک مدل جديد خوشه بندي دو دويي را با استفاده از تجزیه ماتريس دودويی (BMF) که اخیراً توسط ژانگ و همکاران، (2010) ارائه شده است را مورد بررسی قرار می‌دهیم و با در نظر گرفتن داده های مربوط به ریسک سیستماتیک شرکت‌های دارویی پذیرفته شده در بورس به عنوان ژنوم به خوشه بندی آن‌ها با استفاده از این روش جدید می‌پردازیم.BMF نوع جديدي از ماتريس دو دويي است که از تجزیه ماتريس غير منفي نشئت گرفته است. با توجه به اينکه چندين تحقيق در خصوص جنبه هاي NMF بحث کرده‌اند اما مشکل اساسي اينجاست که NMF نمی‌تواند ارتباط دو تايي بين داده‌ها و نمونه‌ها را به طور دقيق شناسايي کند. بنابراين این تحقيق، ابتدا با يک ويژگي جديد از BMF شروع می‌گردد و دو الگوريتم ارائه شده برای آن پياده سازي و نتایج آن با سایر الگوریتم¬های خوشه بندی مقايسه خواهد شد. مبتني بر الگوریتم‌های استراتژي محور، الگوريتم مورد استفاده در اين تحقيق براي BMF بيشتر شبيه به الگوريتم جستجوي نقطه بهينه مطلق می‌باشد. نتايج آزمايشات روي مجموعه داده هاي واقعي و ترکيبي بيانگر اهميت BMF است. علاوه بر عملکرد خوشه بندي جذبي، BMF می‌تواند نتايج تقريبي و پراکنده توليد کند.