چکیده :

پردازش داده‌های عظیم و مدیریت آن‌ها، در سال‌های اخیر، موردتوجه قرارگرفته است و چارچوب‌ها و ابزارهای خاصی به این منظور معرفی‌شده‌اند و تجزیه‌وتحلیل داده‌ها به‌عنوان مدیریت داده‌های عظیم، موردمطالعه قرارگرفته‌اند. تکنیک‌های داده‌کاوی و یادگیری ماشین، امروزه در بسیاری از سازمان‌ها و صنایع به‌منظور بهبود و پیش‌بینی و رونق کسب‌وکار مورداستفاده قرار می‌گیرند و با توجه به رشد اطلاعات سازمانی و حجم بالای آن‌ها و تولید داده‌ها با سرعت‌بالا، تکنیک‌های داده‌کاوی در داده‌های عظیم، نقش مهمی را در این تحولات ایفا می‌کنند. عملیات مختلفی برای مدیریت داده‌ها صورت می‌گیرد که گروهی از این عملیات به‌صورت پیش‌پردازش‌هایی هستند که بر روی داده‌ها انجام می‌شوند تا داده‌ها را برای انجام عملیات اصلی، آماده سازند. از طرفی در محیط‌های ابری، به دلیل توزیع‌شدگی محیط، عملیات گروه‌بندی و دسته‌بندی داده‌ها، اهمیت زیادی می‌یابد. در این مقاله، معروف‌ترین الگوریتم خوشه‌بندی، K-Means، موردبررسی قرارگرفته و بنا بر کارهای صورت گرفته بر روی این الگوریتم، روش هایی پیشنهاد می‌گردد که پارامترهای مهم در محیط‌های ابری را در نظر گرفته و خوشه‌بندی داده‌های عظیم را بهبود بخشد.

کلید واژگان :

خوشه بندی- داده های عظیم-مدیریت داده های عظیم-ذخیره سازی ابری- رایانش ابری- K-Means



ارزش ریالی : 200000 ریال
دریافت مقاله
با پرداخت الکترونیک