پاورپوینت خوشهبندي مقيد (pptx) 34 اسلاید
دسته بندی : پاورپوینت
نوع فایل : PowerPoint (.pptx) ( قابل ویرایش و آماده پرینت )
تعداد اسلاید: 34 اسلاید
قسمتی از متن PowerPoint (.pptx) :
خوشهبندي مقيدConstrained Clustering
2
فهرست مطالب
مقدمه ای بر خوشه بندی
ارزیابی خوشه بندی
خوشه بندی مقید
چالشها و راهکارها
پژوهش های انجام شده
3
خوشهبندي
خوشهبندي
گروهبندي دادهها به گونهاي که خصوصيات مشترک بين دادههاي هر گروه زياد و خصوصيات مشترک بين گروههاي متفاوت کم باشد.
سوال 1: خصوصيات مشترک؟ چگونگي تشخيص خصوصيات؟
طيف وسيع كاربرد
يادگيري ماشين، هوش مصنوعي، الگوشناسي، وب كاوي، تحليل پايگاه داده، پردازش متون و تصاوير، علوم پزشكي، علوم اجتماعي، اقتصاد و تجارت، علوم كامپيوتر، پزشكي
خوشهبندي به عنوان يك مساله مشكل
مهمترين دلايل مشكلبودن مساله:
ذات بدون ناظر بودن الگوريتمهاي خوشهبندي
ابهام در تعريف خوشه مناسب
مشكل بودن تعريف معيار فاصله مناسب
تعريف تابع هدف مناسب به منظور خوشهبندي
عدم وجود الگوريتم جامع براي حل همه مسائل خوشهبندي
4
روشهاي خوشهبندي (دسته بندی)
ارزیابی کلاسترینگ
چند مساله
تمایل به خوشه بندی شدن داده؟
آیا یک ساختار غیر تصادفی در داده وجود دارد؟
استفاده از تستهای آماری
تعداد خوشه ها؟
برخی الگوریتم ها نیاز به دانستن تعداد خوشه ها قبل از خوشه بندی دارند.
راهکارهای تقسیم و ادغام با معیارهایی از قبیل واریانس درون و برون خوشه ای
کیفیت خوشه بندی انجام شده؟
خوشه بندی انجام شده چقدر خوب است؟
ارائه معیارهای ارزیابی مناسب
5
ویژگیهای یک معیار ارزیابی مناسب (4 شرط)
Cluster homogeneity
هر چه خلوص در خوشه بندی (با دانستن کلاس اصلی داده ها، داده های هم کلاس در یک خوشه قرار بگیرند) بیشتر باشد این معیار بیشتر است.
داده های دسته های متفاوت در خوشه های متفاوت قرار داده شوند.
6
ارزیابی کلاسترینگ (کیفیت خوشه بندی انجام شده؟)
Cluster completeness
نقطه مقابل Cluster homogeneity
داده ها ی دسته های یکسان در خوشه های یکسان قرار داده شوند.
7
ارزیابی کلاسترینگ (کیفیت خوشه بندی انجام شده؟)
Rag bag
در برخی مسایل دسته ای به نام «متفرقه» داریم که شامل داده هایی است که نمی توانند با داده های دیگر کلاسها هم خوشه شوند.
جریمه انتساب این نوع داده ها به یک خوشه خالص بیشتر از انتساب آنها به خوشه متفرقه است .
8
ارزیابی کلاسترینگ (کیفیت خوشه بندی انجام شده؟)
Small cluster preservation
هدف: ممانعت از شکسته شدن دسته های کوچک اشیا
تقسیم یک دسته کوچک از اشیا به دسته های ریز بسیار خطرناکتر از تقسیم دسته بزرگ به دسته های کوچکتر است.
داده ها ممکن است با فرض نویز یا outlier حذف شوند.
9