الگوریتم‌های خوشه‌بندی
چنانچه پیش‌تر توضیح داده شد، یکی از وظایف اصلی داده‌کاوی خوشه‌بندی است. در خوشه‌بندی داده‌ها بر اساس شباهتی که به یکدیگر دارند به خوشه‌هایی افراز می‌شوند؛ بنابراین، معیار اصلی این تکنیک اندازه‌گیری شباهت داده‌ها است. لازم است قبل از توضیح هرگونه الگوریتم خوشه‌بندی، به معرفی انواع فاصله‌ها به عنوان معیاری برای اندازه‌گیری شباهت بپردازیم.

(( اینجا فقط تکه ای از متن درج شده است. برای خرید متن کامل فایل پایان نامه با فرمت ورد می توانید به سایت feko.ir مراجعه نمایید و کلمه کلیدی مورد نظرتان را جستجو نمایید. ))

فرض کنید داده‌های ورودی دارای n ویژگی باشند، بنابراین هر داده را می‌توان بوسیله یک بردار n بعدی نمایش داد. اگر x و y دو نمونه از داده‌ها باشند خواهیم داشت:
جدول ۲-۳ تعاریف ریاضی انواع فاصله‌ها را نمایش می‌دهد (شهرابی and شجاعی ۱۳۸۸).
جدول ‏۲‑۳ : انواع فاصله‌ها

تابع فاصله
فرمول

فاصله اقلیدسی

فاصله همینگ

فاصله چبیشف

فاصله مینکوفسکی

فاصله کانبرا[۱۰۰]

جدایی زاویه‌ای[۱۰۱]

ما در این تحقیق به معرفی مختصر دو تکنیک خوشه‌بندی اکتفا کرده‌ایم.
K – Means:
در این الگوریتم تعداد خوشه‌ها (K) مشخص بوده و الگوریتم با تابع هدف حداقل نمودن فواصل درون یک خوشه به انتخاب K مرکز خوشه می‌پردازد. گام‌های این الگوریتم به صورت زیر است:

    1. انتخاب k مرکز خوشه اولیه به صورت تصادفی
    1. خوشه‌بندی داده‌ها: هر داده به خوشه‌ای تعلق دارد که کمترین فاصله را با مرکز آن خوشه داشته باشد.
    1. به روز کردن k مرکز خوشه از طریق محاسبه میانگین وزنی اعضای هر خوشه

مراحل ۲ و ۳ تا زمان یافتن حداقل فاصله درون خوشه‌ای ادامه می‌یابد.
نگاشت‌های خودسازمانده[۱۰۲] (SOM):
تکنیک SOM که توسط کوهنن[۱۰۳] معرفی شد، نوعی شبکه عصبی است که به خوشه‌بندی داده‌ها می‌پردازد. این شبکه عصبی در حیطه شبکه‌های عصبی بدون ناظر قرار دارد و بدین معنی است که برای به روز کردن وزن‌های اتصالات شبکه نیازی به تاثیر بازخورد ناظر نیست؛ به همین دلیل به عنوان خودسازمانده شناخته می‌شوند. ساختار این شبکه فقط دارای دو لایه است؛ یک لایه ورودی که به اندازه ابعاد (تعداد ویژگی‌ها) داده‌های ورودی نرون دارد و یک لایه خروجی که به اندازه تعداد خوشه‌ها نرون دارد و می‌توانند در ابعاد مختلف سازمان یابند. تمامی نرون‌های ورودی به تمامی نرون‌های خروجی متصل هستند؛ بنابراین، برای هر نرون خروجی یا به عبارت دیگر برای هر خوشه، اوزان کمان‌های متصل به آن خوشه را می‌توان در غالب یک بردار وزن برای آن خوشه در نظر گرفت. ابعاد بردارهای وزن خوشه‌ها هم‌بعد باداده‌های ورودی است (Karray and Silva 2004). شکل ۲-۵ ساختار این شبکه را نشان می‌دهد.
شکل ‏۲‑۵ : ساختار SOM

موضوعات: بدون موضوع  لینک ثابت


فرم در حال بارگذاری ...