فایل شماره 6218 |
الگوریتمهای خوشهبندی
چنانچه پیشتر توضیح داده شد، یکی از وظایف اصلی دادهکاوی خوشهبندی است. در خوشهبندی دادهها بر اساس شباهتی که به یکدیگر دارند به خوشههایی افراز میشوند؛ بنابراین، معیار اصلی این تکنیک اندازهگیری شباهت دادهها است. لازم است قبل از توضیح هرگونه الگوریتم خوشهبندی، به معرفی انواع فاصلهها به عنوان معیاری برای اندازهگیری شباهت بپردازیم.
(( اینجا فقط تکه ای از متن درج شده است. برای خرید متن کامل فایل پایان نامه با فرمت ورد می توانید به سایت feko.ir مراجعه نمایید و کلمه کلیدی مورد نظرتان را جستجو نمایید. ))
فرض کنید دادههای ورودی دارای n ویژگی باشند، بنابراین هر داده را میتوان بوسیله یک بردار n بعدی نمایش داد. اگر x و y دو نمونه از دادهها باشند خواهیم داشت:
جدول ۲-۳ تعاریف ریاضی انواع فاصلهها را نمایش میدهد (شهرابی and شجاعی ۱۳۸۸).
جدول ۲‑۳ : انواع فاصلهها
تابع فاصله
فرمول
فاصله اقلیدسی
فاصله همینگ
فاصله چبیشف
فاصله مینکوفسکی
فاصله کانبرا[۱۰۰]
جدایی زاویهای[۱۰۱]
ما در این تحقیق به معرفی مختصر دو تکنیک خوشهبندی اکتفا کردهایم.
K – Means:
در این الگوریتم تعداد خوشهها (K) مشخص بوده و الگوریتم با تابع هدف حداقل نمودن فواصل درون یک خوشه به انتخاب K مرکز خوشه میپردازد. گامهای این الگوریتم به صورت زیر است:
-
- انتخاب k مرکز خوشه اولیه به صورت تصادفی
-
- خوشهبندی دادهها: هر داده به خوشهای تعلق دارد که کمترین فاصله را با مرکز آن خوشه داشته باشد.
-
- به روز کردن k مرکز خوشه از طریق محاسبه میانگین وزنی اعضای هر خوشه
مراحل ۲ و ۳ تا زمان یافتن حداقل فاصله درون خوشهای ادامه مییابد.
نگاشتهای خودسازمانده[۱۰۲] (SOM):
تکنیک SOM که توسط کوهنن[۱۰۳] معرفی شد، نوعی شبکه عصبی است که به خوشهبندی دادهها میپردازد. این شبکه عصبی در حیطه شبکههای عصبی بدون ناظر قرار دارد و بدین معنی است که برای به روز کردن وزنهای اتصالات شبکه نیازی به تاثیر بازخورد ناظر نیست؛ به همین دلیل به عنوان خودسازمانده شناخته میشوند. ساختار این شبکه فقط دارای دو لایه است؛ یک لایه ورودی که به اندازه ابعاد (تعداد ویژگیها) دادههای ورودی نرون دارد و یک لایه خروجی که به اندازه تعداد خوشهها نرون دارد و میتوانند در ابعاد مختلف سازمان یابند. تمامی نرونهای ورودی به تمامی نرونهای خروجی متصل هستند؛ بنابراین، برای هر نرون خروجی یا به عبارت دیگر برای هر خوشه، اوزان کمانهای متصل به آن خوشه را میتوان در غالب یک بردار وزن برای آن خوشه در نظر گرفت. ابعاد بردارهای وزن خوشهها همبعد بادادههای ورودی است (Karray and Silva 2004). شکل ۲-۵ ساختار این شبکه را نشان میدهد.
شکل ۲‑۵ : ساختار SOM
فرم در حال بارگذاری ...
[یکشنبه 1401-04-05] [ 10:52:00 ب.ظ ]
|