فایل شماره 5698

L₁ = {large 1-itemsets}
اقلام با بیشترین فراوانی را محاسبه می‌کند.
= database D;
For (k=2; L_k-1 ≠ ; k++) do begin
موجودیت‌های خالی را حذف می‌کند.
پشتیبان را محاسبه می‌کند.
C_kهای جدید را مطابق الگوریتم بیان شده تولید می‌کند.
مقداردهی اولیه پایگاه داده موجود
یک انباره‌ی جدید ایجاد می‌کند.
فقط آن‌هایی که از حداقل پشتیبان بزرگ‌تر یا مساویند را در L_k قرار می‌دهد.
C_k = apriori-gen(L_k-1);

for all entries t do begin

for all candidates c C_t do
c.count++;

end
end
L_k = {c C_k|c.count minsup}
end
Answer = U_kL_k;

شکل ۳- ۶: الگوریتم AprioriTid
مزایای الگوریتم: از مزایای عمده این روش این است که در فازهای آخر اندازه بسیار کوچک‌تر از کل اندازه پایگاه داده شده و باعث صرفه جویی در زمان می‌شود. این الگوریتم از نظر عملکرد نیز بر الگوریتم‌های SETM و AIS برتری دارد. مشکلی که ممکن است وجود داشته باشد مدیریت حافظه است و دیده می‌شود که این الگوریتم در فازهای انتهایی ( اندازه کوچک‌تر می‌شود ) عملکرد بهتری نسبت به الگوریتم Apriori دارد.
معایب الگوریتم: در فازهای اولیه های تولید شده بزرگ بوده و فضای زیادی اشغال می‌کنند. بنابراین مدت زمانی معادل زمان الگوریتم Apriori را نیازمند است. اگر فضای اشغال شده بیشتر از حافظه در دسترس باشد، هزینه اضافه‌ای را نیز در بر خواهد داشت.

۳-۵- جمع‌بندی
در این فصل، ابتدا شرح مختصری بر داده‌کاوی توزیع شده داده شد. همانطور که گفته شد این تکنولوژی با مشکلات پیچیده‌ای، مانند منابع داده‌ای بزرگ، مشکلات انتقال داده، ترکیب داده‌ها، و غیره روبرو است. سپس عامل‌ها و سیستم‌های چند عامله، و مزایای بهره‌گیری ازین تکنولوژی در داده‌کاوی و داده‌کاوی توزیع شده مورد بررسی قرار گرفت. در نهایت الگوریتم‌های مطرح در حوزه کشف قوانین انجمنی معرفی شدند. در فصل بعد، محاسبات و یافته‌های تحقیق ارائه خواهند شد.
فصل چهارم محاسبات و یافته‌های تحقیق
۴-۱- مقدمه
در این فصل قصد داریم، معماری پیشنهادی برای داده کاوی برپایه‌ی سیستم‌های چند عامله را ارائه کرده و به شرح مختصری از داده کاوی توزیع شده بپردازیم.
مباحث تحقیقاتی باز بسیاری در حوزه‌ی داده‌کاوی بر پایه‌ی عامل وجود دارد. در تاسیس یک زیرساخت داده‌کاوی سازمانی بر پایه‌ی عامل، ممکن است یک نفر بر روی تکنیک‌های طراحی و تجزیه و تحلیل سیستم بررسی اجتماع محور و سازمانی برای سیستم‌های بر پایه‌ی عامل در مقیاس بالا مطالعه کند. به همان نسبت، راه حل‌هایی برای یکپارچه‌سازی برنامه‌ها بر پایه‌ی سرویس عامل، آماده‌سازی داده توزیع شده، مشارکت عامل توزیع شده و محاسبات عامل موازی باید درنظر گرفته شود. در بسیاری از حالات داده‌کاوی، افراد باید بر روی الگوریتم‌هایی که بتوانند با تغییرات پویای داده و درخواست‌های پویای کاربر سازگاری پیدا کنند، مطالعه و بررسی انجام دهند. الگوریتم‌های داده‌کاوی سازگارپذیر و اتوماتیک باید مورد بررسی قرار گیرند. در ادامه لیستی از برخی از مباحث باز این حوزه آورده شده است:
کاوش و مدلسازی فعالیت
داده‌کاوی سازمانی بر پایه‌ی عامل
زیرساخت داده‌کاوی بر پایه‌ی عامل
مدیریت پروژه و فرایند کاوش بر پایه‌ی عامل
داده‌کاوی توزیع شده بر پایه‌ی عامل
یادگیری توزیع شده بر پایه‌ی عامل
محاسبات گرید بر پایه‌ی عامل
داده‌کاوی تعاملی بر پایه‌ی عامل
داده‌کاوی موازی بر پایه‌ی عامل
کاوش وب برپایه‌ی عامل
مدیریت دانش در داده‌کاوی توزیع شده بر پایه‌ی عامل
داده‌کاوی همیاری انسان با عامل
عامل‌های شبکه در کشف دانش و سرویس‌دهی توزیع شده

موضوعات: بدون موضوع لینک ثابت

فرم در حال بارگذاری ...

فید نظر برای این مطلب